文章來源: 矽星人Pro
文章作者:周一笑
6月7日,通義千問推出開源模型系列Qwen2,包括5款模型:0.5B、1.5B、7B、72B、MoE,其中,Qwen2-72B整體性能相比Qwen1.5-110B大幅提升!一舉超越了美國最強的開源模型Llama3-70B,更是将文心4.0等中國衆多閉源模型甩在身後,登上最強開源大模型的寶座。
Qwen2系列模型除了技術性能上的提升,還展現了更多的應用潛力。其多語言處理、長文本處理、代碼生成、數學和邏輯推理等能力,已經在MMLU、GPQA、HumanEval等國際測評中得到了驗證。
此前存在一種觀點認為在大模型的開發上,閉源模型因為其龐大的投資和資源積累,相較開源模型具有不可比拟的優勢,導緻了一種看似共識的觀念:開源模型難以追趕閉源模型的步伐。
單一的公司的閉源模型,如果有大量資金和資源投入,的确可以在短期内推動技術的發展,這一點在OpenAI上已經得到了驗證。而且不可否認,選擇閉源的OpenAI在性能上仍然是業界最強。
而這次阿裡雲Qwen2的發布,表明開源模型同樣能夠達到甚至超越閉源模型的高性能。這不僅讓開源模型落後閉源模型的論調不攻自破,也再次證明了開源大模型不僅不會越來越落後,在技術上更是有着無限的可能。開源大模型能夠做到足夠強,并且會越來越強。
同時這也是對開源價值的再一次闡釋,Qwen系列的開源模型除了為技術社區貢獻了一項重要的資源,也鼓勵了全球性的創新合作,進一步強化了開源大模型生态系統的活力和包容性。
值得一提的是,阿裡雲在1個月前剛剛發布中文場景性能超過GPT-4的閉源模型——通義千問2.5,從這個角度來看開閉源的路線選擇,阿裡雲實際上是兩條腿走路。既利用開源的優勢進行廣泛的技術傳播和創新,又通過閉源的方式保障關鍵技術的領先和商業應用的穩定。這種類似于雙軌制的策略,使得阿裡雲能夠在技術創新和商業化應用中取得平衡,實現技術價值的最大化。
所以,開源與閉源并不矛盾,而是在不同的場景和需求下扮演着各自獨特的角色,這并不是一道非此即彼的選擇題,也是時候為兩者的路線之争畫下休止符了。
1
Qwen2問世,卷起千層浪
Qwen2不僅僅意味着開源大模型陣營誕生了新标杆,它已在整個行業裡卷起千層浪。Qwen2系列模型的API已經登陸自家的阿裡雲百煉平台,衆多全球開源平台和工具也第一時間宣布對Qwen2的支持,包括Tensor-RT、OpenVINO、OpenCompass、XTuner、LLaMA-factory、Firefly、OpenBuddy、vLLM、Ollama等等,這樣的生态影響力在國産大模型行列裡絕無僅有。
Qwen2這次的開源在X上也引發了大量的讨論:海外網友和開發者紛紛歡迎這款最強開源模型的到來。
事實上,過去10個月裡,這樣的場景并不是阿裡雲開源大模型僅有的高光時刻。據了解,Qwen系列模型總下載量已突破1600萬次。在全球開源社區出現了超過1500款基于Qwen二次開發的模型,Qwen系列的72B、110B模型多次登頂HuggingFace 的Open LLM Leaderboard開源模型榜單,其國際社會認可度及開發者好感度可見一斑。
大洋彼岸的Meta試圖用Llama系列一統開源天下,而阿裡的通義千問的出現為全球開發者提供了另一項選擇,也讓我們看到了“國外一開源,國内就自主”說法的偏頗。市場會用腳投票,以Qwen為代表的國内開源模型所作出的貢獻被長期忽視的現狀,一定會随着更多全球企業和開發者的認可,逐漸扭轉過來。
2
開源的Qwen,開放的阿裡雲
開源與互聯網的發展緊密相連,自1970年代Unix和互聯網問世之初,開源就随之出現。如果不是開源運動的推進,許多技術仍可能被少數巨頭企業所壟斷,阻礙科技普惠程度,我們所見證的科技創新浪潮也将不複存在。
對于大模型行業來說,有了更好的開源模型,才能夠吸引更多人才參與到相關技術創新研究中。有了更好的開源模型,更多中小企業才能真正用上大模型,才會有更多對大模型産品應用的探索。
阿裡雲對開源的堅持,本質上是相信開放的力量,也就是阿裡雲CTO周靖人所說,“堅持開源開放是阿裡雲的重要策略,我們希望打造一朵AI時代最開放的雲,讓算力更普惠、讓AI更普及。”這種堅定的開源策略,不僅為技術創新提供了土壤,也為全球開發者提供了平台。
開放是為了服務好客戶,阿裡雲百煉集成了國内外主流優質大模型,提供模型選型、微調訓練、安全套件、模型部署等服務和全鍊路的應用開發工具。
開放也是為了生态的繁榮,把餅做大,才能更好的分餅。在阿裡雲魔搭社區上,彙聚了大量開源模型,成為國内開發者最活躍的AI社區。
選擇開源還是閉源,不僅是企業的戰略決策,更會影響商業模式。不可否認的是大模型的開源存在商業模式不明朗的問題,比如紮克伯格也一直在評估自身能否從雲服務廠商使用Llama相關收入中進行分成,畢竟Meta不太可能為了Llama去開辟雲計算業務。
而對阿裡雲這樣一家提供基礎設施的雲廠商來說,商業邏輯就十分清晰了。在大模型技術帶動雲計算增量需求,幾乎是一個确定性趨勢的背景下,Qwen的開源不需要帶來直接的商業化收益,而是吸引更多的廠商和開發者,來使用阿裡雲打造的基礎設施,以及包括閉源模型在内的相關服務,從底層的算力基座,到大模型應用的構建,再到開放的AI生态,從而形成完整的商業模式。
通過親自下場打造并開源Qwen系列模型,同時為大模型的落地提供完善的工具和平台,阿裡雲走出一條與Meta、微軟、AWS等頂級玩家不同的道路,這種雲+AI的示範效應,已成為一種行業标準,對客戶選擇阿裡雲來探索大模型提供了一種天然的說服力。
這在全球大模型廠商中也是獨一份。
3
Qwen是阿裡AGI願景的重要拼圖
在AGI成為科技巨頭們新戰場的當下,阿裡巴巴清晰地表明了其在這一領域的堅定信心和戰略布局。在阿裡發布的2024财年緻股東信中,明确提出電商和雲計算是阿裡的兩大核心業務,并将通過持續投資保持基礎技術的領先地位,包括人工智能在内的創新。
從技術發展的角度來看,AI的進步經曆了數次重要的飛躍,已經深刻改變了各個行業的面貌。雲計算的普及進一步加速了AI的發展,使得大規模數據處理和複雜模型訓練成為可能。在這一曆史背景下,阿裡雲通過其雲計算基礎設施和持續的技術創新,推動了AI技術的前沿探索,Qwen的領先以及在全球範圍獲得了認可,正是阿裡雲計算與AI結合戰略的産物。
從商業發展的角度,技術創新一直是企業競争力的核心驅動力。阿裡雲通過将AI與雲計算的深度融合,不僅開辟了在AI時代的商業模式,也獲得了持續增長的路徑。
在近期與摩根大通的對話中,阿裡巴巴副主席蔡崇信再次表示AI和雲計算的結合至關重要,并強調了阿裡對AGI願景的堅定信念。現在來看,阿裡雲已然為這一願景打造了一塊關鍵拼圖。