
作為開源大模型的頂梁柱,Llama3正在遭遇冷落。?
近日,據(jù)美國媒體The Information報道,Llama在全球最大的云計算服務(wù)供應(yīng)商亞馬遜的AWS平臺上備受冷落,與之相對,Anthropic的閉源模型Claude才是該平臺上最受歡迎的模型。報道稱,在另一家云平臺微軟Azure上,Llama也并非微軟的銷售首選。
?
一個月前,Meta發(fā)布了最新的開源大模型Llama 3.1 405B,在測試中性能追平GPT-4o??上?,測評中的優(yōu)異成績沒能反映在市場上,據(jù)報道,Llama3.1上線一個月后,下載量僅為360萬,比上一代模型降低了40%。
門檻高效率低,開源模型“才是最貴的”
這一現(xiàn)象早有預(yù)兆。早在今年4月,Llama 3推出70B和400B模型之后,就有開發(fā)者反饋“免費的才是最貴的”,Llama 3“根本用不起”的現(xiàn)象。
?當(dāng)時,一位美國AI創(chuàng)業(yè)者Arsenii Shatokhin的采訪視頻在網(wǎng)上流傳,這位創(chuàng)業(yè)者表示,“我們只有一兩個客戶有足夠資源,來精調(diào)或運行700億參數(shù)的Llama開源模型。”

訪談中,這位AI智能體公司VRSEN的創(chuàng)始人指出,企業(yè)自己運行開源大模型的效率遠(yuǎn)低于使用閉源大模型。他分析出兩個原因:
1) 首先,開源模型多數(shù)需要企業(yè)自己下載后運行,隨著模型參數(shù)向百億、千億不斷攀升,對本地IT設(shè)施要求也隨之提高,大量企業(yè)并不具備與之匹配的充足資源;
2) 其次,與做好精調(diào)和商業(yè)化適配的閉源模型不同,如果使用開源模型,企業(yè)還要再做優(yōu)化,需要公司內(nèi)部有足夠的技術(shù)人才和技術(shù)設(shè)施,對企業(yè)的技術(shù)能力無疑是提出了更高要求。
“我們只會向具備數(shù)據(jù)專業(yè)知識的客戶推銷Llama,比如內(nèi)部有工程師和數(shù)據(jù)科學(xué)家的公司?!睋?jù)The Information報道中,微軟員工這樣向媒體表示。
正如百度創(chuàng)始人李彥宏在近期的上海世界人工智能大會上表示,開源模型在學(xué)術(shù)研究、教學(xué)領(lǐng)域有一定價值,能夠讓學(xué)術(shù)界更熟悉大模型的工作機(jī)制、形成理論;但在大多數(shù)的應(yīng)用場景中,開源模型并不合適,尤其是在激烈的商業(yè)化競爭中,只有閉源模型,才能讓企業(yè)的業(yè)務(wù)效率更高、成本更低。
缺乏商業(yè)驗證,開源模型將越來越落后
近期,開源和閉源模型之爭一直備受行業(yè)關(guān)注,尤其是在時時更新的“測評跑分”上,每當(dāng)新一代大模型誕生、領(lǐng)跑測評榜時,就會爆出“開源大模型超越閉源”或“閉源大模型保持領(lǐng)先”的各類說法。
但迄今為止,閉源模型性能整體領(lǐng)先于開源。在斯坦福大學(xué)7月公布的大規(guī)模多任務(wù)語言理解?(MMLU)測試排名中,排名前十的模型中,僅有Llama 3.1為開源,其余9款上榜模型均為閉源。

某種程度上,這與開源模型并非“真開源”有關(guān)。有多位開發(fā)者表示,當(dāng)前的開源大模型并非與開源軟件不同,僅僅是開放了參數(shù)和調(diào)用接口,在使用中既存在需要SFT精調(diào)、優(yōu)化的問題,還無法像真開源的Linux那樣看到底層代碼。
因此,大模型的開源并不能帶來模型效果的提高?!伴_源模型和閉源模型相比,存在性能差距,這種差距將繼續(xù)擴(kuò)大?!惫雀枨癈EO施密特在采訪中指出。據(jù)介紹,谷歌投資的法國Mistral公司此前推出過開源模型,但從今年2月起,已經(jīng)轉(zhuǎn)向了閉源模型。
在實用性方面,伴隨著Llama 3的“叫好不叫座”,開源模型更是與閉源模型拉開了差距。有多位開發(fā)者表示,大模型的進(jìn)步與實際應(yīng)用密不可分,只有真實應(yīng)用才能不斷為模型提供反饋,讓模型在響應(yīng)速度、參數(shù)大小等方面不斷優(yōu)化。
隨著商業(yè)化的失速,缺乏商業(yè)驗證的開源模型,勢必會逐步掉隊。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。