0
本文作者: nebula | 2024-09-11 14:20 |
“外界對大模型有相當多的誤解,”近日據(jù)媒體報道,李彥宏的一則內(nèi)部講話曝光。在最近一次和員工交流中,李彥宏談及三個大模型認知誤區(qū),涵蓋了大模型競爭、開源模型效率、智能體趨勢等熱點話題。
李彥宏認為未來大模型之間的差距可能會越來越大。他進一步解釋,大模型的天花板很高,現(xiàn)在距離理想情況還相差非常遠,所以模型要不斷快速迭代、更新和升級;需要能幾年、十幾年如一日地投入,不斷滿足用戶需求,降本增效。
榜單不代表大模型實力,模型之間的差距是多維的
對于行業(yè)“大模型之間的能力已經(jīng)沒有壁壘”的說法,李彥宏給出了不同觀點?!懊看涡履P桶l(fā)布,都要和GPT-4o做比較,說我的得分已經(jīng)跟它差不多了,甚至某些單項上得分已經(jīng)超過它了,但這并不表明和最先進的模型就沒有差距了。”
他解釋說,很多模型為了證明自己,會在發(fā)布之后去打榜,會去猜測試題目、答題技巧,從榜單上看 ,或許模型的能力已經(jīng)很接近了,“但到實際應用中,實力還是有明顯差距的。”
李彥宏指出,模型之間的差距是多維度的。行業(yè)往往更關(guān)注理解、生成、邏輯、記憶等能力的差距,但卻忽視了成本、推理速度等維度,有些模型雖能達到同樣效果,但成本高、推理速度慢,還是不如先進模型。
內(nèi)部講話中,李彥宏認為,真正要去衡量大模型能力,應該是在具體應用場景中,看是否能滿足用戶需求、產(chǎn)生價值增益,這才是最值得被在乎的。
開源模型效率不高,解決不了算力問題
延續(xù)此前觀點,內(nèi)部講話中,李彥宏進一步闡釋了外界對開源大模型的認知誤區(qū)。
“在大模型時代之前,大家習慣了開源意味著免費、意味著成本低?!?他解釋說,比如開源的Linux,因為已經(jīng)有了電腦,所以使用Linux是免費的。但這些在大模型時代不成立,大模型推理是很貴的,開源模型也不會送算力,還得自己買設(shè)備,無法實現(xiàn)算力的高效利用。
“效率上開源模型是不行的。” 他表示,“ 閉源模型準確講應該叫商業(yè)模型,是無數(shù)用戶分攤研發(fā)成本、分攤推理用的機器資源和GPU,GPU的使用效率是最高的,百度文心大模型3.5、4.0的GPU使用率都達到了90%多?!?/p>
李彥宏分析,在教學科研等領(lǐng)域,開源模型是有價值的;但在商業(yè)領(lǐng)域,當追求的是效率、效果和最低成本時,開源模型是沒有優(yōu)勢的。
智能體是大模型最重要的發(fā)展方向,但還不是業(yè)界共識
李彥宏還談及了大模型應用的發(fā)展階段,他認為首先出現(xiàn)的是Copilot,對人進行輔助;接下來是Agent智能體,有一定的自主性,能自主使用工具、反思、自我進化;這種自動化程度再發(fā)展,就會變成AI Worker,能獨立完成各方面的工作。
當前,智能體已經(jīng)受到越來越多的大模型公司及客戶的關(guān)注,李彥宏認為,雖然“有很多人看好智能體這個發(fā)展方向,但是到今天為止,智能體還不是共識,像百度這樣把智能體作為大模型最重要的戰(zhàn)略、最重要的發(fā)展方向的公司并不多?!?/p>
為什么要強調(diào)智能體?李彥宏也給出了答案,“智能體的門檻確實很低”, 很多人不知道怎么把大模型變成應用,而智能體是一個非常直接、高效、簡單的方式,在模型之上構(gòu)建智能體相當方便。目前,每周都有上萬個新的智能體在百度文心智能體平臺上被創(chuàng)造出來,智能體的日均分發(fā)次數(shù)已快速增長至800萬次。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。