0
本文作者: 李揚霞 | 2023-06-02 16:37 |
“目前國內(nèi)跟GPT-4真正的差距,我覺得主要是在所謂的超強(qiáng)‘涌現(xiàn)’能力上,但是這個差距不是算法上的,也不是模型上的差距,而是預(yù)訓(xùn)練數(shù)據(jù)和訓(xùn)練方法的差距,還是有一些‘坑’沒有踩完,但這個時間差也就不到半年的時間。”5月31日,在三六零視覺大模型及AI硬件新品發(fā)布會后采訪中,周鴻祎對雷峰網(wǎng)如此說道。
“涌現(xiàn)”在人工智能領(lǐng)域中經(jīng)常被提到。那么什么叫智能涌現(xiàn)?過去的人工智能是,想讓機(jī)器學(xué)會什么技能,就教它什么技能。教過的有可能會,沒教過的就不會。而大模型讓AI學(xué)會了“無師自通”,也就是“涌現(xiàn)”。
業(yè)界普遍認(rèn)為500—600億參數(shù),是大模型是否具備涌現(xiàn)AI能力的一個門檻。于是,千億參數(shù),目前已經(jīng)成了大模型的“標(biāo)配”,時下不少大模型產(chǎn)品,都把自己叫做“千億模型”,但真正能為產(chǎn)業(yè)賦能提高生產(chǎn)力的模型少之又少。
那么周鴻祎是怎么看待“涌現(xiàn)”能力?360智腦大模型和視覺大模型他們之間的關(guān)系是怎樣的?360又是如何利用大模型為產(chǎn)業(yè)賦能的呢?在會后采訪中周鴻祎與雷峰網(wǎng)(公眾號:雷峰網(wǎng))在內(nèi)的一眾媒體進(jìn)行了深入的探討。
談“涌現(xiàn)能力”:跟模型大小沒關(guān)系
周鴻祎認(rèn)為,目前行業(yè)內(nèi)也沒有統(tǒng)一的說法,有人認(rèn)為一千億參數(shù)才有涌現(xiàn)能力,也有人認(rèn)為300億就可以。這其實跟模型大小沒關(guān)系,跟預(yù)訓(xùn)練的數(shù)據(jù)和訓(xùn)練方法有很大的關(guān)系。這就好比小孩兒頭腦不夠聰明,腦子容量不夠,肯定是學(xué)不出來。但是,腦子容量夠,還得跟你的學(xué)習(xí)方法有很大關(guān)系。
在周鴻祎看來,國內(nèi)目前這些廠商大家做的時間也就不到半年,長的有5個月,短的可能有3、4個月。所以,這么短的時間內(nèi),能夠拿出來和GPT-3.5基本上有一比的東西,已經(jīng)是很大的一個進(jìn)步了,如果要縮短兩者之間的差距,還是需要一些時間。
他認(rèn)為,趕上這個差距的時間可能是半年,在這個時間內(nèi)基本上訓(xùn)練中很多的方法以及訓(xùn)練模型,大家踩“坑”踩的差不多了。涌現(xiàn)能力很大程度上跟預(yù)訓(xùn)練的知識含量有很大的關(guān)系,因為現(xiàn)在中文數(shù)據(jù)普遍還是缺乏高質(zhì)量的知識數(shù)據(jù),必須大量的補(bǔ)充英文語言的高質(zhì)量素材。舉個例子,如果一個小孩兒從小看的都是類似故事會的文章,沒有邏輯推理性,他涌現(xiàn)復(fù)雜的邏輯推理能力的概率就非常低。
談視覺大模型與智腦:從感知到認(rèn)知
如果給出一張全身肌肉的蒙娜麗莎像,問他有什么怪異的地方?傳統(tǒng)的感知層面的計算機(jī)視覺可能最多認(rèn)出是一張人像,不一定能認(rèn)出是蒙娜麗莎,即便認(rèn)出蒙娜麗莎,也感覺不到怎么一個女的蒙娜麗莎長了一身男人的麒麟臂,而360的視覺大模型就可以解讀出意思,這是從感知到認(rèn)知的變化。
周鴻祎表示,視覺大模型和語言大模型是兩個不同的基礎(chǔ),首先要有一個大語言模型,大語言模型能夠充分地理解人類的知識,理解人類的自然語言。在這個基礎(chǔ)之上,再給很多圖文,然后進(jìn)行訓(xùn)練,視覺大模型做出來后反過來也可以加強(qiáng)大語言模型的能力,例如對圖片進(jìn)行問答,為下一步理解視覺打好基礎(chǔ)。
他認(rèn)為,視覺大模型是個垂類大模型,過去要訓(xùn)練一張照片是貓是狗,首先要做很多人工標(biāo)注,而且就算識別了是貓是狗,也是根據(jù)你標(biāo)注的圖像匹配出來的,它沒有理解是怎么回事,它也不知道狗是什么意思,貓是什么意思。所以,現(xiàn)在在大語言模型的基礎(chǔ)之上,它對自然語言能夠理解,在識別圖片過程中對這個圖片不僅做了物體的識別,還可以做很多語義的解讀。比如小孩兒站在一個很高的柜子上,或者老人躺在地板上,就可以識別出來不合理并進(jìn)行預(yù)警,這就是多模態(tài)的能力。
談及選擇AI跟硬件結(jié)合去做落地的原因,周鴻祎表示:“原來的AIoT只是垂直AI,不是通用AI,經(jīng)過大模型賦能的AIoT才是‘真AI’?!?/p>
過去的人工智能是弱人工智能,在此基礎(chǔ)上打造的智能硬件不具有真正的智能。大模型出現(xiàn)后,計算機(jī)第一次真正的理解這個世界,并能夠賦予AIoT真正的智能。他表示,大模型的出現(xiàn)標(biāo)志著通用人工智能到來,AI完成了從感知層到認(rèn)知層的進(jìn)化,不僅對傳統(tǒng)人工智能而言是一場顛覆性的革命,還能夠推動自動駕駛、蛋白質(zhì)計算、機(jī)器人控制等領(lǐng)域的發(fā)展。
“大模型將帶來一場新工業(yè)革命”,周鴻祎認(rèn)為,所有軟件、APP、網(wǎng)站,所有行業(yè)都值得用大模型進(jìn)行重塑,而智能硬件是硬件化的APP。從大模型的發(fā)展趨勢來看,多模態(tài)是大模型發(fā)展的必經(jīng)之路,GPT-4最重要的變化是擁有了多模態(tài)的處理能力。因此,周鴻祎預(yù)言,多模態(tài)大模型與物聯(lián)網(wǎng)的結(jié)合將會成為下一個風(fēng)口。
談AI安全問題:不發(fā)展才是最大的不安全
隨著GPT等AI技術(shù)的應(yīng)用,利用“AI換臉”“AI換聲”等虛假音視頻,進(jìn)行詐騙、誹謗的違法行為屢見不鮮。
周鴻祎認(rèn)為AI的安全問題必須重視,他說360現(xiàn)在也成立了內(nèi)部專門的AI安全團(tuán)隊,科技部也給了360一個AI安全的科技平臺,360承擔(dān)著解決AI的安全問題的使命,但是這個問題比一般的問題要復(fù)雜。一方面,AI把對普通人使用的要求降到最低,AI很容易被利用做壞事,所以如果要對抗,就要加大犯罪和反擊方面的成本,例如在AI作品里加入指紋等。另一方面,周鴻祎表示AI的安全問題不僅僅是這些,未來除了傳統(tǒng)的網(wǎng)絡(luò)安全之外,還要警惕數(shù)據(jù)安全和人工智能安全。因為可能未來AI會形成超強(qiáng)的AI能力,會產(chǎn)生意識和自我認(rèn)知。
那360為什么必須要做大模型呢?周鴻祎談到兩點:第一,不發(fā)展是最大的不安全,因為AI是一場工業(yè)革命,我們不能因為它有一些安全的問題就因噎廢食;第二,去做大模型的過程就是在了解它的原理和整個完整的過程,而不是把它當(dāng)作黑盒子,這樣才能在過程中提出更好的安全方案。
談及360布局大模型的整體思路和扮演的角色,周鴻祎表示360就做好兩件事:
第一,數(shù)字化的安全底座,360安全有比較成熟的方案,未來不光解決網(wǎng)絡(luò)安全,還要解決數(shù)據(jù)安全和人工智能安全。
第二,數(shù)字化時代,大模型是數(shù)字化的頂峰,是從數(shù)字化到智能化,因此這個時代誰沒有掌握大模型這一核心技術(shù),沒有大模型實際場景的使用,誰就會被行業(yè)淘汰掉,這就是工業(yè)革命,就像有了電、蒸汽機(jī)、電腦,基本上所有的業(yè)務(wù)都要重塑一遍。所以我們作為一家互聯(lián)網(wǎng)公司,有很多數(shù)字化的技術(shù)積累,所有的大數(shù)據(jù)最后都要用到大模型里。
談大模型與場景:沒有場景的大模型是沒有生命力的
周鴻祎認(rèn)為首先要把大模型的核心技術(shù)牢牢抓在自己手里,不僅要自己打造,也會跟伙伴合作;其次是要抓好場景,人工智能不是閉門造車,只有和用戶、場景結(jié)合才行,沒有場景的大模型是沒有生命力的。
他表示,360大模型應(yīng)用場景已經(jīng)很明確了,主要分為四路:一是,ToC消費者場景,主要是瀏覽器、桌面和搜索、手機(jī)瀏覽器等存量場景,圍繞著360智腦的核心能力打造每個人的個人助理,在這方面360得目標(biāo)是保證在前三名左右;二是,打造了一個SaaS商店,未來將升級成AI商店,面向生態(tài)伙伴開放大模型的API,提供給中小企業(yè)SaaS化服務(wù);三是,打造企業(yè)、政府和城市的專有GPT,未來不會只有一個大模型,公有大模型存在數(shù)據(jù)安全問題,專有或私有大模型更符合用戶場景;四是,攜手行業(yè)伙伴,打造行業(yè)的垂直GPT,例如企業(yè)咨詢行業(yè)的GPT、還有可以賦能IOT行業(yè)等。
談及大模型未來的發(fā)展,周鴻祎表示大模型未來一定是在小型化、輕量化、快速化,包括訓(xùn)練都在追求自動化。
“大模型這個市場很大,如果大家都說我要干掉你,你要干掉我,為了爭奪誰是中國的ChatGPT,那市場就很窄,如果把大模型用到垂直領(lǐng)域、行業(yè)領(lǐng)域、企業(yè)領(lǐng)域,其實對大模型的能力的要求反而是降低了?!敝茗櫟t提出,例如在法律、醫(yī)學(xué)、教育訓(xùn)練一個專門的GPT,這就比訓(xùn)練一個通用大模型要求降低很多。
周鴻祎最后表示:“GPT剛出來大家被震撼了一下,仔細(xì)冷靜下來思考,它要真正能夠變成生產(chǎn)力工具,能為我們所用,還是要走垂直化的路?!?/p>
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。