0
本文作者: 何思思 | 2023-04-23 10:32 |
四月可謂是AI月,準(zhǔn)確的說(shuō)應(yīng)該是“大模型”月。
這個(gè)月,最忙的非大模型廠商莫屬了,先是新公司官宣的消息頻出:諸如王慧文新公司光年之外正式開(kāi)張,王小川五季智能申請(qǐng)AI大模型“百川智能”商標(biāo)...后是緊鑼密鼓的發(fā)布大模型:阿里巴巴發(fā)布通義千問(wèn)大模型,騰訊推出混元,商湯發(fā)布日日新...
雷峰網(wǎng)獲悉,4月20日,出門問(wèn)問(wèn)內(nèi)測(cè)探索了“序列猴子”大模型。同時(shí),還推出了面向C端的升級(jí)版語(yǔ)音助手魔法小問(wèn),面向B端的企業(yè)專屬大模型。其中,面向創(chuàng)作者還發(fā)布了包含AI寫(xiě)作平臺(tái)“奇妙文”、AI繪畫(huà)平臺(tái)“言之畫(huà)”、AI配音平臺(tái)“魔音工坊”、數(shù)字人視頻與直播平臺(tái)“奇妙元”在內(nèi)的四款A(yù)IGC產(chǎn)品。
較“通義千問(wèn)”、“日日新”、“混元”等,序列猴子這個(gè)名字顯得特殊的多。
對(duì)此,出門問(wèn)問(wèn)創(chuàng)始人兼CEO李志飛解釋道,“序列猴子”名字的的靈感,來(lái)源于數(shù)學(xué)家埃米爾·波雷爾在20世紀(jì)初提出的“無(wú)限猴子”定理。即如果一群猴子隨機(jī)地敲打一臺(tái)打字機(jī),最終一定會(huì)產(chǎn)生完整的莎士比亞作品。這個(gè)定理基于概率論和組合數(shù)學(xué),闡釋了概率的統(tǒng)一性。出門問(wèn)問(wèn)自研大模型的構(gòu)建原理與“無(wú)限猴子”類似,海量文本序列通過(guò)出門問(wèn)問(wèn)自主算法的不斷訓(xùn)練,經(jīng)由大規(guī)模算力消化理解,便練成了“序列猴子”。
如今,大模型的熱度早已不言而喻,ChatGPT火了之后,國(guó)內(nèi)各企業(yè)都在追大模型的風(fēng)口,但想要做成并非一件易事。
據(jù)李志飛介紹,他早在2020年6月就開(kāi)始了大模型的研究,并于2021年推出了UCLAI大模型,參數(shù)在60萬(wàn)左右,效果并不理想。但幸運(yùn)的是,隨后的1年多時(shí)間里,出門問(wèn)問(wèn)在此基礎(chǔ)上推出了很多AIGC應(yīng)用,為大模型開(kāi)拓落地場(chǎng)景打下了良好基礎(chǔ)。2022年10份出門問(wèn)問(wèn)重啟大模型研究。
時(shí)隔半年時(shí)間,出門問(wèn)問(wèn)大模型“序列猴子”亮相。雷峰網(wǎng)了解到,和之前的大模型相比,序列猴子是一款具備多模態(tài)生成能力的大語(yǔ)言模型,模型以語(yǔ)言為核心的能力體系涵蓋“知識(shí)、對(duì)話、數(shù)學(xué)、邏輯、推理、規(guī)劃”六個(gè)維度,能夠同時(shí)支持文字生成、圖片生成、3D內(nèi)容生成、語(yǔ)音生成和語(yǔ)音識(shí)別等不同任務(wù)。
李志飛表示,大模型不只是參數(shù)量大,當(dāng)今的大模型是互聯(lián)網(wǎng)文本的深度建模,而互聯(lián)網(wǎng)文本是世界知識(shí)的映射,因此大模型是一個(gè)認(rèn)知模型,是對(duì)語(yǔ)言的建模。而語(yǔ)言是思維的邊界,所以大模型擁有無(wú)限想象空間?!靶蛄泻镒印痹谟?xùn)練過(guò)程中已經(jīng)展現(xiàn)出了“涌現(xiàn)”能力,目前正處于“頓悟”階段,未來(lái)提升的速度會(huì)越來(lái)越快。
發(fā)布會(huì)現(xiàn)場(chǎng),李志飛也進(jìn)行了多輪demo演示,比如“湖北哪個(gè)省的人口最多,廣州和新疆的人口總和是多少?張鵬的前公司是哪家?現(xiàn)公司是哪家?”等等,對(duì)于這些需要上下文語(yǔ)義理解甚至需要邏輯推理的問(wèn)題,大模型序列猴子都能給出相對(duì)準(zhǔn)確的答案。
但和其他大模型一樣,序列猴子也不可避免的會(huì)出現(xiàn)“一本正經(jīng)胡說(shuō)八道”的現(xiàn)象,比如在“奇妙文”demo演示環(huán)節(jié)中,輸入“智慧、AI、科技”等關(guān)鍵詞,并沒(méi)有生成相關(guān)的概念圖片。
李志飛坦言,不同時(shí)間段問(wèn)相同的問(wèn)題,會(huì)得到不同的答案,這是很普遍的,至于不準(zhǔn)確的答案或者生不成的問(wèn)題,主要在于“序列猴子”大模型的語(yǔ)料來(lái)自互聯(lián)網(wǎng),仍需要不斷調(diào)優(yōu)訓(xùn)練?!?/p>
同時(shí),李志飛也給序列猴子模型評(píng)了分——“50分”。雖然還沒(méi)有達(dá)到及格線,但他顯得極為樂(lè)觀,他表示,序列猴子雖然只有50分,大家應(yīng)該意識(shí)到現(xiàn)在的大模型不再像上一代的AI能力有限,它已具備基本的邏輯推理能力,每次都能給人驚喜。他強(qiáng)調(diào),大模型的訓(xùn)練要循序漸進(jìn),不要一上來(lái)就搞“應(yīng)試教育”,大模型的能力很快會(huì)到80分,但是要從80分做到90分以上,會(huì)是非常難的事情。
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))了解到,目前出門問(wèn)問(wèn)已經(jīng)與包括汽車、教育、律所、金融、醫(yī)療、旅游等在內(nèi)的多個(gè)行業(yè)的內(nèi)測(cè)探索伙伴達(dá)成了合作。
“我的初心不是做中國(guó)版OpenAI,而是去造一個(gè)大模型,理解這個(gè)大模型,然后把他用起來(lái)”李志飛坦言。
此次發(fā)布會(huì)上,基于序列猴子,出門問(wèn)問(wèn)還推出了多款面向創(chuàng)作者的AIGC產(chǎn)品及應(yīng)用。
其中“奇妙文”主打AI寫(xiě)作助理,其AI寫(xiě)作能力已經(jīng)覆蓋了職場(chǎng)辦公、市場(chǎng)營(yíng)銷、新媒體和創(chuàng)意寫(xiě)作四大內(nèi)容創(chuàng)作場(chǎng)景,能夠在用戶撰寫(xiě)年終總結(jié)、客服話術(shù)、劇本、廣告文案等內(nèi)容時(shí),為其源源不斷地提供靈感和創(chuàng)意方向。此外,在寫(xiě)作中還能自動(dòng)生成圖片,為用戶帶來(lái)圖文并茂的寫(xiě)作體驗(yàn)。
言之畫(huà)主打AI繪畫(huà)助理的角色,其支持二次元、蒸汽朋克、插畫(huà)等8種創(chuàng)作風(fēng)格。用戶只需輸入文字,“言之畫(huà)”就能一次性生成8張光影逼真、細(xì)節(jié)豐富的2K高分辨率圖像。除了以文生圖,它還擁有以圖生圖、動(dòng)圖生成、個(gè)性頭像生成等AI繪圖能力,極大豐富了用戶的創(chuàng)作手段。對(duì)于企業(yè)用戶,“言之畫(huà)”還支持專屬模型定制,讓企業(yè)用戶能夠根據(jù)自身需要自定義模型風(fēng)格,并且支持多人協(xié)作生產(chǎn),更好地滿足企業(yè)的繪圖需要。
魔音工坊主打AI配音助理,其是一款全球領(lǐng)先的全流程一站式AI配音平臺(tái),已向用戶開(kāi)放了超1000種音色、超2000種聲音風(fēng)格、40國(guó)語(yǔ)言和11種方言。在大模型技術(shù)的加持下,“魔音工坊”是全球首款搭載了大模型AI寫(xiě)作功能的配音平臺(tái),覆蓋了AI寫(xiě)作、AI配音和剪輯等多個(gè)場(chǎng)景。用戶可以在它的輔助下輕松完成影視解說(shuō)、有聲書(shū)、在線教育、新聞播報(bào)等集文案與配音于一體的內(nèi)容創(chuàng)作。
奇妙元主打AI數(shù)字分身,其現(xiàn)有超100款數(shù)字人、超1000款3D數(shù)字資產(chǎn)、超1000種聲音。憑借多模態(tài)生成技術(shù),“奇妙元”平臺(tái)目前共支持圖片建模(2D數(shù)字人)、視頻建模(2.5D數(shù)字人)、3D建模 (3D數(shù)字人)三種不同形式的數(shù)字人生成。其形象克隆功能,僅需一段5分鐘的真人視頻素材,就可以1:1復(fù)刻用戶的形象神態(tài),為用戶打造聲音一致、動(dòng)作自然的數(shù)字人分身。
對(duì)于,大模型在C端還是B端更容易接受或者普遍使用,李志飛表示,首先是創(chuàng)作者,然后是B端,最后是C端。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。