0
本文作者: 張進(jìn) | 2024-05-27 14:09 |
「雷峰網(wǎng)(公眾號:雷峰網(wǎng))」二十多年前,搜索引擎的發(fā)明極大地方便了人們獲取信息,很快搜索引擎便成為互聯(lián)網(wǎng)時(shí)代第一流量入口,谷歌、百度更是憑借搜索引擎在 PC 互聯(lián)網(wǎng)時(shí)代占據(jù)統(tǒng)治地位,成為兩大巨頭,多年以來,兩者在搜索方面的地位無人能撼動。
ChatGPT 問世后,OpenAI 背后金主微軟率先將 GPT 模型集成到旗下Bing 搜索引擎中,自此拉響了重塑搜索的警報(bào)。
看到機(jī)會,國內(nèi)外很快便出現(xiàn)了一批 AI 搜索產(chǎn)品,例如此前大火的Perplexity、秘塔、360 搜索、天工AI……可以說 2023 年是 AI 搜索元年。
Perplexity、秘塔這些 AI 搜索產(chǎn)品他們應(yīng)該都做過同一個(gè)夢:顛覆傳統(tǒng)搜索。
近日,大模型明星創(chuàng)業(yè)公司百川智能也發(fā)布了一款號稱“懂搜索”的 AI 助手「百小應(yīng)」。讓人頗受關(guān)注的是,百川智能創(chuàng)始人王小川,在上個(gè)互聯(lián)網(wǎng)時(shí)代因?yàn)樽龀隽怂压匪阉鞫暶笤?,此番入局大模型?chuàng)業(yè),首款產(chǎn)品跟搜索相關(guān),完全在情理之中,在大家的認(rèn)知里,如果在國內(nèi)選兩個(gè)最能做好AI搜索的人,其中一個(gè)必然是王小川。
但意料之外的是,王小川表示,百小應(yīng)不是對傳統(tǒng)搜索的升級,他不做搜索 2.0。
“大模型創(chuàng)造的是新物種,要讓 AI 從工具變成伙伴,而百小應(yīng)就是一款在模型能力有限的情況下從 AI 工具到 AI 伙伴的過渡型產(chǎn)品?!?/p>
在實(shí)踐上他也很知行合一,跟 Perplexity、秘塔這些用大模型提升AI搜索體驗(yàn)的產(chǎn)品不同,定位AI助手的百小應(yīng)是把搜索作為一個(gè)提升回答準(zhǔn)確性、豐富性的工具。
搜索不僅能讓大模型實(shí)時(shí)獲取最新信息,還能有效解決大模型的幻覺問題,是大模型落地應(yīng)用的關(guān)鍵技術(shù)之一。
但如何在AI應(yīng)用,尤其是AI助手類產(chǎn)品中用好搜索,不同的企業(yè)卻有著不一樣的理解。在百川智能認(rèn)為,今天的 AI 搜索產(chǎn)品更多是搜索聚合,即把搜索結(jié)果做總結(jié),但這樣是不夠的,從用戶體驗(yàn)的角度來看,AI助手需要能像人一樣掌握專業(yè)的搜索技能,利用好搜索這個(gè)工具,也就是“懂搜索”。
在此基礎(chǔ)上,還需要具備“會提問”的能力,讓模型能清晰引導(dǎo)用戶表達(dá)自己的需求。傳統(tǒng)的搜索更多是通過關(guān)鍵詞去搜,無法理解關(guān)鍵詞背后用戶的獲取信息的意圖。今天通過大模型用自然語言去對話、交流,讓機(jī)器具備了理解我們的意圖的能力,但這個(gè)過程中很多時(shí)候用戶表達(dá)不清晰、不準(zhǔn)確,導(dǎo)致用戶對一些搜索結(jié)果仍然不滿意,對此「百小應(yīng)」可以通過提問、反問的方式去引導(dǎo)用戶將需求表達(dá)的更具體、清晰,進(jìn)而得到更準(zhǔn)確的結(jié)果。
為了能夠用好搜索工具,百川智能為「百小應(yīng)」打造了定向搜索、多輪搜索等能力,不僅讓「百小應(yīng)」能夠在與用戶的交流中自主思考是否需要調(diào)用搜索工具,還能主動決策應(yīng)該采用哪種搜索行為。
例如問「百小應(yīng)」“幫我找下《斗羅大陸IV終極斗羅》的資源?”,它能精準(zhǔn)定位你的問題領(lǐng)域——電子書、有聲書、視頻領(lǐng)域,能直接訪問權(quán)威網(wǎng)站,在網(wǎng)站中產(chǎn)生搜索,最后定位到拉看書網(wǎng)、有聲聽書網(wǎng)、嗶哩嗶哩,點(diǎn)鏈接就能進(jìn)入到網(wǎng)站:
這是「百小應(yīng)」采用了定向搜索的策略,它搜索的時(shí)候不是泛泛的查找,而是直接查找與《斗羅大陸IV終極斗羅》資源最相關(guān)的網(wǎng)站。
面對復(fù)雜的問題,人會根據(jù)之前的搜索回應(yīng),進(jìn)行第二次、第三次甚至更多輪次的搜索,百小應(yīng)也擁有這種能力,針對用戶提出的問題,「百小應(yīng)」在得到搜索結(jié)果之后會結(jié)合用戶的問題進(jìn)行反思,自主判斷當(dāng)前資料是否足夠詳實(shí),進(jìn)而自主決策是否需要進(jìn)行更多輪次搜索獲取更多信息。
相比單輪搜索,在市場調(diào)研、產(chǎn)業(yè)分析等復(fù)雜場景下,多輪搜索能夠有效地獲取更專業(yè)、更有深度的信息。
在搜索結(jié)果呈現(xiàn)方面,「百小應(yīng)」同樣與其他在單次搜索后“簡單總結(jié)網(wǎng)頁信息”的應(yīng)用不同,它是將搜索結(jié)果作為問答的參考資料,將“搜索結(jié)果嵌入回答”,從而使回答更加清晰、飽滿。
例如讓「百小應(yīng)」分析“新能源汽車市場格局,小米入場后有什么影響”,它便會將搜索到的數(shù)據(jù)直接引用到回答當(dāng)中作為數(shù)據(jù)支撐的一部分:
在會提問方面,百小應(yīng)能夠在用戶問題的基礎(chǔ)上通過一系列提問來幫助用戶明確自身需求。例如問「百小應(yīng)」“車門打不開了怎么辦?”,它會先問你車的品牌以及型號,是車內(nèi)打不開還是車外打不開?你告訴它車品牌型號和車內(nèi)打不開之后,它會針對性的告訴你正確的開鎖方法:
「百小應(yīng)」還非常具有“理科”思維,很擅長將結(jié)果結(jié)構(gòu)化呈現(xiàn),如下圖:
除了懂搜索和反問功能以外,用戶還能在「百小應(yīng)」中上傳PDF、word文檔,或者直接輸入網(wǎng)頁鏈接(URL),閱讀并分析書籍、報(bào)告、學(xué)術(shù)論文等長篇內(nèi)容,僅用一分鐘便能讀完上市公司財(cái)報(bào):
用戶在提問的同時(shí)還可以同步上傳圖片,對圖片內(nèi)容進(jìn)行解讀,或者將圖片作為補(bǔ)充材料,獲取更精準(zhǔn)的回答;并且,它還支持用戶通過語音的方式進(jìn)行交互。
王小川認(rèn)為,如Perplexity、秘塔這些產(chǎn)品做的都是搜索總結(jié)類的工作,搜索引擎公司自己就能干。如果只是搜索結(jié)果的總結(jié),就只是對傳統(tǒng)搜索的升級,在價(jià)值創(chuàng)造和競爭力上,無法跟傳統(tǒng)搜索大廠競爭,這不是今天創(chuàng)業(yè)公司或朝著 AI 伙伴前進(jìn)路上 AI助手應(yīng)該做的事。
“AI 助手正確的路徑是嵌入搜索結(jié)果,而不是總結(jié)搜索結(jié)果,要把搜索結(jié)果作為觀點(diǎn)、論點(diǎn)、論證,跟模型的結(jié)果融合在一起。”
這種判斷背后是王小川對大模型時(shí)代的超級應(yīng)用的思考,他認(rèn)為,要讓大模型像人一樣思考,超級應(yīng)用應(yīng)該朝著伙伴方向走。
從創(chuàng)立之初,王小川就一直提百川要有自己的超級應(yīng)用。
相比互聯(lián)網(wǎng)時(shí)代動輒上億用戶的應(yīng)用,當(dāng)下一個(gè)擁有 100 億 DAU 的 AI 產(chǎn)品就能引起轟動,但王小川認(rèn)為現(xiàn)在超級應(yīng)用還未出現(xiàn),從用戶體量上看還得再提升兩個(gè)數(shù)量級,DAU 達(dá)到 3 千萬到 3 億之間才能稱之為超級應(yīng)用。
“當(dāng)下最火的兩款應(yīng)用,微信擁有 13 億+DAU,抖音擁有 4 億+DAU,大模型時(shí)代的超級應(yīng)用應(yīng)該是如抖音這樣的一個(gè)產(chǎn)品?!?/p>
過去做輸入法、搜索引擎、瀏覽器的經(jīng)歷,讓百川智能知道一個(gè)應(yīng)用到什么程度才會變成一個(gè)被廣泛使用的產(chǎn)品。
如果「百小應(yīng)」要成為一個(gè)超級應(yīng)用,王小川認(rèn)為應(yīng)該具備以下特點(diǎn):
首先,模型能力能達(dá)到 60%-80% 的可靠性,未來模型一定要和搜索做結(jié)合,因?yàn)槟P褪且粋€(gè)推理引擎,有了搜索之后,它的知識的廣泛程度和真實(shí)度都能得到提升。
第二,作為助手能充分理解用戶的意圖,變成某個(gè)行業(yè)的專業(yè)人士一樣。AI 能像人一樣思考、工作、學(xué)習(xí),最后就會變成一個(gè)職業(yè)人士,例如法律助手、醫(yī)療助手。
接下來,對于「百小應(yīng)」王小川稱并不會通過營銷戰(zhàn)術(shù)去宣傳,他認(rèn)為一些廠商發(fā)產(chǎn)品可能是為了拉融資,這不是一種健康的方式,百川會把精力放在打磨產(chǎn)品、發(fā)掘產(chǎn)品價(jià)值上,做出真正好的產(chǎn)品。
“超級模型+超級應(yīng)用”的雙輪驅(qū)動一直是百川智能的發(fā)展理念。而此次「百小應(yīng)」發(fā)布,剛好補(bǔ)齊了應(yīng)用上的拼圖,百川智能可以算是真正走到“雙輪驅(qū)動”的路上。
雖然現(xiàn)在既沒到超級模型,也沒到超級應(yīng)用,即便「百小應(yīng)」還只是一個(gè)過渡型的產(chǎn)品,但王小川稱團(tuán)隊(duì)心中有超級應(yīng)用的畫面感,尤其是從去年4月份工作到今年5月份這一年的時(shí)間,團(tuán)隊(duì)有足夠的手感。
超級應(yīng)用的誕生,最根本還是要看模型能力。
在模型基礎(chǔ)能力層面,百川智能一直在持續(xù)升級。此次跟「百小應(yīng)」一起發(fā)布的還有 Baichuan 4大模型,作為百川智能發(fā)布的最新一代基座大模型,Baichuan 4相較上一代大模型Baichuan 3在各項(xiàng)能力上均有顯著提升。其中通用能力超過 10%,指令跟隨提升20%,信息理解提升9%,知識問答提升15%,創(chuàng)作提升16%,邏輯推理提升15%;專項(xiàng)能力方面,數(shù)學(xué)提升14%,代碼提升9%。
此外,在國內(nèi)權(quán)威大模型評測機(jī)構(gòu)SuperCLUE的評測中,Baichuan 4模型能力國內(nèi)第一。而此前,在 SpuerCLUE 發(fā)布的“中文大模型基準(zhǔn)測評2024年4月報(bào)告中”,Baichuan 3就已經(jīng)以73.32分的成績超越文心一言4.0、通義千問2.1、GLM 4、Moonshot等大模型,摘得了國內(nèi)大模型排名的頭籌。
不僅如此,與國外主流大模型對比,Baichuan 4在知識百科、長文本、生成創(chuàng)作等文科類中文任務(wù)上明顯優(yōu)于國外大模型。
「雷峰網(wǎng)」Baichuan 4能在短時(shí)間內(nèi)取得模型能力的突破,源于其在訓(xùn)練過程中引入了諸多業(yè)內(nèi)領(lǐng)先的技術(shù)優(yōu)化手段。例如,在預(yù)訓(xùn)練階段采用了基于Model-based+Human-based的協(xié)同數(shù)據(jù)篩選優(yōu)化方法,以及對長文本建模位置編碼科學(xué)的Scaling Law,有效提升了模型對數(shù)據(jù)的利用;在對齊階段重點(diǎn)優(yōu)化了模型Reasoning、Planning、Instruct following能力,通過loss驅(qū)動的數(shù)據(jù)選取與訓(xùn)練,多階段爬坡,多模型參數(shù)融合等方式有效提升了模型的關(guān)鍵指標(biāo)和穩(wěn)定性。同時(shí)突破RLHF和RLAIF融合的RLxF強(qiáng)化學(xué)習(xí)對齊技術(shù),大幅提升模型的指令遵循等能力。
此外,Baichuan 4在多模態(tài)領(lǐng)域也取得了不錯(cuò)的成績,在MMMU、MMBench-EN、CMMMU、MMBench-CN、MathVista等評測基準(zhǔn)上表現(xiàn)優(yōu)異,大幅領(lǐng)先Gemini Pro、Claude3-sonnet等多模態(tài)模型。
同時(shí),為了讓更多開發(fā)者、企業(yè)用戶能夠像「百小應(yīng)」一樣更好的使用百川大模型的能力,百川智能推出了全新的 MaaS+AaaS 服務(wù)。
MaaS 版塊由基座模型組成,并且在綜合了成本和性能的考量下將 API 分為旗艦版和專業(yè)版。旗艦版將全量開放 Baichuan 4 的各項(xiàng)能力。此前,在 SuperCLUE 的金融知識百科能力上 Baichuan 3 就已取得了A+的最高評級,升級之后的 Baichuan 4 則更強(qiáng)。
專業(yè)版包含 Baichuan3-Turbo 和 Baichuan3-Turbo-192K 兩款模型,在價(jià)格方面相比旗艦版 Baichuan 4 更實(shí)惠,且均針對企業(yè)用的高頻場景進(jìn)行了針對性優(yōu)化,綜合測試相比 GPT3.5 整體效果提升 8.9%。
百川還在 Baichuan 4 基礎(chǔ)上針對 Agent 構(gòu)建推出 Assitant API,隨著大模型的應(yīng)用在各領(lǐng)域持續(xù)深入,Agent 已經(jīng)成為企業(yè)的關(guān)注重點(diǎn)。在此背景下,百川智能對模型的工具調(diào)用能力進(jìn)行了特殊強(qiáng)化,不僅支持 Code interpreter、RAG 內(nèi)建工具,還支持自定義工具調(diào)用,方便企業(yè)接入各種豐富復(fù)雜的 API。評測結(jié)果顯示其工具調(diào)用能力接近Open AI assistant API。
百川本次發(fā)布的Assitant API現(xiàn)已正式開啟內(nèi)測邀請,感興趣的用戶均可申請免費(fèi)試用。地址:https://platform.baichuan-ai.com/docs/assistants。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。