百川智能首款 AI 應(yīng)用主打懂搜索，但王小川不做搜索 2.0

本文作者：張進(jìn)

2024-05-27 14:09

導(dǎo)語(yǔ)：AI 助手是從 AI 工具到 AI 伙伴的一個(gè)過(guò)渡型產(chǎn)品。

「雷峰網(wǎng)」二十多年前，搜索引擎的發(fā)明極大地方便了人們獲取信息，很快搜索引擎便成為互聯(lián)網(wǎng)時(shí)代第一流量入口，谷歌、百度更是憑借搜索引擎在 PC 互聯(lián)網(wǎng)時(shí)代占據(jù)統(tǒng)治地位，成為兩大巨頭，多年以來(lái)，兩者在搜索方面的地位無(wú)人能撼動(dòng)。

ChatGPT 問(wèn)世后，OpenAI 背后金主微軟率先將 GPT 模型集成到旗下Bing 搜索引擎中，自此拉響了重塑搜索的警報(bào)。

看到機(jī)會(huì)，國(guó)內(nèi)外很快便出現(xiàn)了一批 AI 搜索產(chǎn)品，例如此前大火的Perplexity、秘塔、360 搜索、天工AI……可以說(shuō) 2023 年是 AI 搜索元年。

Perplexity、秘塔這些 AI 搜索產(chǎn)品他們應(yīng)該都做過(guò)同一個(gè)夢(mèng)：顛覆傳統(tǒng)搜索。

近日，大模型明星創(chuàng)業(yè)公司百川智能也發(fā)布了一款號(hào)稱“懂搜索”的 AI 助手「百小應(yīng)」。讓人頗受關(guān)注的是，百川智能創(chuàng)始人王小川，在上個(gè)互聯(lián)網(wǎng)時(shí)代因?yàn)樽龀隽怂压匪阉鞫暶笤耄朔刖执竽Ｐ蛣?chuàng)業(yè)，首款產(chǎn)品跟搜索相關(guān)，完全在情理之中，在大家的認(rèn)知里，如果在國(guó)內(nèi)選兩個(gè)最能做好AI搜索的人，其中一個(gè)必然是王小川。

但意料之外的是，王小川表示，百小應(yīng)不是對(duì)傳統(tǒng)搜索的升級(jí)，他不做搜索 2.0。

“大模型創(chuàng)造的是新物種，要讓 AI 從工具變成伙伴，而百小應(yīng)就是一款在模型能力有限的情況下從 AI 工具到 AI 伙伴的過(guò)渡型產(chǎn)品?！?/p>

在實(shí)踐上他也很知行合一，跟 Perplexity、秘塔這些用大模型提升AI搜索體驗(yàn)的產(chǎn)品不同，定位AI助手的百小應(yīng)是把搜索作為一個(gè)提升回答準(zhǔn)確性、豐富性的工具。

百小應(yīng)，一個(gè)懂搜索的AI助手

搜索不僅能讓大模型實(shí)時(shí)獲取最新信息，還能有效解決大模型的幻覺(jué)問(wèn)題，是大模型落地應(yīng)用的關(guān)鍵技術(shù)之一。

但如何在AI應(yīng)用，尤其是AI助手類產(chǎn)品中用好搜索，不同的企業(yè)卻有著不一樣的理解。在百川智能認(rèn)為，今天的 AI 搜索產(chǎn)品更多是搜索聚合，即把搜索結(jié)果做總結(jié)，但這樣是不夠的，從用戶體驗(yàn)的角度來(lái)看，AI助手需要能像人一樣掌握專業(yè)的搜索技能，利用好搜索這個(gè)工具，也就是“懂搜索”。

在此基礎(chǔ)上，還需要具備“會(huì)提問(wèn)”的能力，讓模型能清晰引導(dǎo)用戶表達(dá)自己的需求。傳統(tǒng)的搜索更多是通過(guò)關(guān)鍵詞去搜，無(wú)法理解關(guān)鍵詞背后用戶的獲取信息的意圖。今天通過(guò)大模型用自然語(yǔ)言去對(duì)話、交流，讓機(jī)器具備了理解我們的意圖的能力，但這個(gè)過(guò)程中很多時(shí)候用戶表達(dá)不清晰、不準(zhǔn)確，導(dǎo)致用戶對(duì)一些搜索結(jié)果仍然不滿意，對(duì)此「百小應(yīng)」可以通過(guò)提問(wèn)、反問(wèn)的方式去引導(dǎo)用戶將需求表達(dá)的更具體、清晰，進(jìn)而得到更準(zhǔn)確的結(jié)果。

為了能夠用好搜索工具，百川智能為「百小應(yīng)」打造了定向搜索、多輪搜索等能力，不僅讓「百小應(yīng)」能夠在與用戶的交流中自主思考是否需要調(diào)用搜索工具，還能主動(dòng)決策應(yīng)該采用哪種搜索行為。

例如問(wèn)「百小應(yīng)」“幫我找下《斗羅大陸IV終極斗羅》的資源？”，它能精準(zhǔn)定位你的問(wèn)題領(lǐng)域——電子書、有聲書、視頻領(lǐng)域，能直接訪問(wèn)權(quán)威網(wǎng)站，在網(wǎng)站中產(chǎn)生搜索，最后定位到拉看書網(wǎng)、有聲聽書網(wǎng)、嗶哩嗶哩，點(diǎn)鏈接就能進(jìn)入到網(wǎng)站：

百川智能首款 AI 應(yīng)用主打懂搜索，但王小川不做搜索 2.0

這是「百小應(yīng)」采用了定向搜索的策略，它搜索的時(shí)候不是泛泛的查找，而是直接查找與《斗羅大陸IV終極斗羅》資源最相關(guān)的網(wǎng)站。

面對(duì)復(fù)雜的問(wèn)題，人會(huì)根據(jù)之前的搜索回應(yīng)，進(jìn)行第二次、第三次甚至更多輪次的搜索，百小應(yīng)也擁有這種能力，針對(duì)用戶提出的問(wèn)題，「百小應(yīng)」在得到搜索結(jié)果之后會(huì)結(jié)合用戶的問(wèn)題進(jìn)行反思，自主判斷當(dāng)前資料是否足夠詳實(shí)，進(jìn)而自主決策是否需要進(jìn)行更多輪次搜索獲取更多信息。

百川智能首款 AI 應(yīng)用主打懂搜索，但王小川不做搜索 2.0

相比單輪搜索，在市場(chǎng)調(diào)研、產(chǎn)業(yè)分析等復(fù)雜場(chǎng)景下，多輪搜索能夠有效地獲取更專業(yè)、更有深度的信息。

在搜索結(jié)果呈現(xiàn)方面，「百小應(yīng)」同樣與其他在單次搜索后“簡(jiǎn)單總結(jié)網(wǎng)頁(yè)信息”的應(yīng)用不同，它是將搜索結(jié)果作為問(wèn)答的參考資料，將“搜索結(jié)果嵌入回答”，從而使回答更加清晰、飽滿。

例如讓「百小應(yīng)」分析“新能源汽車市場(chǎng)格局，小米入場(chǎng)后有什么影響”，它便會(huì)將搜索到的數(shù)據(jù)直接引用到回答當(dāng)中作為數(shù)據(jù)支撐的一部分：

百川智能首款 AI 應(yīng)用主打懂搜索，但王小川不做搜索 2.0

在會(huì)提問(wèn)方面，百小應(yīng)能夠在用戶問(wèn)題的基礎(chǔ)上通過(guò)一系列提問(wèn)來(lái)幫助用戶明確自身需求。例如問(wèn)「百小應(yīng)」“車門打不開了怎么辦？”，它會(huì)先問(wèn)你車的品牌以及型號(hào)，是車內(nèi)打不開還是車外打不開？你告訴它車品牌型號(hào)和車內(nèi)打不開之后，它會(huì)針對(duì)性的告訴你正確的開鎖方法：

百川智能首款 AI 應(yīng)用主打懂搜索，但王小川不做搜索 2.0

「百小應(yīng)」還非常具有“理科”思維，很擅長(zhǎng)將結(jié)果結(jié)構(gòu)化呈現(xiàn)，如下圖：

百川智能首款 AI 應(yīng)用主打懂搜索，但王小川不做搜索 2.0

除了懂搜索和反問(wèn)功能以外，用戶還能在「百小應(yīng)」中上傳PDF、word文檔，或者直接輸入網(wǎng)頁(yè)鏈接（URL），閱讀并分析書籍、報(bào)告、學(xué)術(shù)論文等長(zhǎng)篇內(nèi)容，僅用一分鐘便能讀完上市公司財(cái)報(bào)：

百川智能首款 AI 應(yīng)用主打懂搜索，但王小川不做搜索 2.0

用戶在提問(wèn)的同時(shí)還可以同步上傳圖片，對(duì)圖片內(nèi)容進(jìn)行解讀，或者將圖片作為補(bǔ)充材料，獲取更精準(zhǔn)的回答；并且，它還支持用戶通過(guò)語(yǔ)音的方式進(jìn)行交互。

王小川認(rèn)為，如Perplexity、秘塔這些產(chǎn)品做的都是搜索總結(jié)類的工作，搜索引擎公司自己就能干。如果只是搜索結(jié)果的總結(jié)，就只是對(duì)傳統(tǒng)搜索的升級(jí)，在價(jià)值創(chuàng)造和競(jìng)爭(zhēng)力上，無(wú)法跟傳統(tǒng)搜索大廠競(jìng)爭(zhēng)，這不是今天創(chuàng)業(yè)公司或朝著 AI 伙伴前進(jìn)路上 AI助手應(yīng)該做的事。

“AI 助手正確的路徑是嵌入搜索結(jié)果，而不是總結(jié)搜索結(jié)果，要把搜索結(jié)果作為觀點(diǎn)、論點(diǎn)、論證，跟模型的結(jié)果融合在一起?！?/p>

這種判斷背后是王小川對(duì)大模型時(shí)代的超級(jí)應(yīng)用的思考，他認(rèn)為，要讓大模型像人一樣思考，超級(jí)應(yīng)用應(yīng)該朝著伙伴方向走。

大模型時(shí)代，王小川眼里的超級(jí)應(yīng)用？

從創(chuàng)立之初，王小川就一直提百川要有自己的超級(jí)應(yīng)用。

相比互聯(lián)網(wǎng)時(shí)代動(dòng)輒上億用戶的應(yīng)用，當(dāng)下一個(gè)擁有 100 億 DAU 的 AI 產(chǎn)品就能引起轟動(dòng)，但王小川認(rèn)為現(xiàn)在超級(jí)應(yīng)用還未出現(xiàn)，從用戶體量上看還得再提升兩個(gè)數(shù)量級(jí)，DAU 達(dá)到 3 千萬(wàn)到 3 億之間才能稱之為超級(jí)應(yīng)用。

“當(dāng)下最火的兩款應(yīng)用，微信擁有 13 億+DAU，抖音擁有 4 億+DAU，大模型時(shí)代的超級(jí)應(yīng)用應(yīng)該是如抖音這樣的一個(gè)產(chǎn)品。”

過(guò)去做輸入法、搜索引擎、瀏覽器的經(jīng)歷，讓百川智能知道一個(gè)應(yīng)用到什么程度才會(huì)變成一個(gè)被廣泛使用的產(chǎn)品。

如果「百小應(yīng)」要成為一個(gè)超級(jí)應(yīng)用，王小川認(rèn)為應(yīng)該具備以下特點(diǎn)：

首先，模型能力能達(dá)到 60%-80% 的可靠性，未來(lái)模型一定要和搜索做結(jié)合，因?yàn)槟Ｐ褪且粋€(gè)推理引擎，有了搜索之后，它的知識(shí)的廣泛程度和真實(shí)度都能得到提升。

第二，作為助手能充分理解用戶的意圖，變成某個(gè)行業(yè)的專業(yè)人士一樣。AI 能像人一樣思考、工作、學(xué)習(xí)，最后就會(huì)變成一個(gè)職業(yè)人士，例如法律助手、醫(yī)療助手。

接下來(lái)，對(duì)于「百小應(yīng)」王小川稱并不會(huì)通過(guò)營(yíng)銷戰(zhàn)術(shù)去宣傳，他認(rèn)為一些廠商發(fā)產(chǎn)品可能是為了拉融資，這不是一種健康的方式，百川會(huì)把精力放在打磨產(chǎn)品、發(fā)掘產(chǎn)品價(jià)值上，做出真正好的產(chǎn)品。

百川的“雙輪驅(qū)動(dòng)”

“超級(jí)模型+超級(jí)應(yīng)用”的雙輪驅(qū)動(dòng)一直是百川智能的發(fā)展理念。而此次「百小應(yīng)」發(fā)布，剛好補(bǔ)齊了應(yīng)用上的拼圖，百川智能可以算是真正走到“雙輪驅(qū)動(dòng)”的路上。

雖然現(xiàn)在既沒(méi)到超級(jí)模型，也沒(méi)到超級(jí)應(yīng)用，即便「百小應(yīng)」還只是一個(gè)過(guò)渡型的產(chǎn)品，但王小川稱團(tuán)隊(duì)心中有超級(jí)應(yīng)用的畫面感，尤其是從去年4月份工作到今年5月份這一年的時(shí)間，團(tuán)隊(duì)有足夠的手感。

超級(jí)應(yīng)用的誕生，最根本還是要看模型能力。

在模型基礎(chǔ)能力層面，百川智能一直在持續(xù)升級(jí)。此次跟「百小應(yīng)」一起發(fā)布的還有 Baichuan 4大模型，作為百川智能發(fā)布的最新一代基座大模型，Baichuan 4相較上一代大模型Baichuan 3在各項(xiàng)能力上均有顯著提升。其中通用能力超過(guò) 10%，指令跟隨提升20%，信息理解提升9%，知識(shí)問(wèn)答提升15%，創(chuàng)作提升16%，邏輯推理提升15%；專項(xiàng)能力方面，數(shù)學(xué)提升14%，代碼提升9%。

此外，在國(guó)內(nèi)權(quán)威大模型評(píng)測(cè)機(jī)構(gòu)SuperCLUE的評(píng)測(cè)中，Baichuan 4模型能力國(guó)內(nèi)第一。而此前，在 SpuerCLUE 發(fā)布的“中文大模型基準(zhǔn)測(cè)評(píng)2024年4月報(bào)告中”，Baichuan 3就已經(jīng)以73.32分的成績(jī)超越文心一言4.0、通義千問(wèn)2.1、GLM 4、Moonshot等大模型，摘得了國(guó)內(nèi)大模型排名的頭籌。

百川智能首款 AI 應(yīng)用主打懂搜索，但王小川不做搜索 2.0

不僅如此，與國(guó)外主流大模型對(duì)比，Baichuan 4在知識(shí)百科、長(zhǎng)文本、生成創(chuàng)作等文科類中文任務(wù)上明顯優(yōu)于國(guó)外大模型。

百川智能首款 AI 應(yīng)用主打懂搜索，但王小川不做搜索 2.0

「雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))」Baichuan 4能在短時(shí)間內(nèi)取得模型能力的突破，源于其在訓(xùn)練過(guò)程中引入了諸多業(yè)內(nèi)領(lǐng)先的技術(shù)優(yōu)化手段。例如，在預(yù)訓(xùn)練階段采用了基于Model-based+Human-based的協(xié)同數(shù)據(jù)篩選優(yōu)化方法，以及對(duì)長(zhǎng)文本建模位置編碼科學(xué)的Scaling Law，有效提升了模型對(duì)數(shù)據(jù)的利用；在對(duì)齊階段重點(diǎn)優(yōu)化了模型Reasoning、Planning、Instruct following能力，通過(guò)loss驅(qū)動(dòng)的數(shù)據(jù)選取與訓(xùn)練，多階段爬坡，多模型參數(shù)融合等方式有效提升了模型的關(guān)鍵指標(biāo)和穩(wěn)定性。同時(shí)突破RLHF和RLAIF融合的RLxF強(qiáng)化學(xué)習(xí)對(duì)齊技術(shù)，大幅提升模型的指令遵循等能力。

此外，Baichuan 4在多模態(tài)領(lǐng)域也取得了不錯(cuò)的成績(jī)，在MMMU、MMBench-EN、CMMMU、MMBench-CN、MathVista等評(píng)測(cè)基準(zhǔn)上表現(xiàn)優(yōu)異，大幅領(lǐng)先Gemini Pro、Claude3-sonnet等多模態(tài)模型。

百川智能首款 AI 應(yīng)用主打懂搜索，但王小川不做搜索 2.0

同時(shí)，為了讓更多開發(fā)者、企業(yè)用戶能夠像「百小應(yīng)」一樣更好的使用百川大模型的能力，百川智能推出了全新的 MaaS+AaaS 服務(wù)。

MaaS 版塊由基座模型組成，并且在綜合了成本和性能的考量下將 API 分為旗艦版和專業(yè)版。旗艦版將全量開放 Baichuan 4 的各項(xiàng)能力。此前，在 SuperCLUE 的金融知識(shí)百科能力上 Baichuan 3 就已取得了A+的最高評(píng)級(jí)，升級(jí)之后的 Baichuan 4 則更強(qiáng)。

專業(yè)版包含 Baichuan3-Turbo 和 Baichuan3-Turbo-192K 兩款模型，在價(jià)格方面相比旗艦版 Baichuan 4 更實(shí)惠，且均針對(duì)企業(yè)用的高頻場(chǎng)景進(jìn)行了針對(duì)性優(yōu)化，綜合測(cè)試相比 GPT3.5 整體效果提升 8.9%。

百川還在 Baichuan 4 基礎(chǔ)上針對(duì) Agent 構(gòu)建推出 Assitant API，隨著大模型的應(yīng)用在各領(lǐng)域持續(xù)深入，Agent 已經(jīng)成為企業(yè)的關(guān)注重點(diǎn)。在此背景下，百川智能對(duì)模型的工具調(diào)用能力進(jìn)行了特殊強(qiáng)化，不僅支持 Code interpreter、RAG 內(nèi)建工具，還支持自定義工具調(diào)用，方便企業(yè)接入各種豐富復(fù)雜的 API。評(píng)測(cè)結(jié)果顯示其工具調(diào)用能力接近Open AI assistant API。

百川本次發(fā)布的Assitant API現(xiàn)已正式開啟內(nèi)測(cè)邀請(qǐng)，感興趣的用戶均可申請(qǐng)免費(fèi)試用。地址：https://platform.baichuan-ai.com/docs/assistants。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。