0
【雷峰網(wǎng)(公眾號:雷峰網(wǎng))】近日,大模型獨角獸零一萬物又開發(fā)布會了!
上次零一萬物(以下簡稱“零一”)開發(fā)布會還是在 2023 年 11 月,宣布成立后的模型首秀:發(fā)布中英雙語大模型“Yi”,并將其開源。
這一次,時隔半年,零一不僅將基座模型卷到千億量級,甚至還直接拿出一款 C 端新品“萬知”,零一萬物創(chuàng)始人李開復稱其為“AI-First 版 office”。
在模型層,零一發(fā)布了千億參數(shù)的 Yi-Large 閉源模型,在第三方評測基準斯坦福大學的英語排行 AlpacaEval 2.0上,Yi-Large 可與 GPT-4 比肩(如下圖所示);并全面升級了開源模型系列 Yi-1.5,分為 34B、9B、6B三個版本,且提供了 Yi-1.5-Chat 微調模型可供開發(fā)者選擇。
斯坦福 AlpacaEval 2.0 Verified 認證模型類別,英語能力評測(2024年5月12日)
李開復預測 2024 年是 AI 大模型應用爆發(fā)年,零一率先推出 AI 生產(chǎn)力產(chǎn)品“萬知”,同款產(chǎn)品去年 9 月就開始試水海外,上線 9 個月用戶數(shù)便突破上千萬,產(chǎn)品 ROI (投入產(chǎn)出比)接近 1,根據(jù)現(xiàn)有的增速,零一萬物預計 2024 年海外市場營收達到 1 億到 2 億人民幣。
經(jīng)過海外市場的驗證后,針對國內(nèi)市場的“萬知”順勢推出。
萬知立足于生產(chǎn)力產(chǎn)品賽道,瞄準辦公場景,開辟了三個核心高價值場景“找讀寫”,不僅能問答、還支持超長文檔閱讀,最吸引用戶的是支持一句話生成PPT,要做大模型時代的“AI 辦公助手”。
發(fā)布會當天,李開復不僅宣布了Yi-Large 千億模型、萬知等新品發(fā)布,還公布了零一萬物的戰(zhàn)略打法,而在發(fā)布會后場答媒體問時,金句頻出:
“ofo 的燒錢邏輯不再適合 AI 2.0?!?/p>
“PMF(產(chǎn)品市場契合)已經(jīng)過時了,大模型賽道從狂奔到長跑,取決于有效實現(xiàn) TC-PMF(Technology-Cost Product-Market-Fit,技術成本 X 產(chǎn)品市場契合度)。”
“AGI 是我的超級夢想,我承諾過我的投資人,未來十年不套現(xiàn)?!?/p>
經(jīng)歷過 2023 年的融資惡戰(zhàn),加之近日 OpenAI 的 GPT-4o 發(fā)布后并未引起太大震撼,說明大模型技術增長曲線處于放緩的狀態(tài),大模型從卷基礎模型能力已經(jīng)進入應用落地、商業(yè)化階段。
零一正是基于這一判斷,早在今年 3 月初零一就推出了 Yi 大模型 API 開放平臺,為開發(fā)者提供包含Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark等多款模型 API 接口,初步試水商業(yè)化。
目前大模型商業(yè)化主要通過兩種方式:API、私有化部署,其中私有化根據(jù)各行各業(yè)對數(shù)據(jù)安全的不同考量,分為云端私有化和本地私有化,API 的方式,簡單點說,就是各家通過一個程序接口,將模型的能力封裝起來,讓用戶可以隨意調用。
在零一的“模應一體”戰(zhàn)略中,萬知跟 Yi 大模型 API 開放平臺都是模型應用、商業(yè)化的探索,一個主攻 C 端用戶,一個面向 B 端開發(fā)者用戶。
近日,AI 科技評論對話零一萬物生產(chǎn)力產(chǎn)品負責人曹大鵬、Yi 大模型 API 開放平臺負責人藍雨川,跟他們聊了聊萬知的研發(fā)過程,C 端產(chǎn)品如何在海外做到 ROI 接近 1,更多探討了他們對 AI 大模型時代的產(chǎn)品思考 ,以及 API 如何成為一門好的生意?
兩人曾在飛書時便是產(chǎn)品與市場的搭檔組合,是移動互聯(lián)網(wǎng)輝煌時代的親歷者,在 ChatGPT 來臨后看到未來一個大的技術浪潮,躬身入局,遂決定加入零一萬物。
以下是跟兩人的對話(經(jīng)整理):
AI 科技評論:請兩位分別講講自己的從業(yè)經(jīng)歷,對大模型時代的借鑒與幫助?
曹大鵬:我經(jīng)歷過 Web 互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng),也曾自己創(chuàng)業(yè),在大廠做過 B 端的 SaaS。
上一份工作是在飛書做產(chǎn)品負責人,國內(nèi)的生產(chǎn)力賽道主要是 tob 的 SaaS,很多軟件不好用。但飛書在國內(nèi)無論是面向 ToB 還是 ToC,用戶體驗都非常好。這段經(jīng)歷對我?guī)椭艽?,讓我了解辦公場景的用戶需求。
在移動互聯(lián)網(wǎng)創(chuàng)業(yè)時一年融了三輪,當時市場熱錢很多,所有投資人或者市場大家更關注用戶能不能增長更快,但是不是發(fā)展更健康關注較少,經(jīng)過了四五年,從 2017 年開始,整個市場完全就變了,抖音或者更大的產(chǎn)品出來,以前高速增長的一些創(chuàng)業(yè)公司例如 ofo 打車這些很難持續(xù)下去。
后來一個新技術出來,都開始關注商業(yè)模式,這種認知延續(xù)到我加入零一,當時零一選擇市場時,便選擇了商業(yè)化比較成熟的海外市場,我們第一天就提供收費功能,一直以收入目標為核心去做增長產(chǎn)品。
零一的生產(chǎn)力產(chǎn)品主打 AI 工作平臺,核心是找到“找讀寫”這三個痛點場景在一個產(chǎn)品里完成,而不是說只做一個 chatbot。
藍雨川:我早期做戰(zhàn)略咨詢跟移動互聯(lián)網(wǎng)時代的投資,后面出來創(chuàng)業(yè),做中國財稅的 SaaS,也用到了 AI + RPA 技術,到飛書后跟曹大鵬搭檔,做一個新業(yè)務的探索,曹大鵬是產(chǎn)品負責人,我是GTM負責人??吹紺hatGPT 出來后,判斷這是未來明確的大趨勢,又一起做了一段時間海外 AI-Native 應用的探索。后來發(fā)現(xiàn)模應一體是更大的機會,所以就加入到零一萬物。
到零一萬物后,一開始花了很多時間在做海外的生產(chǎn)力產(chǎn)品,去年 11月開源 Yi-34B 模型后,在海外影響力不錯,那時起就籌備 Yi 模型 API Service。
AI 科技評論:為什么當時沒有選擇從 B 端開始切入?
曹大鵬:任何一個新技術浪潮來臨的時候,最先增長起來的肯定是 C 端市場,因為 C 端決策非常簡單。ToB,從客戶認可產(chǎn)品價值,到跟決策層談好合作,再完成產(chǎn)品部署,整個周期至少 3 個月到半年起。
AI 科技評論:面對國內(nèi) C 端付費意愿較低的環(huán)境,萬知未來要如何商業(yè)化?
曹大鵬:國內(nèi)跟海外發(fā)達國家相比,不光是AI C端應用,所有的工作軟件,整個付費市場都差了不止一個量級。在國內(nèi),如果一開始就做一個付費產(chǎn)品,可能沒辦法獲得用戶,就沒辦法獲得用戶的反饋,很難真正迭代產(chǎn)品。所以萬知早期還是免費策略,但也有一些高價值場景可能會收費,例如用戶想要一個 PPT,原來需要 1 個小時,現(xiàn)在用萬知創(chuàng)作修改只用 10 分鐘,我們相信有大量用戶愿意付錢,而且據(jù)了解國內(nèi) PPT 制作市場,一些初創(chuàng)公司一個月也能達到上百萬的收入。
AI 科技評論:零一的 API 如何跟友商競爭,有什么優(yōu)勢?
曹大鵬:首先零一最新公布的千億模型性能多項指標超過 GPT-4,這是性能上的優(yōu)勢,其次,零一的 API 定價遠遠低于 GPT-4。零一最強的 Yi-Large 模型定價是 人民幣20 塊 100 萬 tokens ,OpenAI GPT-4-turbo 定價是 10 美金的input, 30 美金的output,GPT-4 定價是 30 美金的 input, 60 美金的 output。
AI 科技評論:如何找到技術的 TC-PMF?
曹大鵬:研發(fā)大模型產(chǎn)品,除了要深度了解大模型本身的能力,能干什么,不能干什么,哪方面做的好,基于它能找到合適的場景去匹配。如果找了一個大模型根本不擅長的場景,這個產(chǎn)品就不可能有PMF。
其次,關于 cost 成本這塊,即每次模型的調用到底花多少錢,包括接下來三個月、六個月它會降到多少錢?要計算產(chǎn)品給用戶的免費用量應該是多少,付費用量應該是多少,因為最終要算整體的 ROI。所以,如果說模型每次調用成本降低很多的話,我們就可以給用戶更多的免費用量,或者給用戶更多的權益。但是成本一直降不下來的話,用戶也就不能低成本獲取 API,使用模型的成本較高。
這就對 AI-First 產(chǎn)品時代的產(chǎn)品經(jīng)理要求更高,要有定義產(chǎn)品 PMF(產(chǎn)品市場契合點)的能力,還要對技術、商業(yè)有更多的理解,才能把 technology 和 cost 這部分權衡好。不同于互聯(lián)網(wǎng)時代成熟產(chǎn)品的產(chǎn)品經(jīng)理,現(xiàn)在的 AI 產(chǎn)品經(jīng)理基本都要從 0 到 1 定義場景,構建產(chǎn)品
AI 科技評論:為何最初選擇在海外開疆拓土?
曹大鵬:零一選擇在大模型發(fā)展領先國內(nèi)一個身位的海外市場出發(fā),在一個相對成熟的市場去找真正的剛需,這是零一的策略,所以去年 9 月率先在海外推出了一系列產(chǎn)品,包括 PPT 這個功能也是在產(chǎn)品迭代過程中,發(fā)現(xiàn)用戶對這個需求特別強,也愿意付費,我們才選擇迭代進去。C 端產(chǎn)品在海外已經(jīng)發(fā)展了近幾百萬用戶,已經(jīng)有了驗證后面才決定跟基礎問答的功能放在一起,在國內(nèi)推。
AI 科技評論:API 開放平臺跟生產(chǎn)力產(chǎn)品兩塊分別在模應一體戰(zhàn)略中扮演什么樣的角色?
藍雨川:ToC Apps 和 API 都算是模型的應用。
API 并沒有想象中簡單,除了標準模型的 API 之外,也提供了Yi-Large-RAG、Yi-Large-Turbo這樣的 API,這些 API 背后不是對應完全不同的模型,而是各個模型的組合。
我們把 API 當做一個產(chǎn)品,去想企業(yè)真實去使用 API 的時候,會怎么用,例如他們在做知識檢索類場景時,是不是希望有一個RAG API能夠帶來知識查詢和聯(lián)網(wǎng)搜索的能力?
我們認為是會的,萬知以及其他少數(shù)幾家競對產(chǎn)品都包含了RAG能力,但真正給到企業(yè)開發(fā)者的國內(nèi)首個 RAG API 是零一API平臺推出的。例如 Turbo API,開發(fā)者不是永遠都需要選擇最好的那個模型,他們經(jīng)常要在性能、成本和速度之間去做一個平衡,這個時候 turbo 可能更適合。
曹大鵬:在零一的模應一體戰(zhàn)略中,應用不僅包含了零一自研的應用,例如萬知,另一部分的應用更廣泛來自整個零一的生態(tài),例如通過 Yi API 開放平臺,將零一的模型開放給外部開發(fā)者,驅動大量新的應用。
因為不是人人都能去部署、訓練大模型,API 就像一個管道一樣,讓開發(fā)者調用,零一希望通過 API 將大模型能力賦能到千行百業(yè)。零一選擇幾個擅長、了解的場景去做ToC 應用,其他應用則通過 API 平臺去孵化。
藍雨川:產(chǎn)品對于 API 是有非常大的幫助的。比如最開始是通過萬知發(fā)現(xiàn)用戶問到一些復雜的問題時,他需要有一個 RAG 的能力去提升這個回答的質量,所以我們就在模型上做了相關的 RAG 能力,再定義了 RAG API 。
AI 科技評論:大模型幻覺還沒有徹底解決,在將模型應用到具體生產(chǎn)力場景中,是否會產(chǎn)生不良影響?
曹大鵬:幻覺并不都是壞的部分,比如零一模型在開源階段,就有開發(fā)者專門拿模型來做創(chuàng)作、創(chuàng)意文案,想象力特別豐富,這就是好事?,F(xiàn)階段我們用大模型做生產(chǎn)力的應用也好,商業(yè)的應用也好,主要還是希望幫人們節(jié)約百分之八九十的時間,最終還是要依賴人的把關、跟判斷的能力,所以現(xiàn)階段 AI 還做不到萬能跟全自動。
AI 科技評論:零一的模型對內(nèi)部開發(fā)跟外部開發(fā)者有什么樣的共通性和區(qū)隔性?
曹大鵬:零一海外、國內(nèi)的生產(chǎn)力產(chǎn)品以及未來正在探索的產(chǎn)品,都用了零一的 API,可以理解為零一自己也是一個開發(fā)者,跟外部的其他公司開發(fā)者一樣,直接調用 API 來研發(fā)應用,底部都是零一的各個模型。
因此,萬知是一個非常豐富的產(chǎn)品,里面不止一個模型,例如解讀圖表背后就疊加了零一的視覺語言模型。
AI 科技評論:萬知的核心場景除了 PPT 制作還有哪些?
曹大鵬:核心場景主要是“找讀寫”,“找”對應的是通用問答,就 chatbot;“讀”是 AI 文檔閱讀,萬知最多支持 5000 頁,500萬字的PDF,這個能力在競品里還沒有幾家能達到,這其實用到了 RAG 技術;“寫”對應到 AI 創(chuàng)作 PPT。
AI 科技評論:PPT制作怎么算是高價值場景?
曹大鵬:舉個簡單例子,小紅書、抖音上有大量靠賣 PPT模板 ,一年賺幾百萬的博主。所以這證明了 PPT其實有大量需求的,WPS 現(xiàn)在 C 端一年收入都有幾十億人民幣,這其中透露的就是產(chǎn)品力和商業(yè)模式。
而且通用問答產(chǎn)品已經(jīng)嚴重同質化了,如果大家都做免費的,真的挺難活下去的,創(chuàng)業(yè)公司燒錢能燒過字節(jié)嗎?
AI 科技評論:零一是如何去找應用場景的?如何才能做到事半功倍?
曹大鵬:用 TC-PMF 方法論去定義場景,模型的能力是不是足夠好,還要看成本是否能 cover 掉,不會盲目去找一些留存少的場景。
其次,從海外尋找經(jīng)驗。萬知是海外先行的產(chǎn)物,海外比國內(nèi)在應用落地上快一年到一年半,所以我們先孵化海外,再復制到國內(nèi),而不是僅僅在國內(nèi)閉門造車?,F(xiàn)在國內(nèi)大模型大家普遍還處于尋找場景的階段,證明其實還沒找到合適的場景。
AI 科技評論:零一會做私有化部署嗎?
藍雨川:零一會很謹慎對待這一點,我們優(yōu)先關注的是,客戶是不是真正在自己的場景上把 API 的用量用起來,把自己的AI產(chǎn)品做起來,產(chǎn)品能PMF 能賺到錢,我們不會去盯著項目交付賺一次性的錢。
AI 科技評論:大模型公司做 C 端應用成本相比市面上其他初創(chuàng)應用公司成本高很多,零一如何看待這個問題?
曹大鵬:自研模型有機會作出SOTA模型,還可以針對產(chǎn)品場景微調強化。如果用開源模型,驗證期可能可以,但做深做大就很難,一是缺乏技術壁壘,二是開源模型本身部署微調的成本和人才要求也很高。
AI 科技評論:零一做應用的優(yōu)勢在哪?
曹大鵬:首先零一自己有在國際標準上排名靠前的模型,而現(xiàn)在的 AI 應用能做起來至少 60% 是由模型能力決定的。
AI 科技評論:現(xiàn)在零一API平臺的用戶有多少?
藍雨川:正式發(fā)布前已經(jīng)試運行了一個多月,有不少種子用戶,可以期待下今年的成績。
AI 科技評論:零一未來會持續(xù)開源嗎?
藍雨川:會持續(xù)升級,開源重要的是開源出來的模型要真的有用。所以零一開源還是以實用性為主,未來開源還是會以輕盈的模型跟多模態(tài)為主。
AI 科技評論:對過去一年整體的感受與看法,未來有怎樣的的趨勢預測?
曹大鵬:過去國內(nèi)基本都在拼模型能力,真正落地到應用的很少,今年 AI 應用會迎來爆發(fā),因為模型能力可能達到了一個臨界點。同時,商業(yè)化會成為非常重要的一個課題。而 API 是很好的一個商業(yè)模式。
藍雨川:我們理解接下來一年會迎來 AI 應用爆發(fā),因為國產(chǎn)大模型能力已經(jīng)與GPT-4 不相上下,而美國 AI 應用全面爆發(fā)正是在 GTP-4 0314發(fā)布之后。
我們也希望 Yi-Large 能夠帶來國內(nèi)AI應用生態(tài)繁榮,也通過 API 為零一創(chuàng)造一個比較好的商業(yè)模式。做大模型的投入非常大,需要融資、買卡、訓模型,如果一個創(chuàng)業(yè)公司一年、兩年看不到商業(yè)回報,不能建立商業(yè)閉環(huán),繼續(xù)做更大的模型就很難,所以我們很努力在通過 ToC 產(chǎn)品和 API 去增長、賺錢。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。