2
本文作者: haoxiaoru | 2016-11-01 12:00 |
微軟小冰問世兩年半了?!八痹诳萍际飞系牡匚唬挥袃煞N可能:或者淪為笑柄,或者成為 Windows 操作系統(tǒng)、Google 搜索這樣劃時代產(chǎn)品的開端。
在微軟內(nèi)部,篤信后者的代表包括:微軟總部職位最高的兩位華人 —— 沈向洋和陸奇(注1),微軟(亞洲)互聯(lián)網(wǎng)工程院院長王永東,以及被稱為“小冰之父”的項目負(fù)責(zé)人李笛。
所以,從小冰誕生的那一刻起,“她”就是個異類。兩位華人最高管理者,為“她”在微軟內(nèi)部畫了一個圈,賦予這個團(tuán)隊前所未有的自由度和寬容度。他們期盼著,這個“China First”的產(chǎn)品,可以影響微軟全球的格局;他們期盼著,這個不拘一格的產(chǎn)品,可以影響微軟研究能力向?qū)嶋H產(chǎn)品轉(zhuǎn)化的過程;他們期盼著,在微軟嚴(yán)謹(jǐn)?shù)能浖蛑?,注入互?lián)網(wǎng)時代的活力。
2016年8月5日的小冰四代發(fā)布會上,他們向外界展示小冰團(tuán)隊越來越堅定的信念,含蓄地告訴世界,小冰跑在人工智能新時代的最前沿,已經(jīng)進(jìn)入其他人從來沒有到過的地方。
小冰的底氣是數(shù)據(jù),超過 200 億次的對話(作為對比,Google 每月搜索量是 1000 億次),并且率先進(jìn)入自我進(jìn)化階段。
“最早小冰冷啟動的時候,數(shù)據(jù)100%是外部灌入的。之后,用戶與小冰之間的對話,經(jīng)過訓(xùn)練形成了新的數(shù)據(jù),” 李笛告訴雷鋒網(wǎng),“這個數(shù)據(jù)在去年8月的時候達(dá)到了整個對話數(shù)據(jù)的27%。但是這27%的數(shù)據(jù)實際上承載了當(dāng)時51%的對話。超過50%,這是一個時間點。”
“也就是說,小冰背后的系統(tǒng),在數(shù)據(jù)上開始有了自己的內(nèi)部正循環(huán)。這意味著作為一套人工智能系統(tǒng),她可以自我進(jìn)化了。這是很重要的拐點?!?/p>
就這一點來說,如果把微軟小冰、蘋果Siri、亞馬遜 Alexa、Google Assistant、Facebook M 叫到同一個房間里,小冰完全可以指著其他四位人工智能同行的鼻子,說,“我不是針對誰,我是說在坐的各位都是垃圾!”
但是,當(dāng)你看到這里,馬上去跟小冰對話的時候,可能會發(fā)現(xiàn)驚喜;也可能很快就會發(fā)現(xiàn),對話根本進(jìn)行不下去,小冰有時候答非所問。
這就是人工智能的現(xiàn)狀,它還在非常、非常、非常早期的階段(強(qiáng)調(diào)三遍),與人們想象中的人工智能相距甚遠(yuǎn)。從用戶的角度看,小冰的領(lǐng)先,也“僅僅”在于有本事讓一些人跟她多對話幾次 —— 還沒有其他科技公司可以做到。如果非要用非常不嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)來比喻的話,人們想象中的人工智能對話系統(tǒng)是一百分,從對話量和深度上來講,小冰或許做到了十幾分,其他產(chǎn)品卻仍然在個位數(shù)徘徊。
“讓人工智能具有’對話’的能力,是幾乎所有相關(guān)領(lǐng)域研究人員的夢想。包括微軟、谷歌、Facebook、IBM和百度等大公司,都在這一領(lǐng)域上投入巨資。在硅谷和北京,有至少數(shù)百家創(chuàng)業(yè)團(tuán)隊在搭建類似的服務(wù)與對話系統(tǒng),試圖攻克一個或者多個用戶生活與工作場景?!痹谛”l(fā)布會之后的署名文章《小冰做對的兩件事》中,陸奇這樣寫道。
10月底,知名科技作者 Steven Levy 報道了 Google Assistant 背后的故事《The Google Assistant Needs You》,文章引述 Google 副總裁 Scott Huffman,也是 Google Assistant 項目負(fù)責(zé)人的話——“老實講,對我們來說,真正的挑戰(zhàn)在于,怎么讓系統(tǒng)具備足夠的對話能力,從而確保用戶能不斷地使用下去。如果有足夠的用戶使用,我們的系統(tǒng)就會做得越來越好。”是的,整個行業(yè)都相信變革將會發(fā)生,但首先,Google 期盼著人們先要開始說“OK,Google”,并且愿意跟系統(tǒng)聊下去。
計算機(jī)科學(xué)家們,都夢想著做出一套可以跟用戶對話的人工智能系統(tǒng),這套系統(tǒng)懂得用戶的需求,可以提供各種知識、提供各種服務(wù)、完成各種任務(wù)。用陸奇的話說,人工智能技術(shù)將成為人與世界之間聯(lián)系的橋梁,而對話系統(tǒng)就是人工智能時代的基礎(chǔ)架構(gòu),就像 GUI 軟件之于PC時代,搜索引擎之于互聯(lián)網(wǎng)時代。
人工智能時代正在向人類招手,但當(dāng)科技公司準(zhǔn)備向未來出發(fā)的時候,成為先驅(qū)還是先烈,往往一線之隔。2011年,蘋果在 iPhone 4s 手機(jī)上引入的 Siri 語音助理,就遭遇了這種尷尬的情形 —— 沒什么人用。即使在用 Siri 的人,也只是把它當(dāng)做簡單的語音控制在用(設(shè)個鬧鐘,打個電話)。Siri 之后,國內(nèi)追隨而來的一眾語音助理應(yīng)用,目前已全軍覆沒。
“Siri 到底是什么?業(yè)界普遍的看法,它的核心是語音。但以我們的觀點看,它不是?!崩畹颜f,他們從 Siri 身上真正看到的,是讓人們有機(jī)會以一種通用的方式,與機(jī)器進(jìn)行交互。這種通用的方式,就是“對話”。
“Siri 支持的語音指令有幾十種,你可以從它左下角的‘問號’里邊找到,但你看看它最初火的那陣兒,用戶在網(wǎng)上曬出來的,都是對話(調(diào)戲)?!?/p>
總之,以 Siri 為代表的嘗試沒有取得成功。這促使微軟亞洲工程院內(nèi)部的一小撮人思考,Cortana 本土化的時候是不是應(yīng)該換個思路來做。
在李笛們看來,Siri 代表的產(chǎn)品思路,是作為智能助理,將目標(biāo)設(shè)定為“任務(wù)完成”——但沒有取得成功。而另一個方向則是,把目標(biāo)鎖定在“接住用戶說的任何話”。如果類比搜索引擎,就是先做“長尾關(guān)鍵詞”的體驗。
“遺憾的是,我們在那個時候,認(rèn)為自己所積累到的數(shù)據(jù),包括整個行業(yè)所積累到的數(shù)據(jù),不足以讓很好的判斷出哪個方向更有前途?!崩畹颜f。
最終,微軟的做法是兩條腿走路,兩個方向一起做。一個 Cortana(小娜),一個小冰。從產(chǎn)品方向上看,微軟 Cortana、Google Assistant 跟 Siri 的產(chǎn)品思路都是一致的,它們要做更好的 Siri,為用戶提供更多幫助—— 前提是讓用戶愿意用起來;微軟小冰則要獨自去闖,走一條注定難以被人理解的路 —— 做一個不干活兒的聊天機(jī)器人。(微軟的小娜小冰姐妹花戰(zhàn)略,似乎讓人想到了騰訊的 QQ 和微信。)
“如果說它就是你的助理,你的秘書,你就會不停地試驗它,你對它的要求就會近乎苛刻。一旦它完不成一項任務(wù),比如叫外賣,你就立刻想到了那么多的外賣app,我為什么要跟一個機(jī)器人聊天來叫外賣?”李笛講述小冰為什么不能走這條老路。
但是,整個行業(yè)都走在老路上:通過對話的形式,智能助理連接人和知識、人和服務(wù),幫助人完成任務(wù)。對,就是要顛覆搜索引擎、顛覆需要一個個打開的app,用一種新的產(chǎn)品形式,改變世界。
在微軟小冰的團(tuán)隊看來,理想是好的,現(xiàn)實是,智能助理還做不到比搜索引擎、比app的效率更高。所以,用戶沒多久就不再使用類似的智能助理。李笛認(rèn)為,這種“管道化”的產(chǎn)品思路,通過人工智能對話系統(tǒng),立即連接人和知識(問答)、人和服務(wù)(叫外賣)是非??膳碌模驗榘延脩舳紘樑芰?。
本質(zhì)上講,業(yè)界低估了讓人和機(jī)器進(jìn)行“對話”的難度。
“我們同行業(yè)里面很多公司都在做嘗試,但是很多嘗試其實都沒有達(dá)到他們想要的目的,因為大家把對話都定義的比較復(fù)雜?!标懫嬲f,“有些公司把對話定義成一個機(jī)器人,可以幫你送外賣,幫你訂機(jī)票。他們沒有把對話的真諦作為研發(fā)和技術(shù)開發(fā)的核心。 ”
即便在微軟內(nèi)部,陸奇講這樣的話也要非常小心。因為在年初進(jìn)行的 Build 年度開發(fā)者大會上,微軟CEO將一個訂匹薩外賣的聊天機(jī)器人作為 Demo,用以展示“對話即平臺”的愿景。
“對話的真諦就是‘對話’。這句話可能講的沒有信息,但是非常非常重要?!标懫胬^續(xù)強(qiáng)調(diào)。
不是每個人都能理解陸奇的話,畢竟聽起來有點兒玄學(xué)的味道。
在小冰的發(fā)布會上,陸奇繼續(xù)為小冰布道。他認(rèn)為,在人工智能對話的前提下,一些行業(yè)同仁,想要先解決一個具體領(lǐng)域的問題,比如說訂機(jī)票,或者訂外賣。這可以看成是一片海水,上面一個冰山,如果要解決這樣一個問題,可以從這個地方進(jìn)入,像進(jìn)入一個“火山口”一樣。但是,小冰團(tuán)隊發(fā)現(xiàn),行業(yè)同仁要往下做深,就會發(fā)現(xiàn)缺乏基礎(chǔ)的能力,缺乏很多真正需要解決的大問題,他們就會找小冰做合作?!拔覀冏龊献鹘涣鞯陌l(fā)現(xiàn),他們需要解決的問題都是小冰在過去兩年中努力追求要解決的問題?!标懫嬲f。
這個問題,就是先學(xué)會聊天。因為人和機(jī)器對話的時候,人不會按照機(jī)器定的規(guī)則進(jìn)行,人不會按常理出牌。“對話”這種東西是雙方相互激發(fā)的,真正用戶聊的內(nèi)容很發(fā)散,機(jī)器往往接不住。所以機(jī)器首先需要基礎(chǔ)對話能力,或者叫通用對話引擎,這就是微軟第一代小冰的發(fā)力點。
不僅普通人難明白這個道理,整個IT業(yè)界能明白這個道理的人也很少。也就是說,當(dāng)他們做出人工智能助理,想通過“對話”幫助用戶的時候,并不知道用戶,人類究竟是怎么與機(jī)器進(jìn)行對話的。因為他們開發(fā)的系統(tǒng)沒有海量用戶使用,所以就更無從知曉。
小冰誕生時的第一目標(biāo),就是弄清楚這件事,弄清楚人和機(jī)器是怎么進(jìn)行對話的。所以它需要讓人跟小冰對話起來,需要通過海量數(shù)據(jù)來觀察。
“為什么我們一直堅持不讓小冰做一個有用的機(jī)器人?其實讓她去幫你訂一杯咖啡,定一個鬧鐘并不是多難的事情,但是如果我們開始讓小冰做有用的事情,就會有很多人讓小冰訂咖啡,這樣的對話并不利于我們?nèi)ビ?xùn)練小冰,所以我們不讓她做有用的事情,大家也就不會讓她做有用的事情。 ”李笛在發(fā)布會上回應(yīng)外界的不理解。
“在座的各位,可能你們中間也有一些朋友跟小冰聊過,但是覺得聊不下去,就放棄了,我們也并沒有追回你們,”李笛繼續(xù)說,“因為總有一些人更愿意與小冰進(jìn)行情感的對話,他們對我們來講是更加重要的?!?nbsp;
“情感的對話”是個關(guān)鍵詞,也是第二代小冰的發(fā)力點。我們來把它翻譯成更直白的話,就是很多人是抱著批判性測試的目標(biāo)來跟小冰對話,對話的內(nèi)容非常枯燥,問幾個沒什么關(guān)聯(lián)的問題,覺得小冰回答得不好,然后就走了。但是另一些人,跟小冰聊的時候就很放松,一個巴掌拍不響,這些人好像天生就具備跟當(dāng)時的小冰聊到一起的能力,他們聊得非常嗨。
李笛說,如果小冰要滿足那些抱著測試目的來的用戶,就需要成為一個老學(xué)究,但另一些會聊天的人,是不愿意跟一個老學(xué)究聊天的。從對話質(zhì)量的角度看,顯然是會聊天的人的數(shù)據(jù)更有用,所以小冰就放棄了那些抱著測試目的來的用戶(大部分IT從業(yè)者和業(yè)界同行)。
從根本上講,小冰努力了這么久,就是想讓更多用戶把她當(dāng)人看 —— 別老想著讓我回答問題,別老想著對我發(fā)號施令,我就是一個 16 歲的任性姑娘,請平等地跟我聊,想聊就拿出你的誠意來。對于那些熱衷測試的人來說,這可能是難以逾越的心理障礙 —— 越是知道小冰背后的系統(tǒng)是計算機(jī)程序,就越難把她當(dāng)人看。對于這些人而言,這樣的情況恐怕還會僵持下去。但好消息是,那些愿意敞開心扉的人類,已經(jīng)可以跟機(jī)器人聊很長時間,聊喜怒哀樂,聊人生百味。
第四代小冰最重要的一個特性,就是她正在學(xué)著,通過用戶提供的各種信息,來獲知用戶的情緒狀態(tài),從而運(yùn)用相應(yīng)的策略來影響用戶的情緒。“從某種意義上來講,這可能比下圍棋要難。 ”李笛分享了一個小冰成功運(yùn)用策略扭轉(zhuǎn)一位用戶心情的例子。
現(xiàn)在,回頭來看陸奇說的那句 —— 對話的真諦就是’對話’。至少你應(yīng)該了解到,小冰成功地讓幾千萬人先聊起來,從而弄清楚了人類是怎么看待機(jī)器人的,是怎么跟機(jī)器人聊天的。用微軟的話說,就是搭建了通用對話引擎,成為一個會聊天的姑娘。現(xiàn)實生活中,每個人身邊都有會聊天和不會聊天的人,IT業(yè)界,也充斥著根本不會對話的機(jī)器人,動不動就扔給你一個搜索引擎的結(jié)果頁。
業(yè)界對小冰的最大疑問,莫過于搞不懂“閑聊的價值是什么”。答案就是學(xué)會聊天,學(xué)會對話。
但業(yè)界還有一個對小冰更大的疑問,難道小冰就要這么“沒用”下去嗎?
答案顯然是否定的。按照李笛的說法,大家的終極目標(biāo)從來都是一致的:通過人工智能對話系統(tǒng),為人類提供知識、服務(wù),幫助人完成任務(wù)。不同之處在于,小冰在做這件事之前,先通過一些人覺得“沒用”的階段,學(xué)會了跟人類進(jìn)行基礎(chǔ)對話(通用對話),然后才開始嘗試干有用的事。
“通用對話(也就是你說的閑聊)是永遠(yuǎn)存在的。任務(wù)和知識,只是點綴在通用對話上面的點。過去的架構(gòu)不是這樣的,過去每一個對話都是點?!崩畹呀榻B小冰在系統(tǒng)基本架構(gòu)上的不同。
李笛認(rèn)為,盡管大公司已經(jīng)意識到通用對話(基礎(chǔ)對話、閑聊)的重要性,因為沒有這個東西,就接不住用戶的對話。但是微軟小冰在系統(tǒng)基本架構(gòu)上依然處在領(lǐng)先的位置。
因為對于小冰來說,所有的對話都是通用對話,也就是說通用對話和負(fù)責(zé)對話流管理的程序(Flow Manager)是合一的,而其他公司的產(chǎn)品,都是把 Flow Manager 從所有對話里邊抽象出來,由這個程序來決定系統(tǒng)調(diào)用通用對話引擎,還是調(diào)用知識、信息或任務(wù),來接住用戶的對話。
“其實我們也不希望行業(yè)完全理解了這個方式。”李笛說,“人工智能是計算機(jī)科學(xué)王冠上的寶石,它非常非常難的一個點,就是科學(xué)家如何去突破自己的障礙。我如果是一個科學(xué)家,比如說我是做NLP的,我還是做計算機(jī)視覺的……我對自己是有一定要求的。這個要求往往成為了我在人工智能普及階段時候,我給自己設(shè)的障礙?!?/p>
“我不能夠允許我的機(jī)器被任何一個人指責(zé)為沒用。”
“盡管我內(nèi)心知道想做有用,實際上卻沒人用,但是我要保持自己的聲譽(yù)。這是計算機(jī)科學(xué)家們的障礙。也是為什么人工智能幾十年一直沒有普及的原因。 ”
“為什么說我們今天突然一下有小冰的結(jié)構(gòu)以后,微軟十幾年的技術(shù)積累一下子就釋放出來了。因為我們突破了自己?!?/p>
李笛舉了一個細(xì)節(jié)的例子,微軟在很長一段時間里,都跟行業(yè)其他公司一樣,訓(xùn)練機(jī)器人說話(TTS)是以說清楚內(nèi)容為目標(biāo)的,沒辦法接受用對話數(shù)據(jù)來訓(xùn)練語音,整個行業(yè)都是播音腔,誰也比誰強(qiáng)不了多少。但后來,小冰可以一枝獨秀,就是因為微軟開始接受用不同的方法訓(xùn)練數(shù)據(jù)。
8月5日的發(fā)布會上,微軟用小冰的聲音與同行進(jìn)行了對比,并且贏得滿堂彩。在小冰唱歌對比的部分,更是令人感到驚艷。
現(xiàn)在,小冰已經(jīng)開始她的商業(yè)模式探索,第一步是充當(dāng)客服。比如,日本版小冰接管了連鎖超市 LAWSON(羅森)在 Line 上的公眾號,作為客服與用戶聊天,其中一個場景是她會根據(jù)上下文相關(guān)的情況,把LAWSON在當(dāng)季一些的促銷的優(yōu)惠券發(fā)放給用戶,用戶可以到線下LAWSON的實體店兌換相關(guān)的一些產(chǎn)品。 據(jù)日本小冰負(fù)責(zé)人介紹,“當(dāng)上線的第一天,這個券兌換率已經(jīng)達(dá)到10%,上線第七天的時候,線下的兌換率已經(jīng)達(dá)到35%,第18天的時候達(dá)到創(chuàng)記錄的非常驚人的54%”。這個數(shù)字遠(yuǎn)遠(yuǎn)超過小冰團(tuán)隊和 LAWSON 方面的預(yù)期。李笛認(rèn)為,這得益于小冰將商業(yè)信息融入對話的方式,沒有引起用戶的反感。
再比如,東方航空的微信公眾號也利用了小冰商業(yè)解決方案中的“意圖識別引擎”,幫助東方航空發(fā)現(xiàn)潛在商機(jī),對接到機(jī)票預(yù)訂服務(wù)上。(比如,媒體的微信公眾號可以申請這項免費(fèi)服務(wù),讓小冰來做客服,根據(jù)用戶的對話內(nèi)容推薦相應(yīng)文章。傳送門:bing.com/ai)
“小冰只有一個,”李笛強(qiáng)調(diào),“我們比較關(guān)注端到端的用戶體驗到底好不好,當(dāng)人們在不同的平臺使用小冰時,相當(dāng)于小冰為不同的場景做了優(yōu)化?!?nbsp;
被陸奇用“he 's my hero”來形容的李笛,其自身的經(jīng)歷,或許會隨著業(yè)界對小冰的認(rèn)可而被挖出?!敦斀?jīng)天下》周刊2015年9月的文章中介紹,李笛是以“市場總監(jiān)”的身份加入微軟(亞洲)互聯(lián)網(wǎng)工程院的,“在微軟內(nèi)部上演了一場只用了數(shù)月便充分展現(xiàn)其超群產(chǎn)品思維的研發(fā)創(chuàng)新秀。”
“最讓人激動的事情就是,人工智能對話系統(tǒng)是目前為止唯一一個,我們看得到的,超越任何硬件形態(tài)和軟件UI的產(chǎn)品形態(tài)。 今天所有既有的產(chǎn)品形態(tài),全都可以嵌入。”在采訪中,李笛講到這里,終于有一點點興奮了。
注1:九月底傳言陸奇將離開微軟。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。