0
本文作者: 叨叨 | 2017-11-13 22:05 |
相比國內(nèi)外的科技巨頭,微軟在這場(chǎng)號(hào)稱“百箱大戰(zhàn)”熱潮里,姍姍來遲。一般來說,遲到的原因無非兩個(gè),一個(gè)是動(dòng)作太慢沒趕上,另一個(gè)是在伺機(jī)而動(dòng)等待后發(fā)。如果說此前還無從判斷微軟的“遲”是哪種情況,那么現(xiàn)在則比較清晰了。
兩周前,微軟聯(lián)合音箱制造商哈曼卡頓推出智能音箱 Invoke,Cortana 作為語音智能助手內(nèi)置其中,可供喚醒,執(zhí)行操作。更早前,微軟與亞馬遜同時(shí)宣布,打通 Cortana 與 Alexa,在 Windows 10 設(shè)備上對(duì) Cortana 說“call Alexa”,就能夠喚醒后者。
在AI競(jìng)爭(zhēng)加劇,智能語音助手混戰(zhàn)的背景下,在薩提亞·納德拉“云+端”的戰(zhàn)略下,從這兩件事其實(shí)可以看出微軟對(duì) Cortana 的定位,越來越明晰了:一方面為硬件合作伙伴提供 AI 技術(shù),另一方面和同行業(yè)伙伴結(jié)盟。
這個(gè)判斷雷鋒網(wǎng)編輯在微軟(亞洲)互聯(lián)網(wǎng)工程院常務(wù)副院長(zhǎng)、Cortana 負(fù)責(zé)人幺寶剛處也得到了確證:
Cortana 的定位是無處不在的人工智能,目前專注效率,既要作為一個(gè)應(yīng)用,也要成為一個(gè)平臺(tái)。
從應(yīng)用角度來看,Cortana 進(jìn)入了 Windows、iOS、Android 等不同的系統(tǒng),連通微軟生態(tài)中的 Office、Skype 等一同成為效率工具。從平臺(tái)角度而言,PC、手機(jī)之后,Cortana 相繼也將其 AI 能力應(yīng)用在了家居、音箱、電視、車載、lOT 等場(chǎng)景中,未來將會(huì)隨著微軟的業(yè)務(wù)繼續(xù)進(jìn)行擴(kuò)張。
整體來說,智能語音助手這條賽道似乎出現(xiàn)了“奇怪”的盤面,一方面是競(jìng)爭(zhēng)的加劇,無論是巨頭之間還是創(chuàng)業(yè)公司的涌進(jìn)都能說明;另一方面則是“結(jié)盟開放”的趨勢(shì)越來越明朗。
以下為專訪幺寶剛的Q&A部分,雷鋒網(wǎng)在不改變?cè)獾幕A(chǔ)上做了增刪:
雷鋒網(wǎng):微軟和哈曼卡頓合作的音箱 Invoke 有什么亮點(diǎn)?
幺寶剛:產(chǎn)品的亮點(diǎn)包括幾個(gè)。
第一個(gè)是優(yōu)秀的產(chǎn)品自然會(huì)吸引最優(yōu)秀的合作者,哈曼卡頓這樣的高端音箱品牌與我們合作,我們也一直希望 Cortana 對(duì)外傳達(dá)一種高端調(diào)性,因此最突出的一點(diǎn)就是聲音,包括兩部分,一部分是音質(zhì)非常好,另一部分是 Cortana 的聲音——計(jì)算機(jī)自動(dòng)生成聲音的自然度也是最好的,這個(gè)是第一個(gè)亮點(diǎn)。
第二個(gè)亮點(diǎn)是,用戶可以通過音箱,直接跟 Skype 連通接打電話,也有一些智能音響可以打電話,但 Skype 除了能夠打電話之外,還跟你的 Skype 聯(lián)系人直接做對(duì)話。
第三是跨平臺(tái)。用戶不光可以在音箱上呼喚小娜,也可以跨平臺(tái)通過 PC,手機(jī)等任何操作平臺(tái)上聯(lián)動(dòng)使用Cortana。
作為人工智能助理, Cortana 對(duì)用戶提出的知識(shí)性問題給予準(zhǔn)確的回答,這主要依托了 Bing 的后臺(tái),除了語音識(shí)別、自然語言理解,對(duì)知識(shí)圖譜的建立,都是智能音箱的亮點(diǎn)。其實(shí)我們非常高興,雖然我們正式進(jìn)入這個(gè)市場(chǎng),來的慢一點(diǎn),但是我們有明晰的定位,并且獲得非常正面的用戶反饋。
Cortana現(xiàn)在定位變的更清晰,現(xiàn)在更多專注在效率方面,高效生活高效工作。
在音箱設(shè)置的時(shí)候,如果用戶擁有 Office365 的帳號(hào),就可以直接連接Cortana,并且使用 Cortana 進(jìn)行管理會(huì)議、日程和提醒,因?yàn)樾∧鹊目缙脚_(tái)屬性,用戶可以輕松同步手機(jī)和 電腦 ,這樣專注于高效的例子,未來將會(huì)在我們產(chǎn)品的特性、功能上不斷加強(qiáng)、優(yōu)化和展現(xiàn)。
小娜的技術(shù)正在不斷的迭代過程中,現(xiàn)在可能越來越多的人工智能同行也都了解到,這需要很大的投入和基礎(chǔ)力量,微軟深耕人工智能領(lǐng)域,其技術(shù)投入和研發(fā)力量不言而喻,例如就在今年8月,我們的對(duì)話語音識(shí)別技術(shù)達(dá)到了人類專業(yè)水平,錯(cuò)誤率由5.9%進(jìn)一步降低到5.1%。雖然數(shù)字感覺很小,但到后面的提高也會(huì)越來越困難,這個(gè)就是技術(shù)的進(jìn)步。
雷鋒網(wǎng):除了賦能硬件廠商外,內(nèi)容上也很重要,微軟在這方面有什么進(jìn)展?
幺寶剛:想要成為無處不在的人工智能助理,小娜還有很長(zhǎng)的路要走,我們現(xiàn)在所專注的是以下幾點(diǎn):
第一點(diǎn),打鐵自身要硬,我個(gè)人對(duì)于微軟自身的技術(shù)非常自信,特別在基礎(chǔ)的科學(xué)研究和技術(shù),例如語音識(shí)別,語意理解,微軟多年的積累和沉淀帶來相當(dāng)大的優(yōu)勢(shì)。
第二點(diǎn),除了技術(shù)之外,還要帶給用戶足夠好的體驗(yàn)。我認(rèn)為,用戶體驗(yàn)分為兩部分:一個(gè)是加入微軟生態(tài),與微軟的生產(chǎn)力工具 Office、Skype 等結(jié)合;另外一個(gè),是小娜的IQ方面的發(fā)力,她需要非常聰明,具備足夠的知識(shí)儲(chǔ)備,從 Cortana 上可以看到,當(dāng)時(shí)微軟在 Bing 上面做投入是有道理的,如果我們不做搜索引擎,那么現(xiàn)在搭建一個(gè)完備的知識(shí)圖譜是很困難的事情,而幸運(yùn)的是,微軟目前既有高效的生產(chǎn)力工具,又有搜索引擎,搭建知識(shí)圖譜,讓人工智能擁有足夠的知識(shí)。。
第三點(diǎn),就是技能的開發(fā)平臺(tái)。我們希望開發(fā)者、第三方用戶、廠商,都可以利用這個(gè)技能平臺(tái)進(jìn)行開發(fā),提供內(nèi)容,加到 Cortana 里,網(wǎng)易云音樂就是個(gè)例子。這個(gè)平臺(tái)已經(jīng)在美國推出了,晚一點(diǎn)時(shí)間,會(huì)在中國繼續(xù)大力推廣,這也是我們希望與合作方構(gòu)建科技生態(tài)的一部分。
雷鋒網(wǎng):讓用戶覺得體驗(yàn)好的標(biāo)準(zhǔn)是什么?
幺寶剛:最基本的層面,是語音的識(shí)別率,我剛才也提到,目前我們的我們的對(duì)話語音識(shí)別技術(shù)達(dá)到了人類專業(yè)水平;再往上升一層,是我們希望用戶的問題能獲得最直接有效的幫助。對(duì)于同一個(gè)問題,有很多智能助理,哪個(gè)回答的最接近于用戶希望得到的,我們是請(qǐng)了專業(yè)的人來評(píng)測(cè)的。但我覺得最關(guān)鍵的,更多用戶使用所產(chǎn)生的大數(shù)據(jù)有足夠多的用戶,使用黏性、使用頻度實(shí)際上證明了這個(gè)事情對(duì)他有多重要。如果他每天都會(huì)來用幾次,說明這個(gè)有用,不然的話自然而然就不用了,就會(huì)選擇別的了。所以我覺得我們既有技術(shù)層面的,也有應(yīng)用層面的,還有用戶層面的一些度量。
雷鋒網(wǎng):未來微軟有沒有可能推出自己的智能音箱?
幺寶剛:小娜未來的發(fā)展自然會(huì)跟隨公司戰(zhàn)略,作為微軟生態(tài)的一部分,像微軟內(nèi)部已有硬件,例如Xbox,小娜已經(jīng)在進(jìn)行整合,所以我們也將會(huì)配合公司的戰(zhàn)略發(fā)展。
雷鋒網(wǎng):目前對(duì) Cortana 在營收上有什么期待嗎?或者KPI。
幺寶剛:像剛才我也提到,在商業(yè)模式方面,我們第一年的專著點(diǎn)會(huì)是先專著于用戶數(shù)量和用戶體驗(yàn)上,所以至少在我們這個(gè)財(cái)年這不是一個(gè)目標(biāo)。
雷鋒網(wǎng):你覺得智能語音助手,在未來競(jìng)爭(zhēng)中可能會(huì)勝出的因素有什么?
幺寶剛:我們也在思考這樣的事情。我覺得有幾點(diǎn):
第一,一定要有自己專業(yè)核心的投入,人工智能這個(gè)概念已經(jīng)不陌生了,歷史上也經(jīng)歷過遇冷,因?yàn)楸旧砭秃茈y,核心的東西,需要長(zhǎng)期不懈的努力,才可能有突破。我認(rèn)為關(guān)鍵點(diǎn)在于公司是否愿意在基礎(chǔ)研究方面做持續(xù)不斷的投入。不然,你的核心技術(shù)將來會(huì)依賴于別人。而微軟在這方面,擁有多年積累的技術(shù)、同樣在人才方面,我們也投入很多。
第二,要有基礎(chǔ)應(yīng)用。人工智能助理必須有自己的內(nèi)容,需要足夠聰明,并且擁有足夠的知識(shí),那這個(gè)從哪里來?微軟之所以有知識(shí)圖譜,是因?yàn)槲覀兺顿Y了多年的 Bing 。同樣,我們之所以能夠?qū)W⒃谛史矫妫彩且驗(yàn)橛?Office 多年的積累,以及對(duì)用戶需求的了解。
第三,足夠多的數(shù)據(jù)。目前有兩種人工智能的應(yīng)用場(chǎng)景,一種是比較通用的,還有一種是在垂直領(lǐng)域的應(yīng)用。我認(rèn)為,要獲得足夠的數(shù)據(jù)首先要有多年的技術(shù)積累,其次要對(duì)行業(yè)非常了解,微軟認(rèn)知服務(wù)集合多種智能API以及知識(shí)API,目前我們已發(fā)布包括視覺,語音,還有翻譯語言,語義理解等29款工具,我們也希望能和更多合作伙伴一同探索人工智能的更多應(yīng)用和可能。
雷鋒網(wǎng):微軟整體的戰(zhàn)略,是云為先移動(dòng)為先,Cortana 在這個(gè)戰(zhàn)略里扮演著什么樣的角色?
幺寶剛:微軟 CEO 薩提亞提出智能云+智能邊緣計(jì)算的概念,也就是Cloud+AI的模式,我們認(rèn)為,未來的世界是由智能云和智能端,用人工智能將所有東西連接在一起。我覺得的 Cortana 是一個(gè)非常典型的體現(xiàn),原因在于,首先我們對(duì) Cortana 的定位,是一個(gè)無處不在的智能助理,所謂無處不在是指, Cortana 既可以獨(dú)立作為一個(gè)應(yīng)用存在,也可以存在在微軟的應(yīng)用或者合作伙伴的應(yīng)用、甚至存在于定制的設(shè)備里,當(dāng)然做到這一點(diǎn)的前提是,小娜必須生活在云端,只有這樣的話,才能夠同時(shí)為這么多的終端服務(wù)。
另外,Cortana 后臺(tái)的很多技術(shù),其實(shí)應(yīng)用的都是云服務(wù),Cortana 可以通過智能助理的使用,把語音做的更好,做更好的語音,我們還通過微軟的認(rèn)知服務(wù)提供給那些暫時(shí)不需要 Cortana,但是需要微軟語音服務(wù)的開發(fā)者使用。
雷鋒網(wǎng):小冰那邊會(huì)講一些數(shù)據(jù),比如說對(duì)話輪次達(dá)到多少輪,小娜好像不太強(qiáng)調(diào)這些數(shù)據(jù)。
幺寶剛:對(duì),因?yàn)樾”且粋€(gè)情感機(jī)器人,那她陪伴用戶的時(shí)間長(zhǎng),對(duì)她來說是一個(gè)很重要的指標(biāo)。我先不說小娜先說搜索引擎,那搜索引擎最理想的對(duì)話次數(shù)是多少?
雷鋒網(wǎng):一輪。
幺寶剛:就是我馬上就告訴你答案。但是對(duì)于智能助理,理想狀態(tài)到底應(yīng)該是多少?這個(gè)其實(shí)說實(shí)在的,我們也沒有把這個(gè)問題規(guī)定下來,是一輪或者多輪。我覺得可能最后還是要看客戶的問題是什么?比如用戶提出一個(gè)問題,是對(duì)智能助理說,幫我定一班去上海的火車,我下午有個(gè)會(huì),那這個(gè)智能助理就應(yīng)該很聰明的知道,用戶下午幾點(diǎn)開會(huì),用戶的火車應(yīng)該在下午兩點(diǎn)就要出發(fā),那他就給你定好了兩點(diǎn)的火車。但如果你的問題是你給我講一個(gè)笑話吧,或者給我唱首歌。那你是只唱一首歌就完了嗎?所以這個(gè)其實(shí)還是要看場(chǎng)景來定的。所以我覺得根據(jù)場(chǎng)景會(huì)有不同測(cè)量的指標(biāo),可以分享的是,從小娜推出之后到現(xiàn)在,用戶問過的問題已經(jīng)超過了一百億。
雷鋒網(wǎng):在和其他硬件系統(tǒng)整合的時(shí)候,會(huì)不會(huì)出現(xiàn)權(quán)限上的差異?比如說 iOS 給 Siri 的權(quán)限大一點(diǎn)?
幺寶剛:每個(gè)平臺(tái)其實(shí)都有限制,即使像 Siri 在 iOS 也不可能所有事情都做,因?yàn)橛袝r(shí)候用戶或者APP本身會(huì)有授權(quán),關(guān)鍵是說你了解這個(gè)限制,然后看怎么樣讓用戶獲得最好的體驗(yàn)。
雷鋒網(wǎng):某種程度上來說 Cortana 也算一個(gè) OS,只是沒有提這樣的概念,微軟如何來面對(duì)類似百度這樣的廠商的競(jìng)爭(zhēng)?
幺寶剛:一方面是微軟對(duì)技術(shù)的多年投入;另外一方面就是不可能全面出擊,而要找到專注點(diǎn)。我們的專注點(diǎn)在于生產(chǎn)效率;第三是微軟還是作為一個(gè)平臺(tái)的公司,我們希望變成一個(gè)開放的系統(tǒng),與更多的合作伙伴進(jìn)行合作。此外,因?yàn)楹芏嗳硕枷胱鲩_放平臺(tái),但不是所有的開放平臺(tái)大家都去用的,所以我覺得微軟作為一家國際性、擁有全球領(lǐng)先科技和具備信賴感的科技企業(yè)我為此充滿信心。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。