一口氣看完微軟人工智能布局和產(chǎn)品落地 | 微軟2018人工智能大會(huì)

本文作者：李詩(shī)

2018-05-21 21:56

導(dǎo)語(yǔ)：在北京召開的微軟2018人工智能大會(huì)上，微軟把自家做的事一股腦全說(shuō)了。

目前，微軟、Google、亞馬遜、蘋果、Facebook都巨頭都在布局人工智能，將人工智能作為公司全面發(fā)展戰(zhàn)略，涉及方方面面，不花費(fèi)一通功夫，很難一下子了解各大公司的技術(shù)、布局和產(chǎn)品落地。

今天，在北京召開的微軟2018人工智能大會(huì)上，微軟把自家做的事一股腦全說(shuō)了。

一口氣看完微軟人工智能布局和產(chǎn)品落地 | 微軟2018人工智能大會(huì)

在雷鋒看來(lái)，發(fā)布會(huì)的亮點(diǎn)主要有：微軟著重強(qiáng)調(diào)了其新的“世界觀”：智能云和智能邊緣；展示了微軟在語(yǔ)音語(yǔ)義、視覺(jué)、機(jī)器翻譯的多項(xiàng)技術(shù)；微軟發(fā)布ONNX項(xiàng)目及ML.NET打造開源跨平臺(tái)人工智能開發(fā)框架；搭載著全新的“全雙工語(yǔ)音技術(shù)”的微軟小冰帶來(lái)了原創(chuàng)詩(shī)歌、歌曲和兒童故事；中國(guó)移動(dòng)、大疆、唯品會(huì)、小米生態(tài)鏈分別展示了與微軟人工智能的合作成果。

微軟新世界觀：智能云和智能邊緣

云計(jì)算、物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能正在將我們的世界將變成一臺(tái)巨大的計(jì)算機(jī)。

微軟全球執(zhí)行副總裁、人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋博士介紹到，在這樣的新時(shí)代，微軟有了全新的世界觀：智能云和智能邊緣。

一口氣看完微軟人工智能布局和產(chǎn)品落地 | 微軟2018人工智能大會(huì)

智能云指的是微軟Azure，是微軟專為人工智能打造的云平臺(tái)。Azure匯聚了微軟在人工智能領(lǐng)域的全部投入與技術(shù)積累，是開發(fā)、部署、運(yùn)行人工智能的云平臺(tái)，同時(shí)也是將智能云與智能邊緣融會(huì)貫通的關(guān)鍵環(huán)節(jié)。

微軟一直在拓展Azure的功能，Azure目前有四個(gè)方面：公有云Azure、混合云Azure Stack、物聯(lián)網(wǎng)Azure IoT Edge和Azure Sphere，以這四個(gè)方面打造出完整的計(jì)算環(huán)境，支持全新應(yīng)用場(chǎng)景。

一口氣看完微軟人工智能布局和產(chǎn)品落地 | 微軟2018人工智能大會(huì)

Azure Stack是Azure公有云在本地?cái)?shù)據(jù)中心的擴(kuò)展，可以在邊緣和離線環(huán)境運(yùn)行、滿足多種監(jiān)管要求。例如石油開發(fā)公司同時(shí)使用Azure公有云和Azure Stack可以按照辦公地點(diǎn)靈活分配計(jì)算資源。

Azure IoT Edge是微軟在2017年Build大會(huì)推出的針對(duì)智能邊緣計(jì)算的產(chǎn)品，可以在Linux和Windows上運(yùn)行，而2018年Build大會(huì)上，微軟宣布將 Azure IoT Edge 開源，允許開發(fā)者進(jìn)行擴(kuò)展、添加功能，并部署到任何環(huán)境中。

一口氣看完微軟人工智能布局和產(chǎn)品落地 | 微軟2018人工智能大會(huì)

Azure 上的認(rèn)知服務(wù)也可以擴(kuò)展到Azure IoT Edge，目前微軟已經(jīng)推出了定制視覺(jué)服務(wù)，可以讓無(wú)人機(jī)或其它工業(yè)裝備無(wú)需連接到云，就能做出快速的響應(yīng)和處理。會(huì)上，大疆展示了與微軟的合作，利用Azure IoT Edge和微軟人工智能服務(wù)，大疆開發(fā)出適用于農(nóng)業(yè)、建筑行業(yè)、公共安全及更多應(yīng)用場(chǎng)景的解決方案。一口氣看完微軟人工智能布局和產(chǎn)品落地 | 微軟2018人工智能大會(huì)

Azure Sphere主要用于保護(hù)和驅(qū)動(dòng)智能云上的設(shè)備。2020年，全球智能邊緣設(shè)備的總數(shù)將超過(guò)200億臺(tái)，世界會(huì)成為一臺(tái)超級(jí)計(jì)算機(jī)，但是我們也會(huì)擔(dān)憂安全問(wèn)題。Azure Sphere方案將提供經(jīng)過(guò)特殊設(shè)計(jì)的安全芯片、安全操作系統(tǒng)和能夠守護(hù)每臺(tái)設(shè)備的云端安全。

在介紹完Azure云平臺(tái)的四個(gè)方面后，沈向洋介紹了微軟將Azure與AI結(jié)合，打造最佳人工智能云平臺(tái)的四個(gè)方向：認(rèn)知服務(wù)、對(duì)話式人工智能、開放平臺(tái)與工具、實(shí)時(shí)人工智能基礎(chǔ)設(shè)施。

Azure 認(rèn)知服務(wù)

在兩年前的Build 2016微軟全球開發(fā)者大會(huì)上，微軟首次公布了運(yùn)行于Azure的認(rèn)知服務(wù)，以API的形式為開發(fā)者提供易用的人工智能技術(shù)能力。目前微軟在全球推出包括語(yǔ)音、視覺(jué)、語(yǔ)言、機(jī)器翻譯等功能的24項(xiàng)服務(wù)，超過(guò)100萬(wàn)開發(fā)者使用。

一口氣看完微軟人工智能布局和產(chǎn)品落地 | 微軟2018人工智能大會(huì)

CaptionBot能像人一樣理解和描述一張圖片，例如，你上傳一張照片，CaptionBot能夠給出一段文字描述：比爾蓋茨正拿著一副網(wǎng)球拍，他看起來(lái)很高興。

此外，還介紹了微軟OCR（(Optical Character Recognition光學(xué)字符識(shí)別），將為各種人工智能應(yīng)用增加圖形文字識(shí)別功能，目前支持從Office到Skype、Bing、HoloLens的微軟應(yīng)用，可以識(shí)別圖像內(nèi)的文字，例如識(shí)別車牌號(hào)、海報(bào)甚至是手寫的筆記。

CaptionBot和OCR都是Azure預(yù)制的人工智能服務(wù)，微軟也針對(duì)變化的場(chǎng)景推出了定制視覺(jué)服務(wù)，可以讓不具備深度學(xué)習(xí)、機(jī)器視覺(jué)背景的開發(fā)者定制圖像標(biāo)簽?zāi)Ｐ?、物件認(rèn)知模型。

微軟技術(shù)院士黃學(xué)東介紹了微軟在人工智能語(yǔ)音語(yǔ)義方面的進(jìn)展。在計(jì)算機(jī)視覺(jué)方面，2015年微軟亞洲研究院發(fā)布的152層殘差網(wǎng)絡(luò)（ResNet）的圖像識(shí)別準(zhǔn)確率已經(jīng)達(dá)到96%，勝過(guò)人類；2017年8月，微軟在Switchboard語(yǔ)音識(shí)別基準(zhǔn)測(cè)試中的錯(cuò)誤率已經(jīng)降低至5.1%，達(dá)到了媲美人類專業(yè)速記員的水平；2018年1月，微軟亞洲研究院自然語(yǔ)言計(jì)算組率先在斯坦福大學(xué)發(fā)起的SQuAD文本理解挑戰(zhàn)賽上獲得超越人類的分?jǐn)?shù)；2018年3月，微軟亞洲研究院與微軟雷德蒙研究院宣布，其研發(fā)的機(jī)器翻譯系統(tǒng)在通用新聞報(bào)道測(cè)試集newstest2017的中-英測(cè)試集上，第一個(gè)達(dá)到了可以與人工翻譯媲美的水平。

5月初，雷鋒網(wǎng)曾報(bào)道，谷歌在I/O大會(huì)上展示了Google語(yǔ)音助手的Duplex（雙工）技術(shù)，能主動(dòng)給餐館、理發(fā)店打電話，幫助用戶預(yù)約時(shí)間。由于其聲音和音調(diào)與人類幾乎沒(méi)有差別，能實(shí)現(xiàn)連續(xù)對(duì)話還能理解上下文快速反應(yīng)，在朋友圈大火了一把。這時(shí)，微軟坐不住了，趕緊發(fā)出了技術(shù)聲明，表明微軟小冰在兩年前就實(shí)現(xiàn)了AI與人類通電話，并且在谷歌之前就公布了實(shí)現(xiàn)AI與人雙向交流的全雙工語(yǔ)音技術(shù)。

在現(xiàn)場(chǎng)，黃學(xué)東忍不住Diss了一下，說(shuō)Google動(dòng)不動(dòng)就吹牛， ”微軟不僅有全雙工，微軟更實(shí)現(xiàn)了全三工、全四工、全五工……”

一口氣看完微軟人工智能布局和產(chǎn)品落地 | 微軟2018人工智能大會(huì)

現(xiàn)場(chǎng)展示了一款“全多工”的產(chǎn)品——微軟與Roobo合作的AI會(huì)議系統(tǒng)。微軟特意在現(xiàn)場(chǎng)準(zhǔn)備了四個(gè)人的現(xiàn)場(chǎng)會(huì)議演示，可以看到，這款A(yù)I會(huì)議系統(tǒng)能識(shí)別不同人的聲音，實(shí)時(shí)以文字記錄下大家的發(fā)言內(nèi)容，同時(shí)識(shí)別出涉及工作安排的內(nèi)容生成代辦事項(xiàng)。這個(gè)產(chǎn)品，可以說(shuō)是每個(gè)團(tuán)隊(duì)中會(huì)議記錄員的救星。

一口氣看完微軟人工智能布局和產(chǎn)品落地 | 微軟2018人工智能大會(huì)

黃學(xué)東還展示了語(yǔ)音定制技術(shù)，根據(jù)上傳的錄音，可以生成和用戶一樣聲音的AI助手。上傳30分鐘的錄音，得到的AI說(shuō)話與用戶相似度不高，但是以10小時(shí)的錄音進(jìn)行訓(xùn)練后，就能得到較為逼真的模仿效果。想一想，你會(huì)想要把家人或者朋友的聲音放進(jìn)AI里，讓它隨時(shí)陪伴你嗎？

黃學(xué)東稱今年微軟達(dá)到中文英文翻譯超過(guò)專業(yè)人士的水平。大會(huì)上，小米生態(tài)鏈企業(yè)香蕉出行展示了魔芋AI翻譯機(jī)，借助微軟認(rèn)知服務(wù)中的微軟翻譯打造，能夠提供14種語(yǔ)言的實(shí)時(shí)語(yǔ)音翻譯。雖然由于現(xiàn)場(chǎng)混音效果，魔芋AI有幾次識(shí)別不出語(yǔ)音指令，但翻譯的效果還是不錯(cuò)的，可以說(shuō)是出游利器。

對(duì)話式人工智能

亞馬遜Echo智能音箱帶動(dòng)了對(duì)話式人工智能的產(chǎn)品落地，現(xiàn)在對(duì)話式人工智能已經(jīng)進(jìn)入音箱、電視、車載等多個(gè)設(shè)備中，是新一代智能應(yīng)用的核心。對(duì)話式人工智能也在不斷升級(jí)其對(duì)話能力，追求越來(lái)越自然、流暢的人機(jī)交流。

微軟有小娜和小冰兩個(gè)對(duì)話式人工智能助手，小娜更傾向于發(fā)展智商，而小冰則是面向情商維度發(fā)展的人工智能系統(tǒng)。

微軟小冰誕生已經(jīng)三年，一直以逗貧、插科打諢的聊天風(fēng)格著稱。最近，微軟將最新的全雙工語(yǔ)音交互技術(shù)(Full Duplex)應(yīng)用在了微軟小冰上，同時(shí)提升了小冰的智商和情商，具備了以下能力：一次喚醒之后的連續(xù)對(duì)話、預(yù)測(cè)用戶接下來(lái)的對(duì)話內(nèi)容、幫助用戶輕松完成多重任務(wù)、內(nèi)容創(chuàng)造（寫詩(shī)、寫歌、講故事）。小冰不只是能夠執(zhí)行用戶的任務(wù)，還能主動(dòng)提供聊天語(yǔ)聊，陪伴和關(guān)心用戶。

一口氣看完微軟人工智能布局和產(chǎn)品落地 | 微軟2018人工智能大會(huì)

這次大會(huì)上，微軟展示了一段小冰在一次電話聊天結(jié)束后，由于判斷出用戶情緒低落，認(rèn)為需要再一次電話溝通，于是又撥打了一通電話，去詢問(wèn)用戶情緒是否變好、提醒用戶早點(diǎn)休息、告知用戶明天天氣情況。

據(jù)了解，2016年8月起，微軟（亞洲）互聯(lián)網(wǎng)工程院通過(guò)人類用戶主動(dòng)發(fā)起的方式，在明確告知用戶小冰并非人類的前提下，已讓小冰與人類用戶完成了累計(jì)超過(guò)60萬(wàn)通電話交流。

在內(nèi)容創(chuàng)作方面，微軟展示了小冰寫的詩(shī)、原創(chuàng)歌曲、有聲讀物。在有聲讀物領(lǐng)域，微軟已擁有接近4萬(wàn)集有聲童話內(nèi)容。這些有聲讀物全部由人工智能技術(shù)生成，在與人類主播質(zhì)量相當(dāng)?shù)那疤嵯?，?shù)量足以陪伴一個(gè)孩子從2歲到9歲的全部時(shí)光。6個(gè)月來(lái)，這些有聲讀物已順利投放到占中國(guó)市場(chǎng)90%的兒童早教機(jī)、故事機(jī)和在線播客平臺(tái)，播放總時(shí)長(zhǎng)超過(guò)400萬(wàn)小時(shí)。

一口氣看完微軟人工智能布局和產(chǎn)品落地 | 微軟2018人工智能大會(huì)

今年四月，微軟已經(jīng)在中國(guó)和美國(guó)宣布了全雙工語(yǔ)音技術(shù)，并且有多項(xiàng)產(chǎn)品落地，微軟（亞洲）互聯(lián)網(wǎng)工程院副院長(zhǎng)李笛宣布，今年秋天，微軟還將向合作伙伴和開發(fā)者開放“全雙工語(yǔ)音技術(shù)（Full Duplex）”開發(fā)者可以使用這項(xiàng)技術(shù)打造自己的對(duì)話應(yīng)用。

雷鋒網(wǎng)好奇，微軟的全雙工語(yǔ)音技術(shù)開源，這會(huì)不會(huì)對(duì)現(xiàn)在的智能音箱里的“傻萌”的語(yǔ)音助手進(jìn)行一次洗牌呢？（延伸閱讀：微軟發(fā)大招：要做智商和情商兼具的語(yǔ)音助手）

開放平臺(tái)+基礎(chǔ)設(shè)施

要促進(jìn)人工智能的普及，技術(shù)開放是必經(jīng)之路，微軟也推出了開放人工智能平臺(tái)（Open AI）戰(zhàn)略及開發(fā)工具。

微軟可以支持TensorFlow、CNTK等業(yè)界主流的深度學(xué)習(xí)平臺(tái)，同時(shí)，微軟還發(fā)起了開放神經(jīng)網(wǎng)絡(luò)交換（ONNX）項(xiàng)目，旨在推動(dòng)人工智能研究的互操作性，讓任何深度學(xué)習(xí)框架在任何芯片與任何設(shè)備上都能運(yùn)行。目前，已經(jīng)有15家公司支持ONNX，并且還有更多公司正在加入進(jìn)來(lái)?，F(xiàn)在已經(jīng)有PyTorch等六種頂級(jí)框架支持ONNX，其它框架則可以通過(guò)轉(zhuǎn)換器獲得支持。

一口氣看完微軟人工智能布局和產(chǎn)品落地 | 微軟2018人工智能大會(huì)

在Build 2018微軟全球開發(fā)者大會(huì)上，微軟宣布推出跨平臺(tái)、開源機(jī)器學(xué)習(xí)框架ML.NET開放預(yù)覽。ML.NET讓任何開發(fā)者都能開發(fā)出自己的定制化機(jī)器學(xué)習(xí)模型，并將其融入到自己的應(yīng)用中去——開發(fā)者完全無(wú)需具備開發(fā)和調(diào)試機(jī)器學(xué)習(xí)模型的經(jīng)驗(yàn)。這一框架最初由微軟研究院開發(fā)，并且在Windows、Bing、Azure等微軟產(chǎn)品上都得到了成功的應(yīng)用。通過(guò)將這一技術(shù)框架開源，微軟希望能夠?yàn)槊恳晃婚_發(fā)者賦予駕馭機(jī)器學(xué)習(xí)的能力。

一口氣看完微軟人工智能布局和產(chǎn)品落地 | 微軟2018人工智能大會(huì) 微軟Project Brainwave能利用Azure上最先進(jìn)的FPGA基礎(chǔ)架構(gòu)完成實(shí)時(shí)的人工智能處理。用戶只需通過(guò)實(shí)時(shí)的單一批數(shù)據(jù)，就能得到以往需要多得多的批數(shù)據(jù)處理才能得到的性能，真正實(shí)現(xiàn)人工智能的實(shí)時(shí)計(jì)算。而且，F(xiàn)PGA運(yùn)算不僅僅只在云端提供——通過(guò)合作伙伴，也可以通過(guò)Azure Stack混合云在本地提供FPGA。如此強(qiáng)大的實(shí)時(shí)計(jì)算能力不僅存在于云端，同時(shí)也適用于邊緣計(jì)算，這將讓更多創(chuàng)新成為可能。

AI賦能Office 365

雖然今天我們看到的都是全新的AI技術(shù)，但是微軟也沒(méi)有忘記其桌面時(shí)代的核心業(yè)務(wù)Windows和Office。

一口氣看完微軟人工智能布局和產(chǎn)品落地 | 微軟2018人工智能大會(huì)

AI功能已經(jīng)成功與Office 365、Dynamics 365、Linkedin等產(chǎn)品和功能融為一體。例如，在發(fā)郵件時(shí)，微軟提供了多種語(yǔ)言的一鍵翻譯。在用Excel時(shí)，Excel能更好地猜測(cè)用戶的行為，提前生成用戶可能需要的內(nèi)容。

在前些天的錘子手機(jī)發(fā)布會(huì)上，羅永浩推出了自己的堅(jiān)果 TNT 工作站，用人工智能的語(yǔ)音和語(yǔ)義技術(shù)升級(jí)Office辦公軟件，例如，可以用語(yǔ)音指令來(lái)做PPT和Excel，用語(yǔ)音指令制作幻燈片，包括調(diào)節(jié)字體大小、顏色、樣式等。

雷鋒網(wǎng)發(fā)現(xiàn)，很多人評(píng)論這些需求或許都是偽需求，我們看到微軟也在用人工智能升級(jí)桌面辦公系統(tǒng)，更能直接對(duì)比，究竟什么樣的智能操作才是我們所需要的。

免費(fèi)AI課程上線

最會(huì)，為了推動(dòng)全民AI，讓每個(gè)人都有機(jī)會(huì)學(xué)習(xí)人工智能，微軟推出在線人工智能學(xué)院，目標(biāo)是一年內(nèi)培養(yǎng)出10 萬(wàn)余名人工智能人才，將免費(fèi)提供包括AI基礎(chǔ)、核心技術(shù)和高階應(yīng)用在內(nèi)的總共250課時(shí)的12門人工智能學(xué)分課程，覆蓋10項(xiàng)應(yīng)用技能。完成課程學(xué)習(xí)的用戶，還可申請(qǐng)微軟專業(yè)學(xué)位課程（MPP，Microsoft Professional Program）作為職業(yè)技能認(rèn)證。感興趣的朋友可以敲：（https://school.azure.cn/）

相關(guān)文章：

會(huì)打電話的 AI 背后：谷歌 Duplex 技術(shù)解析

谷歌AI打電話刷屏，微軟坐不住了

微軟發(fā)大招：要做智商和情商兼具的語(yǔ)音助手

微軟 Build 發(fā)布會(huì)總覽：雖然 Windows 10 缺席，但亮點(diǎn)依然很多

Smartisan R1 是真旗艦，但堅(jiān)果 TNT 工作站真的是革命性產(chǎn)品嗎？

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

5人收藏

李詩(shī)

編輯

關(guān)注AI業(yè)界、NLP、VR、AR技術(shù)與產(chǎn)品。采訪報(bào)道、行業(yè)交流請(qǐng)加微信“Hanass”

掃描關(guān)注作者微信

發(fā)私信

當(dāng)月熱門文章