0
本文作者: 朱恒偉 | 2016-10-17 21:52 |
財(cái)富雜志在近兩周刊文《為什么深度學(xué)習(xí)會(huì)一夜間改變你的生活?》。文中講到,過去四年來,我們身邊的很多技術(shù)都驟然躍進(jìn)。其中最為明顯的莫過于每個(gè)人手機(jī)里的語音助手都變得通曉人性了,無論是亞馬遜的Alexa、微軟的Cortana還是蘋果的Siri,都能在我們需要的時(shí)候飛快又精確地幫我們聯(lián)系到各自的愛人。
image credit: science.howstuffworks.com
以深度學(xué)習(xí)為代表的人工智能技術(shù)的引入,就像通電一樣,使得原本沉悶的機(jī)器、設(shè)備一下子變得靈動(dòng)和善解人意。而在技術(shù)演進(jìn)的背后,是微軟、蘋果、谷歌、亞馬遜、百度這些巨頭公司數(shù)年甚至數(shù)十年的投入推動(dòng)。
在今年的百度世界大會(huì)上,李彥宏說“移動(dòng)互聯(lián)網(wǎng)的下一幕是人工智能。而人工智能是(公司)核心中的核心?!弊鳛閲鴥?nèi)最早投入人工智能研發(fā)的公司之一,我們來看看百度是如何把AI變成電能一樣的基礎(chǔ)設(shè)施。
2016年百度世界大會(huì)揭示了百度人工智能的核心是“百度大腦”。作為大腦,它是一系列技術(shù)和應(yīng)用的集合。李彥宏描述百度大腦有4個(gè)能力:自然語言處理、語音、圖像和用戶畫像。這4個(gè)能力都與搜索業(yè)務(wù)高度相關(guān)。搜狗CEO王小川曾經(jīng)表達(dá)過一個(gè)相近的觀點(diǎn):搜索公司從成立的第一天起就是一家做人工智能的公司。
在人工智能的能力搭建上,李彥宏曾經(jīng)講過3個(gè)關(guān)鍵要素:算法、計(jì)算資源和數(shù)據(jù)。作為一家搜索公司,它的數(shù)據(jù)規(guī)模毋庸置疑。在計(jì)算資源上,它現(xiàn)在擁有的高性能計(jì)算機(jī)群與英偉達(dá)的合作有著密切的關(guān)系。吳恩達(dá)和百度研究院在英偉達(dá)這一代Pascal架構(gòu)的GPU研發(fā)上有很多參與。百度今天所提供的服務(wù),如果是基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí),多半是跑在GPU上。吳恩達(dá)還在GTC 2016上表達(dá)過:
百度是第一家宣布把GPU投入到業(yè)務(wù)中的大型公司,也就是進(jìn)行推理和提供服務(wù),而不僅僅用于訓(xùn)練。
在計(jì)算資源投入上,黃仁勛稱百度為中國最重要的客戶之一,而一位業(yè)內(nèi)資深人士則稱百度“極其舍得投入購買GPU”。
百度人工智能戰(zhàn)略的核心是百度大腦,如果說數(shù)據(jù)和計(jì)算資源是它的硬性實(shí)力,那百度在近幾年奉行的人才戰(zhàn)略就是將這些資源轉(zhuǎn)化為項(xiàng)目的直接推力和催化劑。
深度學(xué)習(xí)研究院IDL是百度歷史上第一個(gè)研究院。這個(gè)研究院于2013年7月成立,李彥宏親自擔(dān)當(dāng)院長,而研究院的落地組建則由時(shí)任百度多媒體業(yè)務(wù)部負(fù)責(zé)人的余凱牽頭。在IDL組建之前,百度也在語音技術(shù)、視覺搜索、人臉應(yīng)用等多個(gè)業(yè)務(wù)上感受到了人工智能技術(shù)帶來的規(guī)模和影響力的提升。
2014年年初,百度宣布了專為IDL定制的“少帥計(jì)劃”:向全球招募9名青年精英,要求其在某一個(gè)或多個(gè)人工智能相關(guān)知識(shí)領(lǐng)域達(dá)到同齡人中的最高水準(zhǔn),少帥計(jì)劃入職即為T9-T10,年薪則在百萬起步。少帥計(jì)劃還提出了3年后有望帶領(lǐng)20 - 30人團(tuán)隊(duì),獨(dú)立領(lǐng)導(dǎo)一個(gè)創(chuàng)新項(xiàng)目,獲得百度天使投資的招募條件。
Andrew Ng. Image credit: forbes.com
2014年,李彥宏找到Andrew Ng吳恩達(dá)聊了多次,吳恩達(dá)隨后加入百度。這是當(dāng)年中國互聯(lián)網(wǎng)公司引入的最重量級(jí)的人物。在此前,吳恩達(dá)曾在谷歌負(fù)責(zé)建設(shè)全球最大的“神經(jīng)網(wǎng)絡(luò)”——谷歌大腦。而加入百度之后,他除了領(lǐng)導(dǎo)研究院,還負(fù)責(zé)百度大腦的搭建。
IDL和少帥計(jì)劃這撥人,即使在離開之后,依然是國內(nèi)人工智能公司的中堅(jiān)力量。百度今天在人工智能上的階段性成果,如無人車、深度學(xué)習(xí)平臺(tái)PaddlePaddle均出自這里。
如前述,百度大腦是百度人工智能的核心,數(shù)據(jù)和計(jì)算資源是硬性的驅(qū)動(dòng)因素,研究院體系和它吸納的人才是軟性的動(dòng)因。而百度大腦也并非是其人工智能業(yè)務(wù)的全部,典型的如“百度大腦+”的應(yīng)用。
比如,百度在這個(gè)月推出對(duì)話機(jī)器人形式的“百度醫(yī)療大腦”,官方介紹它是:通過海量醫(yī)療數(shù)據(jù)、文獻(xiàn)采集與分析進(jìn)行人工智能化的產(chǎn)品設(shè)計(jì),模擬醫(yī)生問診流程,與用戶多輪交流,依據(jù)用戶的癥狀,提出可能出現(xiàn)問題,反復(fù)驗(yàn)證,給出最終建議。簡單來說,就是醫(yī)療數(shù)據(jù)+人工智能。而百度今天最重要的人工智能產(chǎn)品化項(xiàng)目無人車,也可以理解成是百度大腦+汽車。
面向開發(fā)者端(To D)提供PaddlePaddle這樣的深度學(xué)習(xí)開源平臺(tái),同時(shí)接口的方式把語音、圖像、自然語言處理上的積累開放,面向消費(fèi)者們(To C)開始提供度秘、醫(yī)療大腦這樣具有探索性質(zhì)的產(chǎn)品化應(yīng)用,而面向行業(yè)內(nèi)(To B)則提供圖像、語音等技術(shù)集成整合的自動(dòng)駕駛等商業(yè)化解決方案,百度的人工智能生態(tài)也就此展開。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。