0
本文作者: 李智勇 | 2016-10-23 22:20 |
雷鋒網(wǎng)按:本文作者李智勇,有興趣可關(guān)注其公號:zuomoshi(琢磨事)。
看起來DeepMind用AlphaGo戰(zhàn)敗李世石后似乎就沒啥動靜了,但其實不是的,這家公司正推動著A.I.往縱深發(fā)展,而不是單純地停留在圍棋這樣的領(lǐng)域。只不過這些事情沒有那么抓眼球,所以很多人并沒注意到。很有意思的是,從當(dāng)前DeepMind所做的事情里我們其實可以抽取出一些更有價值的模式,比如什么是人工智能+,到底應(yīng)該怎么加。
DeepMind第一件在做的事情是用機(jī)器學(xué)習(xí)來管理數(shù)據(jù)中心,期望達(dá)到比人管理更省電的效果。最終結(jié)果非常不錯,實際成績是:比人管理的時候節(jié)電40%。
為把事情說清楚需要簡單介紹一下背景:
Google這類大互聯(lián)網(wǎng)公司的應(yīng)用比如搜索、Gmail、公有云服務(wù)等是完全跑在自己的服務(wù)器集群上的,這些集群無比龐大通常有數(shù)百萬臺服務(wù)器。由于服務(wù)器太多因此并不會只放在一個地方,而是分布在多個數(shù)據(jù)中心里。管理各個數(shù)據(jù)中心時,一個核心問題就是冷卻。我們手機(jī)用時間長了還發(fā)熱,那么多總是在跑的服務(wù)器如果沒有有效的冷卻措施,那數(shù)據(jù)中心會變的火爐一樣。數(shù)據(jù)中心的冷卻系統(tǒng)和中央空調(diào)差不多,這樣一來就需要來根據(jù)環(huán)境來控制什么時候開冷卻系統(tǒng),開多少度等。但每個數(shù)據(jù)中心所處的地點、架構(gòu)并不完全一致,這就給管理帶來了一些麻煩。DeepMind把這種麻煩總結(jié)為三點:
1. 冷卻設(shè)備、操作設(shè)備的方法、環(huán)境之間不是簡單的線性關(guān)系。也就是說不是環(huán)境溫度是30度時,那冷卻系統(tǒng)調(diào)成20度就完了。
2. 冷卻系統(tǒng)并不能迅速響應(yīng)內(nèi)部或外部的變化。也就是說外部氣溫上升,你據(jù)此進(jìn)行調(diào)整,但實際起效果的時候,外部氣溫可能又下降了。
3. 每個數(shù)據(jù)中心都有自己獨特的架構(gòu)和地理位置。
DeepMind解決這問題時顯然又會用神經(jīng)網(wǎng)絡(luò),這次他們訓(xùn)練了三個神經(jīng)網(wǎng)絡(luò):
一個神經(jīng)網(wǎng)絡(luò)用各種傳感器收集來的數(shù)據(jù)進(jìn)行訓(xùn)練,比如:溫度、功率、泵速等。
一個神經(jīng)網(wǎng)絡(luò)被訓(xùn)練用于預(yù)測下一小時的溫度。
一個神經(jīng)網(wǎng)絡(luò)被訓(xùn)練用于預(yù)測下一小時的工作負(fù)荷。
都訓(xùn)練完之后DeepMind把這三個神經(jīng)網(wǎng)絡(luò)在某一個數(shù)據(jù)中心進(jìn)行了應(yīng)用,評測的指標(biāo)是PUE(Power Usage Effectiveness),這個值表示數(shù)據(jù)中心能源消耗在整個IT能源消耗中的占比(顯然越低越好)。為了說明結(jié)果DeepMind貼了一張圖出來:
取得效果后DeepMind認(rèn)為,它的這個神經(jīng)網(wǎng)絡(luò)不只可以用于數(shù)據(jù)中心,而還有一定的通用性,所以準(zhǔn)備把它展開到發(fā)電廠、半導(dǎo)體制造等。
案例原文:DeepMind AI Reduces Google Data Centre Cooling Bill by 40%
DeepMind的另一個嘗試是用神經(jīng)網(wǎng)絡(luò)看病,并且專門給項目起了個名叫DeepMind Health。
醫(yī)療現(xiàn)實是這樣:每11個成年人里就有1個會得糖尿病,而糖尿病會讓患者失明的概率提高25倍,如果失明的癥狀能在早期發(fā)現(xiàn),那么有98%的可能性來治愈這疾病。但很可惜的是傳統(tǒng)的分析方法非常復(fù)雜,非常有經(jīng)驗的眼科專家也要花很多時間才能做出診斷,所以很難及時的對所有病人進(jìn)行精確診斷。
DeepMind解決問題的思路還是通過導(dǎo)入神經(jīng)網(wǎng)絡(luò)。他們同一家叫Moorfields的機(jī)構(gòu)合作,拿到了近百萬的原始數(shù)據(jù)。我們可以想象這些數(shù)據(jù)有兩個顯然的好處:一個是這些數(shù)據(jù)是原始的醫(yī)療數(shù)據(jù),清晰度足夠;一個是這些數(shù)據(jù)實際上是標(biāo)記過的。DeepMind會用這些數(shù)據(jù)訓(xùn)練它們的神經(jīng)網(wǎng)絡(luò),然后診斷的問題就變成了從圖片中提取特征的問題,而如我們所知深度學(xué)習(xí)在圖像識別上其錯誤率是比人低的,并且會越來越準(zhǔn)。
這個項目還沒有取得實際效果,但從Imagenet上不斷提高識別率上來推斷,這會導(dǎo)致診斷的精度和速度有根本性提升。
案例原文:Announcing DeepMind Health research partnership with Moorfields Eye Hospital
跳出來看的話,我們可以發(fā)現(xiàn)DeepMind的兩個嘗試具有這樣的特征:
1.垂直的領(lǐng)域,但機(jī)器學(xué)習(xí)可以促成質(zhì)的飛躍。
2.垂直領(lǐng)域牽涉的商業(yè)價值足夠大。
3.能夠比較容易的獲取有效數(shù)據(jù)。
我們有理由相信這會是未來人工智能落地的普遍模式?,F(xiàn)在的人工智能具有通用性,但遠(yuǎn)不是通用智能,并不能夠什么都干。這樣一來從投入產(chǎn)出比的角度看,它就只有落地在那些顯然能產(chǎn)出較大回報點上,這樣才能真的獲得應(yīng)用。一個點獲得應(yīng)用后,那再展開到類似的領(lǐng)域,比如DeepMind從數(shù)據(jù)中心展開到發(fā)電廠,這樣就可以形成“技術(shù)進(jìn)步-投資-回報”上的正反饋。這很像新一代的單點突破,橫向展開,所不同的是同一時間可以做的點實際上也還受制于是否能獲得數(shù)據(jù)。
反過來講這也意味著號稱能做通用智能的基本上是騙子和瘋子。聲智科技(一家提供聲學(xué)、語音方案的創(chuàng)業(yè)公司)的CEO陳孝良對此有非常清醒的認(rèn)識,他的一個核心觀點正是:智能不是越通用越好,數(shù)據(jù)也不是越多越好,認(rèn)知技術(shù)能力邊界非常關(guān)鍵。
上面所提到的基本模式未來很可能成為人工智能+的基本模式。有意思的事情是,這種落地并不只是DeepMind公司才能做,而是普遍存在于各個行業(yè)之中。我們可以把能夠做神經(jīng)網(wǎng)絡(luò)的團(tuán)隊分成兩類:一類是真的能對模型本身有所改進(jìn),對社區(qū)做出根本性貢獻(xiàn)的團(tuán)隊;一類是能夠用好模型,把它落地的很好的團(tuán)隊。前者無疑是非常稀缺的,并且也只有極大的,有野心的公司才養(yǎng)的起,后者則門檻相對較低,與此同時應(yīng)用范圍則極廣,極端點可以認(rèn)為可以應(yīng)用到所有匹配上述模式的地方,也正因此這里才蘊含了比較多的創(chuàng)業(yè)機(jī)會。
這里必須一提的是真創(chuàng)業(yè)DeepMind這個公司本身并不是一個很好的模仿對象,這公司實際成功的方法是:先屯一批很牛的人,不管落地方向,做些很牛的事情。等到抱上Google的大腿,再考慮怎么落地。這方法正常創(chuàng)業(yè)公司完全學(xué)不來,上面主要想強(qiáng)調(diào)的是它落地的方法值得學(xué)習(xí),而非公司自身的創(chuàng)業(yè)思路。
很多點獲得突破和應(yīng)用后,事實上就為真的通用智能做了充足的準(zhǔn)備。想象下,我們的電力,醫(yī)療,教育都非常依賴于數(shù)據(jù)和垂直的智能,那只要A.I.的技術(shù)真的有突破,那一種超級智能來接管這一切就會變的非常容易。到那個點上社會結(jié)構(gòu),經(jīng)濟(jì)形態(tài)就會產(chǎn)生根本性變化。當(dāng)然這是另一個非常宏大的話題,真感興趣可以看我的新書《終極復(fù)制:人工智能將如何推動社會巨變》(硬廣,汗...)。
注:頭圖來自svetandroida.cz
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。