丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
業(yè)界 正文
發(fā)私信給劉芳平
發(fā)送

0

技術人創(chuàng)業(yè)者夏粉:用 AI 創(chuàng)造 AI

本文作者: 劉芳平 2018-04-28 20:34 專題:AutoML 祛魅
導語:夏粉去年 6 月創(chuàng)立智鈾科技,公司專注開發(fā)自動化機器學習平臺(Auto ML),至今已獲得兩輪融資。

這幾年從百度出來創(chuàng)業(yè)的人工智能科學家不少,夏粉就是其中一位。去年 6 月,他創(chuàng)立智鈾科技,公司專注開發(fā)自動化機器學習平臺(AutoML),公司產品名為 Ebrain,至今已獲得兩輪融資。

AutoML 的目的是實現(xiàn)機器學習自動化建模,通俗一些來說,是用 AI 創(chuàng)造 AI。當然,往細來講它并非能將整個人工智能應用的過程自動化,而更多是降低這項技術的使用門檻,從而讓更多的人也能用上。在接受雷鋒網專訪的過程中,夏粉對此進行了詳細解讀。

作為技術人創(chuàng)業(yè)者,夏粉也向雷鋒網表達了在向企業(yè)家身份轉變的過程中所遇到的挑戰(zhàn),他表示,

創(chuàng)業(yè)跟科學問題不一樣,科學問題是邊界很清晰、非零即一的。但公司創(chuàng)業(yè)因素很多,有的時候它不見得用科學的方法能解決,可能需要一些藝術的、模糊處理的方式。

關于夏粉

技術人創(chuàng)業(yè)者夏粉:用 AI 創(chuàng)造 AI

夏粉博士,畢業(yè)于中科院自動化所,師從機器學習泰斗王玨老師;智鈾科技公司創(chuàng)始人兼 CEO,專注于自動化機器學習平臺產品。

15+年機器學習領域的研究和應用經驗,曾在百度任資深科學家,負責百度超大規(guī)模機器學習團隊。研發(fā)超大規(guī)模離散稀疏架構自動化機器學習平臺(Pulsar),覆蓋公司 80 % 以上業(yè)務線,包括百度最核心的商業(yè)變現(xiàn)系統(tǒng)鳳巢、金融、糯米等。在公司內部機器學習平臺中用戶數(shù)排名第一。

機器學習頂級會議雜志 JMLR,ICML,NIPS 等發(fā)表多篇文章。

創(chuàng)業(yè):技術人的情懷與資本的橄欖枝

“技術人是有情懷的,他們希望技術研發(fā)得到認可,開發(fā)出世界一流的技術,然后希望它的影響力盡可能大?!毕姆巯蚶卒h網這樣答道。

回顧之前讀機器學習博士專業(yè)的時候,夏粉表示當時技術得到認可的一個表現(xiàn)就是在頂級會議上發(fā)表論文。后來他發(fā)現(xiàn),技術還需要落地,需要影響別人,于是加入了百度,在百度最大的廣告業(yè)務線網盟,他發(fā)展出了一套 AutoML 技術。

但在大企業(yè)里面,每個人都是一顆螺絲釘,其工作目標被一個框所限定。夏粉的這個框就是網盟的點擊預估系統(tǒng)的 CTR 不停地提升。但他希望有一個更大的平臺,于是來到了百度研究院大數(shù)據(jù)實驗室(BDL),站在研究院的基礎上,夏粉推出了業(yè)界第一個基于萬億規(guī)模的深度學習網絡的商用在線學習系統(tǒng)以及全自動機器學習平臺 Pulsar。Pulsar 被公司各業(yè)務線廣泛使用,平臺覆蓋公司絕大部分業(yè)務線,包括鳳巢、網盟、金融和糯米等,并受到一致好評。

“在內部平臺里面,我們得分第一,兩年時間被 30 條業(yè)務線應用?!毕姆鄹嬖V雷鋒網。

在這個過程中,他發(fā)現(xiàn)自己的影響力還可以進一步擴大,于是想到跳出百度,將技術應用到各行各業(yè)。

除了作為技術人的情懷,國家“大眾創(chuàng)業(yè),萬眾創(chuàng)新”的政策也鼓舞了夏粉。而且,他告訴雷鋒網,當時一些資本把錢放到他眼前了,“一些資本會經常問你要不要創(chuàng)業(yè),你創(chuàng)業(yè)了,我的資金放在那,等著你出來創(chuàng)業(yè)?!?/strong>

如此天時地利人和,最終促成了夏粉邁出創(chuàng)業(yè)步伐。

對于前東家,他表示非常感謝:

百度是一個對技術非常重視公司,技術人員在那邊地位不一樣。百度給我很大的場景,一個技術人員研究動力技術再厲害,如果沒有給他場景,沒有實際的東西給他去加工,積累不了經驗,他也沒法發(fā)現(xiàn)問題來提升自己的技術。百度能提供很多數(shù)據(jù)和算力方面的集體資源,然后具有非常大的問題規(guī)模,你可以在這里面得到很好的實踐鍛煉。

產品:自動化機器學習降低 AI 門檻

技術的進步終究要落地到實際的經濟生產中去,這也是近幾年人工智能大熱之后,AI+成為各行業(yè)乃至國家大力推動的事情。吳恩達說人工智能是未來的水和電,意味著它需要有足夠低的門檻,讓各行各業(yè)的人都能很容易地使用。

但俗話說隔行如隔山,想要把一項計算機科學技術深度整合到另一個行業(yè)中去,并不是一件容易的事情。解決這個問題有幾個方向,一是培養(yǎng)更多的人工智能專家,并讓他們學習不同行業(yè)的專業(yè)知識,這方面許多公司、政府和高校都在努力,包括雷鋒網旗下的 AI 慕課學院。

然而人工智能人才培養(yǎng)的周期很長,AI 人才稀缺的問題長期困擾著行業(yè)。根據(jù)教育部印發(fā)的《高等學校人工智能創(chuàng)新行動計劃》,中國人工智能人才缺口超過 500 萬,如此龐大的需求,短時間內肯定無法得到滿足。

而另一個方向是降低機器學習的門檻,這正是夏粉的創(chuàng)業(yè)團隊在做的事情。智軸科技的產品 Ebrain 是一個機器學習自動化建模平臺。其作用就是用 AI 替代機器學習建模過程中需要大量人工操作的部分,從而讓一般的企業(yè)技術人員也能輕易使用上機器學習,不需要自己精通機器學習。

技術人創(chuàng)業(yè)者夏粉:用 AI 創(chuàng)造 AI

關于 Ebrain,雷鋒網針對一些關鍵問題與夏粉進行了交流:

雷鋒網:什么樣的市場痛點促使你選擇做 AutoML 這個方向?

夏粉:從專業(yè)的角度來說,是目睹了工程師辛苦調參的過程,特別累,我覺得一定要把工程師從這種重復勞動中解放出來(高端人才應該致力于前瞻性研究)。

從企業(yè)的角度來說,是提升了他的效率,節(jié)省了他的研發(fā)成本和人力成本。

對業(yè)務人員來說,是從不可能變?yōu)榱丝赡埽ㄖ铝τ谧龊霉ぞ呋?,讓非專業(yè)人士獲得AI能力)。

雷鋒網:AutoML 的優(yōu)勢是什么,其解決的關鍵問題是什么?

夏粉:自動化模型參數(shù)調整,節(jié)省工作量,降低門檻;

自動化特征抽取、變形和組合,找到有效的影響結果的特征;

自動化模型結構設計,比如神經網絡多少層,每一層之間的關系。

雷鋒網:AutoML 的局限又在哪里?

夏粉:如果做到場景通用化,可能會稍微多消耗一些計算資源,但總是比人便宜。

雷鋒網:你怎么看待現(xiàn)在國內做 AutoML 的競爭?

夏粉:我們做的更像Google AutoML,但是我們可以支持企業(yè)私有化部署。國內這個賽道上,智鈾科技是第一家。

雷鋒網:機器學習的目標仍然是解決具體問題,而要將它應用到各行各業(yè)就需要對各行各業(yè)的問題有深刻的理解,一般做機器學習定制化服務的公司,都會同時配備領域內的專業(yè)人士來幫助了解問題,并制定相應的解決方案,開發(fā)相應的ML模型進行解決,AutoML 目前的水平有多大程度可以代替這個過程,有哪些是很難代替的?

夏粉:和業(yè)務相關的部分,很難用自動化機器學習來取代,需要業(yè)務人員的參與,比如數(shù)字化,數(shù)據(jù)采集,界定問題,設定目標;當然機器學習科學家是可以通過短期學習掌握這些問題。

特征抽取----建模-----優(yōu)化,這些過程是可以自動化。

技術人創(chuàng)業(yè)者夏粉:用 AI 創(chuàng)造 AI

雷鋒網:現(xiàn)階段的 AutoML 可以高效解決模型架構設計、超參數(shù)選擇這樣的模型優(yōu)化方面的問題。商用解決方案里還有其它的需求,比如前端的數(shù)據(jù)收集、數(shù)據(jù)預處理以及模型上線后的長期維護和演進,這些需求你們有針對性技術嗎?有長遠規(guī)劃嗎?

夏粉:智鈾科技目前可以在 預處理、特征抽取、建模、優(yōu)化這些方面通過自動化的方式幫助到企業(yè)。將來在ETL,在線模型演進也要做到產品中去。

雷鋒網:目前有哪些應用案例,能否詳細介紹一個,合作中,智鈾科技提供什么,企業(yè)需要做什么,最終達到了怎樣的效果?

夏粉:以內容推薦應用為例,醫(yī)藥公司會通過微信、郵件等方式為醫(yī)生推送一些內容(即文章),推送后醫(yī)生會對文章有閱讀或點贊行為?,F(xiàn)在需要根據(jù)醫(yī)生的特征和歷史閱讀、點贊記錄預測其感興趣的內容,從而進行內容的精準推薦。

常規(guī)的做法是:對醫(yī)生和文本提取大量特征,進行特征選擇和變換,選擇合適算法和對應的超參數(shù),訓練模型。通過在驗證集上效果,挑選最優(yōu)的特征、算法和超參數(shù)。所有的選擇過程由人工完成,耗費大量人力和計算資源。

對此,智鈾在文本結構化處理的基礎上,利用云計算提供的大量計算能力,通過Ebrain在很短的時間內自動構建客戶興趣模型,并提供內容推薦核心服務能力。最終,根據(jù)醫(yī)生的興趣進行信息推薦,按照行業(yè)標準預估客戶內容訪問量提升50%以上。

雷鋒網:Ebrain 對人工智能的發(fā)展意味著什么嗎?

夏粉:降低機器學習門檻;讓普通工程師,業(yè)務人員也可以方便使用機器學習;人人都可以成為數(shù)據(jù)科學家。

雷鋒網:目前大型云服務廠商都提供人工智能云服務,提供很強的算力和軟件服務,企業(yè)可以在上面構建和訓練模型,作為并非大型云服務商,Ebrain 在部署上是否會遇到問題,比如算力、數(shù)據(jù)、接口等方面?

夏粉:產品銷售模式:私有部署+云上SAAS服務,大客戶有定制解決方案。都是標準的接口,不會有什么問題。

雷鋒網:如果大型云平臺也推出 AutoML 的話,Ebrain 如何維持競爭優(yōu)勢?

夏粉:我們對自己的技術、算法積累比較有信心;我們是可以做私有部署的。

我們不僅僅是機器學習,而是機器學習自動化+產品化,并且只有做到自動化,機器學習才能做到產品化。自動化機器學習有很高的技術門檻,難點是“自動化”,在算法和實踐上需要有很深的積累。

自動化機器學習最難的是優(yōu)化問題。給你個目標函數(shù),我需要找到一個點使目標函數(shù)最小,這就有很多研究方法,對目標函數(shù)有很多解法,可以求解。自動化機器學習是目標函數(shù)不可導,反饋機制不明確,計算復雜度高,所以要全部試一遍,成本非常高。把不可導變成可導的優(yōu)化問題出來,就要求近似。報道說,人工智能打敗國際象棋大師是在上世紀80年代,通過暴力搜索,每一步都評估,選取分數(shù)最好的一步,但是到圍棋就不行,復雜度高搜索不出來,窮搜根本搜不出來,所以要做近似問題,把不可解問題近似成可解的問題,找目標函數(shù),使目標函數(shù)以很大的概率覆蓋每個解,同時求解的復雜度降低,我們在這一方面創(chuàng)新了很多算法。(人和機器都沒有辦法找最優(yōu)解,機器范圍大、效率高,所以效果比人好)以前象棋每步搜索2億次,現(xiàn)在只需要做3000萬次,因為做了優(yōu)化。

自動化機器學習的突破最大的是算法設計突破,你要找到A問題近似B問題,比如谷歌 AutoML 是用強化學習做的,他也是窮值,窮值下面也是有一個產生概率在里面,我有幾個候選,這些都有可能是最優(yōu)解,我把每個最優(yōu)解都放了一些概率分布在這兒,然后根據(jù)概率分布我隨機抽一點,抽一點上去試,試的話反饋過來會改變這個概率的分布形式,最終概率分布形式變了,最終最有可能是最優(yōu)解的概率覆蓋到更大的概率。

雷鋒網:目前公司的主要工作是什么?

夏粉:打磨產品。

從技術人到企業(yè)家:用機器學習的方法管理一家機器學習的公司

從技術人到企業(yè)家,對夏粉來說是一個巨大的轉變,也帶來很多新的挑戰(zhàn)。在他看來,做學術和做企業(yè)家有很大差別,涉及到的問題要復雜得多:

第一、做學術可能只是盯著一個問題去研究,而做企業(yè)有很多問題需要去解決,每個問題又需要不同的能力和技巧。

第二、原來解決問題可能只需要管自己,而作為企業(yè)家不一樣,身后是很多人,需要對他們負責?!霸瓉硎呛芎唵?,就是做科學家做一件事情,現(xiàn)在要把這些人也得處理好了?!?/p>

第三、原來就學一個點,現(xiàn)在好多東西都要學,“我也觀察了一些做的比較好的企業(yè),其實從一開始創(chuàng)業(yè),一直到企業(yè)運營都在不停的學習中?!?/p>

夏粉在管理過程中探索了一條類似機器學習的企業(yè)管理方法,包含輸入、輸出與中間三個部分。對于一家企業(yè)來說,輸入的是資金和人力,之后經過中間的步驟,輸出盡可能接近目標的結果。這里面,中間是復雜的地方。

人怎么管?錢怎么用?客戶怎么維護?發(fā)展節(jié)奏怎么樣的?中間就是調參過程。調參過程跟 AutoML 一樣,難點是啥?原來做機器學習,導入很容易知道,但訓練目標和最終目標之間有一個殘差,通過殘差反過來調參,AutoML 有一個問題是殘差找不到,就需要你自己定義殘差,然后再擬合。


做企業(yè)也是一樣,確立一個使命以后,下一階段怎么走?需要定一個子目標,而且這個目標一定要量化了,達到子目標以后,再根據(jù)目標往后面走,然后變成新的目標。

但在向企業(yè)家這個角色調整的過程中也不免遇到難處,“我覺得每一個創(chuàng)業(yè)的背后都是一段很辛酸的過程,即使你看到那個企業(yè)家很成功,背后可能也很多時候會偷偷地抹眼淚?!毕姆鄹嬖V雷鋒網。

現(xiàn)在智鈾是十幾個人的規(guī)模,很快會到二十來人,其中一半以上是技術。夏粉表示,AI 人才稀缺的問題他們也遇到了,而他的解決途徑除了努力招人,也會自己去培養(yǎng)人才。夏粉之前也是老師,在百度的時候培養(yǎng)過很多 AutoML 方向人才。

除了人才,其實還有很多,“比如說摸索方向,跟客戶談判,之前沒遇到,中間都覺得困難,好歹我們一步步的就跨過來了?!毕姆壅f。

但這也是一個成長的過程,夏粉表示,創(chuàng)業(yè)是一個磨練的過程,磨練到一定程度時,心態(tài)會越來越強,在這個過程中也能看到自己的成長。

而且我現(xiàn)在越來越確定了,我們的公司肯定能做成。為什么?因為我們確確實實給社會創(chuàng)造價值,就很多企業(yè)因為有了我們,成本降低了,收益提升了。剩下就是我們怎么把事情做出來。

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄