丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
業(yè)界 正文
發(fā)私信給劉芳平
發(fā)送

0

技術(shù)人創(chuàng)業(yè)者夏粉:用 AI 創(chuàng)造 AI

本文作者: 劉芳平 2018-04-28 20:34 專題:AutoML 祛魅
導語:夏粉去年 6 月創(chuàng)立智鈾科技,公司專注開發(fā)自動化機器學習平臺(Auto ML),至今已獲得兩輪融資。

這幾年從百度出來創(chuàng)業(yè)的人工智能科學家不少,夏粉就是其中一位。去年 6 月,他創(chuàng)立智鈾科技,公司專注開發(fā)自動化機器學習平臺(AutoML),公司產(chǎn)品名為 Ebrain,至今已獲得兩輪融資。

AutoML 的目的是實現(xiàn)機器學習自動化建模,通俗一些來說,是用 AI 創(chuàng)造 AI。當然,往細來講它并非能將整個人工智能應(yīng)用的過程自動化,而更多是降低這項技術(shù)的使用門檻,從而讓更多的人也能用上。在接受雷鋒網(wǎng)專訪的過程中,夏粉對此進行了詳細解讀。

作為技術(shù)人創(chuàng)業(yè)者,夏粉也向雷鋒網(wǎng)表達了在向企業(yè)家身份轉(zhuǎn)變的過程中所遇到的挑戰(zhàn),他表示,

創(chuàng)業(yè)跟科學問題不一樣,科學問題是邊界很清晰、非零即一的。但公司創(chuàng)業(yè)因素很多,有的時候它不見得用科學的方法能解決,可能需要一些藝術(shù)的、模糊處理的方式。

關(guān)于夏粉

技術(shù)人創(chuàng)業(yè)者夏粉:用 AI 創(chuàng)造 AI

夏粉博士,畢業(yè)于中科院自動化所,師從機器學習泰斗王玨老師;智鈾科技公司創(chuàng)始人兼 CEO,專注于自動化機器學習平臺產(chǎn)品。

15+年機器學習領(lǐng)域的研究和應(yīng)用經(jīng)驗,曾在百度任資深科學家,負責百度超大規(guī)模機器學習團隊。研發(fā)超大規(guī)模離散稀疏架構(gòu)自動化機器學習平臺(Pulsar),覆蓋公司 80 % 以上業(yè)務(wù)線,包括百度最核心的商業(yè)變現(xiàn)系統(tǒng)鳳巢、金融、糯米等。在公司內(nèi)部機器學習平臺中用戶數(shù)排名第一。

機器學習頂級會議雜志 JMLR,ICML,NIPS 等發(fā)表多篇文章。

創(chuàng)業(yè):技術(shù)人的情懷與資本的橄欖枝

“技術(shù)人是有情懷的,他們希望技術(shù)研發(fā)得到認可,開發(fā)出世界一流的技術(shù),然后希望它的影響力盡可能大?!毕姆巯蚶卒h網(wǎng)這樣答道。

回顧之前讀機器學習博士專業(yè)的時候,夏粉表示當時技術(shù)得到認可的一個表現(xiàn)就是在頂級會議上發(fā)表論文。后來他發(fā)現(xiàn),技術(shù)還需要落地,需要影響別人,于是加入了百度,在百度最大的廣告業(yè)務(wù)線網(wǎng)盟,他發(fā)展出了一套 AutoML 技術(shù)。

但在大企業(yè)里面,每個人都是一顆螺絲釘,其工作目標被一個框所限定。夏粉的這個框就是網(wǎng)盟的點擊預估系統(tǒng)的 CTR 不停地提升。但他希望有一個更大的平臺,于是來到了百度研究院大數(shù)據(jù)實驗室(BDL),站在研究院的基礎(chǔ)上,夏粉推出了業(yè)界第一個基于萬億規(guī)模的深度學習網(wǎng)絡(luò)的商用在線學習系統(tǒng)以及全自動機器學習平臺 Pulsar。Pulsar 被公司各業(yè)務(wù)線廣泛使用,平臺覆蓋公司絕大部分業(yè)務(wù)線,包括鳳巢、網(wǎng)盟、金融和糯米等,并受到一致好評。

“在內(nèi)部平臺里面,我們得分第一,兩年時間被 30 條業(yè)務(wù)線應(yīng)用。”夏粉告訴雷鋒網(wǎng)。

在這個過程中,他發(fā)現(xiàn)自己的影響力還可以進一步擴大,于是想到跳出百度,將技術(shù)應(yīng)用到各行各業(yè)。

除了作為技術(shù)人的情懷,國家“大眾創(chuàng)業(yè),萬眾創(chuàng)新”的政策也鼓舞了夏粉。而且,他告訴雷鋒網(wǎng),當時一些資本把錢放到他眼前了,“一些資本會經(jīng)常問你要不要創(chuàng)業(yè),你創(chuàng)業(yè)了,我的資金放在那,等著你出來創(chuàng)業(yè)?!?/strong>

如此天時地利人和,最終促成了夏粉邁出創(chuàng)業(yè)步伐。

對于前東家,他表示非常感謝:

百度是一個對技術(shù)非常重視公司,技術(shù)人員在那邊地位不一樣。百度給我很大的場景,一個技術(shù)人員研究動力技術(shù)再厲害,如果沒有給他場景,沒有實際的東西給他去加工,積累不了經(jīng)驗,他也沒法發(fā)現(xiàn)問題來提升自己的技術(shù)。百度能提供很多數(shù)據(jù)和算力方面的集體資源,然后具有非常大的問題規(guī)模,你可以在這里面得到很好的實踐鍛煉。

產(chǎn)品:自動化機器學習降低 AI 門檻

技術(shù)的進步終究要落地到實際的經(jīng)濟生產(chǎn)中去,這也是近幾年人工智能大熱之后,AI+成為各行業(yè)乃至國家大力推動的事情。吳恩達說人工智能是未來的水和電,意味著它需要有足夠低的門檻,讓各行各業(yè)的人都能很容易地使用。

但俗話說隔行如隔山,想要把一項計算機科學技術(shù)深度整合到另一個行業(yè)中去,并不是一件容易的事情。解決這個問題有幾個方向,一是培養(yǎng)更多的人工智能專家,并讓他們學習不同行業(yè)的專業(yè)知識,這方面許多公司、政府和高校都在努力,包括雷鋒網(wǎng)旗下的 AI 慕課學院

然而人工智能人才培養(yǎng)的周期很長,AI 人才稀缺的問題長期困擾著行業(yè)。根據(jù)教育部印發(fā)的《高等學校人工智能創(chuàng)新行動計劃》,中國人工智能人才缺口超過 500 萬,如此龐大的需求,短時間內(nèi)肯定無法得到滿足。

而另一個方向是降低機器學習的門檻,這正是夏粉的創(chuàng)業(yè)團隊在做的事情。智軸科技的產(chǎn)品 Ebrain 是一個機器學習自動化建模平臺。其作用就是用 AI 替代機器學習建模過程中需要大量人工操作的部分,從而讓一般的企業(yè)技術(shù)人員也能輕易使用上機器學習,不需要自己精通機器學習。

技術(shù)人創(chuàng)業(yè)者夏粉:用 AI 創(chuàng)造 AI

關(guān)于 Ebrain,雷鋒網(wǎng)針對一些關(guān)鍵問題與夏粉進行了交流:

雷鋒網(wǎng):什么樣的市場痛點促使你選擇做 AutoML 這個方向?

夏粉:從專業(yè)的角度來說,是目睹了工程師辛苦調(diào)參的過程,特別累,我覺得一定要把工程師從這種重復勞動中解放出來(高端人才應(yīng)該致力于前瞻性研究)。

從企業(yè)的角度來說,是提升了他的效率,節(jié)省了他的研發(fā)成本和人力成本。

對業(yè)務(wù)人員來說,是從不可能變?yōu)榱丝赡埽ㄖ铝τ谧龊霉ぞ呋?,讓非專業(yè)人士獲得AI能力)。

雷鋒網(wǎng):AutoML 的優(yōu)勢是什么,其解決的關(guān)鍵問題是什么?

夏粉:自動化模型參數(shù)調(diào)整,節(jié)省工作量,降低門檻;

自動化特征抽取、變形和組合,找到有效的影響結(jié)果的特征;

自動化模型結(jié)構(gòu)設(shè)計,比如神經(jīng)網(wǎng)絡(luò)多少層,每一層之間的關(guān)系。

雷鋒網(wǎng):AutoML 的局限又在哪里?

夏粉:如果做到場景通用化,可能會稍微多消耗一些計算資源,但總是比人便宜。

雷鋒網(wǎng):你怎么看待現(xiàn)在國內(nèi)做 AutoML 的競爭?

夏粉:我們做的更像Google AutoML,但是我們可以支持企業(yè)私有化部署。國內(nèi)這個賽道上,智鈾科技是第一家。

雷鋒網(wǎng):機器學習的目標仍然是解決具體問題,而要將它應(yīng)用到各行各業(yè)就需要對各行各業(yè)的問題有深刻的理解,一般做機器學習定制化服務(wù)的公司,都會同時配備領(lǐng)域內(nèi)的專業(yè)人士來幫助了解問題,并制定相應(yīng)的解決方案,開發(fā)相應(yīng)的ML模型進行解決,AutoML 目前的水平有多大程度可以代替這個過程,有哪些是很難代替的?

夏粉:和業(yè)務(wù)相關(guān)的部分,很難用自動化機器學習來取代,需要業(yè)務(wù)人員的參與,比如數(shù)字化,數(shù)據(jù)采集,界定問題,設(shè)定目標;當然機器學習科學家是可以通過短期學習掌握這些問題。

特征抽取----建模-----優(yōu)化,這些過程是可以自動化。

技術(shù)人創(chuàng)業(yè)者夏粉:用 AI 創(chuàng)造 AI

雷鋒網(wǎng):現(xiàn)階段的 AutoML 可以高效解決模型架構(gòu)設(shè)計、超參數(shù)選擇這樣的模型優(yōu)化方面的問題。商用解決方案里還有其它的需求,比如前端的數(shù)據(jù)收集、數(shù)據(jù)預處理以及模型上線后的長期維護和演進,這些需求你們有針對性技術(shù)嗎?有長遠規(guī)劃嗎?

夏粉:智鈾科技目前可以在 預處理、特征抽取、建模、優(yōu)化這些方面通過自動化的方式幫助到企業(yè)。將來在ETL,在線模型演進也要做到產(chǎn)品中去。

雷鋒網(wǎng):目前有哪些應(yīng)用案例,能否詳細介紹一個,合作中,智鈾科技提供什么,企業(yè)需要做什么,最終達到了怎樣的效果?

夏粉:以內(nèi)容推薦應(yīng)用為例,醫(yī)藥公司會通過微信、郵件等方式為醫(yī)生推送一些內(nèi)容(即文章),推送后醫(yī)生會對文章有閱讀或點贊行為?,F(xiàn)在需要根據(jù)醫(yī)生的特征和歷史閱讀、點贊記錄預測其感興趣的內(nèi)容,從而進行內(nèi)容的精準推薦。

常規(guī)的做法是:對醫(yī)生和文本提取大量特征,進行特征選擇和變換,選擇合適算法和對應(yīng)的超參數(shù),訓練模型。通過在驗證集上效果,挑選最優(yōu)的特征、算法和超參數(shù)。所有的選擇過程由人工完成,耗費大量人力和計算資源。

對此,智鈾在文本結(jié)構(gòu)化處理的基礎(chǔ)上,利用云計算提供的大量計算能力,通過Ebrain在很短的時間內(nèi)自動構(gòu)建客戶興趣模型,并提供內(nèi)容推薦核心服務(wù)能力。最終,根據(jù)醫(yī)生的興趣進行信息推薦,按照行業(yè)標準預估客戶內(nèi)容訪問量提升50%以上。

雷鋒網(wǎng):Ebrain 對人工智能的發(fā)展意味著什么嗎?

夏粉:降低機器學習門檻;讓普通工程師,業(yè)務(wù)人員也可以方便使用機器學習;人人都可以成為數(shù)據(jù)科學家。

雷鋒網(wǎng):目前大型云服務(wù)廠商都提供人工智能云服務(wù),提供很強的算力和軟件服務(wù),企業(yè)可以在上面構(gòu)建和訓練模型,作為并非大型云服務(wù)商,Ebrain 在部署上是否會遇到問題,比如算力、數(shù)據(jù)、接口等方面?

夏粉:產(chǎn)品銷售模式:私有部署+云上SAAS服務(wù),大客戶有定制解決方案。都是標準的接口,不會有什么問題。

雷鋒網(wǎng):如果大型云平臺也推出 AutoML 的話,Ebrain 如何維持競爭優(yōu)勢?

夏粉:我們對自己的技術(shù)、算法積累比較有信心;我們是可以做私有部署的。

我們不僅僅是機器學習,而是機器學習自動化+產(chǎn)品化,并且只有做到自動化,機器學習才能做到產(chǎn)品化。自動化機器學習有很高的技術(shù)門檻,難點是“自動化”,在算法和實踐上需要有很深的積累。

自動化機器學習最難的是優(yōu)化問題。給你個目標函數(shù),我需要找到一個點使目標函數(shù)最小,這就有很多研究方法,對目標函數(shù)有很多解法,可以求解。自動化機器學習是目標函數(shù)不可導,反饋機制不明確,計算復雜度高,所以要全部試一遍,成本非常高。把不可導變成可導的優(yōu)化問題出來,就要求近似。報道說,人工智能打敗國際象棋大師是在上世紀80年代,通過暴力搜索,每一步都評估,選取分數(shù)最好的一步,但是到圍棋就不行,復雜度高搜索不出來,窮搜根本搜不出來,所以要做近似問題,把不可解問題近似成可解的問題,找目標函數(shù),使目標函數(shù)以很大的概率覆蓋每個解,同時求解的復雜度降低,我們在這一方面創(chuàng)新了很多算法。(人和機器都沒有辦法找最優(yōu)解,機器范圍大、效率高,所以效果比人好)以前象棋每步搜索2億次,現(xiàn)在只需要做3000萬次,因為做了優(yōu)化。

自動化機器學習的突破最大的是算法設(shè)計突破,你要找到A問題近似B問題,比如谷歌 AutoML 是用強化學習做的,他也是窮值,窮值下面也是有一個產(chǎn)生概率在里面,我有幾個候選,這些都有可能是最優(yōu)解,我把每個最優(yōu)解都放了一些概率分布在這兒,然后根據(jù)概率分布我隨機抽一點,抽一點上去試,試的話反饋過來會改變這個概率的分布形式,最終概率分布形式變了,最終最有可能是最優(yōu)解的概率覆蓋到更大的概率。

雷鋒網(wǎng):目前公司的主要工作是什么?

夏粉:打磨產(chǎn)品。

從技術(shù)人到企業(yè)家:用機器學習的方法管理一家機器學習的公司

從技術(shù)人到企業(yè)家,對夏粉來說是一個巨大的轉(zhuǎn)變,也帶來很多新的挑戰(zhàn)。在他看來,做學術(shù)和做企業(yè)家有很大差別,涉及到的問題要復雜得多:

第一、做學術(shù)可能只是盯著一個問題去研究,而做企業(yè)有很多問題需要去解決,每個問題又需要不同的能力和技巧。

第二、原來解決問題可能只需要管自己,而作為企業(yè)家不一樣,身后是很多人,需要對他們負責?!霸瓉硎呛芎唵?,就是做科學家做一件事情,現(xiàn)在要把這些人也得處理好了?!?/p>

第三、原來就學一個點,現(xiàn)在好多東西都要學,“我也觀察了一些做的比較好的企業(yè),其實從一開始創(chuàng)業(yè),一直到企業(yè)運營都在不停的學習中?!?/p>

夏粉在管理過程中探索了一條類似機器學習的企業(yè)管理方法,包含輸入、輸出與中間三個部分。對于一家企業(yè)來說,輸入的是資金和人力,之后經(jīng)過中間的步驟,輸出盡可能接近目標的結(jié)果。這里面,中間是復雜的地方。

人怎么管?錢怎么用?客戶怎么維護?發(fā)展節(jié)奏怎么樣的?中間就是調(diào)參過程。調(diào)參過程跟 AutoML 一樣,難點是啥?原來做機器學習,導入很容易知道,但訓練目標和最終目標之間有一個殘差,通過殘差反過來調(diào)參,AutoML 有一個問題是殘差找不到,就需要你自己定義殘差,然后再擬合。


做企業(yè)也是一樣,確立一個使命以后,下一階段怎么走?需要定一個子目標,而且這個目標一定要量化了,達到子目標以后,再根據(jù)目標往后面走,然后變成新的目標。

但在向企業(yè)家這個角色調(diào)整的過程中也不免遇到難處,“我覺得每一個創(chuàng)業(yè)的背后都是一段很辛酸的過程,即使你看到那個企業(yè)家很成功,背后可能也很多時候會偷偷地抹眼淚?!毕姆鄹嬖V雷鋒網(wǎng)。

現(xiàn)在智鈾是十幾個人的規(guī)模,很快會到二十來人,其中一半以上是技術(shù)。夏粉表示,AI 人才稀缺的問題他們也遇到了,而他的解決途徑除了努力招人,也會自己去培養(yǎng)人才。夏粉之前也是老師,在百度的時候培養(yǎng)過很多 AutoML 方向人才。

除了人才,其實還有很多,“比如說摸索方向,跟客戶談判,之前沒遇到,中間都覺得困難,好歹我們一步步的就跨過來了?!毕姆壅f。

但這也是一個成長的過程,夏粉表示,創(chuàng)業(yè)是一個磨練的過程,磨練到一定程度時,心態(tài)會越來越強,在這個過程中也能看到自己的成長。

而且我現(xiàn)在越來越確定了,我們的公司肯定能做成。為什么?因為我們確確實實給社會創(chuàng)造價值,就很多企業(yè)因為有了我們,成本降低了,收益提升了。剩下就是我們怎么把事情做出來。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄