丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能學(xué)術(shù) 正文
發(fā)私信給陳彩嫻
發(fā)送

0

一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場

本文作者: 陳彩嫻 2020-09-01 17:06
導(dǎo)語:在討論中,賈揚清認(rèn)為:沒有算法工程師這個角色,只有兩個角色,一個是算法的研究人員,一個是應(yīng)用的工程師,而“調(diào)參俠”沒有市場。

一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場

算法工程師不僅需要具備牛逼的算法能力,還要精通業(yè)務(wù)、善于溝通?(小本子趕緊記下來?。?/span>

8月23日晚,知乎直播“AI時代聽大咖聊”邀請到AI領(lǐng)域的兩個大神,分別是阿里云智能高級研究員賈揚清,以及知乎CTO李大海。

在直播中,賈揚清與李大海就國內(nèi)外AI研究區(qū)別、在校生/職場新人如何培養(yǎng)自己的AI才能、AI應(yīng)用落地,以及AI在未來的發(fā)展趨勢展開討論。

在討論中,賈揚清認(rèn)為:沒有算法工程師這個角色,只有兩個角色,一個是算法的研究人員,一個是應(yīng)用的工程師,而“調(diào)參俠”沒有市場。

另外,作為Caffe、PyTorch和Tensorflow曾經(jīng)的核心開發(fā)者,他還提到,深度學(xué)習(xí)框架并不會出現(xiàn)大一統(tǒng)的局面,因為現(xiàn)實中需求很多,并沒有一家機(jī)器學(xué)習(xí)框架能夠囊括所有的需求。

一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場視頻鏈接:https://www.zhihu.com/zvideo/1280989974280634368

AI科技評論對本次分享作了不改變原意的整理與編輯:


1

“專業(yè)”除草,沒想到賣了3億美元

Q1:能否請兩位聊一下國內(nèi)外做AI領(lǐng)域的研究有什么區(qū)別?

賈揚清:首先,國內(nèi)外的工程師都很用功,而且都追求最新的技術(shù)。個人認(rèn)為國內(nèi)的工程師更關(guān)注如何把方法與業(yè)務(wù)結(jié)合起來,而國外在AI方面有一些很好玩的事情。

舉兩個例子:一個是,如今很多農(nóng)產(chǎn)品(比如黃瓜)在運去超市前需要篩選出大小、質(zhì)量等許多方面合格的產(chǎn)品。以前都是用手分揀的,很麻煩,但自從有了深度學(xué)習(xí)的框架TensorFlow之后,有精通工程的年輕農(nóng)民就結(jié)合算法,使用機(jī)器學(xué)習(xí)自動對黃瓜進(jìn)行分類,實現(xiàn)了:大一點的黃瓜送超市,小一點的拿去做零售。

第二個是,我有一個研究生同學(xué)把Raspberry Pi放在后院,后院里有一個喂鳥的地方,松鼠經(jīng)常過來,他就拿那個Raspberry Pi識別松鼠,松鼠一來就把它趕走。這些技術(shù)看著好像沒有什么用處,但后來產(chǎn)生了非常多應(yīng)用。硅谷有一個公司叫Blue River Technology,他們做的事情是運用技術(shù)在田間地頭找雜草、除雜草,有點類似篩黃瓜、找松鼠。這個公司后來被美國最大的農(nóng)機(jī)制造商約翰迪爾公司以3億美元收購了。他們很多時候是出于純粹的技術(shù)好奇心,但后來創(chuàng)造了一個產(chǎn)業(yè)。我覺得這是國外蠻有意思的一點。

一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場直播截圖 

李大海:揚清講的這個公司我有印象,他們通過識別雜草、然后定點噴灑除草劑,雜草率可以降低到原來的10%。硅谷的公司一直有這個文化。當(dāng)時我在谷歌的時候,Eric(谷歌執(zhí)行董事長)曾經(jīng)講過一個很好玩的故事:當(dāng)時在谷歌有一個柜子專門放T恤。在谷歌,無論發(fā)生什么,他們都會把事件印在T恤上,不定期往柜子里塞,然后大家去搶。當(dāng)時柜子附近有一個攝像頭,Eric就基于攝像頭寫了一些代碼去監(jiān)控這個柜子。一旦識別出這個柜子附近有人,攝像頭就會發(fā)出“警報”來通知Eric,然后Eric一看到有人往柜子里面塞T恤就去搶。在美國,這些工程師會自發(fā)地去做這種(技術(shù)應(yīng)用的)微創(chuàng)新。

國內(nèi)工程師在創(chuàng)新方面與國外可能有一些差別。目前國內(nèi)的AI應(yīng)用場景已經(jīng)很廣。比如說,在知乎的工程團(tuán)隊里,大概1/6的人都是算法工程師。在工業(yè)界,算法確實已經(jīng)滲透到應(yīng)用場景的方方面面。第二點是,AI應(yīng)用從互聯(lián)網(wǎng)開始逐漸推向越來越多的傳統(tǒng)企業(yè)和傳統(tǒng)行業(yè)。但在個人層面,與國外相比,國內(nèi)的工程師可能較少會自發(fā)去發(fā)現(xiàn)一些微小的創(chuàng)新機(jī)會,并實現(xiàn)它。


2

如何優(yōu)雅入“AI”這個坑

Q2:作為一個在校生,我要如何將學(xué)習(xí)與業(yè)務(wù)結(jié)合,如何培養(yǎng)自己的AI能力、才能進(jìn)入比較好的互聯(lián)網(wǎng)公司呢?

李大海:我們一般稱掌握了AI知識的同學(xué)為“算法工程師”。算法工程師在本質(zhì)上首先是一個工程師,所以一個工程師所具備的能力,算法工程師也應(yīng)該具備,例如說:1)代碼能力,能夠通過代碼實現(xiàn)自己的想法;2)數(shù)據(jù)能力,即能夠?qū)?shù)據(jù)進(jìn)行分析,并發(fā)現(xiàn)數(shù)據(jù)所包含的重點,同時對數(shù)據(jù)進(jìn)行處理;3)與人溝通的能力,因為算法工程師都是在團(tuán)隊里面工作,不是單打獨斗,所以需要能夠與同組的其他工程師、產(chǎn)品經(jīng)理、測試和其他同事進(jìn)行溝通。

第二點是算法工程師需要培養(yǎng)業(yè)務(wù)能力,即對業(yè)務(wù)的理解。工程師首先要掌握業(yè)務(wù)應(yīng)用的知識。業(yè)務(wù)場景非常多,但每個場景所面臨的問題是不一樣的,所以算法工程師一定要理解業(yè)務(wù)到底是需要解決什么問題,具備定位問題、發(fā)現(xiàn)問題、拆解問題和解決問題的能力。

綜上,對于在校生來說,擁有對算法的理解能力是非常重要的特質(zhì)。雖然算法工程師都喜歡自黑,稱自己是“調(diào)參俠”,但除了調(diào)參之外,還需要知道算法背后的原理。我們現(xiàn)在處于深度學(xué)習(xí)時代,但是在“前深度學(xué)習(xí)時代”有很多淺層模型,這些模型因為沒有深度學(xué)習(xí)碾壓式的表達(dá)能力,所以在淺層模型上做了很多思考。

個人認(rèn)為:“當(dāng)年”那些模型所用到的技巧對于培養(yǎng)機(jī)器學(xué)習(xí)的能力和解決現(xiàn)實問題是非常重要。

一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場       直播截圖

賈揚清:同意大海的觀點:分析問題,定義問題,然后解決問題的整個邏輯非常重要。在校生得到的訓(xùn)練更多是:如何解決問題的能力。但其實如果問題定義清楚了,解決問題的方法就會出現(xiàn)很多。

另外,從工程的角度補充兩點:第一,如何獲取最新的技術(shù)和算法?現(xiàn)在整個開源領(lǐng)域進(jìn)展迅速。其實,不光是開源,也有很多開發(fā)支持平臺。所以,大家可以保持好奇心,然后多帶著玩的心態(tài)進(jìn)行嘗試。例如三年前,名為叫Neural Style Transfer的AI應(yīng)用,將拍的照片上傳之后,就可以轉(zhuǎn)換成一張類似梵高風(fēng)格的藝術(shù)照。

一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場

第二是,“摸透”應(yīng)用的實現(xiàn)流程。落地應(yīng)用是“曇花一現(xiàn)”,但應(yīng)用背后所涉及的工程步驟,例如把算法快速地迭代出來、如何做算法優(yōu)化、如何把算法放到手機(jī)上,如何上線,等等。這種實際操作的流程和只看論文和demo是不一樣的。今天,我們有GitHub這類的開源社區(qū),很多實際操作都比以前更加容易。

李大海:我想補充一點。有段時間我訂閱過arXiv上面的 topic,但我發(fā)現(xiàn)這是個坑。arXiv最近在機(jī)器學(xué)習(xí)領(lǐng)域非?;馃?,每天都大量的論文發(fā)布出來,其中包含很多不同領(lǐng)域的或大或小的突破,這其實會讓人眼花繚亂。所以在這種情況下,我給學(xué)生們的建議是:自己先抓住一個重點(領(lǐng)域),至于其他領(lǐng)域,簡單了解那些技術(shù)和突破是什么就好。

Q3:假設(shè)一個同學(xué)已經(jīng)入職了,已經(jīng)成為算法工程師,他可能會經(jīng)歷初級、中級、高級三個階段。所以,關(guān)于初級算法工程師怎么晉升到中級算法工程師,以及中級算法工程師怎么晉升到高級算法工程師,兩位有何看法?

賈揚清:我覺得挺重要的一點是學(xué)習(xí)是所謂的engineering practice(工程實踐)。很多時候,我們在寫研究代碼時,跟研究本質(zhì)是一樣的,因為研究是快速迭代,不需要做工程實現(xiàn)。假如,今天要上線一個功能,不僅要保證它的整個foundation(基礎(chǔ))是solid(堅固)的。這時候,我們怎么做代碼的管理、協(xié)同、review(審查)、測試、CD和上線?怎么做 performance(性能)的benchmark(基準(zhǔn))跟profiling ?這一系列的工程流程也挺重要。

第二點是保持好奇心。其實任何一個公司的平臺都是挺大的。拿阿里大數(shù)據(jù)和AI平臺來舉例子,像ODPS(Open Data Processing Service)大數(shù)據(jù)平臺是10年前開始建造的,今天平臺非常復(fù)雜,包括上層的C語言庫、中間的 Query Optimization(查詢優(yōu)化)和底層的執(zhí)行調(diào)度,肯定不能完全把握。在這個時候,算法工程師就要與他人保持交流,多提問、多討論。就像T型,對系統(tǒng)的某一點了解特別深,對系統(tǒng)的其他部分就觸類旁通。逐漸成為一個高級算法工程師之后呢,成為一個架構(gòu)師所擁有的能力,其實也能使得我們在更看得更寬、看得更大的同時,有一個更加全局的系統(tǒng)架構(gòu)的視野。

Q4:揚清有沒有一些具體的建議?比如說你在學(xué)生時代是怎么學(xué)習(xí)的?用什么途徑獲取到新的 AI資訊,遇到問題怎么解決?

賈揚清:在我學(xué)生時代,當(dāng)時大家了解深度學(xué)習(xí)的算法是通過看論文,看完論文后大概就知道怎么做架構(gòu)設(shè)計。在看論文的過程中會有非常多的輸入,比如我們學(xué)到,人們最開始寫深度學(xué)習(xí)框架的時候(Torch是2000年左右出來的,Theano是2008年出來的),它們的架構(gòu)設(shè)計怎么做神經(jīng)網(wǎng)絡(luò)、怎么做layer(層數(shù))等等,這對我們后來設(shè)計其他的框架,像Caffe、MXNet、PyTorch等等,是非常有幫助的。再比如說,我們怎么樣做模型civilization的格式化等等,這時候谷歌的ProtoBuf又是一個很好的測試框架,如G test。這些現(xiàn)有的工程實踐以及設(shè)計有現(xiàn)成的代碼、文檔和應(yīng)用,看這些其實能夠在實際中提升自己的能力。

李大海:我非常贊同揚清的觀點,就是在學(xué)校的時候我們會更關(guān)注代碼的算法上是否足夠精妙,但是對架構(gòu)和工程的關(guān)注度是不夠的。我自己在早年的時候也犯過這樣的錯誤,像我們數(shù)學(xué)系畢業(yè)的,在工程上接受到的培訓(xùn)是偏少的,但進(jìn)入公司以后,工程實踐卻變得很重要。揚清之前在一次線下分享中曾提到的一句話我也很贊同,就是:AI是一個系統(tǒng)工程,90%的時間里所做的事情都跟算法無關(guān)。在現(xiàn)實中也確實是這樣。

那么,作為剛?cè)肼毜耐瑢W(xué),其實首先我認(rèn)為入職已經(jīng)晚了,在入職前就應(yīng)該挑選一個在工程上相對規(guī)范的公司去入職。如果是一個小公司,自己又沒有工程上的 sense(意識),那么你進(jìn)入的是一個工程規(guī)范很亂的一家公司,這對于個人的職業(yè)發(fā)展和工程能力的培養(yǎng)是很有問題的。

Q5:想請問兩位 AI從業(yè)者,你們覺得跟其他AI從業(yè)者比,你們最大的優(yōu)勢是什么?

賈揚清:在AI領(lǐng)域里,在業(yè)界做得非常成功的人或團(tuán)隊都有一個特點,就是業(yè)務(wù)化。他們不光懂算法,而且懂得怎么用算法。因為在今天,算法已經(jīng)迅速普及,找一個研究生,兩分鐘就能搞出ResNet。

另外,AI算法的創(chuàng)新在逐漸變慢。比如說,Bert在NLP領(lǐng)域,ResNet在CV領(lǐng)域都已經(jīng)比較成熟。雖然算法創(chuàng)新還可以稍微提升一下,但算法已經(jīng)不是一個核心的differentiate(區(qū)別點)。在這種情況下,怎么樣找到實際應(yīng)用場景,如何把算法和應(yīng)用結(jié)合起來,我覺得這是最能體現(xiàn)出價值的地方。所以,如今AI的突破可能不是在算法上,而是“算法+系統(tǒng)+應(yīng)用”,而且應(yīng)用可能會變得越來越重要。

李大海:我們還處于AI的應(yīng)用層。AI現(xiàn)在已經(jīng)是一個非常大的框,里面可以放非常多東西,領(lǐng)域也非常廣。我覺得我們更像是AI行業(yè)的從業(yè)者,是把AI當(dāng)成一個功能強大的工具去使用。

我們的團(tuán)隊內(nèi)部曾經(jīng)很喜歡一個國外經(jīng)濟(jì)學(xué)家寫的一本書,叫《與運氣競爭》。

       一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場       

里面講到,當(dāng)我們手上有一把鉆子的時候,很容易想到的是我拿著鉆子可以干嘛?但其實很多時候,用戶可能只需要鉆一個孔來掛衣服。所以,如果你想的總是“如何提高鉆頭的合金程度”、“讓它變得更好看”,這可能根本就不是用戶想要的。

總的來說,工具非常重要,我們對于 AI的理解和AI前沿技術(shù)的跟蹤也很重要,但更重要的事情是:用戶的需求到底在哪里,我們能解決什么問題。


3

感知大神VS決策白癡

Q6:現(xiàn)在人工智能處于什么發(fā)展階段?它未來會給我們帶來哪些改變?它的長期規(guī)劃可能是什么樣的?

李大海:如果要判斷AI目前處于什么階段,我們得先知道AI的全景是什么樣子,但這個很難預(yù)測。這時又會涉及到:人工智能最后到底能走到什么階段?它能不能達(dá)到強人工智能的狀態(tài)?我的觀點是偏悲觀的,我覺得強人工智能可能永遠(yuǎn)都達(dá)不到。

但說到應(yīng)用,我們可以看到,人工智能在許多領(lǐng)域里已經(jīng)打敗人了,比如說圖片分類。所以在應(yīng)用層面上我是很樂觀的。人工智能的歷史始于20世紀(jì)初,后來經(jīng)歷了一些起起伏伏。

到今天,AI可能有一些泡沫,但這個泡沫其實是AI公司在商業(yè)模式上遇到的問題。但從技術(shù)層面上講,AI這個工具越來越強大,數(shù)據(jù)量越來越大,這些都是毋庸置疑的事情,所以在應(yīng)用層面上我是很看好的。

賈揚清:從歷史的角度來看,計算機(jī)誕生的目的是為了更加智能化地處理人與世界交互的問題。在人工智能最早的時候,大家都在處理決策的問題。等決策系統(tǒng)做了一堆工作后,我們發(fā)現(xiàn),其實我們首先都還不知道這個世界是如何從一個像素、語音“導(dǎo)入”到計算機(jī)邏輯的系統(tǒng)里。所以在前面這幾年,深度學(xué)習(xí)其實是在從決策層面轉(zhuǎn)到感知層面,從而來解決感知的問題。

從感知的角度來說,今天已經(jīng)相對較成熟。例如2014年,圖像識別的正確率在一個限定的范圍內(nèi)已經(jīng)超過人類。

回過頭來看決策,人工智能的決策發(fā)展還不行。比如說,在自動駕駛里,我能感知這里有一輛車、那里有一個人,但是知道后如何做決策?邏輯是什么?甚至在一些更復(fù)雜的場景,例如限速25,但前面的車都超速往前開了,這時候我又怎么辦呢?這些事情都是要在決策層面上解決的。人工智能很有可能會先解決感知/認(rèn)知問題,然后在感知的基礎(chǔ)上做決策。

綜上,分領(lǐng)域來看,人工智能在認(rèn)知領(lǐng)域已經(jīng)到達(dá)非常成熟的階段,但在決策領(lǐng)域可能還處于初期的探索。


4

AI離不開云

Q7:有一句話叫“AI是云的內(nèi)核,云是AI的必然形態(tài)。”如何看AI和云的關(guān)系,以及AI在云里面扮演的角色。

賈揚清:為什么今天我們說云和AI是一個強結(jié)合的狀態(tài)呢?我覺得原因可能有兩點:一是算力,二是數(shù)據(jù)。從算力的角度來說,以前我們在學(xué)校做實驗或自己創(chuàng)業(yè)的時候都搭過機(jī)器。搭機(jī)器很痛苦,而且運維機(jī)器在一定程度上不產(chǎn)生價值,然后AI又對GPU有非常強烈的需求。GPU又是一個很惡心的事,有時候運行不錯,有時候又會過熱,有時候又需要我們做資源的調(diào)度等等。任何一個實驗室都會遇到資源調(diào)度問題:一個是科研人員在那找GPU的時候發(fā)現(xiàn)找不著,然后系統(tǒng)工程師跑去一看,說:“哇天?。±寐屎玫?!”一邊是starvation(饑餓),一邊是satiation(飽和)。

如今,云可以很好地解決算力問題。30年前,所有的單位都有一個發(fā)電機(jī),但今天沒有人用發(fā)電機(jī)了,因為底層的基礎(chǔ)設(shè)施已經(jīng)非常成熟,可以低成本、大規(guī)模地給社會提供電力。在今天,云的計算力就像水電煤一般的基礎(chǔ)設(shè)施,我們不需要擔(dān)心哪天機(jī)器哪里出了問題。比如說,今天我突然要拉起一個大量的應(yīng)用,這個時候云可以“soo”一聲彈上來,不要了就放掉。這是算力方面。

第二個是數(shù)據(jù)。前段時間,許多人關(guān)注深度學(xué)習(xí)領(lǐng)域,如圖像、語音等等。但許多AI應(yīng)用其實是跟結(jié)構(gòu)化數(shù)據(jù)綁在一塊的。咱們舉個例子。比如說像知乎有大量的用戶內(nèi)容,這涉及到兩方面:一方面是自然語言的處理,另一方面是用戶和內(nèi)容的匹配。這時候,其實是在一個大數(shù)據(jù)底座(像Hadoop和MaxComput)上面做結(jié)構(gòu)化數(shù)據(jù)的人工智能。

這和一個大規(guī)模分布式系統(tǒng)是分不開的,因為我不可能今天說把這些數(shù)據(jù)放到一個GPU機(jī)器上面,拿三個SSD把它給接起來。所以這時候就需要一套比較完整的系統(tǒng),從數(shù)據(jù)的存儲、處理、分析到計算,到上層去進(jìn)行任務(wù)的編排、模型的開發(fā)、模型的上線,以及數(shù)據(jù)的回流。無論用戶是自己搭一個系統(tǒng)(我們叫“私有云”),還是在公有云上面進(jìn)行,云都是AI不可或缺的一個環(huán)境。

今天的AI,越來越多會關(guān)注到系統(tǒng)、云。這也標(biāo)志著AI未來發(fā)展的必然形態(tài)。目前,算法能夠“單機(jī)”開發(fā),但是如何運用算法,則需要算力和數(shù)據(jù)的支持,因此也會需要云和云相關(guān)的技術(shù)。

我現(xiàn)在在做的工作是把AI和大數(shù)據(jù)進(jìn)行結(jié)合。例如,前段時間我們發(fā)現(xiàn):深度學(xué)習(xí)的工程師會發(fā)現(xiàn)目前的大數(shù)據(jù)平臺不能滿足需求。因為過去需要數(shù)據(jù)庫管理結(jié)構(gòu)化數(shù)據(jù),而如今需要大數(shù)據(jù)逐漸向這種深度學(xué)習(xí)的應(yīng)用領(lǐng)域進(jìn)行改變。

另一方面,對于結(jié)構(gòu)化的應(yīng)用工程師來說,當(dāng)存在推薦系統(tǒng)的需求時,所需要的并不是把所有的代碼寫出來,而是通過更加靈活的“拖拉拽”等方式。因此,過去是從大數(shù)據(jù)的角度進(jìn)行AI落地,而未來一到兩年內(nèi)需要從系統(tǒng)的層面,推動非結(jié)構(gòu)化深度學(xué)習(xí)場景和結(jié)構(gòu)化“傳統(tǒng)經(jīng)濟(jì)學(xué)產(chǎn)品”進(jìn)步。


5

算法工程師的未來“兇多吉少”

Q8:AI工程師和AI算法工程師之間有何不同?各自的發(fā)展趨勢是怎樣的?兩者會不會融合?

李大海:在谷歌內(nèi)部,AI的工作是普通的工程師在進(jìn)行,只要把問題描述清楚,然后放到“系統(tǒng)”上,系統(tǒng)就能夠給出一個大概的解決方案。在未來,隨著技術(shù)的發(fā)展,AI和AI工程的門檻會越來越低。這就意味著AI工程師的從業(yè)門檻也會越來越低。

但是有許多缺口需要AI工程師補充,所以,AI工程師也需要積累算法。因此,從這個角度來看,AI工程師既需要懂架構(gòu),又需要懂算法。對于學(xué)生或者剛進(jìn)入工作的職場新人而言,需要好好塑造自己的方法論,快速補充自己,根據(jù)自己的業(yè)務(wù)需求讓自己的能力變強。

其實,無論是在谷歌還是在知乎,我們招聘工程師都有一個標(biāo)準(zhǔn),即希望工程師足夠聰明,能夠快速學(xué)習(xí),可以根據(jù)自己的業(yè)務(wù)補充“技能樹”。

綜上,無論是算法還是工程,其基礎(chǔ)能力和學(xué)習(xí)能力非常重要。

賈揚清:我來討論可能相對比較有爭議性的話題:個人認(rèn)為沒有算法工程師這個角色,只有兩個角色,一個是算法的研究人員,一個是應(yīng)用的工程師,而“調(diào)參俠”沒有市場。因為,有的調(diào)參工作只需要寫for 循環(huán)語句即可。

算法的科研人員更多是攻堅“更好的算法”,例如在計算機(jī)視覺領(lǐng)域,可能要把模型做得更大、更準(zhǔn),在某些問題上需要把模型做得更小。當(dāng)然,在具體量化的過程中,需要在兩者之間進(jìn)行平衡。也就是說,科研人員更多是思考如何在一些“普遍”的場景下對算法進(jìn)行創(chuàng)新。

在具體的應(yīng)用過程中,調(diào)參只是一個手段。例如,在無人駕駛領(lǐng)域,其場景和機(jī)場的云點識別的場景非常類似,但是其數(shù)據(jù)的分布不一樣,所要做的事情不一樣。應(yīng)用工程師更多的是了解其背后的業(yè)務(wù)場景差距和限制,例如傳統(tǒng)的約束滿足問題(CSP)。所以,應(yīng)用工程師更多的是對端到端進(jìn)行整合,找到最優(yōu)的方向進(jìn)行調(diào)參,也就是說,調(diào)參只是一個手段。綜上,調(diào)參俠沒有市場,現(xiàn)實中只存在算法科研人員和應(yīng)用工程師。


6

小板凳蹲阿里、知乎的AI展望

Q9:AI的發(fā)展情況如何?在知乎和阿里有哪些技術(shù)沉淀?未來的應(yīng)用情況、重點投入的AI方向是什么?

李大海:目前的AI工作和場景結(jié)合緊密。抽象來看,(知乎)有三大方向:一是內(nèi)容生產(chǎn),如何利用AI讓內(nèi)容生產(chǎn)進(jìn)行更有效率,例如創(chuàng)作者匹配、激活創(chuàng)作者;二是內(nèi)容理解,建立內(nèi)容概述,對內(nèi)容質(zhì)量有初步把握,例如內(nèi)容底線內(nèi)容在哪里?內(nèi)容是不是帶有辱罵性質(zhì)?是不是有極端(仇恨)情緒;三是內(nèi)容分發(fā),這個方向建立在第二個方向基礎(chǔ)之上,但不再僅僅局限在內(nèi)容的理解上,還需要對用戶進(jìn)行理解。具體而言有兩種情況,一是用戶主動搜索,將AI算法賦能到搜索引擎里;二是,被動推薦,將高質(zhì)量內(nèi)容推薦給合適用戶。

那知乎在文本方面(NLP)有哪些工作呢?主要有兩個方面,一是分詞,例如最近的一次迭代結(jié)果是:F1的值從91%上漲到93.5%。二是詞性的判斷,這類工作包括命名實體識別、消歧等等。

賈揚清:阿里有很多團(tuán)隊在研究AI,例如阿里的PAI團(tuán)隊致力于AI的開發(fā)和治理的平臺,基本上阿里的所有工程師都會在上面做開發(fā),達(dá)摩院的同學(xué)就會在上面構(gòu)建很多應(yīng)用和落地的算法,包含圖片、語音等等。

具體而言,阿里在開發(fā)和工程平臺上基本上有三方面的應(yīng)用,首先是AI和大數(shù)據(jù)的結(jié)合,目的是在傳統(tǒng)機(jī)器學(xué)習(xí)領(lǐng)域里,如何讓應(yīng)用工程師、或者數(shù)據(jù)科學(xué)家更加容易使用數(shù)據(jù)和算法。換句話說,更加豐富、更加成熟、更加高效的算法的結(jié)合,目的是為公司提供需要的場景化的解決方案。最典型的例子有兩個,一個是搜索推薦,另外一個是金融風(fēng)控。這兩個領(lǐng)域?qū)I存在強需求。如果存在場景化的解決方案,那么就能讓其更容易將領(lǐng)域數(shù)據(jù)和AI相結(jié)合。

第二是更加云原生、順暢的AI的深度學(xué)習(xí)的體驗。以往的大數(shù)據(jù)、深度學(xué)習(xí)平臺其結(jié)構(gòu)往往比較重,使用云原生“容器化”的能力可以構(gòu)建出一個和“自己”的開發(fā)環(huán)境相符合的“產(chǎn)品”。例如在無人駕駛場景中,可以實現(xiàn)非常靈活的深度學(xué)習(xí)開發(fā),構(gòu)建靈活的深度學(xué)習(xí)應(yīng)用。

第三是更加成熟的工程化的AI算法的部署,旨在解決模型的穩(wěn)定程度和彈性以及檢測模型的性能。再者,如果有新的模型上線,如何進(jìn)行A/B 測試?如何回流模型的用戶反饋?等等都是需要考慮的問題。

在阿里我們還進(jìn)行了一些“隱形”的工程能力。例如,針對系統(tǒng)利用率低,我們做了資源調(diào)度、資源的編排管理等工作。具體而言,我們在OSDI這一會議發(fā)布了異構(gòu)相關(guān)文章,還發(fā)布了在推理的框架里如何自動生成代碼等論文。這些工作在產(chǎn)品中顯現(xiàn)不清楚,但是確確實實能夠幫助平臺降成本,增效率。

Q10:有何展望?阿里云會不會有自己的深度學(xué)習(xí)框架?接下來有哪些新的產(chǎn)品形態(tài)?

賈揚清:接下來在產(chǎn)品形態(tài)上會把產(chǎn)品做得更加成熟,更加模塊化。目的是讓大家根據(jù)自己的需求進(jìn)行靈活選擇,模塊化的靈活組合。

另外,也會著重強調(diào)穩(wěn)定性和用戶體驗。關(guān)于深度學(xué)習(xí)框架,個人邏輯是:從需求出發(fā)。TensorFlow和Pytorch其出現(xiàn)的原因也是這個邏輯,例如TensorFlow能夠迎合“在一個大規(guī)模的彈性系統(tǒng)上面,靈活構(gòu)建高性能AI的需求”。

但是TensorFlow也有學(xué)習(xí)難度比較大的弱點。所以針對學(xué)習(xí)難度問題,出現(xiàn)了Pytorch。目前,這兩者也在相互借鑒,例如TensorFlow在增強用戶體驗,Pytorch在增強系統(tǒng)能力。所以,從需求的角度來看,這兩者在一定程度上很好的解決了用戶體驗問題。

設(shè)計深度學(xué)習(xí)框架切記不要 meet to product,即和TensorFlow和PyTorch在結(jié)構(gòu)上不一樣,但是所能夠滿足的需求,能夠做的事情是一樣的。(賈揚清意思是:這種框架不值得)

其實,個人認(rèn)為,當(dāng)前最重要的價值是如何更好的對接軟硬件的協(xié)同設(shè)計,不光是大規(guī)模的系統(tǒng),如何將眾多的芯片(例如平頭哥芯片、AMD芯片、蘋果芯片)和框架進(jìn)行對接,也是一個非常現(xiàn)實的工程問題。

所以,軟硬件系統(tǒng)的設(shè)計才是核心問題,能否出現(xiàn)新的深度學(xué)習(xí)框架,這個框架將會解決什么問題,也都會圍繞這個核心問題。


7

精挑細(xì)選的問答

問答1:作為CTO,管理著上百人的技術(shù)團(tuán)隊,你們一天的工作內(nèi)容是什么?

李大海:技術(shù)體系的工作分為兩種,第一種是建體制,即從機(jī)制層面思考創(chuàng)造讓團(tuán)隊認(rèn)真工作的環(huán)境。讓大家覺得工作更愉悅,工作目標(biāo)更明確。如果這個問題解決不好,直接會影響工程團(tuán)隊的組織能力,會影響到團(tuán)隊的文化氛圍。

第二種是對重點的工作領(lǐng)域進(jìn)行分類,在幾百人的團(tuán)隊里,我們的工作覆蓋面非常廣,所以我會關(guān)注到哪些領(lǐng)域的重要程度最高,然后判斷現(xiàn)狀和重要程度之間的差距如何。雷鋒網(wǎng)

最后,我作為全局領(lǐng)導(dǎo)者,擁有的信息比較全面。也會關(guān)注擁有部分信息的員工所作出的決策,如果他出現(xiàn)錯誤,我會進(jìn)行糾正。雷鋒網(wǎng)

賈揚清:有四個方面,第一做事情,即如何搭建平臺,如何進(jìn)行業(yè)務(wù),這里涉及到和阿里云的其他團(tuán)隊進(jìn)行對接,討論需求,商量決策。雷鋒網(wǎng)

第二是如何通過團(tuán)隊之間的良好溝通,確保團(tuán)隊的戰(zhàn)斗力。這需要考慮人的喜怒哀樂,需要考慮組織溫度。

第三,如何構(gòu)建機(jī)制,我們的做法是通過“戰(zhàn)役”進(jìn)行確定重點方向,例如針對用戶體驗,用戰(zhàn)役的機(jī)制進(jìn)行討論、執(zhí)行,確保能夠做出用戶需要的產(chǎn)品。

第四,自我學(xué)習(xí)。在做管理的時候,感覺自身有很多不足的地方。并且,我的知識儲備和團(tuán)隊相比并不會雄厚。所以,需要自我學(xué)習(xí),提升能力,從而更好的管理團(tuán)隊。

總結(jié)一下,我在阿里云做管理,涉及到的工作是:人、機(jī)制、自我學(xué)習(xí)。

問答2:會不用有一個大一統(tǒng)深度學(xué)習(xí)框架?

賈揚清:我覺得不會, 例如可口可樂和百事可樂;安卓和ios ,mac和windows。曾經(jīng)看到過這么一個經(jīng)濟(jì)學(xué)觀點,我們的現(xiàn)實需求很多,并沒有一家能夠囊括所有的需求。例如在最好的語言評選中,數(shù)據(jù)科學(xué)家更傾向于Python,系統(tǒng)工程師會選擇C++。因此,不會有一個一統(tǒng)江湖的框架,也不會存在一成不變的框架。(編者注:賈揚清說的可能是政治經(jīng)濟(jì)學(xué)里面的“壟斷并不會消除競爭”~)

李大海:同意賈揚清的觀點,但是我想從另一個角度討論這個問題。例如微信只有一個,但是其他產(chǎn)品可能會出現(xiàn)并存。是否形成一家獨大的判斷標(biāo)準(zhǔn),我認(rèn)為是是否有網(wǎng)絡(luò)效益。機(jī)器學(xué)習(xí)平臺并沒有那么強的網(wǎng)絡(luò)效益,需求的點有很多,不同的需求可能存在不同的平臺。所以,Tensorflow和Pytorch這兩大主流平臺可能會長期存在,而在某些垂直領(lǐng)域還可能出現(xiàn)某些“小而美”的平臺。

問題3:有哪些好的學(xué)習(xí)方法,最近在看的書可以分享?

賈揚清:學(xué)習(xí)方法在于好的知識輸入渠道,推薦四個:1、知乎;2、Hacker News;3、TechCrunch;4、Reddit machine learning group。關(guān)于書籍,最近在看一些管理方面的書籍,例如《公司的進(jìn)化》。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說