0
本文作者: 我在思考中 | 2022-03-02 15:24 |
編譯 | 王曄
科研界的學(xué)歷內(nèi)卷早已不是新鮮話題,博士后文憑更被認(rèn)為是進(jìn)入高校任職不可或缺的條件之一。以至于青年學(xué)生有這樣一種感覺:高校尚且如此,進(jìn)大廠做研究也是博士以上學(xué)歷最佳吧?
不過,近日有一位正在亞馬遜擔(dān)任應(yīng)用科學(xué)家的華人研究者發(fā)表了一篇文章,親述了他如何在本科畢業(yè)后僅拿著學(xué)士學(xué)位進(jìn)入大廠做研究的經(jīng)歷。
一句話總結(jié):很難,但也不是沒有希望!
這位華人的名字叫 David Fan,2019年本科畢業(yè)于普林斯頓大學(xué)計算機(jī)系,輔修統(tǒng)計學(xué)與機(jī)器學(xué)習(xí),本科期間曾受鄧嘉指導(dǎo),在ICCV上發(fā)表過計算機(jī)視覺相關(guān)的論文。此外,他曾在羅格斯大學(xué)物理系、羅格斯新澤西醫(yī)學(xué)院、哈佛醫(yī)學(xué)院與普林斯頓大學(xué)視覺與學(xué)習(xí)實驗室等機(jī)構(gòu)做過研究。
圖注:David Fan(圖源:個人主頁)
據(jù)其主頁顯示,他在2018年8月加入亞馬遜,先是在亞馬遜網(wǎng)頁服務(wù)(Amazon Web Service, AWS)擔(dān)任軟件工程師實習(xí)生,2019年8月轉(zhuǎn)正,然后在2020年7月正式入職亞馬遜擔(dān)任研究工程師、2021年5月轉(zhuǎn)為應(yīng)用科學(xué)家。
他是如何做到的呢?AI科技評論對其自述做了不改原意的整理與編譯:
我目前是一名應(yīng)用科學(xué)家,在亞馬遜擔(dān)任全職的機(jī)器學(xué)習(xí)(ML)研究員,而且我并沒有博士學(xué)位。在這里,我參與了研究創(chuàng)新難題,與聰明又上進(jìn)的同事一起工作,在做我喜歡做的事情的同時,還能獲得高額的行業(yè)薪酬。
了解到還有很多人對機(jī)器學(xué)習(xí)感興趣,但網(wǎng)上關(guān)于如何從軟件工程過渡到機(jī)器學(xué)習(xí)的指導(dǎo)卻很少。所以,我發(fā)表了這篇文章,分享我從大學(xué)進(jìn)入軟件工程領(lǐng)域,再到后來成為機(jī)器學(xué)習(xí)研究員的歷程,希望能夠有借鑒指導(dǎo)意義。
雖然這篇文章只是針對我個人的經(jīng)驗總結(jié),但我相信有一些要點(diǎn)是適用于每個人的。
我的大學(xué)之旅不是一條一成不變的直線,導(dǎo)致我對機(jī)器學(xué)習(xí)的研究起步較晚。
剛進(jìn)入普林斯頓大學(xué)那會兒,我對計算生物學(xué)研究有著濃厚的興趣,一直堅持研究該方向,直到大三。那時候,我突然意識到自己過于專注在生物領(lǐng)域了,我想發(fā)展能解決更多領(lǐng)域問題的技能。
于是,我開始對機(jī)器學(xué)習(xí)感興趣,特別是具有現(xiàn)實應(yīng)用意義的計算機(jī)視覺。
然而,那時我也只上過機(jī)器學(xué)習(xí)課程,缺乏實踐經(jīng)驗。我的三段實習(xí)經(jīng)歷(羅格斯大學(xué)物理系、羅格斯新澤西醫(yī)學(xué)院、哈佛醫(yī)學(xué)院)也都是有關(guān)生物信息學(xué)和軟件工程的,第一次獨(dú)立提出研究的項目也是關(guān)于生物信息學(xué)的。
當(dāng)時普林斯頓大學(xué)只有少數(shù)老師從事計算機(jī)視覺和深度學(xué)習(xí)方面的研究,他們的實驗室也沒有更多接納本科生的空位了。
幸運(yùn)的是,大四前的那個夏天(2018年),我與一位新聘用的助理教授(鄧嘉)取得了聯(lián)系,并成為了第一批加入他的實驗室的學(xué)生之一。
2018年的夏天,我查閱論文、參加Kaggle比賽(座頭鯨識別比賽)等自學(xué)深度學(xué)習(xí),還有閱讀文獻(xiàn)、以準(zhǔn)備畢業(yè)論文的構(gòu)思。
在我第一次跟導(dǎo)師見面時,我就告訴他我想研究一個有望發(fā)表論文的項目,因為我知道無論是申請讀研究生還是參加工業(yè)界的機(jī)器學(xué)習(xí)職位招聘,我都需要有論文發(fā)表成果。所以他就安排我與一名高年級的博士生一起做了一個3D視覺研究項目。
在課程都是滿的情況下,我堅持平均每周拿出25個小時用來研究。雖然我對這個領(lǐng)域幾乎完全陌生,但通過努力我很快就跟上了進(jìn)度,這些工作也為我的畢業(yè)論文做出了重要貢獻(xiàn)。
畢業(yè)周前夕,我們向 NeurIPS 提交了一篇論文,但遺憾的是,這篇論文被拒了。但那年夏天我們又進(jìn)行了更深入的研究,這篇論文后來也被 CVPR 接收了。
畢業(yè)論文的研究經(jīng)歷重燃了我對研究的熱情,我決定把機(jī)器學(xué)習(xí)研究作為我的事業(yè)。
當(dāng)時我已經(jīng)收到了亞馬遜軟件工程方向的應(yīng)屆畢業(yè)生offer。然而,我沒有任何把握可以得到研究機(jī)器學(xué)習(xí)的職位。那時,我的論文尚未被CVPR 2020接收,所以我當(dāng)時唯一發(fā)表過的論文是生物學(xué)和物理學(xué)方面的研究。我沒有具體的成果可以證明我在ML研究方面做出過有意義的貢獻(xiàn)。
于是,我決定先嘗試加入機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施團(tuán)隊,希望先在該領(lǐng)域獲得一些工作經(jīng)驗,為以后的職業(yè)生涯打基礎(chǔ)。
我認(rèn)為,與大多數(shù)缺乏研究經(jīng)驗的工程師相比,我對機(jī)器學(xué)習(xí)軟件生態(tài)系統(tǒng)的了解是我的優(yōu)勢;而與缺乏產(chǎn)出經(jīng)驗的科學(xué)家相比,擁有端到端交付的能力又能使我脫穎而出。
盡管亞馬遜應(yīng)屆畢業(yè)生通常都是服從團(tuán)隊的職位安排,但我還是給招聘經(jīng)理發(fā)了郵件,想通過網(wǎng)絡(luò)聯(lián)系進(jìn)入亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)的云機(jī)器學(xué)習(xí)部門。
后來,我加入了SageMaker組,該團(tuán)隊主要負(fù)責(zé)銷售機(jī)器學(xué)習(xí)一體化云平臺。在SageMaker,我為降低深度學(xué)習(xí)模型的實時推理成本和延遲工作了一年。我還為一項關(guān)鍵功能的發(fā)布做出了貢獻(xiàn),并撰寫了隨附的AWS官方博客文章。
相關(guān)鏈接:https://aws.amazon.com/cn/blogs/machine-learning/reduce-ml-inference-costs-on-amazon-sagemaker-for-pytorch-models-using-amazon-elastic-inference/
不久之后,我的畢業(yè)論文被CVPR接收并發(fā)表了。至此,我在大學(xué)畢業(yè)大概一年后既有了一篇頂級ML會議的論文,也有了一項新功能發(fā)布的成果。
研究按計劃推進(jìn),此時,我有了足夠的籌碼與亞馬遜的ML研究團(tuán)隊交談。
有趣的是,在我即將晉升二級軟件工程師時,我對原本的計劃有了動搖。
由于我當(dāng)時的團(tuán)隊不屬于研究團(tuán)隊,所以如果我想做研究,就必須轉(zhuǎn)到研究團(tuán)隊,但換團(tuán)隊就要重新調(diào)整晉升時間。當(dāng)時我的朋友和同齡人都已經(jīng)開始升職了,我不想成為最后一個升職的人。
我也開始懷疑,如果沒有博士學(xué)位,我是否能夠在機(jī)器學(xué)習(xí)研究上取得成功?
我與亞馬遜的科學(xué)家以及一些有研究背景但最終選擇從事工程的工程師一起喝咖啡、聊天,期冀從他們那里能夠獲得一些建議。
一方面,很多人告訴我,我唯一的選擇是重回學(xué)校,讀一個研究型的碩士,最好是博士。
另一方面,也有一小部分人給了我鼓勵。他們說我可以進(jìn)行內(nèi)部調(diào)動,并且他們也知道一些成功調(diào)動的例子。
但總的來說,這些談話加深了我的疑慮,因為如果我失敗了,我不僅會丟掉早期的晉升機(jī)會,而且還會 “浪費(fèi)”我生命中的幾年時間。
經(jīng)歷自我思考后,我才意識到我的擔(dān)憂在很大程度上是膚淺和瑣碎的。當(dāng)一個人需要承擔(dān)更少來自家庭等的個人責(zé)任時,其實他更容易在人生早期進(jìn)行諸如轉(zhuǎn)換職業(yè)道路之類的冒險賭注。
我意識到我不會因為沒能在研究中取得成功然后轉(zhuǎn)回軟件工程而后悔,但如果沒有嘗試ML研究我會非常后悔,因為我相信自己有能力可以取得成功。我的競爭好勝心又使我無法接受延遲晉升。
但幸運(yùn)的是,我能夠認(rèn)識到職業(yè)發(fā)展是一場馬拉松比賽,而不是四百米短跑。投資于長期成功而不是短期成功不僅會讓我更快樂,而且還能更好地迎接ML變得更加無處不在的未來。
于是我開始在亞馬遜內(nèi)部尋找 ML 研究團(tuán)隊,并與一位剛在Prime Video成立新團(tuán)隊的經(jīng)理取得了聯(lián)系,該團(tuán)隊致力于用機(jī)器學(xué)習(xí)理解視頻。
由于我沒有碩士和博士學(xué)位,所以我不能直接面試應(yīng)用科學(xué)家的職位,但我可以面試研究工程師。因此,我做了一個研究工程師的內(nèi)部面試,包括一輪 ML 算法面試和一輪編碼面試。
在這個過程中,我親歷了令人驚訝的學(xué)位偏見。雖然我通過了兩輪面試,但后來我被告知,包括我的經(jīng)理在內(nèi)的一些人都因我沒有碩士和博士學(xué)位而表示擔(dān)憂。
盡管如此,我的轉(zhuǎn)組申請最終還是得到了批準(zhǔn),并成為了團(tuán)隊的第一個員工。2021年5月,我開始全身心地投入到成為一名ML研究科學(xué)家的目標(biāo)中。
在以研究工程師的身份加入Prime Video后,我的下一步計劃是通過內(nèi)部調(diào)動成為一名應(yīng)用研究科學(xué)家。
由于亞馬遜的應(yīng)用科學(xué)家大多擁有博士學(xué)位,因此我需要證明自己完全有能力獨(dú)立完成普遍認(rèn)為博士生或優(yōu)秀碩士生水平才能完成的研究。然后我再對這些研究項目進(jìn)行總結(jié),并以晉升文件的方式收集同行的反饋,以便申請調(diào)動。
大多數(shù)應(yīng)用科學(xué)家都是外部聘用的,很少有工程師能在內(nèi)部成功轉(zhuǎn)型,特別是學(xué)位上還存在偏見,因此,機(jī)會對我來說是很難得的。
很長一段時間我都感覺自己身處迷霧之中,因為沒有人能指導(dǎo)我完成這個過程。
通過推測成為一名研究科學(xué)家的必備要求,并評估我距離這些要求的差距,我制定了一個規(guī)劃圖,爭取在日常工作中少做工程項目,多做ML研究。
然而,事實證明,執(zhí)行這個計劃比預(yù)期要困難得多。盡管我的經(jīng)理支持我爭取成為一名研究科學(xué)家,但公司的業(yè)績要求使我難以追求自己的職業(yè)目標(biāo)。如果我作為一名工程師占用了公司太多的時間來做研究項目,這自然會導(dǎo)致我的工程成果比其他工程師少。從績效評估的角度來看,這是非常不利的。
找到兩者之間的正確平衡是一個微妙的過程,我需要經(jīng)常與領(lǐng)導(dǎo)討論要求和目標(biāo),并在工作之余投入大量時間從事研究項目。
幸運(yùn)的是,我在新冠疫情爆發(fā)期間完成了這一轉(zhuǎn)變,因為分心的事情和社交活動比平時少得多。如果不工作更長時間,我很可能無法收集到足夠的研究數(shù)據(jù)和同行的反饋意見,更不可能轉(zhuǎn)為應(yīng)用科學(xué)家。
這期間,我參與的一個研究項目是與另一組的一位首席科學(xué)家合作,這位科學(xué)家能夠提供反饋意見,為我的調(diào)組申請助力。在這個項目中我做出了新的貢獻(xiàn),幫助開發(fā)了一個最先進(jìn)的用于電影場景分割的自監(jiān)督模型并完成部署,這也是我的第二篇CVPR 論文,并在全公司進(jìn)行了主題演講。
論文鏈接:https://arxiv.org/pdf/2104.13537.pdf
在這之后,我寫了一份轉(zhuǎn)組文件,并通過了一位資深科學(xué)家的技術(shù)評估。
盡管我有所有的可交付成果來證明我符合應(yīng)用科學(xué)家的要求,但由于要對我的文件進(jìn)行內(nèi)部審查,我的轉(zhuǎn)組被推遲了。
直到2021年5月,在我進(jìn)入機(jī)器學(xué)習(xí)領(lǐng)域3年后、也是我加入Prime Video11個月后,我轉(zhuǎn)為應(yīng)用科學(xué)家的申請終于被批準(zhǔn)了!
現(xiàn)在,作為一名應(yīng)用科學(xué)家,我領(lǐng)導(dǎo)著前瞻性的研究,這些研究有可能為Prime Video等產(chǎn)品帶來新功能和優(yōu)化。我用約一半的時間來開發(fā)和生產(chǎn)支持新功能的機(jī)器學(xué)習(xí)模型,剩下的時間花在可發(fā)表的研究和撰寫論文上。
與我當(dāng)工程師那會兒相比,我現(xiàn)在對自己的工作方向有更多的自主權(quán)和所有權(quán),這也給了我更大的成就感。
機(jī)器學(xué)習(xí)研究是我現(xiàn)在夢寐以求的工作,我非常幸運(yùn)能夠通過做我喜歡的事情來獲得報酬。
如果你是一名學(xué)生并且確定對ML研究感興趣,那么你目前所能做的最好的事情就是獲得已發(fā)表論文的研究經(jīng)驗和共同作者身份,甚至是第一作者身份。
你也可以和有興趣合作的教員交談,看看是否有項目需要幫助進(jìn)行實驗。有時教師太忙、無法直接回答或指導(dǎo)你,在這種情況下,你可以嘗試尋找在項目方面需要幫助并愿意與你合作的研究生。
學(xué)習(xí)額外的課程是有幫助的,但收益會遞減,因為進(jìn)行研究所需的大多數(shù)知識都是高度具體的,最好通過閱讀相關(guān)論文和通過實踐進(jìn)行動手實驗來學(xué)習(xí)。
如果你已經(jīng)要畢業(yè)并且沒有研究經(jīng)驗,那么可以進(jìn)行一到兩年以研究為中心的碩士學(xué)習(xí)。當(dāng)你可以在行業(yè)工作中獲得經(jīng)驗和報酬時,以課堂為重點(diǎn)的碩士課程并不是對時間的有效利用方式。
是否要攻讀博士學(xué)位是一個復(fù)雜的話題,但基本上我不認(rèn)為博士學(xué)位對于行業(yè)研究中的職業(yè)發(fā)展是必要的。只有當(dāng)你想要有高度專注的時間來解決一個非常具體的問題,并且有興趣之后成為一名教授時,博士學(xué)位才是一個不錯的選擇。
同樣,如果您在行業(yè)中并沒有研究經(jīng)驗,要么可以選擇讀碩,繼續(xù)以研究為重點(diǎn),要么你也可以像我一樣嘗試在內(nèi)部進(jìn)行轉(zhuǎn)組,先加入一個研究團(tuán)隊,成為一名軟件工程師,然后逐漸贏得更多的研究工作機(jī)會。
當(dāng)你的學(xué)歷不滿足崗位要求時,內(nèi)部調(diào)動比外部申請要更容易,因為招聘系統(tǒng)是高度自動化的,并且經(jīng)過了優(yōu)化、可以最大限度地減少誤報。但第二個選擇的缺點(diǎn)是,在公司內(nèi)部發(fā)展時,你需要花時間來建立聯(lián)系并贏得信任。
對你有利的一點(diǎn)是,工程經(jīng)驗對于可擴(kuò)展性迭代實驗很有價值,并且通常會讓你比純粹的科學(xué)家更有優(yōu)勢(尤其是經(jīng)驗方面)。
無論你在哪里,你都需要算力來做ML研究,而ML研究的計算量越來越大。如果你沒有機(jī)會進(jìn)入學(xué)術(shù)界或工業(yè)界的計算集群,我會建議你建立自己的PC,并做一些諸如ML 會議主辦的競賽之類的輔助項目,以跟上ML的發(fā)展速度,發(fā)展綜合能力。我認(rèn)為Kaggle比賽也是一個公平的學(xué)習(xí)選擇,但不是培養(yǎng)綜合能力的理想之選,因為這些項目通常與學(xué)術(shù)文獻(xiàn)相關(guān)性不大,而是更側(cè)重于現(xiàn)實世界的使用,與NeurIPS等ML會議主辦的比賽形成了鮮明對比。
回顧我在亞馬遜至今的經(jīng)歷,我可以想到以下主要教訓(xùn):
我是唯一一個可以決定我的事業(yè)走向的人。作為一個剛畢業(yè)的學(xué)生,我不理解我的經(jīng)理的激勵措施,當(dāng)他們沒有給我想要的項目時,我經(jīng)常怨恨他們。當(dāng)時我不明白、后來才知道的一點(diǎn)是:我不應(yīng)該期望別人為我出力。我需要為自己而戰(zhàn),創(chuàng)造我想要的機(jī)會。
運(yùn)氣=準(zhǔn)備+機(jī)會。雖然我很幸運(yùn)得到了加入Prime Video的機(jī)會,但我之前也做了充分的準(zhǔn)備,通過我的努力工作和人脈來利用這個機(jī)會。
規(guī)則很少是一成不變的。雖然博士學(xué)位是機(jī)器學(xué)習(xí)研究工作職位的硬性要求,但學(xué)位只是能力的代表。博士學(xué)位預(yù)示著一個人很可能有能力做獨(dú)立的研究,但也有很多人沒有博士學(xué)位,卻做了了不起的工作。歸根結(jié)底,唯一重要的是你是否可以完成工作。學(xué)位可以使你更容易被雇用,但一旦你被雇用,沒有人在乎你有什么學(xué)位。當(dāng)對要求有疑問時,試著從招聘經(jīng)理的角度思考這個角色的職能職責(zé)是什么。在我看來,這同樣適用于MBA和其他專業(yè)學(xué)位。
做你自己喜歡的事。有些人主張為生活而工作,然后在工作之外做自己喜歡的事情。我認(rèn)為這也可以,并且我很欽佩那些能夠?qū)崿F(xiàn)它的人,但我發(fā)現(xiàn)這對我而言具有挑戰(zhàn)性。當(dāng)我剛開始在亞馬遜的一個非研究團(tuán)隊工作時,我試圖在工作之余保持對研究論文的關(guān)注,但這并不持久,因為工作已經(jīng)耗費(fèi)了我大量的精神和體力。當(dāng)我的激情與我的工作交織在一起時,我就會更有動力提高自己。
原文鏈接:https://medium.com/@davidfan/entering-industry-ml-ai-research-without-a-phd-e56761979c8f
雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。