0
本文作者: 李揚(yáng)霞 | 2023-09-01 15:33 |
作者 | 李揚(yáng)霞
編輯 | 陳彩嫻
他們的大腦掌握著復(fù)雜的邏輯和算法。
他們的眼睛審視著一行行的代碼。
他們的手指是精準(zhǔn)的輸入工具。
給他們一臺(tái)電腦,他們就能改變世界……
最近,中國(guó)首檔以程序員為中心的真人綜藝節(jié)目《燃燒吧!天才程序員》第三季熱映,再次將掌握國(guó)內(nèi)頂尖科技的程序員展現(xiàn)在大眾眼前。
節(jié)目中,他們的手指在鍵盤(pán)上飛速敲擊,如同舞者在舞臺(tái)上熱烈地舞動(dòng)著,技巧和熱情均展露地淋漓盡致。每一次敲擊,都是程序員與計(jì)算機(jī)的一次互動(dòng),一行行代碼也在他們的指下流出。而這些代碼所組成的世界,都有一個(gè)共同的野心:用技術(shù)改變世界。
這 16 位燃燒的程序員選手都是獨(dú)特的。他們對(duì)技術(shù)擁有不同的認(rèn)知和思考,同時(shí)也有各自的優(yōu)勢(shì)和劣勢(shì),以及偏好和厭惡。
他們從千人的線上賽一路披荊斬棘,進(jìn)入到線下總決賽。
他們或奔著100萬(wàn)獎(jiǎng)金的誘惑而來(lái)、或?yàn)榱嗽黾幼约簩?shí)踐履歷、或?yàn)榱嗽诮咏鎸?shí)的工業(yè)場(chǎng)景下激發(fā)自己的創(chuàng)造力和想象力。
但無(wú)論如何,他們?cè)谶@里都會(huì)有所收獲。
《燃燒吧!天才程序員3·科技助實(shí)》是基于第三屆ATEC科技精英賽(ATEC2022)錄制的節(jié)目。
在這里,“技術(shù)的力量被看見(jiàn),程序員的聲音被聽(tīng)見(jiàn)。”
1
“實(shí)踐經(jīng)驗(yàn)”比獲獎(jiǎng)更有價(jià)值
在21世紀(jì)的今天,科技的力量日益顯現(xiàn),而實(shí)踐,才是解決問(wèn)題的“金鑰匙”。
擰螺絲是大家都知道的事情,但擰得熟練不熟練卻有著很大的差別,平時(shí)看似很簡(jiǎn)單的擰螺絲,在飛行器上就成了不簡(jiǎn)單,因?yàn)樾⌒÷萁z釘?shù)拿撀浜芸赡茚劤纱笫鹿省?/p>
數(shù)字化時(shí)代,程序員的工作就是構(gòu)筑一座座賽博朋克大廈,如果出現(xiàn)Bug,那么整座大廈系統(tǒng)就會(huì)崩潰。
程序員需要掌握各種編程語(yǔ)言和技術(shù),而理論并不能代替實(shí)踐。正如古人云:“紙上得來(lái)終覺(jué)淺,絕知此事要躬行?!?/p>
而比賽正是學(xué)生從學(xué)校走向社會(huì)的一個(gè)重要的練武場(chǎng)。ATEC科技精英賽到今年已經(jīng)舉辦到第三屆,吸引了無(wú)數(shù)的學(xué)子以及愛(ài)好技術(shù)的程序員們。
周遠(yuǎn)哲就是參加ATEC比賽的選手之一,他來(lái)參加比賽的目的很簡(jiǎn)單,除了百萬(wàn)獎(jiǎng)金的誘惑,就是可以學(xué)習(xí)到新的技術(shù)。
在他看來(lái),比賽是一個(gè)很好的通過(guò)實(shí)戰(zhàn)學(xué)習(xí)的途徑,在比賽中很多知識(shí)都需要現(xiàn)學(xué),這個(gè)過(guò)程讓他感覺(jué)很興奮。作為線上賽“數(shù)字化安全”第二賽道,AB榜均為第一名的選手,誰(shuí)能想到能獲得這么好的成績(jī)竟然都是現(xiàn)學(xué)的。他告訴AI科技評(píng)論,包括分布式學(xué)習(xí)和聯(lián)邦學(xué)習(xí)的知識(shí)和經(jīng)驗(yàn)都是在這次比賽中學(xué)到的。
而且他還是第二賽道唯一一個(gè)以個(gè)人身份參賽的選手。在周?chē)际菆F(tuán)隊(duì)作戰(zhàn),強(qiáng)敵環(huán)伺的情況下,他選擇單打獨(dú)斗,而且還一舉拿下線上賽第一名,這是何等的孤勇。
而此前,他還做了一件更酷的事情,就是從物理轉(zhuǎn)到計(jì)算機(jī)。為了更好的就業(yè),他自學(xué)AI,并在短短兩年時(shí)間就進(jìn)?知名???作。
而他把這些成果歸結(jié)于自己主動(dòng)學(xué)習(xí)的動(dòng)機(jī)更強(qiáng)。一來(lái)受比賽的影響,學(xué)習(xí)效率相對(duì)高一些;二來(lái)想贏,所以就會(huì)更加積極。
在他看來(lái)攢經(jīng)驗(yàn)值,比獲得獎(jiǎng)項(xiàng)更為重要。
賽道二“數(shù)字化安全”考驗(yàn)的是選手利用隱私計(jì)算(聯(lián)邦學(xué)習(xí)/協(xié)作學(xué)習(xí))、半監(jiān)督學(xué)習(xí)、圖學(xué)習(xí)等技術(shù)能力識(shí)別風(fēng)險(xiǎn)商戶。這是周遠(yuǎn)哲從來(lái)沒(méi)有遇到過(guò)的場(chǎng)景,通過(guò)一步步的學(xué)習(xí)、驗(yàn)證以及構(gòu)建模型,他對(duì)于聯(lián)邦學(xué)習(xí)、分布式的整個(gè)架構(gòu)以及流程都有了一定的了解。
只有親身實(shí)踐,才能更深入的理解知識(shí),只有將抽象的理論知識(shí)和具體的情況相結(jié)合,知識(shí)才會(huì)更加生動(dòng)。
目前高校教育更多“從定義出發(fā)“,缺乏實(shí)踐操作環(huán)節(jié),學(xué)生難以接觸和了解實(shí)際項(xiàng)目操作流程,導(dǎo)致學(xué)生難以學(xué)以致用,創(chuàng)新能力和解決問(wèn)題的能力得不到充分鍛煉,
參加比賽的選手有很大一部分是學(xué)生,而ATEC社區(qū)的價(jià)值彌補(bǔ)了學(xué)生從學(xué)校走向社會(huì),實(shí)踐能力不足的這一段鴻溝。
而通過(guò)比賽,不僅讓選手接觸到了一些前沿的技術(shù),也可以吸引更多具有創(chuàng)新精神和實(shí)際操作能力的人才參與其中,為解決現(xiàn)實(shí)問(wèn)題貢獻(xiàn)力量。
2
真實(shí)工業(yè)場(chǎng)景引領(lǐng)創(chuàng)新
“以往的比賽,大家更關(guān)注提高模型的準(zhǔn)確度以及性能,沒(méi)有考慮到隱私保護(hù),而現(xiàn)實(shí)中更需要做好模型的隱私泄漏防范,”李金膛如是說(shuō)。
在實(shí)驗(yàn)室模型的精度提高的再好,僅僅體現(xiàn)在冰冷的數(shù)字和機(jī)械中,也感受不到科技對(duì)于現(xiàn)實(shí)世界帶來(lái)的變化。
沒(méi)有真實(shí)的場(chǎng)景是很難驅(qū)動(dòng)人們?nèi)ニ伎技夹g(shù)真正的價(jià)值。
從賽題來(lái)看,今年線上賽道的設(shè)置一如去年,都是實(shí)際業(yè)務(wù)中遇到的場(chǎng)景。數(shù)字化運(yùn)營(yíng)賽道,主要聚焦在消費(fèi)券發(fā)放,考察選手如何利用多種非結(jié)構(gòu)化數(shù)據(jù),如用戶歷史行為序列、用戶間關(guān)系圖、消費(fèi)券知識(shí)圖譜等,來(lái)幫助提高數(shù)字消費(fèi)券的分發(fā)精度。數(shù)字化安全賽道,就是圍繞數(shù)字生態(tài)中風(fēng)險(xiǎn)商戶的識(shí)別問(wèn)題,考察選手如何利用隱私計(jì)算技術(shù)來(lái)聯(lián)合來(lái)自多方的交易信息,在隱私保護(hù)的前提下,提高對(duì)風(fēng)險(xiǎn)商戶的識(shí)別精度。
面對(duì)實(shí)實(shí)在在的業(yè)務(wù)場(chǎng)景,選手們也感受到了實(shí)驗(yàn)室和工業(yè)場(chǎng)景之間的差距。
李金膛告訴AI科技評(píng)論,一方面實(shí)驗(yàn)室和真實(shí)工業(yè)場(chǎng)景下的數(shù)據(jù)不同,實(shí)驗(yàn)室使用的數(shù)據(jù)都是經(jīng)過(guò)精心處理好的理想化的數(shù)據(jù),然而在現(xiàn)實(shí)會(huì)遇到噪聲數(shù)據(jù)、數(shù)據(jù)缺失或者數(shù)據(jù)錯(cuò)誤等等很多問(wèn)題;另一方面實(shí)驗(yàn)室的數(shù)據(jù)規(guī)模很小,在真實(shí)的工業(yè)場(chǎng)景下,幾千萬(wàn)、幾億的規(guī)模都是很常見(jiàn)的,因此就會(huì)導(dǎo)致實(shí)驗(yàn)室做出來(lái)的方案并不能夠擴(kuò)展到大規(guī)模的數(shù)據(jù)場(chǎng)景,而組委會(huì)提供的真實(shí)工業(yè)場(chǎng)景下的數(shù)據(jù),會(huì)促使選手更好的優(yōu)化自己的方案。
讓李金膛感受最深的就是線下賽從60小時(shí)變?yōu)?8小時(shí),賽程變短,而賽題并沒(méi)有減少。其實(shí)這樣設(shè)置也是為了模擬真實(shí)的工業(yè)場(chǎng)景中,需要在有限的時(shí)間內(nèi)完成工作任務(wù)的環(huán)境。這不僅可以考驗(yàn)參賽者的專(zhuān)業(yè)技能,也鍛煉了他們?cè)趬毫ο逻M(jìn)行決策的能力。
1000個(gè)程序員解決問(wèn)題的方法有1000種。而在比賽中,李金膛認(rèn)為最有意思的就是加入隱私保護(hù)的模塊。
在線上賽數(shù)字化安全賽道,李金膛共用了三種技術(shù),包括聯(lián)邦學(xué)習(xí)、知識(shí)蒸餾、模型集成。據(jù)李金膛所述,在聯(lián)邦學(xué)習(xí)的環(huán)境下進(jìn)行比賽,模型的準(zhǔn)確性一定會(huì)有影響。選手們能做的就是盡可能降低其對(duì)模型的影響。
為了提高準(zhǔn)確度而他選擇用知識(shí)蒸餾的方法解決各個(gè)本地?cái)?shù)據(jù)較少,模型容易產(chǎn)生過(guò)擬合的問(wèn)題。最后將多個(gè)模型集成到一起解決單一模型的泛化性問(wèn)題。
而這一賽道獲勝的關(guān)鍵是數(shù)據(jù)特征的構(gòu)建。“行業(yè)內(nèi)有一句話,數(shù)據(jù)構(gòu)建的特征是決定整體模型最終上限,怎么去設(shè)計(jì)模型,是去不斷逼近這個(gè)上限,”李金膛如是說(shuō)。
螞蟻舉辦的ATEC比賽是就是基于他們業(yè)務(wù)場(chǎng)景的真實(shí)的工業(yè)場(chǎng)景的一些數(shù)據(jù),往往這些數(shù)據(jù)會(huì)涉及到一些領(lǐng)域內(nèi)比較新的一些技術(shù),選手通過(guò)去接觸這些數(shù)據(jù),然后提出解決方案。同時(shí)也有機(jī)會(huì)去學(xué)習(xí)和掌握一些新的技術(shù)工具以及一些方法,并有助于擴(kuò)展他們的一些技能包,保持對(duì)整個(gè)行業(yè)發(fā)展的敏感性,有助于其后續(xù)的職業(yè)發(fā)展。
人工智能發(fā)展到了一定程度,才去關(guān)注其他一些問(wèn)題。比如說(shuō)模型的可靠程度、模型的隱私保護(hù)能力等,這些相對(duì)模型精度相對(duì)沒(méi)那么重要,但是這對(duì)于整個(gè)人工智能領(lǐng)域有更好更健康的發(fā)展,是不可或缺的一部分,ATEC引發(fā)了比賽的一個(gè)新方向。
李金膛說(shuō):“參加了兩屆比賽,第一個(gè)最直接的收獲就是接觸到一些真實(shí)的工業(yè)場(chǎng)景數(shù)據(jù),增加了我在相關(guān)方面的實(shí)踐經(jīng)驗(yàn)。另一方面就是培養(yǎng)了解決問(wèn)題的能力,鍛煉了在高壓環(huán)境下的創(chuàng)造性思維?!?/p>
AI不能只待在實(shí)驗(yàn)室,實(shí)踐能力的訓(xùn)練更需要真實(shí)的場(chǎng)景。
3
賽博世界的“手藝人”
經(jīng)濟(jì)社會(huì)發(fā)展對(duì)科技的需求,從來(lái)沒(méi)有像今天這樣重要而迫切。
數(shù)字化智能化正在深入各行各業(yè),實(shí)體企業(yè)正處在艱難的爬坡階段。
程序員就是改造這座賽博大廈手藝人,他們和作曲家、建筑師、畫(huà)家和作家一樣,都試圖創(chuàng)作出優(yōu)秀的作品。
而程序員是利用手中的代碼構(gòu)建模型從而解決現(xiàn)實(shí)問(wèn)題。
ATEC每一年命題的設(shè)置都踩在時(shí)代的脈搏上,第一年的野生動(dòng)物保護(hù),第二年的科技反詐,第三年的科技助實(shí),最終目的都是解決現(xiàn)實(shí)問(wèn)題。
ATEC 2022線下賽設(shè)置的第二道賽題就是利用計(jì)算機(jī)視覺(jué)、衛(wèi)星遙感等技術(shù)來(lái)識(shí)別農(nóng)作物類(lèi)別。讓人們真實(shí)的感受到了科技不僅能夠真正解決生活中遇到一些的問(wèn)題,同時(shí)還讓人們了解到科技還能夠預(yù)測(cè)田地的價(jià)值。
唐靜作為為數(shù)不多的女程序員選手,在賽場(chǎng)上可以說(shuō)是獨(dú)特的存在。
誰(shuí)說(shuō)女生不能是個(gè)好的算法工程師呢?唐靜參加比賽是被老公包恒達(dá)拉來(lái)的,沒(méi)想到最后輕輕松松拿下了線上賽數(shù)字化運(yùn)營(yíng)賽道第三名。
當(dāng)然選擇這一賽道也是因?yàn)樗龔氖峦扑]算法的工作,而消費(fèi)券預(yù)測(cè)的賽題有些異曲同工。
她告訴AI科技評(píng)論:“在比賽中,靠譜的線下驗(yàn)證十分關(guān)鍵,因?yàn)榫€上提交一般都有限制,只有保證線上線下一致才能快速嘗試更多思路?!?/p>
就比賽對(duì)于唐靜本人的意義而言,最大的收獲是有機(jī)會(huì)嘗試和學(xué)習(xí)最新的技術(shù)。在算法的工作環(huán)境當(dāng)中,由于試錯(cuò)成本高,更加追求穩(wěn)定,所以沒(méi)法嘗試特別多前沿技術(shù),但是比賽場(chǎng)景下能更靈活快速迭代模型,學(xué)習(xí)更前沿的技術(shù)。
在她看來(lái),今年的主題比較“接地氣”,可以實(shí)實(shí)在在幫助到中小企業(yè),比如線下賽的第三個(gè)賽題,就是關(guān)于預(yù)測(cè)小微企業(yè)經(jīng)營(yíng)風(fēng)險(xiǎn)的,這是現(xiàn)實(shí)中確實(shí)存在的問(wèn)題,如果這塊內(nèi)容做好了,是一件非常有意義的事情。
在科技助實(shí)這條路上,注定不是一朝一夕就能夠完成的,需要一代代人不斷努力創(chuàng)新迭代,從而構(gòu)筑一個(gè)新的賽博世界。
回想中世紀(jì)在歐洲建造的大教堂,每一座都需要數(shù)千人年的努力,時(shí)間跨度長(zhǎng)達(dá)幾十年。從中吸取的經(jīng)驗(yàn)教訓(xùn)被傳遞給下一代的建造者,最終一代代累積的造詣推動(dòng)了結(jié)構(gòu)工程的發(fā)展。而木匠、石匠、雕刻師和玻璃工人都是手工藝人。
當(dāng)今時(shí)代,這座以科技為基座的高樓大廈,需要更多的手藝人去支撐,他們就是程序員。現(xiàn)代科技高樓也需要一代代的程序員去不斷構(gòu)建。
本文作者:李揚(yáng)霞,微信Dec9102。長(zhǎng)期聚焦網(wǎng)絡(luò)安全、數(shù)字安全領(lǐng)域,同時(shí)關(guān)注AIGC、大模型等內(nèi)容,對(duì)以上領(lǐng)域感興趣的讀者歡迎添加作者微信。雷峰網(wǎng)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。