0
本文作者: 鄭佳美 | 2024-12-04 14:31 |
時(shí)隔兩個(gè)月,字節(jié)模型遭攻擊事件又有新后續(xù)。
今年10月份,字節(jié)商業(yè)化內(nèi)部模型商業(yè)化內(nèi)部模型訓(xùn)練遭實(shí)習(xí)生攻擊一事鬧得滿城風(fēng)雨,后這位名為田柯宇的實(shí)習(xí)生便被開除并被要求賠償字節(jié)的侵權(quán)損失800萬元及合理支出2萬元。
本以為這個(gè)瓜會(huì)以字節(jié)的“雷霆手段”告一段落,沒想到就在剛剛,事件迎來了大扭轉(zhuǎn)。田柯宇和字節(jié)合作的論文竟然被人工智能頂級(jí)會(huì)議 NIPS 被評(píng)為了 Best Paper。
網(wǎng)友們也是紛紛下場(chǎng)吃瓜:
有人感嘆:有點(diǎn)小說那意思了,昨日的我你愛答不理,今日的我你高攀不起。
也有人勸字節(jié)及時(shí)止損,抓緊請(qǐng)“老師”回家。
更有人支持田柯宇直接下場(chǎng)創(chuàng)業(yè)。
不過也不乏理智的網(wǎng)友:優(yōu)秀永遠(yuǎn)也不能成為作惡的通行證。
字節(jié)「雷霆手段」始末
兩個(gè)多月前,網(wǎng)上流傳出一則消息,“字節(jié)大模型訓(xùn)練被實(shí)習(xí)生入侵,注入了破壞代碼,導(dǎo)致其訓(xùn)練成果不可靠,可能需要重新訓(xùn)練。據(jù)稱遭到入侵的代碼注入了8000多張卡,帶來的損失可能超過千萬美元?!?/p>
10月19日,官方發(fā)布公告對(duì)這件事進(jìn)行了澄清,確有商業(yè)化技術(shù)團(tuán)隊(duì)實(shí)習(xí)生發(fā)生嚴(yán)重違紀(jì)行為,涉事實(shí)習(xí)生已于2024年8月被公司辭退,并將其行為同步給行業(yè)聯(lián)盟和所在學(xué)校,交由校方處理。
緊接著11月5日,字節(jié)還專門發(fā)布了面向內(nèi)部全員的《企業(yè)紀(jì)律與職業(yè)道德委員會(huì)通報(bào)》,對(duì)這件事件進(jìn)行了更詳細(xì)地披露。
通報(bào)提到,2024年6月至7月,集團(tuán)商業(yè)產(chǎn)品與技術(shù)部門前實(shí)習(xí)員工田某某,因?qū)F(tuán)隊(duì)資源分配不滿,通過編寫、篡改代碼等形式惡意攻擊團(tuán)隊(duì)研究項(xiàng)目的模型訓(xùn)練任務(wù),造成資源損耗。字節(jié)方已與其解除實(shí)習(xí)協(xié)議,同步陽光誠(chéng)信聯(lián)盟及企業(yè)反舞弊聯(lián)盟,并同步至其就讀學(xué)校處理。
AI科技評(píng)論了解到,這名實(shí)習(xí)生本科畢業(yè)于北京航空航天大學(xué)軟件學(xué)院,研究生就讀于北京大學(xué),師從王立威教授。研究興趣為深度學(xué)習(xí)的優(yōu)化與算法。自2019年起,他在商湯和字節(jié)跳動(dòng)實(shí)習(xí)研究,具體包括超參數(shù)優(yōu)化、強(qiáng)化學(xué)習(xí)算法、自監(jiān)督的新型算法。
而就在事件處理期間,他卻多次對(duì)外否認(rèn),聲稱當(dāng)時(shí)攻擊訓(xùn)練任務(wù)的人不是自己,而是其他的實(shí)習(xí)生,甚至還報(bào)警稱自己遭到了造謠。
這一舉動(dòng)直接惹怒的老東家字節(jié),直接一紙?jiān)V狀把他告上法庭,要求其索賠公司的侵權(quán)損失800萬元及合理支出2萬元。
然而讓人感到抽象的是,而時(shí)至今日,田柯宇的領(lǐng)英主頁(yè)上還明晃晃的寫著幾個(gè)大字:勿信謠勿傳謠
「作惡者」搞出大新聞
12月4日凌晨,田柯宇獲得 Best Paper 的消息在網(wǎng)上不脛而走。
AI科技評(píng)論第一時(shí)間去核實(shí)了信源的可靠性,確認(rèn)田柯宇的論文確實(shí)是被 NeurIPS 評(píng)為了 Best Paper,并且早在2023年,田柯宇的一項(xiàng)工作就曾被ICLR評(píng)選為Spotlight論文。
在這篇 Best Paper 中,田柯宇和其所在團(tuán)隊(duì)首次提出了一種新的圖像生成框架,這個(gè)框架在圖像合成的質(zhì)量、多樣性、數(shù)據(jù)效率和推理速度方面首次超越了強(qiáng)大的擴(kuò)散模型,并且具有很好的擴(kuò)展性和零樣本任務(wù)泛化能力,并且這個(gè)項(xiàng)目已經(jīng)在Github上積累了4.4k多顆星。
人工智能超級(jí)頂會(huì) NeurIPS
讓田柯宇又火了一把的 NeurIPS,是被稱為「人工智能超級(jí)頂會(huì)」的存在。
NeurIPS全稱為神經(jīng)信息處理系統(tǒng)大會(huì),是機(jī)器學(xué)習(xí)領(lǐng)域公認(rèn)的頂級(jí)會(huì)議,與ICML(國(guó)際機(jī)器學(xué)習(xí)會(huì)議)和ICLR(國(guó)際學(xué)習(xí)表征會(huì)議)齊名,被認(rèn)為是難度最大、水平最高、影響力最強(qiáng)的會(huì)議之一。在中國(guó)計(jì)算機(jī)學(xué)會(huì)的國(guó)際學(xué)術(shù)會(huì)議排名中,NeurIPS被列為人工智能領(lǐng)域的A類會(huì)議。
除此之外,雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))還了解到,NeurIPS的最佳論文獎(jiǎng)評(píng)選標(biāo)準(zhǔn)也非常嚴(yán)格,NeurIPS 2024共收到15671篇有效論文投稿,比去年增長(zhǎng)了27%,但最終接收率低于2023年,僅有25.8%。
而那些獲得NeurIPS最佳論文獎(jiǎng)的研究者,往往代表了神經(jīng)科學(xué)和人工智能領(lǐng)域的前沿成就,他們的工作不僅在學(xué)術(shù)界產(chǎn)生重大影響,也在工業(yè)界引起廣泛關(guān)注,成為引領(lǐng)研究趨勢(shì)的關(guān)鍵力量。
最佳論文獎(jiǎng)之外,NeurIPS另外一個(gè)重磅獎(jiǎng)項(xiàng)為時(shí)間檢驗(yàn)獎(jiǎng)(Test-of-Time Award),頒發(fā)給那些在NeurIPS會(huì)議上發(fā)表的論文,這些論文在10年后仍然顯示出深遠(yuǎn)的影響和持久的價(jià)值。今年有兩篇論文獲得這一獎(jiǎng)項(xiàng),分別為Ilya Sutskever的Seq2Seq和Ian Goodfellow的生成對(duì)抗網(wǎng)絡(luò)GAN。
至于字節(jié)會(huì)如何應(yīng)對(duì)這件事,還是一言不發(fā)?我們拭目以待。
獲獎(jiǎng)地址:https://neurips.cc/virtual/2024/poster/94115
論文地址:https://arxiv.org/abs/2404.02905
項(xiàng)目開源地址:https://github.com/FoundationVision/VAR
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。