0
| 本文作者: 鄭佳美 | 2025-10-28 18:06 |
雷峰網(wǎng) AI 科技評(píng)論獨(dú)家獲悉,MiniMax 高級(jí)研究總監(jiān)鐘怡然已離職,具體去向暫未公開(kāi)。
據(jù)公開(kāi)資料顯示,鐘怡然博士畢業(yè)于澳大利亞國(guó)立大學(xué),師從李宏?yáng)|教授與 Richard Hartley 院士。并曾在國(guó)際權(quán)威期刊及頂級(jí)學(xué)術(shù)會(huì)議上累計(jì)發(fā)表了 40 余篇研究論文,涵蓋 TPAMI、IJCV、IEEE TIP、CVPR、NeurIPS、ECCV、ICCV、ICLR、EMNLP 等領(lǐng)域,且持有多項(xiàng)美國(guó)專(zhuān)利。
鐘怡然的科研成果在學(xué)術(shù)界與產(chǎn)業(yè)界都受到了廣泛關(guān)注,相關(guān)論文累計(jì)被引用近 2000 次。還曾獲的 2023 年 ICCV Workshop 最佳論文獎(jiǎng)以和 2014 年 ICIP 最佳學(xué)生論文獎(jiǎng)。
博士畢業(yè)后,鐘怡然于 2021 年加入商湯科技,擔(dān)任高級(jí)經(jīng)理,負(fù)責(zé)大語(yǔ)言模型、多輪對(duì)話(huà)及多模態(tài)融合方向的研究。隨后在 2022 年,以青年科學(xué)家的身份加入上海人工智能實(shí)驗(yàn)室,擔(dān)任新架構(gòu)探索組的 PI,OpenNLPLab負(fù)責(zé)人,專(zhuān)注于高效的大語(yǔ)言模型和視聽(tīng)語(yǔ)言多模態(tài)融合。
2023 年底,鐘怡然在 MiniMax 就大模型的高效架構(gòu)方向提出構(gòu)想,與研發(fā)團(tuán)隊(duì)共同推進(jìn)線(xiàn)性注意力機(jī)制在大規(guī)模語(yǔ)言模型中的應(yīng)用。
2024 年,團(tuán)隊(duì)正式啟動(dòng) MiniMax-01 項(xiàng)目,由鐘怡然擔(dān)任項(xiàng)目負(fù)責(zé)人,全面主導(dǎo)模型的架構(gòu)設(shè)計(jì)與研發(fā)工作。經(jīng)過(guò)近一年的迭代與優(yōu)化,MiniMax 于 2025 年初正式發(fā)布基于 Lightning Attention 架構(gòu)的 MiniMax-01 模型。
該模型一經(jīng)推出便在業(yè)界引發(fā)廣泛關(guān)注,被普遍認(rèn)為是一款具有突破性意義的大語(yǔ)言模型。MiniMax-01 在超長(zhǎng)上下文處理能力方面表現(xiàn)尤為突出,采用團(tuán)隊(duì)自主研發(fā)的 Lightning Attention 架構(gòu),通過(guò)線(xiàn)性或近線(xiàn)性注意力機(jī)制,大幅提升了模型在長(zhǎng)序列輸入下的計(jì)算效率與可擴(kuò)展性,有效突破了傳統(tǒng) Transformer 在復(fù)雜度上的性能瓶頸。
總體而言,業(yè)內(nèi)普遍認(rèn)為 MiniMax-01 在大模型的架構(gòu)創(chuàng)新與效率優(yōu)化方面走出了一條獨(dú)特路徑,代表了“高效長(zhǎng)上下文建?!狈较虻闹匾夹g(shù)進(jìn)展。
作為成就這一成果的核心人物之一,鐘怡然在項(xiàng)目中發(fā)揮了關(guān)鍵作用。他帶領(lǐng)團(tuán)隊(duì)完成了從理論創(chuàng)新到工程落地的全過(guò)程,推動(dòng) Lightning Attention 成為業(yè)內(nèi)關(guān)注的焦點(diǎn),為 MiniMax 的技術(shù)體系奠定了基礎(chǔ)。
對(duì)此 MiniMax 回應(yīng)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng)) AI 科技評(píng)論,“鐘怡然已于半年前離職,此前只參與 M1 部分研發(fā)工作,祝福他未來(lái)有更好發(fā)展?!?/p>
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。