丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給高允毅
發(fā)送

0

為什么是梁文鋒做出了DeepSeek?

本文作者: 高允毅   2025-02-27 17:28
導語:一個更清晰的梁文鋒,一個更明白的關于DeepSeek的故事。

這是2025年開年最火的科技明星,短短幾天時間,梁文鋒從小到大的種種過往都被展現(xiàn)在世人眼前,包括他來不及裝修的新房以及在房子里睡覺用的帳篷,都成為了他獨特個性的象征。

獨特個性固然為人津津樂道,但并不是成功的關鍵,這個籍籍無名的大學生,在過去的十幾年中所能倚靠的,只有他的思想和能力。

所有人都好奇這樣一個問題,為什么是梁文鋒做出了DeepSeek?這其中固然有時代的因素,以及他本人迥異于其他大模型研究者的個人經(jīng)歷。但AI科技評論認為,理解梁文鋒是個什么樣的人,才是理解這個問題的關鍵。

找人才不需要標簽

獵頭都覺得,幫梁文鋒的公司找人太不容易了。

一位從21年開始就與幻方深度合作的獵頭告訴雷峰網(wǎng)(公眾號:雷峰網(wǎng)),招人招得讓他“想哭”,因為難度太高了。

“清華本博,六篇頂會,你覺得肯定沒問題了吧,哎,怎么簡歷直接掛了;一個清華本科的MIT博士,第二輪面試就被淘汰了?!?/p>

如果要在大廠內(nèi)部找候選人,他認為,幻方和DeepSeek基本上不會對標國內(nèi)公司,他們只會對標Google和Meta這樣的海外大廠。

另外一位獵頭一談到DeepSeek也是忍不住頭大,“太挑剔了,推過一個在字節(jié)績效非常好的年輕中層,聊了之后沒過。我就很奇怪,去問他們,給我的回答是,這個人對AI沒有熱情。人家都是做過一些AI Agent相關的項目了,一般是不太會說這樣的評價的?!?/p>

梁文鋒對人才沒有標簽,不論學歷背景,不論過往業(yè)績,他只看這個人的個人能力和個人素質(zhì)。

極高的人才門檻,造就了如今的DeepSeek。在國內(nèi)的大模型團隊中,DeepSeek的人才厚度可能不足以跟頂尖公司相提并論,但是人才密度絕對可以說得上是第一檔。

留住這些人才,除了DeepSeek的高薪酬外,還有充分尊重創(chuàng)意與idea的管理模式?!盁o固定團隊、無匯報關系、無年度計劃”與其說是管理,不如說是信任。《奈飛文化手冊》一書曾經(jīng)說過,“優(yōu)秀的同事和艱巨的挑戰(zhàn)是吸引人們來公司工作的最大因素”。對AI從業(yè)者而言,再沒有比AGI更艱巨的挑戰(zhàn)了。

做最難的事,就要找到最好的人,給出充足的資源與信任。得到信任的頂級人才往往會帶來巨大的爆發(fā)力,這一理論可以在抖音崛起中得到印證。

在2018年春節(jié)期間,抖音日新增用戶超過千萬量級。一位負責增長的產(chǎn)品經(jīng)理曾提及,這個增長項目完全沒有績效壓力,而且向財務發(fā)了一封郵件,他的賬戶中就多出了上億元的投放預算。他當時就意識到,“這樣的團隊,做啥打不贏呢?”

DeepSeek也是同理。被篩掉簡歷的人,一定不是學歷問題;面試通不過,肯定也不是能力問題;人才的需求集中為一句話就是,這個人是可以被信任一同為AGI努力的人嗎?

這就是DeepSeek的人才觀,理解了這種人才觀,就是理解梁文鋒的第一步。

極簡主義的世界觀

盡管做了多年量化,但是梁文鋒并不認為自己是個做金融的,他對自己的看法是,“我是做AI的,只不過做的是量化場景”。

幾乎所有與梁文鋒交流過的人,都說出他是一個不會受到外界干擾的人,“他的思維方式極其純粹,特別注重第一性原理”,“說話很慢”,“一開口就切中要害”。

量化投資的特性恰好契合了他這種極簡主義的風格——它不需要與復雜的上下游產(chǎn)業(yè)鏈打交道,只需專注于純粹的市場數(shù)據(jù)。

時至今日,梁文鋒依然常常沉浸在自己的技術世界中,專注于解決問題。比如做大模型這件事,他會告訴別人,“想清楚了就能干,只要有卡就行”,其他困難不在考慮范圍之內(nèi)。

對待金錢也是如此。錢就是用來投資,或者做慈善事業(yè)的,只要能花在合適的地方,虧損并不值一提。

2023年底,曾有一個旨在扶助聾啞人士的手語大模型項目,為了拉投資找到了梁文鋒。梁文鋒提出,這個項目的優(yōu)點是公益性突出,缺點是市場規(guī)模有限,其中的隱患是,這是一個Top高校大學生團隊的項目,他們可能不會長期堅持。

盡管極有可能得不到任何回報,他仍然提出,只要團隊愿意繼續(xù)推進項目,他就愿意投入。

過去梁文鋒每年會拿出5億元用于投資或慈善上,現(xiàn)在他把這筆錢花在了DeepSeek上。炒股是為了掙錢,投入大模型是為了AGI,僅此而已。

DeepSeek有將近兩萬張卡,他對算力極其慷慨,對上述的手語大模型團隊,他就承諾過,算力集群會隨時向他們開放。但是他又有點“小氣”,對這近兩萬張卡的利用率要求很高,力求打滿,不要空轉。

這兩種行為看似矛盾,如果按照極簡主義的觀點來解釋,那就行得通了:卡的存在就是為了用的,能用盡用,萬勿浪費。

不以商業(yè)化為限

沒花一分錢投放費用,DeepSeek的App只用7天時間就得到了一個億用戶,對這一奇跡般的增長,梁文鋒怎么看? 有投資人在春節(jié)期間專門問了梁文鋒這個問題,但是梁文鋒看起來對這么大的流量根本毫不在意,投資人得到的回答是,“這距離AGI的路還很遠”。

這并不是梁文鋒在故作姿態(tài)。據(jù)雷峰網(wǎng)了解,DeepSeek只安排了兩三個人負責App維護、對話網(wǎng)頁開發(fā)、以及充值后臺的管理工作。所以它不好用是正常的。

DeepSeek在B端市場的種種事跡,流傳更廣。比如此前他們的私有化部署定價僅為45萬元,其中不僅包含一臺H20或910b的使用權,還附贈大模型服務,使用期限為一年。而同樣的價格,在華為云上僅僅只能租到 910b一年的使用權,這也就意味著 DeepSeek 的大模型近乎免費提供。

私有化部署不掙錢,DeepSeek也不在乎靠API掙不掙錢。一位對接DeepSeek的大廠員工吐槽它有一種“愛用不用”的氣質(zhì),總是很難用,總是不調(diào)整。

再大的客戶和調(diào)用量,都不值得另眼相看。一切大廠在高峰期都要排隊,用戶體驗很差。大客戶的反饋也很多,要求DeepSeek擴容擴容再擴容,至少回應流暢一些,不要兩次請求就有一次失敗,特別是在客服場景上,這種失敗幾乎不能忍受。

外界喧喧囂囂,不過梁文鋒看起來并不是很在意這件事情。

這位大廠員工與DeepSeek員工私下交流過怎么改善這個問題,他得到的回答是,梁文鋒認為,大廠完全有能力自己想辦法解決請求失敗的問題,他們應該自己給自己兜底,而不是過度依賴 DeepSeek來保障服務。

這個回答簡直要把他給氣笑了,“我們可是DeepSeek的Top級客戶。”

可以說,現(xiàn)在的梁文鋒不在乎商業(yè)化的一切可能。

在不少團隊投入到應用的今天,梁文鋒曾經(jīng)跟一個好友說過,“你不要一直去看應用和行業(yè)落地的事情,你現(xiàn)在去看只能把你自己禁錮住了,因為沒有到時候,現(xiàn)在想的一切都是錯的。而且你在錯誤的路上你還投入了更多時間、精力和錢。”

這是對好友的忠告,也是自己的踐行。將精力投入到應用上,投入到商業(yè)化上,對梁文鋒來說,不論做什么,都是一條錯誤的道路。

而正確的道路從來只有一條,他現(xiàn)在已經(jīng)走在了正確的道路上。


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知

為什么是梁文鋒做出了DeepSeek?

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說