袁進(jìn)輝獲近億元天使+輪融資；接棒湯曉鷗，上海AILab主任周伯文探索AI-45°Law；8人6個(gè)月從0開(kāi)發(fā)GPT4o丨AI情報(bào)局

本文作者：我在思考中

2024-07-05 10:30

導(dǎo)語(yǔ)：產(chǎn)品推薦：Ariglad，pyVideoTrans，Widgera，Mutahunter

融資快報(bào)

硅基流動(dòng)完成近億元天使+輪融資：硅基流動(dòng)是一家專(zhuān)注于A(yíng)I Infra（AI基礎(chǔ)設(shè)施）領(lǐng)域的創(chuàng)業(yè)公司，成立于2023年8月。創(chuàng)始人袁進(jìn)輝是前OneFlow創(chuàng)始人及CEO，曾任微軟亞洲研究院主管研究員，獲得微軟亞洲研究院院長(zhǎng)特別獎(jiǎng)。本輪融資由某知名產(chǎn)業(yè)方領(lǐng)投，跟投方包括智譜AI、360和水木清華校友基金等知名企業(yè)及機(jī)構(gòu)，老股東耀途資本繼續(xù)超額跟進(jìn)，華興資本擔(dān)任獨(dú)家財(cái)務(wù)顧問(wèn)。

AI法律獨(dú)角獸Harvey收購(gòu)失敗，估值縮水：此前Harvey正尋求以至少 20 億美元的估值融資 6 億美元，計(jì)劃利用部分資金收購(gòu)成立25年的法律研究公司 vLex。但以收購(gòu)告終，本輪融資也縮水。據(jù)兩位參與投資的人士透露，Harvey目前預(yù)計(jì)將在由谷歌母公司 Alphabet 旗下投資機(jī)構(gòu) GV 領(lǐng)投的一輪融資中籌集約 1 億美元。

傲鯊智能完成數(shù)千萬(wàn)元A+輪投資：傲鯊智能是一家基于外骨骼技術(shù)平臺(tái)的機(jī)器人科技公司。公司主要服務(wù)B端工業(yè)市場(chǎng)提供外骨骼機(jī)器人產(chǎn)品和配套解決方案。A+輪融資由敦鴻資產(chǎn)領(lǐng)投。融資資金將用于加速傲鯊智能“千元級(jí)外骨骼”及“具身智能”通用人形機(jī)器人與外骨骼結(jié)合形態(tài)的初步產(chǎn)品發(fā)布。

國(guó)帆科技完成2600萬(wàn)人民幣A輪融資：國(guó)帆科技是一家互聯(lián)網(wǎng)軟件開(kāi)發(fā)服務(wù)商，該公司旗下?lián)碛卸陡锻ǖ绕放?。本輪融資由字節(jié)資本領(lǐng)投。資金將用于加強(qiáng)技術(shù)研發(fā)推動(dòng)云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)的創(chuàng)新和應(yīng)用等方面。

Prodia獲1500萬(wàn)美元融資：Prodia 是一個(gè)由 GPU 分布式網(wǎng)絡(luò)驅(qū)動(dòng)的人工智能推理平臺(tái)，利用Web3基礎(chǔ)設(shè)施，以極低的成本提供可擴(kuò)展的高性能計(jì)算資源。本輪融資由Dragonfly領(lǐng)投。

Bitmagic獲400萬(wàn)美元融資：Bitmagic是芬蘭一家人工智能游戲平臺(tái)，可將提示轉(zhuǎn)化為完全互動(dòng)的多人 3D 游戲，簡(jiǎn)化了游戲開(kāi)發(fā)，無(wú)需編碼技能，可通過(guò) Steam Playtest 免費(fèi)下載。本輪融資由Supercell、Sisu Game Ventures、Zak Phelps、Maarten De Koning、Korea Investment Partners 投資。

Vide獲300萬(wàn)美元種子輪融資：Vida是美國(guó)企業(yè)級(jí)AI語(yǔ)音解決方案提供商，本輪融資由Stillmark領(lǐng)投。

Hypertype 獲 60萬(wàn)歐元融資：Hypertype是一家瑞典營(yíng)銷(xiāo)科技初創(chuàng)公司，專(zhuān)注于通過(guò)人工智能自動(dòng)化和簡(jiǎn)化客戶(hù)支持和銷(xiāo)售人員與客戶(hù)的溝通。融資由 Butterfly Ventures 和 Bust 的領(lǐng)投，將用于擴(kuò)大其 AI 服務(wù)的市場(chǎng)份額。

OpenFi 獲50萬(wàn)英鎊種子資金：OpenFi 是一家專(zhuān)注于對(duì)話(huà)式人工智能的公司，獲得了來(lái)自 Bijan Morvaridi、Fortune Green Capital Ltd 和 Foundation Ventures Ltd 的投資。OpenFi 的 SalesTalkAI 通過(guò) WhatsApp、電子郵件和社交生成人類(lèi)對(duì)話(huà)。 SalesTalkAI 使用自然語(yǔ)言對(duì)話(huà)式 AI 來(lái)過(guò)濾、篩選和培養(yǎng)潛在客戶(hù)。

Cartken 宣布籌集2250萬(wàn)美元融資：Cartken 是一家專(zhuān)注于機(jī)器人自主導(dǎo)航技術(shù)的初創(chuàng)公司，該公司的技術(shù)不受特定環(huán)境限制，能夠在多樣化的環(huán)境中運(yùn)作。這次投資由 468 Capital 領(lǐng)投，其他參與投資的機(jī)構(gòu)包括 Incubate Fund、LDV Partners 和 Vela Partners，以及全球性的移動(dòng)技術(shù)領(lǐng)導(dǎo)者如 Magna International、三菱電氣、Shell Ventures 和 Volex。

Gendo 獲110 萬(wàn)美元融資：Gendo 是一個(gè)專(zhuān)為建筑師設(shè)計(jì)的生成式 AI 平臺(tái)，它能夠?qū)?2D 繪圖、草圖或文本提示轉(zhuǎn)換成復(fù)雜、逼真的可視化。

若創(chuàng)科技獲硅谷VC美元投資：原大疆光電部負(fù)責(zé)人洪小平成立深圳若創(chuàng)科技。洪小平曾在伯克利獲得物理學(xué)博士學(xué)位，并在霍尼韋爾擔(dān)任高級(jí)科學(xué)家，后在大疆主導(dǎo)光電模塊及激光雷達(dá)產(chǎn)品的研發(fā)和生產(chǎn)。他是大疆的核心研發(fā)人員之一，與公司共同申請(qǐng)了 187 項(xiàng)專(zhuān)利。新公司的業(yè)務(wù)方向?yàn)榈退贆C(jī)器人。

瑞士 SaaS 平臺(tái) Squirro收購(gòu)Synaptica：Squirro是一家位于瑞士的企業(yè) SaaS 平臺(tái)，專(zhuān)注于生成式 AI、搜索和業(yè)務(wù)洞察， Synaptica是美國(guó)企業(yè)分類(lèi)管理和知識(shí)圖譜系統(tǒng) SaaS 提供商。這次收購(gòu)的目的是將 Synaptica 的強(qiáng)大語(yǔ)義圖技術(shù)與 Squirro 的尖端生成式 AI 功能相結(jié)合，形成一個(gè)強(qiáng)大的平臺(tái)，用于知識(shí)發(fā)現(xiàn)、對(duì)話(huà)搜索和業(yè)務(wù)流程自動(dòng)化。

（歡迎添加微信AIyanxishe2，了解更多AIGC、融資情況，與志同道合的朋友一同暢聊時(shí)新AI產(chǎn)品）

國(guó)內(nèi)情報(bào)：

周伯文接任湯曉鷗，以上海AI Lab主任身份發(fā)表WAIC演講：

周伯文在 WAIC 2024 全體會(huì)議上以上海 AI 實(shí)驗(yàn)室主任身份發(fā)表演講，提出了人工智能 45° 平衡律（AI-45° Law），強(qiáng)調(diào)從長(zhǎng)期視角確保 AI 安全與性能的平衡發(fā)展。他指出，當(dāng)前 AI 發(fā)展存在失衡，性能提升遠(yuǎn)超安全性，導(dǎo)致了所謂的 “Crippled AI” 現(xiàn)象。為了解決這一問(wèn)題，周伯文提出了可信 AGI 的 “因果之梯”，分為三個(gè)階段：泛對(duì)齊、可干預(yù)和能反思，旨在逐步提升 AI 的安全性和可信度。他還強(qiáng)調(diào)了 AI 安全的全球性公共利益，呼吁國(guó)際社會(huì)共同推進(jìn) AI-45° 平衡律的實(shí)現(xiàn)。

Kimi論文自曝推理架構(gòu)，80%流量都靠它:

月之暗面和清華 KVCache.ai 團(tuán)隊(duì)發(fā)布論文，揭示了 Kimi 大模型背后的推理架構(gòu) Mooncake，該架構(gòu)采用分離式設(shè)計(jì)，通過(guò) KV 緩存優(yōu)化和分布式系統(tǒng)結(jié)構(gòu)，以及基于預(yù)測(cè)的早期拒絕策略，有效提高了推理服務(wù)性能，能夠承擔(dān) 80% 以上的流量。

中國(guó)首款全尺寸通用人形機(jī)器人開(kāi)源公版機(jī)“青龍”發(fā)布：

“青龍”身高 185cm，體重 80kg，全身?yè)碛?43 個(gè)主動(dòng)自由度，關(guān)節(jié)峰值扭矩最大 400N?m，算力支持 400TOPS。擁有高度仿生的軀干構(gòu)型、擬人化的運(yùn)動(dòng)控制，支持多模態(tài)機(jī)動(dòng) / 感知 / 交互 / 操控。其同時(shí)具備高機(jī)動(dòng)下肢行走配置、輕量化高精度上肢作業(yè)配置，支持快速行走、敏捷避障、穩(wěn)健上下坡、抗沖擊干擾四大運(yùn)動(dòng)功能。“青龍”由人形機(jī)器人（上海）有限公司自研，已獲批省部級(jí)上海人形機(jī)器人制造業(yè)創(chuàng)新中心，并于 2024 年 5 月由工業(yè)和信息化部授牌國(guó)家地方共建人形機(jī)器人創(chuàng)新中心。

階躍星辰發(fā)布Step-2等三個(gè)模型，主打多模態(tài)能力：

Step-2 是一個(gè)擁有萬(wàn)億參數(shù)的 MoE 模型，目前處于申請(qǐng)?bào)w驗(yàn)階段。Step-1.5V 展現(xiàn)了在圖片和視頻理解方面的非凡才華，推動(dòng)了視覺(jué)藝術(shù)的邊界。Step-1X 則以其 DiT 架構(gòu)的靈活性，表現(xiàn)出對(duì)中國(guó)文化元素的深刻理解，實(shí)現(xiàn)了東方美學(xué)與現(xiàn)代科技的完美融合。

摩爾線(xiàn)程升級(jí)夸娥智算集群到首個(gè)國(guó)產(chǎn)全功能GPU的萬(wàn)卡規(guī)模集群：

國(guó)產(chǎn)GPU公司摩爾線(xiàn)程宣布其人工智能旗艦產(chǎn)品夸娥（KUAE）智算集群解決方案實(shí)現(xiàn)重大升級(jí)——從千卡擴(kuò)展至萬(wàn)卡規(guī)模。總算力超過(guò)10EFLOPS，目標(biāo)是做到有效計(jì)算效率超過(guò)60%、穩(wěn)定性達(dá)99%，能支撐萬(wàn)億參數(shù)級(jí)大模型訓(xùn)練。

商湯發(fā)布可控人物視頻生成大模型Vimi，實(shí)現(xiàn)分鐘級(jí)視頻：

商湯科技打造的首個(gè)面向C端用戶(hù)的可控人物視頻生成大模型VImi。Vimi基于商湯日日新大模型的強(qiáng)大能力，僅通過(guò)一張任意風(fēng)格的照片就能生成和目標(biāo)動(dòng)作一致的人物類(lèi)視頻，并支持多種驅(qū)動(dòng)方式，可通過(guò)已有人物視頻、動(dòng)畫(huà)、聲音、文字等多種元素進(jìn)行驅(qū)動(dòng)。

網(wǎng)易伏羲發(fā)布機(jī)器人品牌“靈動(dòng)” 推出“易生諸相”多模態(tài)大模型：

靈動(dòng)由網(wǎng)易伏羲依托自主研發(fā)的工業(yè)級(jí)大型模型和AOP技術(shù)理念精心打造，旗下推出的兩款旗艦產(chǎn)品——挖掘機(jī)器人和裝載機(jī)器人，已經(jīng)在超過(guò)50個(gè)省級(jí)重點(diǎn)項(xiàng)目中投入使用，服務(wù)于礦山、港口、攪拌站、學(xué)校等多樣化的應(yīng)用環(huán)境。網(wǎng)易伏羲還展示了其最新研發(fā)的“易生諸相”多模態(tài)大型模型，以及名為“丹青約”的多模態(tài)智能體助手。

騰訊云發(fā)布全新自研大數(shù)據(jù)高性能計(jì)算引擎Meson：

通過(guò)軟硬一體加速和智能技術(shù)的綜合應(yīng)用，該引擎能顯著為AI等場(chǎng)景下的大數(shù)據(jù)任務(wù)提供更優(yōu)的計(jì)算性能，并節(jié)省更多計(jì)算資源。比如，在數(shù)據(jù)湖場(chǎng)景下，Meson能夠助力單個(gè)數(shù)據(jù)查詢(xún)分析提速6倍，在微信讀書(shū)“AI問(wèn)書(shū)”項(xiàng)目中，Meson助力大數(shù)據(jù)任務(wù)節(jié)省了9成的資源消耗。

騰訊混元DiT升級(jí)，推出6G小顯存版本，支持Kohya訓(xùn)練：

騰訊混元文生圖大模型（混元DiT）宣布開(kāi)源小顯存版本，僅需6G顯存即可運(yùn)行，對(duì)使用個(gè)人電腦本地部署的開(kāi)發(fā)者十分友好，該版本與LoRA、ControlNet等插件，都已適配至Diffusers庫(kù)；并新增對(duì)Kohya圖形化界面的支持，讓開(kāi)發(fā)者可以低門(mén)檻地訓(xùn)練個(gè)性化LoRA模型；同時(shí)，混元DiT模型升級(jí)至1.2版本，在圖片質(zhì)感與構(gòu)圖方面均有所提升。

Agent再升級(jí)！昆侖萬(wàn)維、智源等聯(lián)合發(fā)布計(jì)算機(jī)控制框架 “Cradle”：

這一AI框架使智能體無(wú)需特別訓(xùn)練，直接像人一樣控制鍵盤(pán)和鼠標(biāo)，與任意開(kāi)閉源軟件進(jìn)行交互，不依賴(lài)任何內(nèi)部API。Cradle是首個(gè)能夠同時(shí)玩轉(zhuǎn)多種商業(yè)游戲和操作各類(lèi)軟件應(yīng)用的AI框架，其論文、項(xiàng)目和代碼均已開(kāi)源。在具有挑戰(zhàn)性的benchmark OSWorld上擊敗了使用真值標(biāo)簽的基線(xiàn)方法。

北京計(jì)劃2025年智算供給規(guī)模達(dá)45EFLOPS，兩年打造AI原生城市：

北京市經(jīng)濟(jì)和信息化局總經(jīng)濟(jì)師、數(shù)字經(jīng)濟(jì)專(zhuān)班執(zhí)行長(zhǎng)唐建國(guó)表示：“北京市明確提出，到2025年本地智算供給規(guī)模達(dá)到45EFLOPS，形成北京市內(nèi)東西南北四個(gè)億級(jí)以上算力中心，構(gòu)建‘京津冀蒙’算力供給走廊，為人工智能大模型的訓(xùn)練和推理應(yīng)用提供高效的算力供給。同時(shí)，推出一系列人工智能商業(yè)場(chǎng)景，預(yù)計(jì)利用兩年時(shí)間打造AI原生城市?！?/p>

李彥宏稱(chēng)沒(méi)有應(yīng)用，基礎(chǔ)模型一文不值，商業(yè)化閉源模型最能打：

百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏談及2023年國(guó)內(nèi)出現(xiàn)了百模大戰(zhàn)，造成了社會(huì)資源的絕大浪費(fèi)，但也使得國(guó)內(nèi)追趕世界上最先進(jìn)的基礎(chǔ)模型能力得到建立。李彥宏強(qiáng)調(diào)閉源模型的優(yōu)勢(shì)，稱(chēng)激烈競(jìng)爭(zhēng)環(huán)境下，商業(yè)化閉源模型最能打。另外，沒(méi)有應(yīng)用，基礎(chǔ)模型一文不值。同時(shí)他稱(chēng)智能體是最看好的AI應(yīng)用方向。最簡(jiǎn)單的AI應(yīng)用開(kāi)發(fā)就是智能體，未來(lái)將會(huì)有數(shù)百萬(wàn)量級(jí)的智能體出現(xiàn)，而搜索是智能體分發(fā)的最大入口。

他還指出要避免掉入“超級(jí)應(yīng)用陷阱”，認(rèn)為一定要出現(xiàn)一個(gè)10億DAU的APP才叫成功，這是移動(dòng)時(shí)代的思維邏輯。AI時(shí)代，規(guī)律可能不是這樣的，“超級(jí)能干”的應(yīng)用比只看DAU的“超級(jí)應(yīng)用”更重要，只要對(duì)產(chǎn)業(yè)、對(duì)應(yīng)用場(chǎng)景能產(chǎn)生大的增益，整體價(jià)值就比移動(dòng)互聯(lián)網(wǎng)要大多了。

商湯科技 CEO 徐立稱(chēng)AI 行業(yè)很熱但未到“超級(jí)時(shí)刻”，需要應(yīng)用來(lái)支撐：

商湯科技董事長(zhǎng)兼 CEO 徐立指出，當(dāng)前 AI 行業(yè)確實(shí)很熱，但“還沒(méi)有到一個(gè)超級(jí)時(shí)刻”—— 因?yàn)?AI 暫未真正走進(jìn)行業(yè)垂直應(yīng)用，或引起廣泛變化。當(dāng)下的大模型只是一個(gè)“記憶器”，只是背下了所有的知識(shí)點(diǎn)，僅有的一點(diǎn)點(diǎn)智能其實(shí)是來(lái)自互聯(lián)網(wǎng)上的數(shù)據(jù)背后帶有的一個(gè)“高階邏輯思維鏈”。在談到“超級(jí)時(shí)刻”時(shí)徐立補(bǔ)充說(shuō)，超級(jí)時(shí)刻和應(yīng)用是相互成就的?！俺?jí)時(shí)刻”帶來(lái)認(rèn)知變化，才能推動(dòng)應(yīng)用。如果有應(yīng)用來(lái)支撐，那么當(dāng)下就是“超級(jí)時(shí)刻”?！熬拖?iPhone 一樣，因?yàn)橛辛似脚_(tái)，后面才有 App Store 的生態(tài)。所以我想，這個(gè)時(shí)代是否是 AI 的超級(jí)時(shí)刻，一個(gè)關(guān)鍵就在于應(yīng)用?！?/p>

丘成桐稱(chēng)人工智能要重視上游的基礎(chǔ)學(xué)科：

菲爾茲獎(jiǎng)首位華人得主丘成桐表示，“人工智能的上游、中游、下游要同步做，上游（基礎(chǔ)學(xué)科）要領(lǐng)導(dǎo)，中、下游要幫忙，中國(guó)尤其要重視上游的工作?！?/p>

中國(guó)移動(dòng)董事長(zhǎng)楊杰稱(chēng)擅長(zhǎng)使用 AI 的人將替代不會(huì)使用 AI 的人：

楊杰表示：“AI 到底是人類(lèi)的助手還是對(duì)手、是機(jī)遇還是威脅，已經(jīng)成為全社會(huì)共同的話(huà)題。我個(gè)人認(rèn)為，AI 不會(huì)取代人類(lèi)智能，但是會(huì)重構(gòu)很多行業(yè)和領(lǐng)域，擅長(zhǎng)使用 AI 的人將會(huì)替代不會(huì)使用 AI 的人?！?/p>

華為云 CEO 張平安稱(chēng)中國(guó)的 AI 應(yīng)追求在行業(yè)領(lǐng)域構(gòu)筑大模型的全球領(lǐng)先地位：

華為常務(wù)董事、華為云 CEO 張平安表示，中國(guó)的 AI 發(fā)展離不開(kāi)算力基礎(chǔ)設(shè)施的創(chuàng)新，并且要敢于開(kāi)放行業(yè)場(chǎng)景，讓 AI 在行業(yè)應(yīng)用上領(lǐng)先。張平安提出，中國(guó)的 AI 發(fā)展道路，追求的應(yīng)該是在行業(yè)領(lǐng)域構(gòu)筑大模型的全球領(lǐng)先地位。如果各行各業(yè)都積極擁抱 AI，積極地開(kāi)放行業(yè)的業(yè)務(wù)場(chǎng)景，中國(guó)很有機(jī)會(huì)在 2B 領(lǐng)域構(gòu)筑起全球的領(lǐng)先優(yōu)勢(shì)。

國(guó)際情報(bào)：

搶跑OpenAI發(fā)布語(yǔ)音助手，法國(guó)Kyutai實(shí)驗(yàn)室演示自帶70種情緒AI：

法國(guó)開(kāi)源AI研究實(shí)驗(yàn)室Kyutai發(fā)布實(shí)時(shí)語(yǔ)音多模態(tài)模型Moshi，具備看、聽(tīng)、說(shuō)等功能。該實(shí)驗(yàn)室的八人研究團(tuán)隊(duì)耗時(shí)六個(gè)月從零開(kāi)始開(kāi)發(fā)。Moshi對(duì)標(biāo)OpenAI GPT-4o，可以聽(tīng)取人的語(yǔ)音提問(wèn)后進(jìn)行實(shí)時(shí)推理回答內(nèi)容，能夠以 70 種情緒和風(fēng)格進(jìn)行交流，并且可以在 Kyutai 的網(wǎng)站上進(jìn)行免費(fèi)的交互式演示。Kyutai 計(jì)劃公開(kāi) Moshi 模型的代碼和權(quán)重。

特斯拉二代人形機(jī)器人Optimus亮相WAIC，行走速度提升30%：

2024世界人工智能大會(huì)上，特斯拉二代人形機(jī)器人Optimus正式亮相。特斯拉介紹，二代Optimus在直立行走的基礎(chǔ)上，行走速度提升了30%；其手指還“進(jìn)化”到除了感知和觸覺(jué)，可以在輕握雞蛋和搬運(yùn)重物時(shí)做到“游刃有余”。近期二代 Optimus 已經(jīng)在特斯拉工廠(chǎng)嘗試“打工”。借助視覺(jué)神經(jīng)網(wǎng)絡(luò)和 FSD 芯片，二代 Optimus 可以模仿人類(lèi)操作，進(jìn)行電池的分揀訓(xùn)練。

macOS 版 ChatGPT 被指以純文本存儲(chǔ) AI 對(duì)話(huà)，OpenAI 緊急更新修復(fù)：

開(kāi)發(fā)者Pedro Vieito在Thread平臺(tái)發(fā)布動(dòng)態(tài)，表示 macOS 版 ChatGPT 應(yīng)用會(huì)以純文本方式在計(jì)算機(jī)上存儲(chǔ)用戶(hù)對(duì)話(huà)，可能被惡意行為者訪(fǎng)問(wèn)。OpenAI 公司回應(yīng)稱(chēng)已更新其應(yīng)用，對(duì)存儲(chǔ)在 Mac 設(shè)備上的聊天記錄進(jìn)行了加密處理。

微軟更新支持文檔，鼓勵(lì)開(kāi)發(fā)者為 Win11 開(kāi)發(fā) AI 應(yīng)用:

微軟公司更新了支持文檔，鼓勵(lì)開(kāi)發(fā)者在 Windows 11 系統(tǒng)中充分利用 AI 功能，打造優(yōu)質(zhì)應(yīng)用程序。文檔介紹了相關(guān)專(zhuān)業(yè)術(shù)語(yǔ)和內(nèi)容，推薦開(kāi)發(fā)者使用 OnnxRuntime 等框架來(lái)使用本地或者云端的 AI 模型，除了 C++ 和 Python 之外，還推薦使用 C# 開(kāi)發(fā) Windows 應(yīng)用程序。同時(shí)，微軟提醒開(kāi)發(fā)者要注意數(shù)據(jù)隱私和安全問(wèn)題，鼓勵(lì)公開(kāi)數(shù)據(jù)收集情況，用戶(hù)應(yīng)對(duì)數(shù)據(jù)擁有控制權(quán)。

Perplexity AI發(fā)布 Pro Search，提升問(wèn)題解決與代碼執(zhí)行能力：

新版Pro Search不僅能處理更復(fù)雜的查詢(xún)，還具備多步推理能力，能執(zhí)行高級(jí)數(shù)學(xué)和編程計(jì)算，提供更全面的調(diào)研結(jié)果。通過(guò)整合Wolfram|Alpha引擎，Pro Search在解決復(fù)雜數(shù)學(xué)問(wèn)題方面的準(zhǔn)確性和速度得到顯著提升。所有用戶(hù)每四小時(shí)可免費(fèi)使用Pro Search五次。Perplexity Pro訂閱者則享有幾乎無(wú)限制的每日使用權(quán)限。

Cloudflare 推出一鍵阻止AI機(jī)器人網(wǎng)絡(luò)爬蟲(chóng)的新方法：

Cloudflare發(fā)布了新的免費(fèi)工具，用于防止 AI 機(jī)器人爬取其托管網(wǎng)站的數(shù)據(jù)，以訓(xùn)練 AI 模型。Cloudflare 通過(guò)分析 AI 機(jī)器人和爬蟲(chóng)的流量，優(yōu)化了自動(dòng)機(jī)器人檢測(cè)模型，以便更準(zhǔn)確地識(shí)別和標(biāo)記那些試圖模仿瀏覽器使用者行為以逃避檢測(cè)的 AI 機(jī)器人。此外還設(shè)立了一個(gè)表單，供主機(jī)商報(bào)告可疑的 AI 機(jī)器人和爬蟲(chóng)，并承諾隨著時(shí)間的推移不斷手動(dòng)將 AI 機(jī)器人列入黑名單。

ElevenLabs發(fā)布消音神器VOICE ISOLATOR，可去除音頻中的背景噪音：

VOICE ISOLATOR不僅能消除不需要的背景噪音，還能從任何音頻中提取出清晰的對(duì)話(huà)，讓播客、采訪(fǎng)或電影聽(tīng)起來(lái)就像在專(zhuān)業(yè)錄音室錄制的一樣。它的Extract vocals功能可以增強(qiáng)人聲，同時(shí)清除街道噪音、麥克風(fēng)雜音以及其他任何不需要的背景噪音。

三星放緩汽車(chē)半導(dǎo)體開(kāi)發(fā)，專(zhuān)注于人工智能芯片：

三星負(fù)責(zé)芯片設(shè)計(jì)的系統(tǒng)LSI部門(mén)正在進(jìn)行業(yè)務(wù)和組織重組，將優(yōu)先發(fā)展AI芯片。此次從事汽車(chē)處理器“Exynos Auto”開(kāi)發(fā)的的人員已在該部門(mén)內(nèi)重新分配到AI系統(tǒng)級(jí)芯片團(tuán)隊(duì)，該團(tuán)隊(duì)現(xiàn)在是三星設(shè)計(jì)工作的重點(diǎn)。目前，該部門(mén)集中了100-150名專(zhuān)門(mén)設(shè)計(jì)人員，致力于A(yíng)I芯片設(shè)計(jì)。

一開(kāi)發(fā)者在 Google Drive 上運(yùn)行了整個(gè)操作系統(tǒng)：

普渡大學(xué)計(jì)算機(jī)科學(xué)專(zhuān)業(yè)學(xué)生 Sambhav S. 完成了一項(xiàng)創(chuàng)新的技術(shù)項(xiàng)目，該項(xiàng)目能夠讓完整的 Linux 發(fā)行版直接從 Google Drive 啟動(dòng)。他利用 FUSERAM 磁盤(pán)技術(shù)，在 Linux 啟動(dòng)過(guò)程中直接從 Google Drive 加載操作系統(tǒng)的關(guān)鍵組件、應(yīng)用程序和網(wǎng)絡(luò)二進(jìn)制文件。最終成功地在一臺(tái)沒(méi)有本地存儲(chǔ)空間的備用筆記本電腦上啟動(dòng)了這個(gè)系統(tǒng)。雖然速度較慢，權(quán)限和屬性也受到影響，但仍然可用。Sambhav 認(rèn)為這種技術(shù)可能有實(shí)際應(yīng)用，比如從 Git 倉(cāng)庫(kù)或 SSH 連接啟動(dòng)環(huán)境，甚至可能讓公司完全依賴(lài)云技術(shù)而不是硬件存儲(chǔ)。

IBM公布其完整的6.48 TB LLM訓(xùn)練數(shù)據(jù)集：

這個(gè)數(shù)據(jù)集經(jīng)過(guò)嚴(yán)格的預(yù)處理后，縮減為2.07TB，減少了68%。對(duì)于確保高質(zhì)量、無(wú)偏見(jiàn)、符合倫理和法律的數(shù)據(jù)集，以滿(mǎn)足企業(yè)應(yīng)用場(chǎng)景需求至關(guān)重要。數(shù)據(jù)集由多個(gè)來(lái)源精心策劃而來(lái)，包括 arXiv、Common Crawl、DeepMind Mathematics、Free Law、GitHub Clean、Wikimedia 等。IBM 發(fā)布了四個(gè) Granite 代碼模型的版本，參數(shù)范圍從30億到340億。

比爾蓋茨稱(chēng)現(xiàn)在對(duì)AI的狂熱遠(yuǎn)超互聯(lián)網(wǎng)泡沫：

蓋茨曾預(yù)言每個(gè)辦公桌上都會(huì)有一臺(tái)電腦，現(xiàn)在他又預(yù)言每個(gè)人的耳邊都將配備一個(gè)人工智能助手。他指出，目前對(duì)人工智能的狂熱遠(yuǎn)超過(guò)去互聯(lián)網(wǎng)泡沫時(shí)期，進(jìn)入人工智能領(lǐng)域的門(mén)檻非常低，資本正在以前所未有的速度涌入這個(gè)新領(lǐng)域。雖然谷歌和微軟等大公司在人工智能領(lǐng)域擁有大量資本，但這并沒(méi)有阻止其他公司在基礎(chǔ)能力或垂直領(lǐng)域的發(fā)展。人工智能技術(shù)在全球經(jīng)濟(jì)中所占的份額雖然相對(duì)較小，但其潛力巨大，即使是小型機(jī)構(gòu)也能借助這些工具與大型機(jī)構(gòu)競(jìng)爭(zhēng)，并提供更優(yōu)質(zhì)的服務(wù)。

更多國(guó)際情報(bào)：

谷歌母公司 Alphabet CEO 皮查伊減持公司股票，套現(xiàn)超 420 萬(wàn)美元：皮查伊本次出售股票是根據(jù)預(yù)先制定的 10b5-1 交易計(jì)劃進(jìn)行的，此類(lèi)計(jì)劃允許公司內(nèi)部人士在預(yù)定時(shí)間出售股票，以避免因利用內(nèi)幕信息交易而受到指控。

Google AI Overviews新研究，SE Ranking的全新發(fā)現(xiàn)：Google 的 AI Overviews 功能僅出現(xiàn)在 8.71%的 SERPs 中，用于 100K 關(guān)鍵詞，比之前的 64%有了顯著的下降。具有更多單詞、較低搜索量和較低 CPC 的用戶(hù)查詢(xún)更有可能觸發(fā) AI 生成的回應(yīng)。

Alphabet將放棄其礦業(yè)機(jī)器人農(nóng)業(yè)初創(chuàng)公司Mineral：這是由于激烈的行業(yè)競(jìng)爭(zhēng)和微薄的利潤(rùn)率。Mineral 曾是 Google 的 X 實(shí)驗(yàn)室的一部分，該實(shí)驗(yàn)室也是 Google 眼鏡和 Waymo 自動(dòng)駕駛汽車(chē)部門(mén)的孵化器。

谷歌等科技巨頭承認(rèn)AI可能會(huì)損害其業(yè)務(wù)：在他們提交給美國(guó)證券交易委員會(huì)的年度財(cái)報(bào)中，谷歌母公司 Alphabet 指出，AI 產(chǎn)品和服務(wù)可能會(huì)引發(fā)道德、技術(shù)、法律、監(jiān)管等挑戰(zhàn)，影響品牌形象和市場(chǎng)需求。Meta、微軟和甲骨文也提到生成式 AI 帶來(lái)的錯(cuò)誤信息傳播、有害內(nèi)容滋生、知識(shí)產(chǎn)權(quán)侵犯和數(shù)據(jù)隱私泄露等問(wèn)題。

聯(lián)合國(guó)報(bào)告稱(chēng)中國(guó)生成式AI專(zhuān)利申請(qǐng)量世界第一：據(jù)聯(lián)合國(guó)保護(hù)知識(shí)產(chǎn)權(quán)機(jī)構(gòu)數(shù)據(jù)顯示，中國(guó)在人工智能發(fā)明方面申請(qǐng)的專(zhuān)利數(shù)量是美國(guó)的六倍。

任天堂反對(duì)在游戲中使用生成式AI：任天堂總裁古川俊太郎認(rèn)為 AI 侵犯知識(shí)產(chǎn)權(quán)，生成式 AI 制作的內(nèi)容缺乏個(gè)性化與任天堂注重的原創(chuàng)性和創(chuàng)造力不符。

Zepp Health推搭載GPT-4o的 Zepp OS 4 智能手表操作系統(tǒng)：Zepp OS 的主界面允許用戶(hù)通過(guò)自然語(yǔ)言交互來(lái)控制設(shè)備。用戶(hù)可以通過(guò)說(shuō)出指令來(lái)管理設(shè)置、回復(fù) WhatsApp 等應(yīng)用程序的消息，并發(fā)起藍(lán)牙電話(huà)。

蘋(píng)果中國(guó)官網(wǎng)上線(xiàn)iOS 18介紹頁(yè)面，全程未提AI：由于技術(shù)限制及政策考量，ChatGPT與Apple Intelligence在中國(guó)市場(chǎng)暫時(shí)無(wú)法提供服務(wù)，這也直接導(dǎo)致了iOS18中的AI功能在國(guó)內(nèi)的缺席，從而未在官網(wǎng)介紹中占據(jù)一席之地。

Product Hunt 熱榜， AI驅(qū)動(dòng)的知識(shí)庫(kù)Ariglad

Ariglad是一款創(chuàng)新的AI工具，專(zhuān)注于自動(dòng)化知識(shí)庫(kù)的創(chuàng)建和更新。它能夠無(wú)縫整合來(lái)自Zendesk、支持票據(jù)和Slack等多個(gè)渠道的信息，為企業(yè)提供一站式的幫助中心解決方案。通過(guò)分析海量數(shù)據(jù)，Ariglad已生成超過(guò)30,000條建議，處理了500,000多張支持票據(jù)。

這款工具簡(jiǎn)化了知識(shí)庫(kù)的維護(hù)過(guò)程，確保了信息的實(shí)時(shí)更新和安全性（獲得SOC2認(rèn)證）。通過(guò)自動(dòng)識(shí)別知識(shí)空白、整合產(chǎn)品更新和利用Slack對(duì)話(huà)，Ariglad幫助企業(yè)節(jié)省時(shí)間成本，同時(shí)提高客戶(hù)滿(mǎn)意度。在當(dāng)今81%的客戶(hù)傾向于自助尋找答案的背景下，Ariglad為企業(yè)提供了維護(hù)高質(zhì)量、始終最新的知識(shí)庫(kù)的有力工具。

?https://www.ariglad.com/?ref=producthunt

GitHub Trending 熱榜，一鍵視頻翻譯+配音工具pyVideoTrans

通過(guò)簡(jiǎn)單操作實(shí)現(xiàn)視頻語(yǔ)音識(shí)別、字幕翻譯+配音，生成帶有字幕+配音的新視頻（把視頻從一種語(yǔ)言翻譯成另一種語(yǔ)言并配音）；支持自動(dòng)視頻翻譯，集成faster-whisper模型，支持自定義huggingface模型；集成批量處理工具，批量語(yǔ)音轉(zhuǎn)字幕、批量字幕翻譯和批量配音；支持多種配音和翻譯渠道，如edgeTTS、AzureTTS、OpenAiTTS、Elevenlabs、Google、ChatGPT、DeepL、Gemini等；翻譯渠道替換為本地模型，配音渠道替換為clone-voice，即可實(shí)現(xiàn)完全本地離線(xiàn)視頻翻譯

?https://pyvideotrans.com/

開(kāi)發(fā)者推薦

1.Widgera：無(wú)代碼網(wǎng)站開(kāi)發(fā)新選擇

Widgera是一款新興的無(wú)代碼網(wǎng)站和應(yīng)用開(kāi)發(fā)平臺(tái)，專(zhuān)為初創(chuàng)企業(yè)和中小企業(yè)打造。該平臺(tái)目前處于A(yíng)lpha 0.0.11階段，提供拖放式界面和高度定制化功能，無(wú)需編碼或設(shè)計(jì)技能即可創(chuàng)建強(qiáng)大的網(wǎng)站和應(yīng)用。

Widgera的核心優(yōu)勢(shì)在于其簡(jiǎn)便性和靈活性。用戶(hù)可輕松添加電子商務(wù)、預(yù)訂等功能，并享受內(nèi)置支付系統(tǒng)。平臺(tái)還運(yùn)用動(dòng)態(tài)界面?zhèn)€性化技術(shù)，根據(jù)用戶(hù)行為調(diào)整內(nèi)容。目前Widgera免費(fèi)使用，計(jì)劃在2024年11月推出Beta版本后采用每月29美元的定價(jià)模式。

?https://widgera.com/?ref=producthunt

2.AI驅(qū)動(dòng)的開(kāi)源測(cè)試工具M(jìn)utahunter

Mutahunter是一款基于大型語(yǔ)言模型的突變測(cè)試工具，引起開(kāi)發(fā)者關(guān)注。這個(gè)開(kāi)源項(xiàng)目支持多種編程語(yǔ)言，通過(guò)AI生成上下文相關(guān)的錯(cuò)誤注入，模擬真實(shí)世界的軟件漏洞。其特點(diǎn)包括自托管選項(xiàng)、與Tree-Sitter的集成，以及詳細(xì)的覆蓋率報(bào)告生成。

該工具旨在提高代碼質(zhì)量并增強(qiáng)開(kāi)發(fā)流程，其實(shí)際效果和在不同開(kāi)發(fā)環(huán)境中的適用性仍有待進(jìn)一步驗(yàn)證。

?https://github.com/codeintegrity-ai/mutahunter?utm_source=uwl.me

前沿技術(shù)

1.港大字節(jié)開(kāi)源自回歸文生圖模型LlamaGen，圖像生成如此簡(jiǎn)單：

LlamaGen在GitHub上獲得了近900顆星標(biāo)的認(rèn)可。在ImageNet測(cè)試基準(zhǔn)上，LlamaGen的表現(xiàn)超越了LDM、DiT等擴(kuò)散模型。LlamaGen的技術(shù)實(shí)現(xiàn)基于幾個(gè)關(guān)鍵設(shè)計(jì)原則:圖像壓縮/量化器、可擴(kuò)展的圖像生成模型，以及高質(zhì)量的訓(xùn)練數(shù)據(jù)。研究團(tuán)隊(duì)采用了與VQ-GAN相似的CNN架構(gòu)，將連續(xù)圖像轉(zhuǎn)化為離散Token，并在兩個(gè)階段的訓(xùn)練過(guò)程中，顯著提升了圖像的視覺(jué)質(zhì)量和分辨率。

?項(xiàng)目地址:https://top.aibase.com/tool/llamagen

?在線(xiàn)體驗(yàn)地址:https://huggingface.co/spaces/FoundationVision/LlamaGen

2.首個(gè)開(kāi)源、原生多模態(tài)生成大模型Anole，破圖文交互：

上海交通大學(xué) GAIR 團(tuán)隊(duì)開(kāi)發(fā)了全球首個(gè)完全開(kāi)源、自回歸、原生的多模態(tài)大模型 Anole，它能夠通過(guò)純 "token" 自回歸預(yù)測(cè)實(shí)現(xiàn)文字與圖像的生成。Anole 基于 Meta AI 的 Chameleon 模型，通過(guò)精心構(gòu)建的約 6,000 張圖像數(shù)據(jù)集進(jìn)行微調(diào)，實(shí)現(xiàn)了出色的圖像生成和理解能力。該模型不僅能夠生成圖像并附帶相關(guān)文本描述，還能夠根據(jù)文本生成圖像，并且在初步測(cè)試中表現(xiàn)出卓越的能力，能夠產(chǎn)生高質(zhì)量的圖像和交錯(cuò)的文本 - 圖像內(nèi)容，與用戶(hù)提示密切吻合。GAIR 團(tuán)隊(duì)已經(jīng)對(duì) Anole 項(xiàng)目進(jìn)行了全方位開(kāi)源，提供了模型微調(diào)代碼、權(quán)重轉(zhuǎn)換代碼、推理代碼、以及用于微調(diào)的 5k + 圖片，以及詳細(xì)的使用教程，旨在幫助研究人員更容易上手和實(shí)驗(yàn)。

?https://gair-nlp.github.io/anole

3.InstantStyle-Plus: 文本生圖的風(fēng)格革新

InstantStyle-Plus是一項(xiàng)由Haofan Wang團(tuán)隊(duì)開(kāi)發(fā)的創(chuàng)新技術(shù)，旨在解決文本到圖像生成中的一個(gè)關(guān)鍵挑戰(zhàn)：如何在轉(zhuǎn)換視覺(jué)風(fēng)格的同時(shí)保持原始內(nèi)容的完整性。這項(xiàng)技術(shù)巧妙地將風(fēng)格遷移任務(wù)分解為風(fēng)格、空間結(jié)構(gòu)和語(yǔ)義內(nèi)容三個(gè)核心元素，通過(guò)輕量級(jí)處理實(shí)現(xiàn)高效的風(fēng)格注入。

該技術(shù)的獨(dú)特之處在于其多方面的創(chuàng)新：使用反轉(zhuǎn)內(nèi)容的潛在噪聲和可插拔的Tile ControlNet保持原始布局，集成全局語(yǔ)義適配器提高語(yǔ)義保真度，并采用風(fēng)格提取器作為判別器提供額外的風(fēng)格指導(dǎo)。盡管目前仍處于預(yù)實(shí)驗(yàn)階段，InstantStyle-Plus已展示出在實(shí)際應(yīng)用中的巨大潛力，為未來(lái)的圖像生成和風(fēng)格遷移技術(shù)開(kāi)辟了新的可能性。

?https://instantstyle-plus.github.io/?utm_source=uwl.me

4.Magic Insert: 跨風(fēng)格圖像融合的魔法師

Magic Insert允許用戶(hù)將任意風(fēng)格的圖像主體無(wú)縫融入到風(fēng)格迥異的目標(biāo)圖像中，同時(shí)保持主體的原有風(fēng)格和真實(shí)感。它通過(guò)巧妙地結(jié)合風(fēng)格感知個(gè)性化和對(duì)象插入兩大技術(shù)，克服了傳統(tǒng)圖像合成方法的局限。

該技術(shù)的核心在于其獨(dú)特的兩步流程：首先，利用LoRA和學(xué)習(xí)到的文本令牌對(duì)預(yù)訓(xùn)練模型進(jìn)行微調(diào)，實(shí)現(xiàn)風(fēng)格感知個(gè)性化；其次，通過(guò)引導(dǎo)領(lǐng)域適應(yīng)技術(shù)，將專(zhuān)門(mén)的對(duì)象插入模型應(yīng)用于多樣化的藝術(shù)風(fēng)格。

?https://magicinsert.github.io/

5.書(shū)生浦語(yǔ)：開(kāi)源 InternLM 2.5 系列模型

InternLM/InternLM 是一個(gè)公開(kāi)的 GitHub 倉(cāng)庫(kù)，最近發(fā)布了 InternLM2.5 版本，其中包括 7B 參數(shù)規(guī)模的基礎(chǔ)和聊天模型。這個(gè)版本具有 1M（10^6）的上下文支持能力，這意味著模型能夠處理大量的文本輸入，適用于復(fù)雜的自然語(yǔ)言處理任務(wù)。

?https://github.com/InternLM/InternLM/

大牛洞見(jiàn)

OpenAI 聯(lián)合創(chuàng)始人 Andrej Karpathy 解釋了新的計(jì)算范式

“我們正在進(jìn)入一個(gè)新的計(jì)算范式，大語(yǔ)言模型就像CPU一樣，使用Token而不是字節(jié)，并且有一個(gè)上下文窗口而不是RAM。這就是大語(yǔ)言模型操作系統(tǒng)。”

Andrej指出，人工智能領(lǐng)域在過(guò)去15年中經(jīng)歷了巨大的發(fā)展，從最初的學(xué)術(shù)研討到現(xiàn)在的廣泛應(yīng)用，這種變化令人矚目。尤其是大語(yǔ)言模型的興起，徹底改變了計(jì)算的范式，使得計(jì)算不僅僅是處理字節(jié)，而是處理語(yǔ)言和上下文，這為人工智能的應(yīng)用打開(kāi)了新的大門(mén)。

他回顧了自己在OpenAI的經(jīng)歷，描述了公司從八個(gè)人在公寓里工作到如今成為市值近千億美元的行業(yè)巨頭的歷程。通過(guò)一個(gè)個(gè)小項(xiàng)目的積累和發(fā)展，OpenAI最終實(shí)現(xiàn)了巨大的突破。Andrej特別強(qiáng)調(diào)了項(xiàng)目經(jīng)驗(yàn)的重要性，很多看似不起眼的小項(xiàng)目最終可能會(huì)帶來(lái)意想不到的巨大影響。

? https://www.youtube.com/watch?v=tsTeEkzO9xc

敬請(qǐng)期待明日的最新動(dòng)態(tài)！

AI情報(bào)局征集情報(bào)合伙人，匯集獨(dú)家價(jià)值線(xiàn)索！如果您可以提供有關(guān)AI最新成果&行業(yè)內(nèi)幕&獨(dú)特產(chǎn)品，請(qǐng)?zhí)砑舆\(yùn)營(yíng)微信號(hào)：AIyanxishe2備注行業(yè)崗位。

雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

我在思考中

運(yùn)營(yíng)

發(fā)私信

當(dāng)月熱門(mén)文章

袁進(jìn)輝獲近億元天使+輪融資；接棒湯曉鷗，上海AILab主任周伯文探索AI-45°Law；8人6個(gè)月從0開(kāi)發(fā)GPT4o丨AI情報(bào)局

袁進(jìn)輝獲近億元天使+輪融資；接棒湯曉鷗，上海AILab主任周伯文探索AI-45°Law；8人6個(gè)月從0開(kāi)發(fā)GPT4o丨AI情報(bào)局