漆遠獲新融資，阿里云參投；芯原創(chuàng)始人直言百模大戰(zhàn)就是“群模亂舞”，是在浪費電；英偉達今年在華將交付超100萬顆芯片丨AI情報局

本文作者：我在思考中

2024-07-08 11:01

導(dǎo)語：產(chǎn)品推薦：Pygma、AnythingLLM、Artificial Analysis

融資快報

無限光年完成新一輪融資：無限光年的核心產(chǎn)品是可信大模型，這是漆遠認為通往人工智能通用智能的道路?？尚糯竽Ｐ徒Y(jié)合了大語言模型與符號推理，旨在解決大模型的幻覺問題和遺忘性災(zāi)難，提高模型的可信度和可解釋性。無限光年已完成多輪融資，并與金融和醫(yī)療行業(yè)的頭部企業(yè)合作，打造了針對特定行業(yè)的精專大模型。此次投資人包括阿里云、啟明創(chuàng)投等頭部投資機構(gòu)。創(chuàng)始人漆遠從螞蟻集團副總裁任上離職后，漆遠先是重返學(xué)界，在復(fù)旦擔任教職，而后又產(chǎn)學(xué)研并行地創(chuàng)立了大模型公司無限光年。

Benchmark募資4.25億美元投向AI新時代：據(jù)《福布斯》獲得的一封投資者信顯示，風險投資公司 Benchmark 正在為其第十一期基金募集 4.25 億美元。新基金將被命名為 "Benchmark 1"，據(jù)悉，該公司的所有合伙人預(yù)計都會在其典型的專注領(lǐng)域（如消費科技、云計算或加密貨幣）內(nèi)尋找人工智能公司。

軟銀宣布4億英鎊收購AI芯片公司Graphcore：日本軟銀宣布將以4億英鎊收購陷入困境的人工智能初創(chuàng)公司 Graphcore，該交易還需要獲得英國政府的審查批準才能生效。Graphcore成立于2016年，生產(chǎn)稱為智能處理器單元的AI芯片，旨在挑戰(zhàn)英偉達。由于英偉達的設(shè)備需求量很大，投資者們紛紛向這家初創(chuàng)公司注入資金，尋找替代英偉達的可行方案。2020年，Graphcore以28億美元的估值籌集2.22億美元，使其成為英國最有前途的初創(chuàng)公司之一。

EvolutionaryScale獲超1.42億美元種子輪融資： 該公司創(chuàng)始團隊的八位成員全都來自于Meta的FAIR部門。去年八月Meta官宣旗下的蛋白質(zhì)折疊團隊Meta-FAIR解散。EvolutionaryScale旨在通過開放、安全的研究方式，來指導(dǎo)蛋白質(zhì)設(shè)計領(lǐng)域的人工智能技術(shù)開發(fā)，團隊開發(fā)用于創(chuàng)造新型蛋白質(zhì)和其他生物系統(tǒng)的大型語言模型ESM，已迭代到ESM-3。本次融資由Nat Friedman和Daniel Gross以及Lux Capital領(lǐng)投，亞馬遜、NVentures和天使投資人參投。

DNEG集團獲2億美元戰(zhàn)略投資：DNEG是好萊塢視效技術(shù)提供商，曾參與多部知名好萊塢電影的制作，如“狂怒”、“銀翼殺手2049”和“星際穿越”。這一投資將推動DNEG集團新成立的Brahma，開發(fā)人工智能驅(qū)動的CGI工具，以簡化視覺效果的創(chuàng)作過程。Brahma的AI創(chuàng)作者解決方案將利用超過25年的VFX數(shù)據(jù)生成逼真的視覺效果。該筆融資來自United Al Saqer Group，將使DNEG集團的估值超過20億美元。

焱融科技完成雙輪融資：焱融科技核心產(chǎn)品YRCloudFile 高性能文件存儲系統(tǒng)，在 AI 和高性能計算場景中嶄露頭角。完成 B 輪和 B+ 輪融資，累計融資額近 2 億元人民幣。兩輪融資分別由豐年資本和北京股權(quán)領(lǐng)投，老股東耀途資本、卓源亞洲、信雅達等知名投資機構(gòu)持續(xù)跟投。

大道智創(chuàng)完成500萬人民幣融資：大道智創(chuàng)是一家專注于研發(fā)安保機器人的公司，主要研發(fā)和銷售巡邏機器人、安保機器人等商用服務(wù)型機器人，以視覺定位為主，配合多傳感器融合，在復(fù)雜環(huán)境下實現(xiàn)全自主定位巡航，目前已推出了一代產(chǎn)品“e巡 ”機器警長。投資方為中關(guān)村科技租賃。

Altrove AI獲400萬美元種子融資：Altrove使用AI生成無機材料的潛在配方，特別是稀土元素。融資由Contrarian Ventures領(lǐng)投。

Phaidra獲1200萬美元融資：該公司的系統(tǒng)從設(shè)施內(nèi)的數(shù)千個傳感器收集數(shù)據(jù)，并使用人工智能模型就如何更有效地管理和冷卻設(shè)備做出實時決策。融資由Index Ventures 領(lǐng)投。

OpenLedger 籌集了 800 萬美元的種子資金：用于 AI 模型開發(fā)的去中心化數(shù)據(jù)基礎(chǔ)設(shè)施

（歡迎添加微信AIyanxishe2，了解更多AIGC、融資情況，與志同道合的朋友一同暢聊時新AI產(chǎn)品）

國內(nèi)情報：

2024 世界人工智能大會線下參觀人數(shù)創(chuàng)歷史新高，預(yù)計總投資額超 400 億元：

大會線下參觀人數(shù)突破 30 萬人次，全網(wǎng)流量突破 10 億，比上屆增長了 90%，據(jù)悉，本次大會對接 132 個采購團組，形成了 126 個項目采購需求，預(yù)計意向采購金額達 150 億元，推動 24 個重大產(chǎn)業(yè)項目的簽約，預(yù)計總投資額超過 400 億元。本次大會的展覽面積超過 5.2 萬平方米，500 余家知名企業(yè)、超過 1500 項展品參展，50 余款新品首發(fā)首秀，均創(chuàng)歷史新高。

快手可靈 AI 網(wǎng)頁端上線，文生圖大模型“可圖”開源：

快手可靈 AI 網(wǎng)頁端正式上線，所有功能限時免費。“文生視頻”開放最長 10 秒生成能力，“圖生視頻”新增運鏡控制、自定義首尾幀等功能。據(jù)悉，已有超過50萬用戶申請可靈的內(nèi)測資格，視頻生成數(shù)量達700萬。此外，文生圖大模型“可圖”開源，已上線網(wǎng)頁版和微信小程序，支持文生圖和圖生圖兩類功能，可用于 AI 創(chuàng)作圖像以及 AI 形象定制。

科大訊飛大模型新增投入超 6.5 億元、AI 學(xué)習機發(fā)布預(yù)售11699 元：

科大訊飛發(fā)布 2024 上半年業(yè)績預(yù)告，預(yù)計凈虧損 3.8 億元至 4.6 億元，上年同期盈利 7357.2 萬元，同比下降 725.24%~616.50%?？拼笥嶏w表示，公司在全力加大“訊飛星火大模型”研發(fā)投入的同時，加快了大模型的落地推廣力度。2024 年上半年營收、毛利預(yù)計增長 15%-20%，且毛利增速高于收入增速。

此外科大訊飛近期還發(fā)布了 AI 學(xué)習機新品 T30 Ultra，內(nèi)置星火大模型，屏幕尺寸為 14.7 英寸，12GB+1TB 版本到手 11699 元，將于 7 月 20 日開售。

智譜開源代碼生成大模型 CodeGeeX 第四代，號稱百億以下規(guī)模性能最強：

該產(chǎn)品集成了代碼補全和生成、代碼問答、代碼解釋器、工具調(diào)用、聯(lián)網(wǎng)搜索、項目級代碼問答等功能，支持超過 300 種編程語言，并且能夠處理 128K 上下文，這使得其能夠更好地理解和處理復(fù)雜的代碼文件。CodeGeeX4-ALL-9B 在 Berkeley Function Calling Leaderboard 上的測試表現(xiàn)超過 90% 的成功率，被譽為目前唯一能實現(xiàn) Function Call 的代碼大模型。

騰訊發(fā)布大模型時代的AI十大趨勢，走進“機器外腦”時代：

騰訊研究院、上海交通大學(xué)、騰訊優(yōu)圖實驗室、騰訊云智能聯(lián)合發(fā)布了《2024大模型十大趨勢——走進“機器外腦”時代》報告。報告指出，我們正在進入一個“機器外腦”時代。海量GPU和新一代大模型的組合起來，使人工智能在三個方向上有了實質(zhì)性的飛躍：推理分析、創(chuàng)意生成和情緒智能。這意味著AI第一次擁有了類人的交互能能力，新一代AI正在成為人類的“機器外腦”，提供智力的外掛。

上海AI lab開源超強多模態(tài)LLM InternLM-XComposer-2.5：

上海 AI 實驗室聯(lián)合香港中文大學(xué)、商湯科技集團以及清華大學(xué)研發(fā)了 IXC-2.5 模型。模型具備長上下文處理能力，能夠處理超長的文本和圖像輸入，同時在視覺能力上有特殊優(yōu)勢，包括超高分辨率的圖像理解和細粒度的視頻理解。模型架構(gòu)包括輕量級的視覺編碼器、大型語言模型，以及部分 LoRA 對齊技術(shù)。在 28 個基準測試中，IXC-2.5 在 16 項測試中超過了現(xiàn)有的開源模型，其余 16 項測試中的表現(xiàn)也接近或超過了 GPT-4V 和 Gemini Pro。

支付寶發(fā)布多模態(tài)醫(yī)療大模型，支持千億級視覺識別：

支付寶多模態(tài)醫(yī)療大模型成為國內(nèi)首批多模態(tài)醫(yī)療大模型之一。基于螞蟻百靈的多模態(tài)能力，模型可實現(xiàn)直接理解并訓(xùn)練音頻、視頻、圖、文等多模態(tài)數(shù)據(jù)，使其更像人一樣感知和互動，能“看”會“聽”、能“說”會“畫”，支持千億級別參數(shù)醫(yī)療視覺識別。據(jù)悉，螞蟻百靈大模型已具備原生多模態(tài)能力，可以直接理解并訓(xùn)練音頻、視頻、圖、文等多模態(tài)數(shù)據(jù)。

金山辦公發(fā)布 WPS AI 2.0，新增 4 個 AI 辦公助手，政務(wù)自研模型首次亮相:

WPS AI 2.0包含 WPS AI 辦公助手、WPS AI 政務(wù)版等應(yīng)用，并首次公開了 13B 級別的政務(wù)自研模型，金山政務(wù)辦公模型 1.0。為個人用戶新增了 4 個 AI 辦公助手，分別為 AI 寫作助手、AI 閱讀助手、AI 數(shù)據(jù)助手、AI 設(shè)計助手。此次發(fā)布的金山政務(wù)辦公模型 1.0 擅長公文寫作，實現(xiàn)無口語化描述且按照公文風輸出，輸出的內(nèi)容自帶公文格式，模型了解國家相關(guān)政策，回答均基于可靠依據(jù)。

阿里“通義”APP上線特殊AI繪本工具“追星星的AI”：

這是一款為孤獨癥兒童提供定制 AI 繪本服務(wù)的工具。它基于阿里自研 Modelscope-Agent 框架，調(diào)用了通義大模型的多項服務(wù)，可實現(xiàn)從一句話故事梗概到完整有聲繪本的生成。上海美術(shù)電影制片廠免費授權(quán)了旗下經(jīng)典動畫形象供公益繪本使用?！巴x”APP 已經(jīng)限時上線以孫悟空和大耳朵圖圖為主角的 AI 繪本。

商湯科技發(fā)布日日新5.5大模型體系：

該大模型體系包括6000億參數(shù)基礎(chǔ)模型日日新5.5，性能提升30%；流式多模態(tài)交互模型日日新5o，是國內(nèi)首個所見即所得模型，可進行實時多模態(tài)交互和問答；日日新5.5Lite在端側(cè)模型進行升級，模型精度提升10%、首包延遲降低40%，推理效率提升15%。

王堅稱美國AI發(fā)展的電力瓶頸短板我國不存在，最不缺就是電：

中國工程院院士、阿里云創(chuàng)始人王堅表示，美國AI人工智能發(fā)展的瓶頸是電力，這對中國來說不是問題?！爸袊荒甑陌l(fā)電量是美國、日本、俄羅斯的總和還要多”，王堅說道。另外他提出一個應(yīng)用、模型、電力和算力的不等式，認為在此不等式下，目前從事人工智能的人還不用擔心瓶頸問題。

MiniMax創(chuàng)始人閆俊杰稱至少三年后才會出現(xiàn)“殺手級”AI應(yīng)用：

閆俊杰表示，雖然國內(nèi)很多公司正在迎頭趕上ChatGPT，但是目前模型的錯誤率在60%-70%的水平，遠不及GPT-4的30%-40%。類似于微信、抖音、今日頭條這種規(guī)模的“殺手級”AI超級應(yīng)用（Killer App），至少要到三年之后才能實現(xiàn)。

無問芯穹發(fā)布全球首個單任務(wù)千卡異構(gòu)芯片混合訓(xùn)練平臺，算力利用率達 97.6%：

無問芯穹聯(lián)合創(chuàng)始人兼 CEO 夏立雪發(fā)布無問芯穹大規(guī)模模型的異構(gòu)分布式混合訓(xùn)練系統(tǒng)，稱千卡異構(gòu)混合訓(xùn)練集群算力利用率最高達到了 97.6%。夏立雪還宣布無問芯穹 Infini-AI 云平臺已集成大模型異構(gòu)千卡混訓(xùn)能力，是全球首個可進行單任務(wù)千卡規(guī)模異構(gòu)芯片混合訓(xùn)練的平臺，具備萬卡擴展性。

中國公司開始大量訂購NVIDIA H20芯片：

摩根士丹利報告，NVIDIA特供中國市場的人工智能芯片H20系列，開始吸引包括百度、阿里巴巴、騰訊和字節(jié)跳動在內(nèi)的中國科技巨頭的采購興趣。盡管H20在性能上不及英偉達的H100，其AI算力只有H100的不到15%，甚至部分性能不及Ascend 910B，但在國產(chǎn)AI芯片供應(yīng)不足的情況下，中國廠商的選擇顯得有些無奈。

百度李彥宏稱開源模型是智商稅，閉源模型更強大、推理成本更低：

李彥宏稱：“我覺得，開源其實是一種智商稅”，“當你理性地去想，大模型能夠帶來什么價值，以什么樣的成本帶來價值的時候，就會發(fā)現(xiàn)，你永遠應(yīng)該選擇閉源模型。今天無論是 ChatGPT、還是文心一言等閉源模型，一定比開源模型更強大，推理成本更低。”

李彥宏還指出，當前AI領(lǐng)域存在一種不良風氣，即各個公司競相發(fā)布新一代大語言模型，宣稱自己的模型參數(shù)規(guī)模和訓(xùn)練數(shù)據(jù)量超越了GPT-4，但在實際應(yīng)用落地方面卻鮮有成熟方案。AI技術(shù)的發(fā)展不應(yīng)僅僅停留在跑分和刷榜上。今天一個震撼發(fā)布，明天一個史詩級更新，但實際應(yīng)用卻遲遲未見。只有將AI技術(shù)應(yīng)用于實際產(chǎn)業(yè)和場景，才能創(chuàng)造出真正的價值。

中國工程院院士高文稱今天的人工智能是低水平智能，有一點中水平的假象：

他認為，AI技術(shù)的智能水平可以劃分為低中高三階段。低水平智能，是對顯式知識的記憶和使用來表現(xiàn)智能，即所謂的記憶學(xué)習。中水平智能，是利用得到的少量顯式知識，可以類比推理得到相關(guān)隱式知識簇。能夠舉一反三，觸類旁通。高水平智能，是利用極少的線索，創(chuàng)造新知識和知識體系，例如牛頓力學(xué)和相對論。今天的人工智能，主要還是低水平智能，因為深度神經(jīng)網(wǎng)絡(luò)是使用數(shù)據(jù)訓(xùn)練出來的，是基于統(tǒng)計的模型，連知識都不能算，等到什么時候可解釋了，才能算知識?！按笳Z言模式是由不同種的知識涌現(xiàn)，原則上還是低水平智能，有一點中水平的假象，相當于熟讀唐詩三百首，不會作詩也會吟，屬于熟能生巧的范疇?！?/p>

此外高文認為，AI技術(shù)需要完善理論基礎(chǔ)驗證，并實現(xiàn)模型的可解釋性；要嚴格控制人工智能的底層價值取向，實現(xiàn)技術(shù)的標準化；在應(yīng)用階段，需要預(yù)防人為造成的人工智能安全問題，對人工智能進行動機選擇。應(yīng)對強人工智能，必須加強國際合作。

阿里云創(chuàng)始人王堅院士稱GPT的潛力還沒有被完整地探索：

王堅認為，今天的AI有別于過去的AI，GPT的潛力事實上還沒有被完整地探索。此外他還談到，AI時代下一定會有新的大公司出現(xiàn)，也一定會有大公司“浴火重生”。對于不同規(guī)模的企業(yè)來說，大企業(yè)一定會覺得AI是“工具的革命”；小企業(yè)一定會覺得這是“革命的工具”，“如果大企業(yè)也意識到這是革命的工具，那變化就來了”。

另外阿里云 CTO 周靖人宣布通義千問開源模型下載量增長 2 倍，突破 2000 萬次，阿里云百煉服務(wù)客戶數(shù)從 9 萬增長至 23 萬，漲幅超 150%。「到今天，通義千問已經(jīng)實現(xiàn)真正意義上的全尺寸、全模態(tài)開源，拉平了開源、閉源模型之間的差距?！?/p>

芯原創(chuàng)始人直言百模大戰(zhàn)就是“群模亂舞”，是在浪費電：

在中國RISC-V產(chǎn)業(yè)聯(lián)盟理事長、芯原微電子創(chuàng)始人戴偉民博士看來，當前AI領(lǐng)域的"百模大戰(zhàn)"現(xiàn)象更像是一種資源的浪費。這種"群模亂舞"的現(xiàn)象實際上并不經(jīng)濟。要實現(xiàn)超越人腦智能的AI，需要不斷擴大模型參數(shù)規(guī)模，這對計算力的需求呈指數(shù)級增長，將導(dǎo)致巨大的電力消耗。

他預(yù)測，到2028年，中國基礎(chǔ)大模型的數(shù)量將少于10個，更理想的狀態(tài)是5個。戴偉民還提到，目前全球有超過100款A(yù)I大模型，但這種模式并不可持續(xù)，他認為應(yīng)該集中資源發(fā)展更高效、更環(huán)保的AI技術(shù)，而不是盲目追求模型數(shù)量。此外，戴偉民還探討了生成式AI所需的算力芯片發(fā)展趨勢，他認為未來將有更多專用芯片出現(xiàn)，挑戰(zhàn)現(xiàn)有的GPU/GPGPU架構(gòu)。

華為張平安稱中國 AI 發(fā)展離不開算力基礎(chǔ)設(shè)施的創(chuàng)新，必須摒棄“沒有最先進芯片就無法發(fā)展”的觀念：

張平安指出，華為創(chuàng)新的方向是將端側(cè)的 AI 算力需求通過光纖和無線網(wǎng)絡(luò)釋放到云上，通過端云協(xié)同獲得無縫的 AI 算力。通過云側(cè)的算力，讓端側(cè)既保持了豐富的功能，又極大地降低了功耗和對芯片的依賴。他強調(diào)，中國的 AI 發(fā)展道路，追求的應(yīng)該是在行業(yè)領(lǐng)域構(gòu)筑大模型的全球領(lǐng)先地位。如果各行各業(yè)都積極擁抱 AI，積極地開放行業(yè)的業(yè)務(wù)場景，中國很有機會在 2B 領(lǐng)域構(gòu)筑起全球的領(lǐng)先優(yōu)勢。

更多國內(nèi)情報：

工信部透露中國算力規(guī)模位居全球第二：截至 5 月底，全國規(guī)劃具有高性能計算機集群的智算中心已達十余個，智能算力在算力總規(guī)模中的比重超過了30%。目前，我國已經(jīng)培育了 421 家國家級智能制造示范工廠，人工智能企業(yè)的數(shù)量也超過了 4500 家，并推動制定了 48 項智能制造相關(guān)的國際標準。

全球最大甲骨文“數(shù)據(jù)集”開源：“數(shù)字甲骨共創(chuàng)中心”正式開源全球最大的甲骨文多模態(tài)數(shù)據(jù)集，共包含一萬片甲骨的拓片、摹本，甲骨單字對應(yīng)位置、對應(yīng)字頭、對應(yīng)釋文以及辭例分組、釋讀順序等數(shù)據(jù)。所有研究者都能基于該數(shù)據(jù)集研發(fā)甲骨文檢測、識別、摹本生成、字形匹配和釋讀等算法，加速甲骨文研究智能化進程。

B站首次展出自研大語言模型：嗶哩嗶哩公布了多項自主研發(fā)的 AI 技術(shù)成果和 AIGC 多元創(chuàng)意，包括最新定制的 AI 語音聲庫、自研音視頻大模型必剪 Studio 以及自研 AI 動態(tài)漫技術(shù)等。

百度文心智能體平臺升級，向開發(fā)者免費開放文心大模型4.0：開發(fā)者在文心智能體平臺上制作智能體時，可靈活選擇文心大模型 3.5 或 4.0 版本。

AI羅永浩評10年前與王自如“約架”：有媒體向智譜的數(shù)字員工AI老羅提問還記得王自如嗎？AI老羅表示：“可別提了，讓我想起來的都是些不愉快的事，我們倆在直播辯論的時候，他那個所謂的客觀獨立第三方的評測，簡直讓人笑掉大牙?！薄拔铱墒菫榱苏胬砗驼x而戰(zhàn)，他只會躲在數(shù)據(jù)后面，不敢正面回應(yīng)，這種對手不提也罷?！?/p>

國內(nèi)首款鴻蒙人形機器人正在蔚來、亨通等工廠檢測驗證：“盤古大模型 + 夸父人形機器人”將在工業(yè)和家庭兩大場景同步推進應(yīng)用。

國際情報：

英偉達今年在華銷售額預(yù)計將達120億美元，發(fā)貨超100萬顆芯片：

芯片咨詢公司SemiAnalysis報告預(yù)估，今年英偉達有望在中國銷售價值約120億美元的人工智能芯片。黃仁勛曾表示，希望借助新的芯片使得英偉達在中國的業(yè)務(wù)實現(xiàn)最大化。英偉達有望在未來幾個月內(nèi)在中國交付超過100萬顆定制版H20芯片，這些芯片的設(shè)計不受美國對向中國客戶銷售人工智能處理器的限制。據(jù)悉，每顆H20芯片的價格在12000至13000美元之間。

消息稱黑客去年曾侵入OpenAI內(nèi)部系統(tǒng)，部分AI設(shè)計細節(jié)被盜：

據(jù)悉，一名黑客去年曾成功“黑入”了OpenAI的內(nèi)部消息系統(tǒng)，并竊取了有關(guān)人工智能技術(shù)和研究材料的敏感討論，但黑客并未進入托管人工智能源代碼的服務(wù)器。OpenAI高管在去年4月的全體員工大會上向員工和公司董事會通報了這一漏洞，但高管并未對外公開這一消息。

Meta AI 重磅發(fā)布，多標記預(yù)測模型現(xiàn)已開放研究：

Meta 在Hugging Face上發(fā)布了采用多標記預(yù)測方法的預(yù)訓(xùn)練模型，可能改變大型語言模型的開發(fā)和部署方式。這種新技術(shù)模型同時預(yù)測多個未來單詞，可能改善語言結(jié)構(gòu)和上下文理解，有望提高人工智能效率，加速人機協(xié)作編碼的趨勢。

破解ChatGPT驚人耗電！DeepMind新算法訓(xùn)練提效13倍，能耗暴降10倍：

DeepMind 研究團隊提出了一種名為 JEST（多模態(tài)對比學(xué)習與聯(lián)合示例選擇）的新算法，旨在加快 AI 訓(xùn)練過程并減少所需的計算資源和能耗。JEST 算法能夠以 13 倍更少的迭代次數(shù)和 10 倍更少的計算量，超越最先進的模型。這一發(fā)現(xiàn)揭示了數(shù)據(jù)篩選水平可以作為評判 Scaling Law 的一個新維度。JEST 算法通過從 “超級 batch” 中篩選出最具可學(xué)習性的 “子 batch”，實現(xiàn)了高效的數(shù)據(jù)管理和訓(xùn)練過程。實驗結(jié)果表明，JEST 方法在效率提升和性能優(yōu)化方面取得了顯著成效，尤其是在多模態(tài)學(xué)習加速和數(shù)據(jù)質(zhì)量引導(dǎo)方面。

解鎖動物語言？SuperAnimal這款A(yù)I神器，顛覆人與自然的關(guān)系：

SuperAnimal是一款開源AI模型，能自動識別和分析動物的運動行為，提供精確的姿態(tài)分析；該模型通過統(tǒng)一的預(yù)訓(xùn)練模型和關(guān)鍵點空間映射，減少人工標注需求，提高數(shù)據(jù)整合和模型泛化能力；SuperAnimal應(yīng)用于獸醫(yī)學(xué)、生物醫(yī)學(xué)研究和野生動物保護，使用高級模型架構(gòu)和獨特訓(xùn)練方法以提高性能和適應(yīng)性。

更多國際情報：

布局 AI 等市場，格芯收購泰戈爾科技氮化鎵技術(shù)和相關(guān)團隊：氮化鎵成為可持續(xù)高效電源管理（尤其是在數(shù)據(jù)中心）的關(guān)鍵解決方案。泰戈爾科技公司工程師團隊將加入格芯，進一步開發(fā)氮化鎵技術(shù)。

“高達”式鐵路機器人在日本大范圍推廣：主要設(shè)計用于修剪鐵軌上的樹枝，固定和噴漆列車上方電纜的金屬框架等等。

互聯(lián)網(wǎng)巨頭公司正合法利用用戶數(shù)據(jù)來訓(xùn)練其 AI 模型：多家硅谷科技公司，如谷歌、Meta、X、Snap 和 Zoom 在隱私政策和服務(wù)條款中，加入了使用用戶數(shù)據(jù)來訓(xùn)練 AI 模型的條款。

真實商戰(zhàn)？報告稱谷歌曾試圖禁止蘋果 Safari 瀏覽器用戶使用 AI 摘要功能：美國司法部調(diào)查谷歌在搜索行業(yè)的統(tǒng)治地位，涉及谷歌每年向蘋果支付超 200 億美元費用，以成為 iPhone 的默認搜索引擎。谷歌試圖增加 iPhone 用戶在在 Safari 瀏覽器以外的平臺上進行搜索的比例，目標是到 2030 年時達到 50%。為此曾考慮限制 AI 摘要功能，但最終決定不采取這一措施。

YouTube 測試“AI 音頻橡皮擦”：該工具使用 AI 算法來專門檢測和刪除相關(guān)歌曲，創(chuàng)作者可輕松移除受版權(quán)保護背景音樂，而不會影響包括對話或音效在內(nèi)的任何其他音頻。

Product Hunt 熱榜， Pygma

Pygma是一款A(yù)I驅(qū)動社交媒體管理助手，專為Instagram用戶和中小企業(yè)量身打造。這款智能工具通過深度分析用戶風格和受眾反應(yīng)，在幾秒鐘內(nèi)生成定制化的帖子、故事和Reels內(nèi)容，大大簡化了社交媒體流程。

不僅提供內(nèi)容創(chuàng)作，還集成了智能編輯、排程發(fā)布等功能，真正實現(xiàn)一站式社媒管理。其獨特的AI生成器和編輯器，加上即將推出的目標受眾分析功能，使Pygma成為提升品牌形象和吸引目標受眾的強大工具。

?https://www.pygma.me/

GitHub Trending 熱榜，智能辦公AI助手AnythingLLM

獲 YC 投資，為企業(yè)構(gòu)建一站式內(nèi)部 Agent 和 RAG 應(yīng)用解決方案的 Mintplex Labs 開源其跨端應(yīng)用 anything-llm是一款多功能AI商業(yè)智能工具，支持多種大型語言模型和操作系統(tǒng)。該工具提供一鍵安裝的桌面應(yīng)用程序，強調(diào)用戶隱私保護，支持自定義模型和多種文檔格式處理。AnythingLLM適用于個人和組織用戶，可在離線環(huán)境下運行。

該工具提供全面的開發(fā)者API和外觀定制選項，支持企業(yè)級和開源模型。AnythingLLM的官方網(wǎng)站提供了詳細的產(chǎn)品信息，包括定價、使用方法和與其他類似工具的比較。這些特性使AnythingLLM成為一個全面的AI商業(yè)智能解決方案。

?https://github.com/Mintplex-Labs/anything-llm

開發(fā)者推薦

1.AI模型評測：Artificial Analysis

Artificial Analysis平臺專注于對各大LLM API提供商進行全面基準測試，不僅評估模型輸出質(zhì)量，還重點關(guān)注響應(yīng)速度。通過整合LMSYS Chatbot Arena、Hugging Face排行榜和斯坦福HELM項目等多方數(shù)據(jù)，Artificial Analysis為開發(fā)者提供了更全面、更實用的模型選擇參考。

這一創(chuàng)新approach填補了現(xiàn)有AI評測體系的空白，特別適合對令牌生成速度要求較高的應(yīng)用場景。業(yè)內(nèi)專家認為，Artificial Analysis的出現(xiàn)將激勵A(yù)I服務(wù)提供商不斷優(yōu)化模型性能，推動整個行業(yè)向更高效、更實用的方向發(fā)展。對開發(fā)者而言，這個網(wǎng)站的評測結(jié)果將幫助他們更精準地選擇適合自身需求的AI模型，從而提升應(yīng)用效果和用戶體驗。

?https://artificialanalysis.ai2.KREA免費生成和增強圖像與視頻

KREA 旨在通過強大的人工智能技術(shù)，讓用戶能夠直觀地生成和增強圖像與視頻。該平臺提供了多種功能，包括實時視頻生成、圖像增強、視頻增強以及免費訪問的 AI 視頻生成。此外，KREA 還推出了一系列迷你應(yīng)用程序，如 “Logo Illusions” 和 “AI Patterns”，以及舊版應(yīng)用程序，如 “AI Training” 和 “Canvas Project Studio”。用戶需要在瀏覽器中啟用 JavaScript 以正確查看頁面。

?https://www.krea.ai/home

3.AI視頻創(chuàng)作一條龍，達摩院“尋光”突破可控編輯難題：

尋光定位為PUGC一站式AI視頻創(chuàng)作平臺，能夠?qū)崿F(xiàn)視頻創(chuàng)作的全流程 AI 輔助，包括劇本創(chuàng)作、分鏡圖設(shè)計、視頻素材編輯等。讓視頻編輯像操作PPT一樣簡單，主要用于輔助創(chuàng)作劇本、分鏡圖，支持對素材進行AI編輯，包括人物控制、場景控制、運鏡控制、目標新增/消除/修改等10多種功能，解決了 AI 視頻內(nèi)容的可控編輯問題。

?https://xunguang.damo-vision.com/

前沿技術(shù)

1.LivePortrait：AI 肖像動畫技術(shù)

快手科技團隊推出 LivePortrait，這是一種基于隱式關(guān)鍵點框架的高效肖像動畫技術(shù)。它能從單張源圖像和驅(qū)動視頻生成生動的視頻，展現(xiàn)出優(yōu)秀的泛化能力、可控性和效率。

研究者通過擴大訓(xùn)練數(shù)據(jù)集、采用混合訓(xùn)練策略、升級網(wǎng)絡(luò)架構(gòu)等方法提升了生成質(zhì)量。LivePortrait 在 RTX 4090 GPU 上每幀僅需 12.8 毫秒，效果媲美擴散模型方法。該項目的推理代碼和模型已開源。

?https://liveportrait.github.io/

2.通義語音團隊開源了語音基座大模型，SenseVoice和CosyVoice：

SenseVoice多語言音頻理解大模型：多語言語音識別在中文和粵語上相比Whisper相對提升+50%，推理速度快15倍，并且支持SOTA的情緒識別和音頻事件檢測。

CosyVoice多語言音頻生成大模型：通過超過17萬小時的多語言音頻數(shù)據(jù)訓(xùn)練，支持多語言、音色和情感控制，CosyVoice則在多語言語音生成、零樣本語音生成、跨語言聲音合成和指令執(zhí)行能力方面表現(xiàn)卓越。

?https://fun-audio-llm.github.io/

3.斯坦福大學(xué)發(fā)布OccFusion，可完整渲染出被遮擋的人體：

OccFusion 是一種基于高效 3D 高斯分片和預(yù)訓(xùn)練 2D 擴散模型的人體渲染技術(shù)，它能在人體被部分遮擋的情況下渲染出完整的形態(tài)。OccFusion 在 ZJU-MoCap 和 OcMotion 序列上進行了評估，表現(xiàn)出色，達到了遮擋人體渲染的最新水平。整個訓(xùn)練過程僅需在單個 Titan RTX GPU 上花費 10 分鐘。

?https://cs.stanford.edu/~xtiange/projects/occfusion/

4.浦語靈筆 IXC-2.5 展現(xiàn)多模態(tài)實力

上海人工智能實驗室最新推出的浦語靈筆 IXC-2.5 模型引發(fā)業(yè)界關(guān)注。這款基于7B LLM的多模態(tài)大模型在圖像和視頻理解方面表現(xiàn)出色，據(jù)稱能力可與GPT-4V相媲美。其特色功能包括高分辨率圖像理解、精細視頻分析和多輪多圖像對話。該模型還拓展了實用領(lǐng)域，能夠自動生成網(wǎng)頁和創(chuàng)作高質(zhì)量文章，利用逐步推理方法確保長文本內(nèi)容的邏輯性和連貫性。浦語靈筆 IXC-2.5 的推出為人工智能在多模態(tài)應(yīng)用領(lǐng)域開辟了新的可能性。

?https://huggingface.co/spaces/Willow123/InternLM-XComposer

5.推薦系統(tǒng)新范式：DiffMM開啟多模態(tài)精準推薦時代

港大和騰訊研究人員聯(lián)手打造的DiffMM多模態(tài)推薦系統(tǒng)引發(fā)業(yè)界關(guān)注。這一創(chuàng)新模型通過構(gòu)建包含用戶和視頻多元信息的圖譜，并結(jié)合圖擴散技術(shù)和對比學(xué)習方法，實現(xiàn)了對用戶喜好的深度理解。在三個公共數(shù)據(jù)集的實驗中，DiffMM展現(xiàn)出卓越性能，超越現(xiàn)有基線模型。該項目已開源，為推薦系統(tǒng)研究提供了新思路，有望在短視頻等領(lǐng)域帶來更精準的個性化推薦體驗。

?https://github.com/HKUDS/DiffMM

6.快手AI繪畫新里程碑：Kolors模型雙語圖像生成

快手科技旗下Kolors團隊近日推出了一款突破性的文本到圖像生成模型Kolors。這一基于潛流擴散技術(shù)的大規(guī)模模型在數(shù)十億文本-圖像對上進行訓(xùn)練，在視覺質(zhì)量、語義準確性和中英文字體渲染方面均展現(xiàn)出卓越表現(xiàn)。Kolors支持中英雙語輸入，特別在生成中文內(nèi)容時表現(xiàn)出色。通過人類專家評估和機器評測，Kolors在視覺吸引力和整體滿意度方面均領(lǐng)先于現(xiàn)有開源和閉源模型。

?https://github.com/Kwai-Kolors/Kolors

熱議話題

AI應(yīng)用現(xiàn)狀:期待與現(xiàn)實的差距

Retool 2024年上半年AI狀況報告指出AI應(yīng)用的真實情況：

1.AI采用，進展緩慢但穩(wěn)定：AI在企業(yè)中的實際應(yīng)用進展并不如想象中迅速。報告顯示，僅有約30%的受訪者認為他們的公司在AI采用方面處于"運行"或"飛行"階段，這一比例甚至較2023年有所下降。

2.AI影響尚未達到變革性水平：盡管AI已在多個領(lǐng)域得到應(yīng)用，但影響力似乎被夸大了。受訪者給出的平均影響評分僅為6.7/10，遠未達到"變革性"的程度。

3.投資態(tài)度，謹慎樂觀：盡管AI的實際影響有限，但大多數(shù)企業(yè)并不認為他們在AI上投資過度。相反，42%的受訪者認為投資"恰到好處"，40.5%甚至認為投資"不夠"。企業(yè)對AI的長期潛力持樂觀態(tài)度，愿意繼續(xù)投入資源。

4.AI應(yīng)用場景以內(nèi)部為主，外部謹慎：企業(yè)更傾向于在內(nèi)部應(yīng)用AI技術(shù)。最常見的用例包括編寫代碼或查詢(42.1%)、知識庫問答(36.4%)和支持聊天機器人(33.9%)。相比之下，面向客戶的AI應(yīng)用相對較少。這種傾向可能源于企業(yè)希望在內(nèi)部環(huán)境中先行試驗和完善AI應(yīng)用，以降低風險。

5.OpenAI獨占鰲頭，新星嶄露頭角：在AI技術(shù)棧方面，OpenAI的模型仍然主導(dǎo)市場，GPT-4和GPT-3.5合計占據(jù)70%的份額。不過像Anthropic的Claude 3和Mistral這樣的新興模型正在嶄露頭角，AI技術(shù)生態(tài)趨向多元化。

6.潛力巨大，道路漫長：業(yè)內(nèi)人士對AI未來發(fā)展保持樂觀。總的來說，AI技術(shù)的發(fā)展正處于一個關(guān)鍵的轉(zhuǎn)折點。雖然其影響力尚未達到預(yù)期，但企業(yè)和開發(fā)者正在積極探索和實踐，為未來的突破奠定基礎(chǔ)。

?https://retool.com/blog/state-of-ai-h1-2024

敬請期待明日的最新動態(tài)！

AI情報局征集情報合伙人，匯集獨家價值線索！如果您可以提供有關(guān)AI最新成果&行業(yè)內(nèi)幕&獨特產(chǎn)品，請?zhí)砑舆\營微信號：AIyanxishe2備注行業(yè)崗位。

雷峰網(wǎng)(公眾號：雷峰網(wǎng))

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

我在思考中

運營

發(fā)私信

當月熱門文章

漆遠獲新融資，阿里云參投；芯原創(chuàng)始人直言百模大戰(zhàn)就是“群模亂舞”，是在浪費電；英偉達今年在華將交付超100萬顆芯片丨AI情報局

漆遠獲新融資，阿里云參投；芯原創(chuàng)始人直言百模大戰(zhàn)就是“群模亂舞”，是在浪費電；英偉達今年在華將交付超100萬顆芯片丨AI情報局