0
本文作者: 我在思考中 | 2024-07-08 11:01 |
融資快報
無限光年完成新一輪融資:無限光年的核心產(chǎn)品是可信大模型,這是漆遠認為通往人工智能通用智能的道路??尚糯竽P徒Y(jié)合了大語言模型與符號推理,旨在解決大模型的幻覺問題和遺忘性災(zāi)難,提高模型的可信度和可解釋性。無限光年已完成多輪融資,并與金融和醫(yī)療行業(yè)的頭部企業(yè)合作,打造了針對特定行業(yè)的精專大模型。此次投資人包括阿里云、啟明創(chuàng)投等頭部投資機構(gòu)。創(chuàng)始人漆遠從螞蟻集團副總裁任上離職后,漆遠先是重返學(xué)界,在復(fù)旦擔任教職,而后又產(chǎn)學(xué)研并行地創(chuàng)立了大模型公司無限光年。
Benchmark募資4.25億美元投向AI新時代:據(jù)《福布斯》獲得的一封投資者信顯示,風險投資公司 Benchmark 正在為其第十一期基金募集 4.25 億美元。新基金將被命名為 "Benchmark 1",據(jù)悉,該公司的所有合伙人預(yù)計都會在其典型的專注領(lǐng)域(如消費科技、云計算或加密貨幣)內(nèi)尋找人工智能公司。
軟銀宣布4億英鎊收購AI芯片公司Graphcore:日本軟銀宣布將以4億英鎊收購陷入困境的人工智能初創(chuàng)公司 Graphcore,該交易還需要獲得英國政府的審查批準才能生效。Graphcore成立于2016年,生產(chǎn)稱為智能處理器單元的AI芯片,旨在挑戰(zhàn)英偉達。由于英偉達的設(shè)備需求量很大,投資者們紛紛向這家初創(chuàng)公司注入資金,尋找替代英偉達的可行方案。2020年,Graphcore以28億美元的估值籌集2.22億美元,使其成為英國最有前途的初創(chuàng)公司之一。
EvolutionaryScale獲超1.42億美元種子輪融資: 該公司創(chuàng)始團隊的八位成員全都來自于Meta的FAIR部門 。去年八月Meta官宣旗下的蛋白質(zhì)折疊團隊Meta-FAIR解散。EvolutionaryScale旨在通過開放、安全的研究方式,來指導(dǎo)蛋白質(zhì)設(shè)計領(lǐng)域的人工智能技術(shù)開發(fā),團隊開發(fā)用于創(chuàng)造新型蛋白質(zhì)和其他生物系統(tǒng)的大型語言模型ESM,已迭代到ESM-3。本次融資由Nat Friedman和Daniel Gross以及Lux Capital領(lǐng)投,亞馬遜、NVentures和天使投資人參投。
DNEG集團獲2億美元戰(zhàn)略投資:DNEG是好萊塢視效技術(shù)提供商,曾參與多部知名好萊塢電影的制作,如“狂怒”、“銀翼殺手2049”和“星際穿越”。這一投資將推動DNEG集團新成立的Brahma,開發(fā)人工智能驅(qū)動的CGI工具,以簡化視覺效果的創(chuàng)作過程。Brahma的AI創(chuàng)作者解決方案將利用超過25年的VFX數(shù)據(jù)生成逼真的視覺效果。該筆融資來自United Al Saqer Group,將使DNEG集團的估值超過20億美元。
焱融科技完成雙輪融資:焱融科技核心產(chǎn)品YRCloudFile 高性能文件存儲系統(tǒng),在 AI 和高性能計算場景中嶄露頭角。完成 B 輪和 B+ 輪融資,累計融資額近 2 億元人民幣。兩輪融資分別由豐年資本和北京股權(quán)領(lǐng)投,老股東耀途資本、卓源亞洲、信雅達等知名投資機構(gòu)持續(xù)跟投。
大道智創(chuàng)完成500萬人民幣融資:大道智創(chuàng)是一家專注于研發(fā)安保機器人的公司,主要研發(fā)和銷售巡邏機器人、安保機器人等商用服務(wù)型機器人,以視覺定位為主,配合多傳感器融合,在復(fù)雜環(huán)境下實現(xiàn)全自主定位巡航,目前已推出了一代產(chǎn)品“e巡 ”機器警長。投資方為中關(guān)村科技租賃。
Altrove AI獲400萬美元種子融資:Altrove使用AI生成無機材料的潛在配方,特別是稀土元素。融資由Contrarian Ventures領(lǐng)投。
Phaidra獲1200萬美元融資:該公司的系統(tǒng)從設(shè)施內(nèi)的數(shù)千個傳感器收集數(shù)據(jù),并使用人工智能模型就如何更有效地管理和冷卻設(shè)備做出實時決策。融資由Index Ventures 領(lǐng)投。
OpenLedger 籌集了 800 萬美元的種子資金:用于 AI 模型開發(fā)的去中心化數(shù)據(jù)基礎(chǔ)設(shè)施
(歡迎添加微信AIyanxishe2,了解更多AIGC、融資情況,與志同道合的朋友一同暢聊時新AI產(chǎn)品)
國內(nèi)情報:
2024 世界人工智能大會線下參觀人數(shù)創(chuàng)歷史新高,預(yù)計總投資額超 400 億元:
大會線下參觀人數(shù)突破 30 萬人次,全網(wǎng)流量突破 10 億,比上屆增長了 90%,據(jù)悉,本次大會對接 132 個采購團組,形成了 126 個項目采購需求,預(yù)計意向采購金額達 150 億元,推動 24 個重大產(chǎn)業(yè)項目的簽約,預(yù)計總投資額超過 400 億元。本次大會的展覽面積超過 5.2 萬平方米,500 余家知名企業(yè)、超過 1500 項展品參展,50 余款新品首發(fā)首秀,均創(chuàng)歷史新高。
快手可靈 AI 網(wǎng)頁端上線,文生圖大模型“可圖”開源:
快手可靈 AI 網(wǎng)頁端正式上線,所有功能限時免費。“文生視頻”開放最長 10 秒生成能力,“圖生視頻”新增運鏡控制、自定義首尾幀等功能。據(jù)悉,已有超過50萬用戶申請可靈的內(nèi)測資格,視頻生成數(shù)量達700萬。此外,文生圖大模型“可圖”開源,已上線網(wǎng)頁版和微信小程序,支持文生圖和圖生圖兩類功能,可用于 AI 創(chuàng)作圖像以及 AI 形象定制。
科大訊飛大模型新增投入超 6.5 億元、AI 學(xué)習機發(fā)布預(yù)售11699 元:
科大訊飛發(fā)布 2024 上半年業(yè)績預(yù)告,預(yù)計凈虧損 3.8 億元至 4.6 億元,上年同期盈利 7357.2 萬元,同比下降 725.24%~616.50%??拼笥嶏w表示,公司在全力加大“訊飛星火大模型”研發(fā)投入的同時,加快了大模型的落地推廣力度。2024 年上半年營收、毛利預(yù)計增長 15%-20%,且毛利增速高于收入增速。
此外科大訊飛近期還發(fā)布了 AI 學(xué)習機新品 T30 Ultra,內(nèi)置星火大模型,屏幕尺寸為 14.7 英寸,12GB+1TB 版本到手 11699 元,將于 7 月 20 日開售。
智譜開源代碼生成大模型 CodeGeeX 第四代,號稱百億以下規(guī)模性能最強:
該產(chǎn)品集成了代碼補全和生成、代碼問答、代碼解釋器、工具調(diào)用、聯(lián)網(wǎng)搜索、項目級代碼問答等功能,支持超過 300 種編程語言,并且能夠處理 128K 上下文,這使得其能夠更好地理解和處理復(fù)雜的代碼文件。CodeGeeX4-ALL-9B 在 Berkeley Function Calling Leaderboard 上的測試表現(xiàn)超過 90% 的成功率,被譽為目前唯一能實現(xiàn) Function Call 的代碼大模型。
騰訊發(fā)布大模型時代的AI十大趨勢,走進“機器外腦”時代:
騰訊研究院、上海交通大學(xué)、騰訊優(yōu)圖實驗室、騰訊云智能聯(lián)合發(fā)布了《2024大模型十大趨勢——走進“機器外腦”時代》報告。報告指出,我們正在進入一個“機器外腦”時代。海量GPU和新一代大模型的組合起來,使人工智能在三個方向上有了實質(zhì)性的飛躍:推理分析、創(chuàng)意生成和情緒智能。這意味著AI第一次擁有了類人的交互能能力,新一代AI正在成為人類的“機器外腦”,提供智力的外掛。
上海AI lab開源超強多模態(tài)LLM InternLM-XComposer-2.5:
上海 AI 實驗室聯(lián)合香港中文大學(xué)、商湯科技集團以及清華大學(xué)研發(fā)了 IXC-2.5 模型。模型具備長上下文處理能力,能夠處理超長的文本和圖像輸入,同時在視覺能力上有特殊優(yōu)勢,包括超高分辨率的圖像理解和細粒度的視頻理解。模型架構(gòu)包括輕量級的視覺編碼器、大型語言模型,以及部分 LoRA 對齊技術(shù)。在 28 個基準測試中,IXC-2.5 在 16 項測試中超過了現(xiàn)有的開源模型,其余 16 項測試中的表現(xiàn)也接近或超過了 GPT-4V 和 Gemini Pro。
支付寶發(fā)布多模態(tài)醫(yī)療大模型,支持千億級視覺識別:
支付寶多模態(tài)醫(yī)療大模型成為國內(nèi)首批多模態(tài)醫(yī)療大模型之一。基于螞蟻百靈的多模態(tài)能力,模型可實現(xiàn)直接理解并訓(xùn)練音頻、視頻、圖、文等多模態(tài)數(shù)據(jù),使其更像人一樣感知和互動,能“看”會“聽”、能“說”會“畫”,支持千億級別參數(shù)醫(yī)療視覺識別。據(jù)悉,螞蟻百靈大模型已具備原生多模態(tài)能力,可以直接理解并訓(xùn)練音頻、視頻、圖、文等多模態(tài)數(shù)據(jù)。
金山辦公發(fā)布 WPS AI 2.0,新增 4 個 AI 辦公助手,政務(wù)自研模型首次亮相:
WPS AI 2.0包含 WPS AI 辦公助手、WPS AI 政務(wù)版等應(yīng)用,并首次公開了 13B 級別的政務(wù)自研模型,金山政務(wù)辦公模型 1.0。為個人用戶新增了 4 個 AI 辦公助手,分別為 AI 寫作助手、AI 閱讀助手、AI 數(shù)據(jù)助手、AI 設(shè)計助手。此次發(fā)布的金山政務(wù)辦公模型 1.0 擅長公文寫作,實現(xiàn)無口語化描述且按照公文風輸出,輸出的內(nèi)容自帶公文格式,模型了解國家相關(guān)政策,回答均基于可靠依據(jù)。
阿里“通義”APP上線特殊AI繪本工具“追星星的AI”:
這是一款為孤獨癥兒童提供定制 AI 繪本服務(wù)的工具。它基于阿里自研 Modelscope-Agent 框架,調(diào)用了通義大模型的多項服務(wù),可實現(xiàn)從一句話故事梗概到完整有聲繪本的生成。上海美術(shù)電影制片廠免費授權(quán)了旗下經(jīng)典動畫形象供公益繪本使用?!巴x”APP 已經(jīng)限時上線以孫悟空和大耳朵圖圖為主角的 AI 繪本。
商湯科技發(fā)布日日新5.5大模型體系:
該大模型體系包括6000億參數(shù)基礎(chǔ)模型日日新5.5,性能提升30%;流式多模態(tài)交互模型日日新5o,是國內(nèi)首個所見即所得模型,可進行實時多模態(tài)交互和問答;日日新5.5Lite在端側(cè)模型進行升級,模型精度提升10%、首包延遲降低40%,推理效率提升15%。
王堅稱美國AI發(fā)展的電力瓶頸短板我國不存在,最不缺就是電:
中國工程院院士、阿里云創(chuàng)始人王堅表示,美國AI人工智能發(fā)展的瓶頸是電力,這對中國來說不是問題?!爸袊荒甑陌l(fā)電量是美國、日本、俄羅斯的總和還要多”,王堅說道。另外他提出一個應(yīng)用、模型、電力和算力的不等式,認為在此不等式下,目前從事人工智能的人還不用擔心瓶頸問題。
MiniMax創(chuàng)始人閆俊杰稱至少三年后才會出現(xiàn)“殺手級”AI應(yīng)用:
閆俊杰表示,雖然國內(nèi)很多公司正在迎頭趕上ChatGPT,但是目前模型的錯誤率在60%-70%的水平,遠不及GPT-4的30%-40%。類似于微信、抖音、今日頭條這種規(guī)模的“殺手級”AI超級應(yīng)用(Killer App),至少要到三年之后才能實現(xiàn)。
無問芯穹發(fā)布全球首個單任務(wù)千卡異構(gòu)芯片混合訓(xùn)練平臺,算力利用率達 97.6%:
無問芯穹聯(lián)合創(chuàng)始人兼 CEO 夏立雪發(fā)布無問芯穹大規(guī)模模型的異構(gòu)分布式混合訓(xùn)練系統(tǒng),稱千卡異構(gòu)混合訓(xùn)練集群算力利用率最高達到了 97.6%。夏立雪還宣布無問芯穹 Infini-AI 云平臺已集成大模型異構(gòu)千卡混訓(xùn)能力,是全球首個可進行單任務(wù)千卡規(guī)模異構(gòu)芯片混合訓(xùn)練的平臺,具備萬卡擴展性。
中國公司開始大量訂購NVIDIA H20芯片:
摩根士丹利報告,NVIDIA特供中國市場的人工智能芯片H20系列,開始吸引包括百度、阿里巴巴、騰訊和字節(jié)跳動在內(nèi)的中國科技巨頭的采購興趣。盡管H20在性能上不及英偉達的H100,其AI算力只有H100的不到15%,甚至部分性能不及Ascend 910B,但在國產(chǎn)AI芯片供應(yīng)不足的情況下,中國廠商的選擇顯得有些無奈。
百度李彥宏稱開源模型是智商稅,閉源模型更強大、推理成本更低:
李彥宏稱:“我覺得,開源其實是一種智商稅”,“當你理性地去想,大模型能夠帶來什么價值,以什么樣的成本帶來價值的時候,就會發(fā)現(xiàn),你永遠應(yīng)該選擇閉源模型。今天無論是 ChatGPT、還是文心一言等閉源模型,一定比開源模型更強大,推理成本更低。”
李彥宏還指出,當前AI領(lǐng)域存在一種不良風氣,即各個公司競相發(fā)布新一代大語言模型,宣稱自己的模型參數(shù)規(guī)模和訓(xùn)練數(shù)據(jù)量超越了GPT-4,但在實際應(yīng)用落地方面卻鮮有成熟方案。AI技術(shù)的發(fā)展不應(yīng)僅僅停留在跑分和刷榜上。今天一個震撼發(fā)布,明天一個史詩級更新,但實際應(yīng)用卻遲遲未見。只有將AI技術(shù)應(yīng)用于實際產(chǎn)業(yè)和場景,才能創(chuàng)造出真正的價值。
中國工程院院士高文稱今天的人工智能是低水平智能,有一點中水平的假象:
他認為,AI技術(shù)的智能水平可以劃分為低中高三階段。低水平智能,是對顯式知識的記憶和使用來表現(xiàn)智能,即所謂的記憶學(xué)習。中水平智能,是利用得到的少量顯式知識,可以類比推理得到相關(guān)隱式知識簇。能夠舉一反三,觸類旁通。高水平智能,是利用極少的線索,創(chuàng)造新知識和知識體系,例如牛頓力學(xué)和相對論。今天的人工智能,主要還是低水平智能,因為深度神經(jīng)網(wǎng)絡(luò)是使用數(shù)據(jù)訓(xùn)練出來的,是基于統(tǒng)計的模型,連知識都不能算,等到什么時候可解釋了,才能算知識?!按笳Z言模式是由不同種的知識涌現(xiàn),原則上還是低水平智能,有一點中水平的假象,相當于熟讀唐詩三百首,不會作詩也會吟,屬于熟能生巧的范疇?!?/p>
此外高文認為,AI技術(shù)需要完善理論基礎(chǔ)驗證,并實現(xiàn)模型的可解釋性;要嚴格控制人工智能的底層價值取向,實現(xiàn)技術(shù)的標準化;在應(yīng)用階段,需要預(yù)防人為造成的人工智能安全問題,對人工智能進行動機選擇。應(yīng)對強人工智能,必須加強國際合作。
阿里云創(chuàng)始人王堅院士稱GPT的潛力還沒有被完整地探索:
王堅認為,今天的AI有別于過去的AI,GPT的潛力事實上還沒有被完整地探索。此外他還談到,AI時代下一定會有新的大公司出現(xiàn),也一定會有大公司“浴火重生”。對于不同規(guī)模的企業(yè)來說,大企業(yè)一定會覺得AI是“工具的革命”;小企業(yè)一定會覺得這是“革命的工具”,“如果大企業(yè)也意識到這是革命的工具,那變化就來了”。
另外阿里云 CTO 周靖人宣布通義千問開源模型下載量增長 2 倍,突破 2000 萬次,阿里云百煉服務(wù)客戶數(shù)從 9 萬增長至 23 萬,漲幅超 150%。「到今天,通義千問已經(jīng)實現(xiàn)真正意義上的全尺寸、全模態(tài)開源,拉平了開源、閉源模型之間的差距?!?/p>
芯原創(chuàng)始人直言百模大戰(zhàn)就是“群模亂舞”,是在浪費電:
在中國RISC-V產(chǎn)業(yè)聯(lián)盟理事長、芯原微電子創(chuàng)始人戴偉民博士看來,當前AI領(lǐng)域的"百模大戰(zhàn)"現(xiàn)象更像是一種資源的浪費。這種"群模亂舞"的現(xiàn)象實際上并不經(jīng)濟。要實現(xiàn)超越人腦智能的AI,需要不斷擴大模型參數(shù)規(guī)模,這對計算力的需求呈指數(shù)級增長,將導(dǎo)致巨大的電力消耗。
他預(yù)測,到2028年,中國基礎(chǔ)大模型的數(shù)量將少于10個,更理想的狀態(tài)是5個。戴偉民還提到,目前全球有超過100款A(yù)I大模型,但這種模式并不可持續(xù),他認為應(yīng)該集中資源發(fā)展更高效、更環(huán)保的AI技術(shù),而不是盲目追求模型數(shù)量。此外,戴偉民還探討了生成式AI所需的算力芯片發(fā)展趨勢,他認為未來將有更多專用芯片出現(xiàn),挑戰(zhàn)現(xiàn)有的GPU/GPGPU架構(gòu)。
華為張平安稱中國 AI 發(fā)展離不開算力基礎(chǔ)設(shè)施的創(chuàng)新,必須摒棄“沒有最先進芯片就無法發(fā)展”的觀念:
張平安指出,華為創(chuàng)新的方向是將端側(cè)的 AI 算力需求通過光纖和無線網(wǎng)絡(luò)釋放到云上,通過端云協(xié)同獲得無縫的 AI 算力。通過云側(cè)的算力,讓端側(cè)既保持了豐富的功能,又極大地降低了功耗和對芯片的依賴。他強調(diào),中國的 AI 發(fā)展道路,追求的應(yīng)該是在行業(yè)領(lǐng)域構(gòu)筑大模型的全球領(lǐng)先地位。如果各行各業(yè)都積極擁抱 AI,積極地開放行業(yè)的業(yè)務(wù)場景,中國很有機會在 2B 領(lǐng)域構(gòu)筑起全球的領(lǐng)先優(yōu)勢。
更多國內(nèi)情報:
工信部透露中國算力規(guī)模位居全球第二:截至 5 月底,全國規(guī)劃具有高性能計算機集群的智算中心已達十余個,智能算力在算力總規(guī)模中的比重超過了30%。目前,我國已經(jīng)培育了 421 家國家級智能制造示范工廠,人工智能企業(yè)的數(shù)量也超過了 4500 家,并推動制定了 48 項智能制造相關(guān)的國際標準。
全球最大甲骨文“數(shù)據(jù)集”開源:“數(shù)字甲骨共創(chuàng)中心”正式開源全球最大的甲骨文多模態(tài)數(shù)據(jù)集,共包含一萬片甲骨的拓片、摹本,甲骨單字對應(yīng)位置、對應(yīng)字頭、對應(yīng)釋文以及辭例分組、釋讀順序等數(shù)據(jù)。所有研究者都能基于該數(shù)據(jù)集研發(fā)甲骨文檢測、識別、摹本生成、字形匹配和釋讀等算法,加速甲骨文研究智能化進程。
B站首次展出自研大語言模型:嗶哩嗶哩公布了多項自主研發(fā)的 AI 技術(shù)成果和 AIGC 多元創(chuàng)意,包括最新定制的 AI 語音聲庫、自研音視頻大模型必剪 Studio 以及自研 AI 動態(tài)漫技術(shù)等。
百度文心智能體平臺升級,向開發(fā)者免費開放文心大模型4.0:開發(fā)者在文心智能體平臺上制作智能體時,可靈活選擇文心大模型 3.5 或 4.0 版本。
AI羅永浩評10年前與王自如“約架”:有媒體向智譜的數(shù)字員工AI老羅提問還記得王自如嗎?AI老羅表示:“可別提了,讓我想起來的都是些不愉快的事,我們倆在直播辯論的時候,他那個所謂的客觀獨立第三方的評測,簡直讓人笑掉大牙?!薄拔铱墒菫榱苏胬砗驼x而戰(zhàn),他只會躲在數(shù)據(jù)后面,不敢正面回應(yīng),這種對手不提也罷?!?/p>
國內(nèi)首款鴻蒙人形機器人正在蔚來、亨通等工廠檢測驗證:“盤古大模型 + 夸父人形機器人”將在工業(yè)和家庭兩大場景同步推進應(yīng)用。
國際情報:
英偉達今年在華銷售額預(yù)計將達120億美元,發(fā)貨超100萬顆芯片:
芯片咨詢公司SemiAnalysis報告預(yù)估,今年英偉達有望在中國銷售價值約120億美元的人工智能芯片。黃仁勛曾表示,希望借助新的芯片使得英偉達在中國的業(yè)務(wù)實現(xiàn)最大化。英偉達有望在未來幾個月內(nèi)在中國交付超過100萬顆定制版H20芯片,這些芯片的設(shè)計不受美國對向中國客戶銷售人工智能處理器的限制。據(jù)悉,每顆H20芯片的價格在12000至13000美元之間。
消息稱黑客去年曾侵入OpenAI內(nèi)部系統(tǒng),部分AI設(shè)計細節(jié)被盜:
據(jù)悉,一名黑客去年曾成功“黑入”了OpenAI的內(nèi)部消息系統(tǒng),并竊取了有關(guān)人工智能技術(shù)和研究材料的敏感討論,但黑客并未進入托管人工智能源代碼的服務(wù)器。OpenAI高管在去年4月的全體員工大會上向員工和公司董事會通報了這一漏洞,但高管并未對外公開這一消息。
Meta AI 重磅發(fā)布,多標記預(yù)測模型現(xiàn)已開放研究:
Meta 在Hugging Face上發(fā)布了采用多標記預(yù)測方法的預(yù)訓(xùn)練模型,可能改變大型語言模型的開發(fā)和部署方式。這種新技術(shù)模型同時預(yù)測多個未來單詞,可能改善語言結(jié)構(gòu)和上下文理解,有望提高人工智能效率,加速人機協(xié)作編碼的趨勢。
破解ChatGPT驚人耗電!DeepMind新算法訓(xùn)練提效13倍,能耗暴降10倍:
DeepMind 研究團隊提出了一種名為 JEST(多模態(tài)對比學(xué)習與聯(lián)合示例選擇)的新算法,旨在加快 AI 訓(xùn)練過程并減少所需的計算資源和能耗。JEST 算法能夠以 13 倍更少的迭代次數(shù)和 10 倍更少的計算量,超越最先進的模型。這一發(fā)現(xiàn)揭示了數(shù)據(jù)篩選水平可以作為評判 Scaling Law 的一個新維度。JEST 算法通過從 “超級 batch” 中篩選出最具可學(xué)習性的 “子 batch”,實現(xiàn)了高效的數(shù)據(jù)管理和訓(xùn)練過程。實驗結(jié)果表明,JEST 方法在效率提升和性能優(yōu)化方面取得了顯著成效,尤其是在多模態(tài)學(xué)習加速和數(shù)據(jù)質(zhì)量引導(dǎo)方面。
解鎖動物語言?SuperAnimal這款A(yù)I神器,顛覆人與自然的關(guān)系:
SuperAnimal是一款開源AI模型,能自動識別和分析動物的運動行為,提供精確的姿態(tài)分析;該模型通過統(tǒng)一的預(yù)訓(xùn)練模型和關(guān)鍵點空間映射,減少人工標注需求,提高數(shù)據(jù)整合和模型泛化能力;SuperAnimal應(yīng)用于獸醫(yī)學(xué)、生物醫(yī)學(xué)研究和野生動物保護,使用高級模型架構(gòu)和獨特訓(xùn)練方法以提高性能和適應(yīng)性。
更多國際情報:
布局 AI 等市場,格芯收購泰戈爾科技氮化鎵技術(shù)和相關(guān)團隊:氮化鎵成為可持續(xù)高效電源管理(尤其是在數(shù)據(jù)中心)的關(guān)鍵解決方案。泰戈爾科技公司工程師團隊將加入格芯,進一步開發(fā)氮化鎵技術(shù)。
“高達”式鐵路機器人在日本大范圍推廣:主要設(shè)計用于修剪鐵軌上的樹枝,固定和噴漆列車上方電纜的金屬框架等等。
互聯(lián)網(wǎng)巨頭公司正合法利用用戶數(shù)據(jù)來訓(xùn)練其 AI 模型:多家硅谷科技公司,如谷歌、Meta、X、Snap 和 Zoom 在隱私政策和服務(wù)條款中,加入了使用用戶數(shù)據(jù)來訓(xùn)練 AI 模型的條款。
真實商戰(zhàn)?報告稱谷歌曾試圖禁止蘋果 Safari 瀏覽器用戶使用 AI 摘要功能:美國司法部調(diào)查谷歌在搜索行業(yè)的統(tǒng)治地位,涉及谷歌每年向蘋果支付超 200 億美元費用,以成為 iPhone 的默認搜索引擎。谷歌試圖增加 iPhone 用戶在在 Safari 瀏覽器以外的平臺上進行搜索的比例,目標是到 2030 年時達到 50%。為此曾考慮限制 AI 摘要功能,但最終決定不采取這一措施。
YouTube 測試“AI 音頻橡皮擦”:該工具使用 AI 算法來專門檢測和刪除相關(guān)歌曲,創(chuàng)作者可輕松移除受版權(quán)保護背景音樂,而不會影響包括對話或音效在內(nèi)的任何其他音頻。
Product Hunt 熱榜, Pygma
Pygma是一款A(yù)I驅(qū)動社交媒體管理助手,專為Instagram用戶和中小企業(yè)量身打造。這款智能工具通過深度分析用戶風格和受眾反應(yīng),在幾秒鐘內(nèi)生成定制化的帖子、故事和Reels內(nèi)容,大大簡化了社交媒體流程。
不僅提供內(nèi)容創(chuàng)作,還集成了智能編輯、排程發(fā)布等功能,真正實現(xiàn)一站式社媒管理。其獨特的AI生成器和編輯器,加上即將推出的目標受眾分析功能,使Pygma成為提升品牌形象和吸引目標受眾的強大工具。
?https://www.pygma.me/
GitHub Trending 熱榜,智能辦公AI助手AnythingLLM
獲 YC 投資,為企業(yè)構(gòu)建一站式內(nèi)部 Agent 和 RAG 應(yīng)用解決方案的 Mintplex Labs 開源其跨端應(yīng)用 anything-llm是一款多功能AI商業(yè)智能工具,支持多種大型語言模型和操作系統(tǒng)。該工具提供一鍵安裝的桌面應(yīng)用程序,強調(diào)用戶隱私保護,支持自定義模型和多種文檔格式處理。AnythingLLM適用于個人和組織用戶,可在離線環(huán)境下運行。
該工具提供全面的開發(fā)者API和外觀定制選項,支持企業(yè)級和開源模型。AnythingLLM的官方網(wǎng)站提供了詳細的產(chǎn)品信息,包括定價、使用方法和與其他類似工具的比較。這些特性使AnythingLLM成為一個全面的AI商業(yè)智能解決方案。
?https://github.com/Mintplex-Labs/anything-llm
開發(fā)者推薦
1.AI模型評測:Artificial Analysis
Artificial Analysis平臺專注于對各大LLM API提供商進行全面基準測試,不僅評估模型輸出質(zhì)量,還重點關(guān)注響應(yīng)速度。通過整合LMSYS Chatbot Arena、Hugging Face排行榜和斯坦福HELM項目等多方數(shù)據(jù),Artificial Analysis為開發(fā)者提供了更全面、更實用的模型選擇參考。
這一創(chuàng)新approach填補了現(xiàn)有AI評測體系的空白,特別適合對令牌生成速度要求較高的應(yīng)用場景。業(yè)內(nèi)專家認為,Artificial Analysis的出現(xiàn)將激勵A(yù)I服務(wù)提供商不斷優(yōu)化模型性能,推動整個行業(yè)向更高效、更實用的方向發(fā)展。對開發(fā)者而言,這個網(wǎng)站的評測結(jié)果將幫助他們更精準地選擇適合自身需求的AI模型,從而提升應(yīng)用效果和用戶體驗。
?https://artificialanalysis.ai2.KREA免費生成和增強圖像與視頻
KREA 旨在通過強大的人工智能技術(shù),讓用戶能夠直觀地生成和增強圖像與視頻。該平臺提供了多種功能,包括實時視頻生成、圖像增強、視頻增強以及免費訪問的 AI 視頻生成。此外,KREA 還推出了一系列迷你應(yīng)用程序,如 “Logo Illusions” 和 “AI Patterns”,以及舊版應(yīng)用程序,如 “AI Training” 和 “Canvas Project Studio”。用戶需要在瀏覽器中啟用 JavaScript 以正確查看頁面。
?https://www.krea.ai/home
3.AI視頻創(chuàng)作一條龍,達摩院“尋光”突破可控編輯難題:
尋光定位為PUGC一站式AI視頻創(chuàng)作平臺,能夠?qū)崿F(xiàn)視頻創(chuàng)作的全流程 AI 輔助,包括劇本創(chuàng)作、分鏡圖設(shè)計、視頻素材編輯等。讓視頻編輯像操作PPT一樣簡單,主要用于輔助創(chuàng)作劇本、分鏡圖,支持對素材進行AI編輯,包括人物控制、場景控制、運鏡控制、目標新增/消除/修改等10多種功能,解決了 AI 視頻內(nèi)容的可控編輯問題。
?https://xunguang.damo-vision.com/
前沿技術(shù)
1.LivePortrait:AI 肖像動畫技術(shù)
快手科技團隊推出 LivePortrait,這是一種基于隱式關(guān)鍵點框架的高效肖像動畫技術(shù)。它能從單張源圖像和驅(qū)動視頻生成生動的視頻,展現(xiàn)出優(yōu)秀的泛化能力、可控性和效率。
研究者通過擴大訓(xùn)練數(shù)據(jù)集、采用混合訓(xùn)練策略、升級網(wǎng)絡(luò)架構(gòu)等方法提升了生成質(zhì)量。LivePortrait 在 RTX 4090 GPU 上每幀僅需 12.8 毫秒,效果媲美擴散模型方法。該項目的推理代碼和模型已開源。
?https://liveportrait.github.io/
2.通義語音團隊開源了語音基座大模型,SenseVoice和CosyVoice:
SenseVoice多語言音頻理解大模型:多語言語音識別在中文和粵語上相比Whisper相對提升+50%,推理速度快15倍,并且支持SOTA的情緒識別和音頻事件檢測。
CosyVoice多語言音頻生成大模型:通過超過17萬小時的多語言音頻數(shù)據(jù)訓(xùn)練,支持多語言、音色和情感控制,CosyVoice則在多語言語音生成、零樣本語音生成、跨語言聲音合成和指令執(zhí)行能力方面表現(xiàn)卓越。
?https://fun-audio-llm.github.io/
3.斯坦福大學(xué)發(fā)布OccFusion,可完整渲染出被遮擋的人體:
OccFusion 是一種基于高效 3D 高斯分片和預(yù)訓(xùn)練 2D 擴散模型的人體渲染技術(shù),它能在人體被部分遮擋的情況下渲染出完整的形態(tài)。OccFusion 在 ZJU-MoCap 和 OcMotion 序列上進行了評估,表現(xiàn)出色,達到了遮擋人體渲染的最新水平。整個訓(xùn)練過程僅需在單個 Titan RTX GPU 上花費 10 分鐘。
?https://cs.stanford.edu/~xtiange/projects/occfusion/
4.浦語靈筆 IXC-2.5 展現(xiàn)多模態(tài)實力
上海人工智能實驗室最新推出的浦語靈筆 IXC-2.5 模型引發(fā)業(yè)界關(guān)注。這款基于7B LLM的多模態(tài)大模型在圖像和視頻理解方面表現(xiàn)出色,據(jù)稱能力可與GPT-4V相媲美。其特色功能包括高分辨率圖像理解、精細視頻分析和多輪多圖像對話。該模型還拓展了實用領(lǐng)域,能夠自動生成網(wǎng)頁和創(chuàng)作高質(zhì)量文章,利用逐步推理方法確保長文本內(nèi)容的邏輯性和連貫性。浦語靈筆 IXC-2.5 的推出為人工智能在多模態(tài)應(yīng)用領(lǐng)域開辟了新的可能性。
?https://huggingface.co/spaces/Willow123/InternLM-XComposer
5.推薦系統(tǒng)新范式:DiffMM開啟多模態(tài)精準推薦時代
港大和騰訊研究人員聯(lián)手打造的DiffMM多模態(tài)推薦系統(tǒng)引發(fā)業(yè)界關(guān)注。這一創(chuàng)新模型通過構(gòu)建包含用戶和視頻多元信息的圖譜,并結(jié)合圖擴散技術(shù)和對比學(xué)習方法,實現(xiàn)了對用戶喜好的深度理解。在三個公共數(shù)據(jù)集的實驗中,DiffMM展現(xiàn)出卓越性能,超越現(xiàn)有基線模型。該項目已開源,為推薦系統(tǒng)研究提供了新思路,有望在短視頻等領(lǐng)域帶來更精準的個性化推薦體驗。
?https://github.com/HKUDS/DiffMM
6.快手AI繪畫新里程碑:Kolors模型雙語圖像生成
快手科技旗下Kolors團隊近日推出了一款突破性的文本到圖像生成模型Kolors。這一基于潛流擴散技術(shù)的大規(guī)模模型在數(shù)十億文本-圖像對上進行訓(xùn)練,在視覺質(zhì)量、語義準確性和中英文字體渲染方面均展現(xiàn)出卓越表現(xiàn)。Kolors支持中英雙語輸入,特別在生成中文內(nèi)容時表現(xiàn)出色。通過人類專家評估和機器評測,Kolors在視覺吸引力和整體滿意度方面均領(lǐng)先于現(xiàn)有開源和閉源模型。
?https://github.com/Kwai-Kolors/Kolors
熱議話題
AI應(yīng)用現(xiàn)狀:期待與現(xiàn)實的差距
Retool 2024年上半年AI狀況報告指出AI應(yīng)用的真實情況:
1.AI采用,進展緩慢但穩(wěn)定:AI在企業(yè)中的實際應(yīng)用進展并不如想象中迅速。報告顯示,僅有約30%的受訪者認為他們的公司在AI采用方面處于"運行"或"飛行"階段,這一比例甚至較2023年有所下降。
2.AI影響尚未達到變革性水平:盡管AI已在多個領(lǐng)域得到應(yīng)用,但影響力似乎被夸大了。受訪者給出的平均影響評分僅為6.7/10,遠未達到"變革性"的程度。
3.投資態(tài)度,謹慎樂觀:盡管AI的實際影響有限,但大多數(shù)企業(yè)并不認為他們在AI上投資過度。相反,42%的受訪者認為投資"恰到好處",40.5%甚至認為投資"不夠"。企業(yè)對AI的長期潛力持樂觀態(tài)度,愿意繼續(xù)投入資源。
4.AI應(yīng)用場景以內(nèi)部為主,外部謹慎:企業(yè)更傾向于在內(nèi)部應(yīng)用AI技術(shù)。最常見的用例包括編寫代碼或查詢(42.1%)、知識庫問答(36.4%)和支持聊天機器人(33.9%)。相比之下,面向客戶的AI應(yīng)用相對較少。這種傾向可能源于企業(yè)希望在內(nèi)部環(huán)境中先行試驗和完善AI應(yīng)用,以降低風險。
5.OpenAI獨占鰲頭,新星嶄露頭角:在AI技術(shù)棧方面,OpenAI的模型仍然主導(dǎo)市場,GPT-4和GPT-3.5合計占據(jù)70%的份額。不過像Anthropic的Claude 3和Mistral這樣的新興模型正在嶄露頭角,AI技術(shù)生態(tài)趨向多元化。
6.潛力巨大,道路漫長:業(yè)內(nèi)人士對AI未來發(fā)展保持樂觀。總的來說,AI技術(shù)的發(fā)展正處于一個關(guān)鍵的轉(zhuǎn)折點。雖然其影響力尚未達到預(yù)期,但企業(yè)和開發(fā)者正在積極探索和實踐,為未來的突破奠定基礎(chǔ)。
?https://retool.com/blog/state-of-ai-h1-2024
敬請期待明日的最新動態(tài)!
AI情報局征集情報合伙人,匯集獨家價值線索!如果您可以提供有關(guān)AI最新成果&行業(yè)內(nèi)幕&獨特產(chǎn)品,請?zhí)砑舆\營微信號:AIyanxishe2備注行業(yè)崗位。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。