0
本文作者: 我在思考中 | 2024-07-08 11:01 |
融資快報(bào)
無限光年完成新一輪融資:無限光年的核心產(chǎn)品是可信大模型,這是漆遠(yuǎn)認(rèn)為通往人工智能通用智能的道路??尚糯竽P徒Y(jié)合了大語言模型與符號(hào)推理,旨在解決大模型的幻覺問題和遺忘性災(zāi)難,提高模型的可信度和可解釋性。無限光年已完成多輪融資,并與金融和醫(yī)療行業(yè)的頭部企業(yè)合作,打造了針對(duì)特定行業(yè)的精專大模型。此次投資人包括阿里云、啟明創(chuàng)投等頭部投資機(jī)構(gòu)。創(chuàng)始人漆遠(yuǎn)從螞蟻集團(tuán)副總裁任上離職后,漆遠(yuǎn)先是重返學(xué)界,在復(fù)旦擔(dān)任教職,而后又產(chǎn)學(xué)研并行地創(chuàng)立了大模型公司無限光年。
Benchmark募資4.25億美元投向AI新時(shí)代:據(jù)《福布斯》獲得的一封投資者信顯示,風(fēng)險(xiǎn)投資公司 Benchmark 正在為其第十一期基金募集 4.25 億美元。新基金將被命名為 "Benchmark 1",據(jù)悉,該公司的所有合伙人預(yù)計(jì)都會(huì)在其典型的專注領(lǐng)域(如消費(fèi)科技、云計(jì)算或加密貨幣)內(nèi)尋找人工智能公司。
軟銀宣布4億英鎊收購(gòu)AI芯片公司Graphcore:日本軟銀宣布將以4億英鎊收購(gòu)陷入困境的人工智能初創(chuàng)公司 Graphcore,該交易還需要獲得英國(guó)政府的審查批準(zhǔn)才能生效。Graphcore成立于2016年,生產(chǎn)稱為智能處理器單元的AI芯片,旨在挑戰(zhàn)英偉達(dá)。由于英偉達(dá)的設(shè)備需求量很大,投資者們紛紛向這家初創(chuàng)公司注入資金,尋找替代英偉達(dá)的可行方案。2020年,Graphcore以28億美元的估值籌集2.22億美元,使其成為英國(guó)最有前途的初創(chuàng)公司之一。
EvolutionaryScale獲超1.42億美元種子輪融資: 該公司創(chuàng)始團(tuán)隊(duì)的八位成員全都來自于Meta的FAIR部門 。去年八月Meta官宣旗下的蛋白質(zhì)折疊團(tuán)隊(duì)Meta-FAIR解散。EvolutionaryScale旨在通過開放、安全的研究方式,來指導(dǎo)蛋白質(zhì)設(shè)計(jì)領(lǐng)域的人工智能技術(shù)開發(fā),團(tuán)隊(duì)開發(fā)用于創(chuàng)造新型蛋白質(zhì)和其他生物系統(tǒng)的大型語言模型ESM,已迭代到ESM-3。本次融資由Nat Friedman和Daniel Gross以及Lux Capital領(lǐng)投,亞馬遜、NVentures和天使投資人參投。
DNEG集團(tuán)獲2億美元戰(zhàn)略投資:DNEG是好萊塢視效技術(shù)提供商,曾參與多部知名好萊塢電影的制作,如“狂怒”、“銀翼殺手2049”和“星際穿越”。這一投資將推動(dòng)DNEG集團(tuán)新成立的Brahma,開發(fā)人工智能驅(qū)動(dòng)的CGI工具,以簡(jiǎn)化視覺效果的創(chuàng)作過程。Brahma的AI創(chuàng)作者解決方案將利用超過25年的VFX數(shù)據(jù)生成逼真的視覺效果。該筆融資來自United Al Saqer Group,將使DNEG集團(tuán)的估值超過20億美元。
焱融科技完成雙輪融資:焱融科技核心產(chǎn)品YRCloudFile 高性能文件存儲(chǔ)系統(tǒng),在 AI 和高性能計(jì)算場(chǎng)景中嶄露頭角。完成 B 輪和 B+ 輪融資,累計(jì)融資額近 2 億元人民幣。兩輪融資分別由豐年資本和北京股權(quán)領(lǐng)投,老股東耀途資本、卓源亞洲、信雅達(dá)等知名投資機(jī)構(gòu)持續(xù)跟投。
大道智創(chuàng)完成500萬人民幣融資:大道智創(chuàng)是一家專注于研發(fā)安保機(jī)器人的公司,主要研發(fā)和銷售巡邏機(jī)器人、安保機(jī)器人等商用服務(wù)型機(jī)器人,以視覺定位為主,配合多傳感器融合,在復(fù)雜環(huán)境下實(shí)現(xiàn)全自主定位巡航,目前已推出了一代產(chǎn)品“e巡 ”機(jī)器警長(zhǎng)。投資方為中關(guān)村科技租賃。
Altrove AI獲400萬美元種子融資:Altrove使用AI生成無機(jī)材料的潛在配方,特別是稀土元素。融資由Contrarian Ventures領(lǐng)投。
Phaidra獲1200萬美元融資:該公司的系統(tǒng)從設(shè)施內(nèi)的數(shù)千個(gè)傳感器收集數(shù)據(jù),并使用人工智能模型就如何更有效地管理和冷卻設(shè)備做出實(shí)時(shí)決策。融資由Index Ventures 領(lǐng)投。
OpenLedger 籌集了 800 萬美元的種子資金:用于 AI 模型開發(fā)的去中心化數(shù)據(jù)基礎(chǔ)設(shè)施
(歡迎添加微信AIyanxishe2,了解更多AIGC、融資情況,與志同道合的朋友一同暢聊時(shí)新AI產(chǎn)品)
國(guó)內(nèi)情報(bào):
2024 世界人工智能大會(huì)線下參觀人數(shù)創(chuàng)歷史新高,預(yù)計(jì)總投資額超 400 億元:
大會(huì)線下參觀人數(shù)突破 30 萬人次,全網(wǎng)流量突破 10 億,比上屆增長(zhǎng)了 90%,據(jù)悉,本次大會(huì)對(duì)接 132 個(gè)采購(gòu)團(tuán)組,形成了 126 個(gè)項(xiàng)目采購(gòu)需求,預(yù)計(jì)意向采購(gòu)金額達(dá) 150 億元,推動(dòng) 24 個(gè)重大產(chǎn)業(yè)項(xiàng)目的簽約,預(yù)計(jì)總投資額超過 400 億元。本次大會(huì)的展覽面積超過 5.2 萬平方米,500 余家知名企業(yè)、超過 1500 項(xiàng)展品參展,50 余款新品首發(fā)首秀,均創(chuàng)歷史新高。
快手可靈 AI 網(wǎng)頁端上線,文生圖大模型“可圖”開源:
快手可靈 AI 網(wǎng)頁端正式上線,所有功能限時(shí)免費(fèi)。“文生視頻”開放最長(zhǎng) 10 秒生成能力,“圖生視頻”新增運(yùn)鏡控制、自定義首尾幀等功能。據(jù)悉,已有超過50萬用戶申請(qǐng)可靈的內(nèi)測(cè)資格,視頻生成數(shù)量達(dá)700萬。此外,文生圖大模型“可圖”開源,已上線網(wǎng)頁版和微信小程序,支持文生圖和圖生圖兩類功能,可用于 AI 創(chuàng)作圖像以及 AI 形象定制。
科大訊飛大模型新增投入超 6.5 億元、AI 學(xué)習(xí)機(jī)發(fā)布預(yù)售11699 元:
科大訊飛發(fā)布 2024 上半年業(yè)績(jī)預(yù)告,預(yù)計(jì)凈虧損 3.8 億元至 4.6 億元,上年同期盈利 7357.2 萬元,同比下降 725.24%~616.50%??拼笥嶏w表示,公司在全力加大“訊飛星火大模型”研發(fā)投入的同時(shí),加快了大模型的落地推廣力度。2024 年上半年?duì)I收、毛利預(yù)計(jì)增長(zhǎng) 15%-20%,且毛利增速高于收入增速。
此外科大訊飛近期還發(fā)布了 AI 學(xué)習(xí)機(jī)新品 T30 Ultra,內(nèi)置星火大模型,屏幕尺寸為 14.7 英寸,12GB+1TB 版本到手 11699 元,將于 7 月 20 日開售。
智譜開源代碼生成大模型 CodeGeeX 第四代,號(hào)稱百億以下規(guī)模性能最強(qiáng):
該產(chǎn)品集成了代碼補(bǔ)全和生成、代碼問答、代碼解釋器、工具調(diào)用、聯(lián)網(wǎng)搜索、項(xiàng)目級(jí)代碼問答等功能,支持超過 300 種編程語言,并且能夠處理 128K 上下文,這使得其能夠更好地理解和處理復(fù)雜的代碼文件。CodeGeeX4-ALL-9B 在 Berkeley Function Calling Leaderboard 上的測(cè)試表現(xiàn)超過 90% 的成功率,被譽(yù)為目前唯一能實(shí)現(xiàn) Function Call 的代碼大模型。
騰訊發(fā)布大模型時(shí)代的AI十大趨勢(shì),走進(jìn)“機(jī)器外腦”時(shí)代:
騰訊研究院、上海交通大學(xué)、騰訊優(yōu)圖實(shí)驗(yàn)室、騰訊云智能聯(lián)合發(fā)布了《2024大模型十大趨勢(shì)——走進(jìn)“機(jī)器外腦”時(shí)代》報(bào)告。報(bào)告指出,我們正在進(jìn)入一個(gè)“機(jī)器外腦”時(shí)代。海量GPU和新一代大模型的組合起來,使人工智能在三個(gè)方向上有了實(shí)質(zhì)性的飛躍:推理分析、創(chuàng)意生成和情緒智能。這意味著AI第一次擁有了類人的交互能能力,新一代AI正在成為人類的“機(jī)器外腦”,提供智力的外掛。
上海AI lab開源超強(qiáng)多模態(tài)LLM InternLM-XComposer-2.5:
上海 AI 實(shí)驗(yàn)室聯(lián)合香港中文大學(xué)、商湯科技集團(tuán)以及清華大學(xué)研發(fā)了 IXC-2.5 模型。模型具備長(zhǎng)上下文處理能力,能夠處理超長(zhǎng)的文本和圖像輸入,同時(shí)在視覺能力上有特殊優(yōu)勢(shì),包括超高分辨率的圖像理解和細(xì)粒度的視頻理解。模型架構(gòu)包括輕量級(jí)的視覺編碼器、大型語言模型,以及部分 LoRA 對(duì)齊技術(shù)。在 28 個(gè)基準(zhǔn)測(cè)試中,IXC-2.5 在 16 項(xiàng)測(cè)試中超過了現(xiàn)有的開源模型,其余 16 項(xiàng)測(cè)試中的表現(xiàn)也接近或超過了 GPT-4V 和 Gemini Pro。
支付寶發(fā)布多模態(tài)醫(yī)療大模型,支持千億級(jí)視覺識(shí)別:
支付寶多模態(tài)醫(yī)療大模型成為國(guó)內(nèi)首批多模態(tài)醫(yī)療大模型之一?;谖浵伆凫`的多模態(tài)能力,模型可實(shí)現(xiàn)直接理解并訓(xùn)練音頻、視頻、圖、文等多模態(tài)數(shù)據(jù),使其更像人一樣感知和互動(dòng),能“看”會(huì)“聽”、能“說”會(huì)“畫”,支持千億級(jí)別參數(shù)醫(yī)療視覺識(shí)別。據(jù)悉,螞蟻百靈大模型已具備原生多模態(tài)能力,可以直接理解并訓(xùn)練音頻、視頻、圖、文等多模態(tài)數(shù)據(jù)。
金山辦公發(fā)布 WPS AI 2.0,新增 4 個(gè) AI 辦公助手,政務(wù)自研模型首次亮相:
WPS AI 2.0包含 WPS AI 辦公助手、WPS AI 政務(wù)版等應(yīng)用,并首次公開了 13B 級(jí)別的政務(wù)自研模型,金山政務(wù)辦公模型 1.0。為個(gè)人用戶新增了 4 個(gè) AI 辦公助手,分別為 AI 寫作助手、AI 閱讀助手、AI 數(shù)據(jù)助手、AI 設(shè)計(jì)助手。此次發(fā)布的金山政務(wù)辦公模型 1.0 擅長(zhǎng)公文寫作,實(shí)現(xiàn)無口語化描述且按照公文風(fēng)輸出,輸出的內(nèi)容自帶公文格式,模型了解國(guó)家相關(guān)政策,回答均基于可靠依據(jù)。
阿里“通義”APP上線特殊AI繪本工具“追星星的AI”:
這是一款為孤獨(dú)癥兒童提供定制 AI 繪本服務(wù)的工具。它基于阿里自研 Modelscope-Agent 框架,調(diào)用了通義大模型的多項(xiàng)服務(wù),可實(shí)現(xiàn)從一句話故事梗概到完整有聲繪本的生成。上海美術(shù)電影制片廠免費(fèi)授權(quán)了旗下經(jīng)典動(dòng)畫形象供公益繪本使用?!巴x”APP 已經(jīng)限時(shí)上線以孫悟空和大耳朵圖圖為主角的 AI 繪本。
商湯科技發(fā)布日日新5.5大模型體系:
該大模型體系包括6000億參數(shù)基礎(chǔ)模型日日新5.5,性能提升30%;流式多模態(tài)交互模型日日新5o,是國(guó)內(nèi)首個(gè)所見即所得模型,可進(jìn)行實(shí)時(shí)多模態(tài)交互和問答;日日新5.5Lite在端側(cè)模型進(jìn)行升級(jí),模型精度提升10%、首包延遲降低40%,推理效率提升15%。
王堅(jiān)稱美國(guó)AI發(fā)展的電力瓶頸短板我國(guó)不存在,最不缺就是電:
中國(guó)工程院院士、阿里云創(chuàng)始人王堅(jiān)表示,美國(guó)AI人工智能發(fā)展的瓶頸是電力,這對(duì)中國(guó)來說不是問題。“中國(guó)一年的發(fā)電量是美國(guó)、日本、俄羅斯的總和還要多”,王堅(jiān)說道。另外他提出一個(gè)應(yīng)用、模型、電力和算力的不等式,認(rèn)為在此不等式下,目前從事人工智能的人還不用擔(dān)心瓶頸問題。
MiniMax創(chuàng)始人閆俊杰稱至少三年后才會(huì)出現(xiàn)“殺手級(jí)”AI應(yīng)用:
閆俊杰表示,雖然國(guó)內(nèi)很多公司正在迎頭趕上ChatGPT,但是目前模型的錯(cuò)誤率在60%-70%的水平,遠(yuǎn)不及GPT-4的30%-40%。類似于微信、抖音、今日頭條這種規(guī)模的“殺手級(jí)”AI超級(jí)應(yīng)用(Killer App),至少要到三年之后才能實(shí)現(xiàn)。
無問芯穹發(fā)布全球首個(gè)單任務(wù)千卡異構(gòu)芯片混合訓(xùn)練平臺(tái),算力利用率達(dá) 97.6%:
無問芯穹聯(lián)合創(chuàng)始人兼 CEO 夏立雪發(fā)布無問芯穹大規(guī)模模型的異構(gòu)分布式混合訓(xùn)練系統(tǒng),稱千卡異構(gòu)混合訓(xùn)練集群算力利用率最高達(dá)到了 97.6%。夏立雪還宣布無問芯穹 Infini-AI 云平臺(tái)已集成大模型異構(gòu)千卡混訓(xùn)能力,是全球首個(gè)可進(jìn)行單任務(wù)千卡規(guī)模異構(gòu)芯片混合訓(xùn)練的平臺(tái),具備萬卡擴(kuò)展性。
中國(guó)公司開始大量訂購(gòu)NVIDIA H20芯片:
摩根士丹利報(bào)告,NVIDIA特供中國(guó)市場(chǎng)的人工智能芯片H20系列,開始吸引包括百度、阿里巴巴、騰訊和字節(jié)跳動(dòng)在內(nèi)的中國(guó)科技巨頭的采購(gòu)興趣。盡管H20在性能上不及英偉達(dá)的H100,其AI算力只有H100的不到15%,甚至部分性能不及Ascend 910B,但在國(guó)產(chǎn)AI芯片供應(yīng)不足的情況下,中國(guó)廠商的選擇顯得有些無奈。
百度李彥宏稱開源模型是智商稅,閉源模型更強(qiáng)大、推理成本更低:
李彥宏稱:“我覺得,開源其實(shí)是一種智商稅”,“當(dāng)你理性地去想,大模型能夠帶來什么價(jià)值,以什么樣的成本帶來價(jià)值的時(shí)候,就會(huì)發(fā)現(xiàn),你永遠(yuǎn)應(yīng)該選擇閉源模型。今天無論是 ChatGPT、還是文心一言等閉源模型,一定比開源模型更強(qiáng)大,推理成本更低?!?/p>
李彥宏還指出,當(dāng)前AI領(lǐng)域存在一種不良風(fēng)氣,即各個(gè)公司競(jìng)相發(fā)布新一代大語言模型,宣稱自己的模型參數(shù)規(guī)模和訓(xùn)練數(shù)據(jù)量超越了GPT-4,但在實(shí)際應(yīng)用落地方面卻鮮有成熟方案。AI技術(shù)的發(fā)展不應(yīng)僅僅停留在跑分和刷榜上。今天一個(gè)震撼發(fā)布,明天一個(gè)史詩(shī)級(jí)更新,但實(shí)際應(yīng)用卻遲遲未見。只有將AI技術(shù)應(yīng)用于實(shí)際產(chǎn)業(yè)和場(chǎng)景,才能創(chuàng)造出真正的價(jià)值。
中國(guó)工程院院士高文稱今天的人工智能是低水平智能,有一點(diǎn)中水平的假象:
他認(rèn)為,AI技術(shù)的智能水平可以劃分為低中高三階段。低水平智能,是對(duì)顯式知識(shí)的記憶和使用來表現(xiàn)智能,即所謂的記憶學(xué)習(xí)。中水平智能,是利用得到的少量顯式知識(shí),可以類比推理得到相關(guān)隱式知識(shí)簇。能夠舉一反三,觸類旁通。高水平智能,是利用極少的線索,創(chuàng)造新知識(shí)和知識(shí)體系,例如牛頓力學(xué)和相對(duì)論。今天的人工智能,主要還是低水平智能,因?yàn)樯疃壬窠?jīng)網(wǎng)絡(luò)是使用數(shù)據(jù)訓(xùn)練出來的,是基于統(tǒng)計(jì)的模型,連知識(shí)都不能算,等到什么時(shí)候可解釋了,才能算知識(shí)?!按笳Z言模式是由不同種的知識(shí)涌現(xiàn),原則上還是低水平智能,有一點(diǎn)中水平的假象,相當(dāng)于熟讀唐詩(shī)三百首,不會(huì)作詩(shī)也會(huì)吟,屬于熟能生巧的范疇?!?/p>
此外高文認(rèn)為,AI技術(shù)需要完善理論基礎(chǔ)驗(yàn)證,并實(shí)現(xiàn)模型的可解釋性;要嚴(yán)格控制人工智能的底層價(jià)值取向,實(shí)現(xiàn)技術(shù)的標(biāo)準(zhǔn)化;在應(yīng)用階段,需要預(yù)防人為造成的人工智能安全問題,對(duì)人工智能進(jìn)行動(dòng)機(jī)選擇。應(yīng)對(duì)強(qiáng)人工智能,必須加強(qiáng)國(guó)際合作。
阿里云創(chuàng)始人王堅(jiān)院士稱GPT的潛力還沒有被完整地探索:
王堅(jiān)認(rèn)為,今天的AI有別于過去的AI,GPT的潛力事實(shí)上還沒有被完整地探索。此外他還談到,AI時(shí)代下一定會(huì)有新的大公司出現(xiàn),也一定會(huì)有大公司“浴火重生”。對(duì)于不同規(guī)模的企業(yè)來說,大企業(yè)一定會(huì)覺得AI是“工具的革命”;小企業(yè)一定會(huì)覺得這是“革命的工具”,“如果大企業(yè)也意識(shí)到這是革命的工具,那變化就來了”。
另外阿里云 CTO 周靖人宣布通義千問開源模型下載量增長(zhǎng) 2 倍,突破 2000 萬次,阿里云百煉服務(wù)客戶數(shù)從 9 萬增長(zhǎng)至 23 萬,漲幅超 150%?!傅浇裉?,通義千問已經(jīng)實(shí)現(xiàn)真正意義上的全尺寸、全模態(tài)開源,拉平了開源、閉源模型之間的差距?!?/p>
芯原創(chuàng)始人直言百模大戰(zhàn)就是“群模亂舞”,是在浪費(fèi)電:
在中國(guó)RISC-V產(chǎn)業(yè)聯(lián)盟理事長(zhǎng)、芯原微電子創(chuàng)始人戴偉民博士看來,當(dāng)前AI領(lǐng)域的"百模大戰(zhàn)"現(xiàn)象更像是一種資源的浪費(fèi)。這種"群模亂舞"的現(xiàn)象實(shí)際上并不經(jīng)濟(jì)。要實(shí)現(xiàn)超越人腦智能的AI,需要不斷擴(kuò)大模型參數(shù)規(guī)模,這對(duì)計(jì)算力的需求呈指數(shù)級(jí)增長(zhǎng),將導(dǎo)致巨大的電力消耗。
他預(yù)測(cè),到2028年,中國(guó)基礎(chǔ)大模型的數(shù)量將少于10個(gè),更理想的狀態(tài)是5個(gè)。戴偉民還提到,目前全球有超過100款A(yù)I大模型,但這種模式并不可持續(xù),他認(rèn)為應(yīng)該集中資源發(fā)展更高效、更環(huán)保的AI技術(shù),而不是盲目追求模型數(shù)量。此外,戴偉民還探討了生成式AI所需的算力芯片發(fā)展趨勢(shì),他認(rèn)為未來將有更多專用芯片出現(xiàn),挑戰(zhàn)現(xiàn)有的GPU/GPGPU架構(gòu)。
華為張平安稱中國(guó) AI 發(fā)展離不開算力基礎(chǔ)設(shè)施的創(chuàng)新,必須摒棄“沒有最先進(jìn)芯片就無法發(fā)展”的觀念:
張平安指出,華為創(chuàng)新的方向是將端側(cè)的 AI 算力需求通過光纖和無線網(wǎng)絡(luò)釋放到云上,通過端云協(xié)同獲得無縫的 AI 算力。通過云側(cè)的算力,讓端側(cè)既保持了豐富的功能,又極大地降低了功耗和對(duì)芯片的依賴。他強(qiáng)調(diào),中國(guó)的 AI 發(fā)展道路,追求的應(yīng)該是在行業(yè)領(lǐng)域構(gòu)筑大模型的全球領(lǐng)先地位。如果各行各業(yè)都積極擁抱 AI,積極地開放行業(yè)的業(yè)務(wù)場(chǎng)景,中國(guó)很有機(jī)會(huì)在 2B 領(lǐng)域構(gòu)筑起全球的領(lǐng)先優(yōu)勢(shì)。
更多國(guó)內(nèi)情報(bào):
工信部透露中國(guó)算力規(guī)模位居全球第二:截至 5 月底,全國(guó)規(guī)劃具有高性能計(jì)算機(jī)集群的智算中心已達(dá)十余個(gè),智能算力在算力總規(guī)模中的比重超過了30%。目前,我國(guó)已經(jīng)培育了 421 家國(guó)家級(jí)智能制造示范工廠,人工智能企業(yè)的數(shù)量也超過了 4500 家,并推動(dòng)制定了 48 項(xiàng)智能制造相關(guān)的國(guó)際標(biāo)準(zhǔn)。
全球最大甲骨文“數(shù)據(jù)集”開源:“數(shù)字甲骨共創(chuàng)中心”正式開源全球最大的甲骨文多模態(tài)數(shù)據(jù)集,共包含一萬片甲骨的拓片、摹本,甲骨單字對(duì)應(yīng)位置、對(duì)應(yīng)字頭、對(duì)應(yīng)釋文以及辭例分組、釋讀順序等數(shù)據(jù)。所有研究者都能基于該數(shù)據(jù)集研發(fā)甲骨文檢測(cè)、識(shí)別、摹本生成、字形匹配和釋讀等算法,加速甲骨文研究智能化進(jìn)程。
B站首次展出自研大語言模型:嗶哩嗶哩公布了多項(xiàng)自主研發(fā)的 AI 技術(shù)成果和 AIGC 多元?jiǎng)?chuàng)意,包括最新定制的 AI 語音聲庫(kù)、自研音視頻大模型必剪 Studio 以及自研 AI 動(dòng)態(tài)漫技術(shù)等。
百度文心智能體平臺(tái)升級(jí),向開發(fā)者免費(fèi)開放文心大模型4.0:開發(fā)者在文心智能體平臺(tái)上制作智能體時(shí),可靈活選擇文心大模型 3.5 或 4.0 版本。
AI羅永浩評(píng)10年前與王自如“約架”:有媒體向智譜的數(shù)字員工AI老羅提問還記得王自如嗎?AI老羅表示:“可別提了,讓我想起來的都是些不愉快的事,我們倆在直播辯論的時(shí)候,他那個(gè)所謂的客觀獨(dú)立第三方的評(píng)測(cè),簡(jiǎn)直讓人笑掉大牙。”“我可是為了真理和正義而戰(zhàn),他只會(huì)躲在數(shù)據(jù)后面,不敢正面回應(yīng),這種對(duì)手不提也罷?!?/p>
國(guó)內(nèi)首款鴻蒙人形機(jī)器人正在蔚來、亨通等工廠檢測(cè)驗(yàn)證:“盤古大模型 + 夸父人形機(jī)器人”將在工業(yè)和家庭兩大場(chǎng)景同步推進(jìn)應(yīng)用。
國(guó)際情報(bào):
英偉達(dá)今年在華銷售額預(yù)計(jì)將達(dá)120億美元,發(fā)貨超100萬顆芯片:
芯片咨詢公司SemiAnalysis報(bào)告預(yù)估,今年英偉達(dá)有望在中國(guó)銷售價(jià)值約120億美元的人工智能芯片。黃仁勛曾表示,希望借助新的芯片使得英偉達(dá)在中國(guó)的業(yè)務(wù)實(shí)現(xiàn)最大化。英偉達(dá)有望在未來幾個(gè)月內(nèi)在中國(guó)交付超過100萬顆定制版H20芯片,這些芯片的設(shè)計(jì)不受美國(guó)對(duì)向中國(guó)客戶銷售人工智能處理器的限制。據(jù)悉,每顆H20芯片的價(jià)格在12000至13000美元之間。
消息稱黑客去年曾侵入OpenAI內(nèi)部系統(tǒng),部分AI設(shè)計(jì)細(xì)節(jié)被盜:
據(jù)悉,一名黑客去年曾成功“黑入”了OpenAI的內(nèi)部消息系統(tǒng),并竊取了有關(guān)人工智能技術(shù)和研究材料的敏感討論,但黑客并未進(jìn)入托管人工智能源代碼的服務(wù)器。OpenAI高管在去年4月的全體員工大會(huì)上向員工和公司董事會(huì)通報(bào)了這一漏洞,但高管并未對(duì)外公開這一消息。
Meta AI 重磅發(fā)布,多標(biāo)記預(yù)測(cè)模型現(xiàn)已開放研究:
Meta 在Hugging Face上發(fā)布了采用多標(biāo)記預(yù)測(cè)方法的預(yù)訓(xùn)練模型,可能改變大型語言模型的開發(fā)和部署方式。這種新技術(shù)模型同時(shí)預(yù)測(cè)多個(gè)未來單詞,可能改善語言結(jié)構(gòu)和上下文理解,有望提高人工智能效率,加速人機(jī)協(xié)作編碼的趨勢(shì)。
破解ChatGPT驚人耗電!DeepMind新算法訓(xùn)練提效13倍,能耗暴降10倍:
DeepMind 研究團(tuán)隊(duì)提出了一種名為 JEST(多模態(tài)對(duì)比學(xué)習(xí)與聯(lián)合示例選擇)的新算法,旨在加快 AI 訓(xùn)練過程并減少所需的計(jì)算資源和能耗。JEST 算法能夠以 13 倍更少的迭代次數(shù)和 10 倍更少的計(jì)算量,超越最先進(jìn)的模型。這一發(fā)現(xiàn)揭示了數(shù)據(jù)篩選水平可以作為評(píng)判 Scaling Law 的一個(gè)新維度。JEST 算法通過從 “超級(jí) batch” 中篩選出最具可學(xué)習(xí)性的 “子 batch”,實(shí)現(xiàn)了高效的數(shù)據(jù)管理和訓(xùn)練過程。實(shí)驗(yàn)結(jié)果表明,JEST 方法在效率提升和性能優(yōu)化方面取得了顯著成效,尤其是在多模態(tài)學(xué)習(xí)加速和數(shù)據(jù)質(zhì)量引導(dǎo)方面。
解鎖動(dòng)物語言?SuperAnimal這款A(yù)I神器,顛覆人與自然的關(guān)系:
SuperAnimal是一款開源AI模型,能自動(dòng)識(shí)別和分析動(dòng)物的運(yùn)動(dòng)行為,提供精確的姿態(tài)分析;該模型通過統(tǒng)一的預(yù)訓(xùn)練模型和關(guān)鍵點(diǎn)空間映射,減少人工標(biāo)注需求,提高數(shù)據(jù)整合和模型泛化能力;SuperAnimal應(yīng)用于獸醫(yī)學(xué)、生物醫(yī)學(xué)研究和野生動(dòng)物保護(hù),使用高級(jí)模型架構(gòu)和獨(dú)特訓(xùn)練方法以提高性能和適應(yīng)性。
更多國(guó)際情報(bào):
布局 AI 等市場(chǎng),格芯收購(gòu)泰戈?duì)柨萍嫉壖夹g(shù)和相關(guān)團(tuán)隊(duì):氮化鎵成為可持續(xù)高效電源管理(尤其是在數(shù)據(jù)中心)的關(guān)鍵解決方案。泰戈?duì)柨萍脊竟こ處焾F(tuán)隊(duì)將加入格芯,進(jìn)一步開發(fā)氮化鎵技術(shù)。
“高達(dá)”式鐵路機(jī)器人在日本大范圍推廣:主要設(shè)計(jì)用于修剪鐵軌上的樹枝,固定和噴漆列車上方電纜的金屬框架等等。
互聯(lián)網(wǎng)巨頭公司正合法利用用戶數(shù)據(jù)來訓(xùn)練其 AI 模型:多家硅谷科技公司,如谷歌、Meta、X、Snap 和 Zoom 在隱私政策和服務(wù)條款中,加入了使用用戶數(shù)據(jù)來訓(xùn)練 AI 模型的條款。
真實(shí)商戰(zhàn)?報(bào)告稱谷歌曾試圖禁止蘋果 Safari 瀏覽器用戶使用 AI 摘要功能:美國(guó)司法部調(diào)查谷歌在搜索行業(yè)的統(tǒng)治地位,涉及谷歌每年向蘋果支付超 200 億美元費(fèi)用,以成為 iPhone 的默認(rèn)搜索引擎。谷歌試圖增加 iPhone 用戶在在 Safari 瀏覽器以外的平臺(tái)上進(jìn)行搜索的比例,目標(biāo)是到 2030 年時(shí)達(dá)到 50%。為此曾考慮限制 AI 摘要功能,但最終決定不采取這一措施。
YouTube 測(cè)試“AI 音頻橡皮擦”:該工具使用 AI 算法來專門檢測(cè)和刪除相關(guān)歌曲,創(chuàng)作者可輕松移除受版權(quán)保護(hù)背景音樂,而不會(huì)影響包括對(duì)話或音效在內(nèi)的任何其他音頻。
Product Hunt 熱榜, Pygma
Pygma是一款A(yù)I驅(qū)動(dòng)社交媒體管理助手,專為Instagram用戶和中小企業(yè)量身打造。這款智能工具通過深度分析用戶風(fēng)格和受眾反應(yīng),在幾秒鐘內(nèi)生成定制化的帖子、故事和Reels內(nèi)容,大大簡(jiǎn)化了社交媒體流程。
不僅提供內(nèi)容創(chuàng)作,還集成了智能編輯、排程發(fā)布等功能,真正實(shí)現(xiàn)一站式社媒管理。其獨(dú)特的AI生成器和編輯器,加上即將推出的目標(biāo)受眾分析功能,使Pygma成為提升品牌形象和吸引目標(biāo)受眾的強(qiáng)大工具。
?https://www.pygma.me/
GitHub Trending 熱榜,智能辦公AI助手AnythingLLM
獲 YC 投資,為企業(yè)構(gòu)建一站式內(nèi)部 Agent 和 RAG 應(yīng)用解決方案的 Mintplex Labs 開源其跨端應(yīng)用 anything-llm是一款多功能AI商業(yè)智能工具,支持多種大型語言模型和操作系統(tǒng)。該工具提供一鍵安裝的桌面應(yīng)用程序,強(qiáng)調(diào)用戶隱私保護(hù),支持自定義模型和多種文檔格式處理。AnythingLLM適用于個(gè)人和組織用戶,可在離線環(huán)境下運(yùn)行。
該工具提供全面的開發(fā)者API和外觀定制選項(xiàng),支持企業(yè)級(jí)和開源模型。AnythingLLM的官方網(wǎng)站提供了詳細(xì)的產(chǎn)品信息,包括定價(jià)、使用方法和與其他類似工具的比較。這些特性使AnythingLLM成為一個(gè)全面的AI商業(yè)智能解決方案。
?https://github.com/Mintplex-Labs/anything-llm
開發(fā)者推薦
1.AI模型評(píng)測(cè):Artificial Analysis
Artificial Analysis平臺(tái)專注于對(duì)各大LLM API提供商進(jìn)行全面基準(zhǔn)測(cè)試,不僅評(píng)估模型輸出質(zhì)量,還重點(diǎn)關(guān)注響應(yīng)速度。通過整合LMSYS Chatbot Arena、Hugging Face排行榜和斯坦福HELM項(xiàng)目等多方數(shù)據(jù),Artificial Analysis為開發(fā)者提供了更全面、更實(shí)用的模型選擇參考。
這一創(chuàng)新approach填補(bǔ)了現(xiàn)有AI評(píng)測(cè)體系的空白,特別適合對(duì)令牌生成速度要求較高的應(yīng)用場(chǎng)景。業(yè)內(nèi)專家認(rèn)為,Artificial Analysis的出現(xiàn)將激勵(lì)A(yù)I服務(wù)提供商不斷優(yōu)化模型性能,推動(dòng)整個(gè)行業(yè)向更高效、更實(shí)用的方向發(fā)展。對(duì)開發(fā)者而言,這個(gè)網(wǎng)站的評(píng)測(cè)結(jié)果將幫助他們更精準(zhǔn)地選擇適合自身需求的AI模型,從而提升應(yīng)用效果和用戶體驗(yàn)。
?https://artificialanalysis.ai2.KREA免費(fèi)生成和增強(qiáng)圖像與視頻
KREA 旨在通過強(qiáng)大的人工智能技術(shù),讓用戶能夠直觀地生成和增強(qiáng)圖像與視頻。該平臺(tái)提供了多種功能,包括實(shí)時(shí)視頻生成、圖像增強(qiáng)、視頻增強(qiáng)以及免費(fèi)訪問的 AI 視頻生成。此外,KREA 還推出了一系列迷你應(yīng)用程序,如 “Logo Illusions” 和 “AI Patterns”,以及舊版應(yīng)用程序,如 “AI Training” 和 “Canvas Project Studio”。用戶需要在瀏覽器中啟用 JavaScript 以正確查看頁面。
?https://www.krea.ai/home
3.AI視頻創(chuàng)作一條龍,達(dá)摩院“尋光”突破可控編輯難題:
尋光定位為PUGC一站式AI視頻創(chuàng)作平臺(tái),能夠?qū)崿F(xiàn)視頻創(chuàng)作的全流程 AI 輔助,包括劇本創(chuàng)作、分鏡圖設(shè)計(jì)、視頻素材編輯等。讓視頻編輯像操作PPT一樣簡(jiǎn)單,主要用于輔助創(chuàng)作劇本、分鏡圖,支持對(duì)素材進(jìn)行AI編輯,包括人物控制、場(chǎng)景控制、運(yùn)鏡控制、目標(biāo)新增/消除/修改等10多種功能,解決了 AI 視頻內(nèi)容的可控編輯問題。
?https://xunguang.damo-vision.com/
前沿技術(shù)
1.LivePortrait:AI 肖像動(dòng)畫技術(shù)
快手科技團(tuán)隊(duì)推出 LivePortrait,這是一種基于隱式關(guān)鍵點(diǎn)框架的高效肖像動(dòng)畫技術(shù)。它能從單張?jiān)磮D像和驅(qū)動(dòng)視頻生成生動(dòng)的視頻,展現(xiàn)出優(yōu)秀的泛化能力、可控性和效率。
研究者通過擴(kuò)大訓(xùn)練數(shù)據(jù)集、采用混合訓(xùn)練策略、升級(jí)網(wǎng)絡(luò)架構(gòu)等方法提升了生成質(zhì)量。LivePortrait 在 RTX 4090 GPU 上每幀僅需 12.8 毫秒,效果媲美擴(kuò)散模型方法。該項(xiàng)目的推理代碼和模型已開源。
?https://liveportrait.github.io/
2.通義語音團(tuán)隊(duì)開源了語音基座大模型,SenseVoice和CosyVoice:
SenseVoice多語言音頻理解大模型:多語言語音識(shí)別在中文和粵語上相比Whisper相對(duì)提升+50%,推理速度快15倍,并且支持SOTA的情緒識(shí)別和音頻事件檢測(cè)。
CosyVoice多語言音頻生成大模型:通過超過17萬小時(shí)的多語言音頻數(shù)據(jù)訓(xùn)練,支持多語言、音色和情感控制,CosyVoice則在多語言語音生成、零樣本語音生成、跨語言聲音合成和指令執(zhí)行能力方面表現(xiàn)卓越。
?https://fun-audio-llm.github.io/
3.斯坦福大學(xué)發(fā)布OccFusion,可完整渲染出被遮擋的人體:
OccFusion 是一種基于高效 3D 高斯分片和預(yù)訓(xùn)練 2D 擴(kuò)散模型的人體渲染技術(shù),它能在人體被部分遮擋的情況下渲染出完整的形態(tài)。OccFusion 在 ZJU-MoCap 和 OcMotion 序列上進(jìn)行了評(píng)估,表現(xiàn)出色,達(dá)到了遮擋人體渲染的最新水平。整個(gè)訓(xùn)練過程僅需在單個(gè) Titan RTX GPU 上花費(fèi) 10 分鐘。
?https://cs.stanford.edu/~xtiange/projects/occfusion/
4.浦語靈筆 IXC-2.5 展現(xiàn)多模態(tài)實(shí)力
上海人工智能實(shí)驗(yàn)室最新推出的浦語靈筆 IXC-2.5 模型引發(fā)業(yè)界關(guān)注。這款基于7B LLM的多模態(tài)大模型在圖像和視頻理解方面表現(xiàn)出色,據(jù)稱能力可與GPT-4V相媲美。其特色功能包括高分辨率圖像理解、精細(xì)視頻分析和多輪多圖像對(duì)話。該模型還拓展了實(shí)用領(lǐng)域,能夠自動(dòng)生成網(wǎng)頁和創(chuàng)作高質(zhì)量文章,利用逐步推理方法確保長(zhǎng)文本內(nèi)容的邏輯性和連貫性。浦語靈筆 IXC-2.5 的推出為人工智能在多模態(tài)應(yīng)用領(lǐng)域開辟了新的可能性。
?https://huggingface.co/spaces/Willow123/InternLM-XComposer
5.推薦系統(tǒng)新范式:DiffMM開啟多模態(tài)精準(zhǔn)推薦時(shí)代
港大和騰訊研究人員聯(lián)手打造的DiffMM多模態(tài)推薦系統(tǒng)引發(fā)業(yè)界關(guān)注。這一創(chuàng)新模型通過構(gòu)建包含用戶和視頻多元信息的圖譜,并結(jié)合圖擴(kuò)散技術(shù)和對(duì)比學(xué)習(xí)方法,實(shí)現(xiàn)了對(duì)用戶喜好的深度理解。在三個(gè)公共數(shù)據(jù)集的實(shí)驗(yàn)中,DiffMM展現(xiàn)出卓越性能,超越現(xiàn)有基線模型。該項(xiàng)目已開源,為推薦系統(tǒng)研究提供了新思路,有望在短視頻等領(lǐng)域帶來更精準(zhǔn)的個(gè)性化推薦體驗(yàn)。
?https://github.com/HKUDS/DiffMM
6.快手AI繪畫新里程碑:Kolors模型雙語圖像生成
快手科技旗下Kolors團(tuán)隊(duì)近日推出了一款突破性的文本到圖像生成模型Kolors。這一基于潛流擴(kuò)散技術(shù)的大規(guī)模模型在數(shù)十億文本-圖像對(duì)上進(jìn)行訓(xùn)練,在視覺質(zhì)量、語義準(zhǔn)確性和中英文字體渲染方面均展現(xiàn)出卓越表現(xiàn)。Kolors支持中英雙語輸入,特別在生成中文內(nèi)容時(shí)表現(xiàn)出色。通過人類專家評(píng)估和機(jī)器評(píng)測(cè),Kolors在視覺吸引力和整體滿意度方面均領(lǐng)先于現(xiàn)有開源和閉源模型。
?https://github.com/Kwai-Kolors/Kolors
熱議話題
AI應(yīng)用現(xiàn)狀:期待與現(xiàn)實(shí)的差距
Retool 2024年上半年AI狀況報(bào)告指出AI應(yīng)用的真實(shí)情況:
1.AI采用,進(jìn)展緩慢但穩(wěn)定:AI在企業(yè)中的實(shí)際應(yīng)用進(jìn)展并不如想象中迅速。報(bào)告顯示,僅有約30%的受訪者認(rèn)為他們的公司在AI采用方面處于"運(yùn)行"或"飛行"階段,這一比例甚至較2023年有所下降。
2.AI影響尚未達(dá)到變革性水平:盡管AI已在多個(gè)領(lǐng)域得到應(yīng)用,但影響力似乎被夸大了。受訪者給出的平均影響評(píng)分僅為6.7/10,遠(yuǎn)未達(dá)到"變革性"的程度。
3.投資態(tài)度,謹(jǐn)慎樂觀:盡管AI的實(shí)際影響有限,但大多數(shù)企業(yè)并不認(rèn)為他們?cè)贏I上投資過度。相反,42%的受訪者認(rèn)為投資"恰到好處",40.5%甚至認(rèn)為投資"不夠"。企業(yè)對(duì)AI的長(zhǎng)期潛力持樂觀態(tài)度,愿意繼續(xù)投入資源。
4.AI應(yīng)用場(chǎng)景以內(nèi)部為主,外部謹(jǐn)慎:企業(yè)更傾向于在內(nèi)部應(yīng)用AI技術(shù)。最常見的用例包括編寫代碼或查詢(42.1%)、知識(shí)庫(kù)問答(36.4%)和支持聊天機(jī)器人(33.9%)。相比之下,面向客戶的AI應(yīng)用相對(duì)較少。這種傾向可能源于企業(yè)希望在內(nèi)部環(huán)境中先行試驗(yàn)和完善AI應(yīng)用,以降低風(fēng)險(xiǎn)。
5.OpenAI獨(dú)占鰲頭,新星嶄露頭角:在AI技術(shù)棧方面,OpenAI的模型仍然主導(dǎo)市場(chǎng),GPT-4和GPT-3.5合計(jì)占據(jù)70%的份額。不過像Anthropic的Claude 3和Mistral這樣的新興模型正在嶄露頭角,AI技術(shù)生態(tài)趨向多元化。
6.潛力巨大,道路漫長(zhǎng):業(yè)內(nèi)人士對(duì)AI未來發(fā)展保持樂觀??偟膩碚f,AI技術(shù)的發(fā)展正處于一個(gè)關(guān)鍵的轉(zhuǎn)折點(diǎn)。雖然其影響力尚未達(dá)到預(yù)期,但企業(yè)和開發(fā)者正在積極探索和實(shí)踐,為未來的突破奠定基礎(chǔ)。
?https://retool.com/blog/state-of-ai-h1-2024
敬請(qǐng)期待明日的最新動(dòng)態(tài)!
AI情報(bào)局征集情報(bào)合伙人,匯集獨(dú)家價(jià)值線索!如果您可以提供有關(guān)AI最新成果&行業(yè)內(nèi)幕&獨(dú)特產(chǎn)品,請(qǐng)?zhí)砑舆\(yùn)營(yíng)微信號(hào):AIyanxishe2備注行業(yè)崗位。
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。