0
本文作者: 我在思考中 | 2024-06-20 18:39 |
情報局直擊CVPR2024
超 1.2 萬人參加 CVPR 2024,谷歌研究院獲得最佳論文 :
2024 年的 CVPR 會議在美國西雅圖舉辦,成為了該會議歷史上最大規(guī)模和最多參與人數(shù)的一屆,共有 1.2 萬人參與。本屆會議共有 35691 位注冊作者,提交了 11532 篇論文,其中 2719 篇論文被接收,錄用率為 23.6%。與去年相比,論文數(shù)量增加了 20.6%,但錄用率略有下降。
會議頒發(fā)了兩項最佳論文獎和兩項最佳學(xué)生論文獎,其中谷歌研究院團(tuán)隊的《Generative Image Dynamics》和由多所機(jī)構(gòu)共同發(fā)表的《Rich Human Feedback for Text-to-Image Generation》獲得了最佳論文獎。此外,會議還討論了視覺基礎(chǔ)模型和圖像視頻生成等熱點話題,以及機(jī)器遺忘、3D 視覺和自主系統(tǒng)等領(lǐng)域的最新研究進(jìn)展。
https://mp.weixin.qq.com/s/45DYFWMXn-ce7ysJTrjp7g
AI情報局征集情報合伙人,匯集獨家價值線索!如果您可以提供有關(guān)AI最新成果&行業(yè)內(nèi)幕&獨特產(chǎn)品,請?zhí)砑舆\營微信號: AIyanxishe2 備注行業(yè)崗位。
融資快報
MainFunc獲6000萬美元種子輪融資: 由前百度高管(原小度科技CEO景鯤和CTO朱凱華)創(chuàng)立的MainFunc,推出旗下首款A(yù)I Agent搜索產(chǎn)品Genspark。已在一筆超額認(rèn)購的種子輪融資中籌集了6000萬美元,本輪融資由藍(lán)馳創(chuàng)投領(lǐng)投,對這家目前尚未盈利的初創(chuàng)企業(yè)的估值為2.6億美元。
CuspAI獲得3000萬美元種子輪融資: CuspAI是一家人工智能材料搜索引擎開發(fā)商。由 Hoxton Ventures 領(lǐng)投,Basis Set Ventures、Lightspeed Venture Partners、LocalGlobe、Northzone、Touring Capital、Giant Ventures、FJ Labs、Tiferes Ventures 和 Zero Prime Ventures 參投。
Point72籌備專注于AI行業(yè)的新對沖基金: 據(jù)悉,Steve Cohen的Point72 Asset Management尋求為一支新的專注于AI的選股對沖基金籌集約10億美元。該基金將在全球范圍內(nèi)押漲、押跌AI硬件和半導(dǎo)體公司。這將是Point72幾十年來第一支新對沖基金。
San Francisco AI Factory Inc獲2000 萬美元融資: San Francisco AI Factory 旨在利用 AI 簡化編碼任務(wù)司,提供自動化 AI 系統(tǒng)—— Droids,幫助企業(yè)生成軟件功能、審查代碼和解決漏洞等工程任務(wù)。截至目前,F(xiàn)actory共籌集了2000萬美元,除了紅杉美國,其他投資者包括 Lux Capital、Hugging Face以及Databricks CEO,還有洛杉磯音樂組合The Chainsmokers。
英偉達(dá)收購軟件初創(chuàng)公司Shoreline: Shoreline.io由亞馬遜網(wǎng)絡(luò)服務(wù)前高管創(chuàng)辦。對Shoreline的估值約為1億美元。
Constructor 籌集2500 萬美元 B 輪融資: Constructor使用語義搜索和人工智能技術(shù),提供準(zhǔn)確和個性化的搜索結(jié)果,并支持圖像、內(nèi)容和語音搜索產(chǎn)品。本輪融資由 Sapphire Ventures 領(lǐng)投。
Aim Security 籌集1800 萬美元 A 輪融資: Aim Security 專注于在企業(yè)環(huán)境中部署和使用生成式 AI 工具的安全性。本輪融資由 Canaan Partners 領(lǐng)投
Omi 籌集1400 萬美元種子輪融資: Omi 利用人工智能幫助品牌創(chuàng)建 3D 視覺資產(chǎn),包括靜止圖像和視頻。本輪融資由 Dawn Capital 領(lǐng)投。
Finaloop完成3500萬美元A輪融資: Finaloop是一家AI驅(qū)動的電商會計平臺。本輪融資由Lightspeed Venture Partners領(lǐng)投,Vesey Ventures、Commerce Ventures以及現(xiàn)有投資者Accel和Aleph參與投資。
Aim Security完成1800萬美元A輪融資: Aim Security是一家企業(yè)AI安全平臺。本輪融資由Canaan Partners領(lǐng)投,該公司種子輪投資者YL Ventures也參與了投資。
Trustwise籌集了400萬美元的種子輪融資: Trustwise是一家生成式AI應(yīng)用性能和風(fēng)險管理初創(chuàng)公司。本輪融資由Hitachi Ventures領(lǐng)投,F(xiàn)irestreak Ventures和Grit Ventures參與投資。
Promaxo獲戰(zhàn)略投資 : Promaxo是一家美國醫(yī)學(xué)影像服務(wù)提供商,專注于醫(yī)學(xué)影像,機(jī)器人和AI技術(shù)。本次投資由Zynext Ventures投資。
百奧幾何完成Pre-A輪融資: 百奧幾何是一家大分子藥物研發(fā)開源機(jī)器學(xué)習(xí)平臺提供商,用于大分子藥物研發(fā)。本輪融資由將門創(chuàng)投領(lǐng)投,智譜AI、盛景嘉成跟投,老股東高榕創(chuàng)投持續(xù)追加投資。
環(huán)天智慧完成B輪融資: 環(huán)天智慧以遙感應(yīng)用、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等信息技術(shù)為依托,推出“天空地一體化”與“星-云-網(wǎng)-端”的系統(tǒng)服務(wù)架構(gòu)。投資方為鼎暉百孚。
Enveda Biosciences獲5500萬美元融資: Enveda使用其AI工具來識別和表征生物體產(chǎn)生的各種分子,從而創(chuàng)建一個新的化學(xué)生物多樣性數(shù)據(jù)庫。本輪融資由新投資者Premji Invest 、Lingotto Investment Fund、微軟、The Nature Conservancy及老股東 Kinnevik、True Ventures、FPV、Level Ventures 和 Jazz Venture Partners共同參與。
先楫半導(dǎo)體完成近億元B輪融資: 先楫半導(dǎo)體是一家國產(chǎn)高性能微控制器廠商,本輪融資由天堂硅谷資本領(lǐng)投,天津永鈦海河、杭州元琰股權(quán)投資基金及三旺奇通等跟投。融資將用于加速在智能駕駛、機(jī)器人、邊緣側(cè)AI芯片等領(lǐng)域的開拓。
(歡迎添加微信 AIyanxishe2 ,了解更多AIGC、融資情況,與志同道合的朋友一同暢聊時新AI產(chǎn)品)
國內(nèi)情報
華為昇騰 AI 算力性能已超英偉達(dá) A100,近半中國大模型選擇昇騰技術(shù)路線:
江蘇鯤鵬?昇騰生態(tài)創(chuàng)新中心首席運營官王陶表示,昇騰集群是國內(nèi)唯一已完成訓(xùn)練千億參數(shù)大模型的技術(shù)路線。該芯片在訓(xùn)練效率層面最高可達(dá)英偉達(dá) 1.1 倍?!霸诟ミ_(dá) A100(指 0.8 倍)的確還有一定差距,但在大模型訓(xùn)練這一塊已跟英偉達(dá) A100 芯片沒有明顯差距。特別是在萬卡算力集群,包括鯤鵬云腦、科大訊飛這一塊都經(jīng)過了市場檢驗。”
中國氣象局發(fā)布三個AI氣象大模型系統(tǒng),命名風(fēng)清、風(fēng)雷、風(fēng)順:
“風(fēng)清”是人工智能全球中短期預(yù)報系統(tǒng),“風(fēng)雷”是人工智能臨近預(yù)報系統(tǒng),兩個模型由中國氣象局聯(lián)合清華大學(xué)組建攻關(guān)團(tuán)隊構(gòu)建。“風(fēng)順”是人工智能全球次季節(jié)—季節(jié)預(yù)測系統(tǒng),由中國氣象局聯(lián)合復(fù)旦大學(xué)和上??茖W(xué)智能研究院基于人工智能方法構(gòu)建。
中國電信、智源發(fā)布全球首個單體稠密萬億參數(shù)語義模型 Tele-FLM-1T:
該模型基于模型生長和損失預(yù)測等技術(shù),僅使用了業(yè)界普通訓(xùn)練方案 9%的算力資源, 112 臺 A800 服務(wù)器,用 4 個月完成 3 個模型總計 2.3T tokens 的訓(xùn)練。TeleFLM 系列模型已經(jīng)全面開源了 52B 版本,開源模型下載量過萬,積累超 40 萬用戶。Tele-FLM-1T 版本也即將開源。
百度曦靈數(shù)字人平臺升級,支持文生 3D 數(shù)字人、音色克隆等功能:
新版平臺能夠在短時間內(nèi)自動生成逼真的 3D 數(shù)字人,并提供了極速和精品兩種克隆選擇,以滿足不同需求。極速克隆可在半小時內(nèi)完成,適用于效率追求的場景;精品克隆則能夠 1:1 還原真人,適合對真人還原要求較高的場合。此外,曦靈平臺還推出了音色克隆功能,用戶僅需 30 秒的錄音即可生成專屬音色。
百度文庫新產(chǎn)品“橙篇”支持10萬字長文生成:
在超長圖文理解上,橙篇可實現(xiàn)超長文本無損理解,支持用戶一次性上傳100個多種格式、單個最大200MB的文件,并支持基于上傳內(nèi)容進(jìn)行快速總結(jié)、問答和創(chuàng)作。
商湯披露50篇論文入選CVPR 2024:
商湯科技披露今年50篇論文入選CVPR,其中還有9篇被錄用為Oral、Highlight。論文涉及自動駕駛、機(jī)器人等前沿方向。
國際情報
OpenAI與Color Health合作打造輔助篩查、治療癌癥的AI工具:
OpenAI 公司宣布與基因檢測公司 Color Health 合作,將使用 GPT-4o 模型開發(fā) AI 工具 Cancer Copilot,幫助醫(yī)生根據(jù)患者數(shù)據(jù)制定篩查和治療計劃,識別缺失的診斷結(jié)果,并創(chuàng)建量身定制的工作計劃,讓醫(yī)療服務(wù)提供者能夠就癌癥篩查和治療做出循證決策。
TikTok 推出全新 AI 功能套件 Symphony :
Symphony包括數(shù)字化身、翻譯工具、AI 助手等。品牌可以從一系列基于真實演員的“庫存化身”中進(jìn)行選擇,或者創(chuàng)建自定義化身,作為虛擬品牌代表 。此外,TikTok 還推出了“全球覆蓋翻譯”功能。這是一種新的 AI 配音工具,可以自動轉(zhuǎn)錄、翻譯和配音視頻,支持 10 多種語言,幫助品牌在全球范圍內(nèi)擴(kuò)展內(nèi)容。
Notion 推出 AI 連接器功能,提升工作流程效率 :
用戶可以直接從公司的 Slack 中提取知識,無需離開當(dāng)前工作流程,減少了工具和窗口切換的需要。已在 X 平臺上發(fā)布,旨在提高用戶的工作效率。目前,Slack 的集成已經(jīng)開始逐步推出,Google Drive 和其他未公開的集成功能也在推進(jìn)中。
蘋果叫停Vision Pro高端機(jī):
蘋果暫停了下一代 Vision Pro 的開發(fā),轉(zhuǎn)而專注于 2025 年底發(fā)布更便宜的機(jī)型?;?qū)⑼瞥雒麨镹109的低價Vision產(chǎn)品,重量是 Vision Pro 的 1/3,價格或與高端iPhone差不多,或?qū)⒈A舾叨孙@示屏,由視涯科技供應(yīng)。設(shè)備攝像頭更少、頭帶更簡單、揚(yáng)聲器更小。
Meta 宣布重組 Reality Labs,成立新的可穿戴設(shè)備組:
重組后Reality Labs 將主要分為兩個部分,一個是元宇宙:該部門涵蓋 Quest 頭顯系列、Horizon(Meta 的社交網(wǎng)絡(luò))以及相關(guān)技術(shù)。另一個是可穿戴設(shè)備:該新部門包括 Meta 其余的硬件業(yè)務(wù),例如與 Ray-Ban 合作的智能眼鏡。
Meta FAIR團(tuán)隊發(fā)布多款模型、研究和數(shù)據(jù)集:
Meta FAIR團(tuán)隊發(fā)布了多款模型、研究和數(shù)據(jù)集,包括Meta Chameleon:多模態(tài)模型,7B/34B;Multi-Token Prediction:多詞預(yù)測模型;JASCO:文本生成音樂模型;AudioSeal:AI語音檢測;PRISM:AI反饋數(shù)據(jù)集;“DIG In”:人文地理差異評估方法。
環(huán)球音樂與 SoundLabs 推出 AI 插件 MicDrop:
MicDrop 是一款 AI 人聲插件,使用藝術(shù)家自己的聲音數(shù)據(jù)進(jìn)行訓(xùn)練,可創(chuàng)建高保真人聲模型,保留藝術(shù)家所有權(quán),用于專屬創(chuàng)作,不向公眾開放。它將于今年夏天推出,兼容所有主要的 DAW,環(huán)球音樂稱它可以實現(xiàn)多種聲音轉(zhuǎn)換。
組隊訓(xùn)練 AI,MLX 項目亮相:
MLX 項目使用 MPI 分布式計算,通過 Thunderbolt 4 電纜來連接主控機(jī)和多臺 Mac 設(shè)備,可以實現(xiàn)高效并行計算,適合家庭環(huán)境下訓(xùn)練 AI 等場景。蘋果公司此前曾探索開發(fā)出類似的 XGrid 項目,串聯(lián)多臺 Mac 設(shè)備實現(xiàn)并行計算,不過主要面向企業(yè)和政府機(jī)構(gòu),對于消費者和業(yè)余愛好者并不友好。
“AI 教父”Hinton擔(dān)任CuspAI 董事會顧問:
Hinton對這家初創(chuàng)公司給予了較高的評價,稱該公司及其使命給自己留下了深刻印象?!八麄兝?AI 為新材料設(shè)計過程提速,以應(yīng)對人類最緊迫的挑戰(zhàn)之一 —— 氣候變化?!睋?jù)悉,CuspAI 公司由劍橋大學(xué)創(chuàng)立,該公司計劃利用搜索引擎的功能按需識別新型建筑材料所需的特性。
ChatGPT等模型瘋狂訓(xùn)練,2026年或迎來AI界“數(shù)據(jù)荒”:
Epochai 研究報告指出目前人類公開的高質(zhì)量文本訓(xùn)練數(shù)據(jù)集約有 300 萬億個 tokens,但隨著大模型的胃口增大,這些數(shù)據(jù)可能很快將被消耗殆盡。例如 Meta 的 Llama3 模型在 8B 版本上的過度訓(xùn)練竟然達(dá)到了驚人的 100 倍。
Epochai 提出了四種獲取新訓(xùn)練數(shù)據(jù)的方法:合成數(shù)據(jù)、多模態(tài)和跨領(lǐng)域數(shù)據(jù)學(xué)習(xí)、私有數(shù)據(jù)的使用以及與真實世界實時交互學(xué)習(xí)。旨在避免 AI 界的 “數(shù)據(jù)荒”,并為 AI 模型的持續(xù)發(fā)展提供數(shù)據(jù)支持。
ACM頂會SIGGRAPH 2024最佳論文揭曉,英偉達(dá)CMU各占40%:
ACM SIGGRAPH共評選出了5篇最佳論文、12篇榮譽(yù)提名,并延續(xù)去年的傳統(tǒng)將時間檢驗獎頒給了2012年和2013年發(fā)表的4篇論文。上??萍即髮W(xué)、華中科技大學(xué)、香港中文大學(xué)等國內(nèi)機(jī)構(gòu)榜上有名。
更多國際情報
BCG報告稱生成式AI正在撼動就業(yè)市場: 報告預(yù)測生成式 AI 將在未來十年內(nèi)對全球經(jīng)濟(jì)產(chǎn)生至少 2.2 萬億至 3.7 萬億美元的經(jīng)濟(jì)影響,同時對某些重復(fù)性高、創(chuàng)造性低職位帶來威脅,但也將創(chuàng)造新的職位,推動人才對技能進(jìn)行重新塑造和學(xué)習(xí)。
三星電子將于明年推出配備人工智能的家電: 三星電子正在開發(fā)帶有大型語言模型的集成家電產(chǎn)品,目標(biāo)在2025年發(fā)布。
AI產(chǎn)品
Product Hunt 熱榜, 免費的 AI 代理搜索引擎Genspark :
Genspark 是一個免費的 AI 代理搜索引擎,通過專業(yè)的 AI 代理為用戶查詢研究并生成所謂的 Sparkpages。這些頁面綜合可靠信息,提供更有價值的結(jié)果,為用戶節(jié)省時間。創(chuàng)始人景鯤強(qiáng)調(diào),Genspark 與傳統(tǒng)搜索引擎不同,更像是一群快速為用戶找到所需答案的有用 AI 伙伴。Genspark 旨在消除廣告、誘導(dǎo)內(nèi)容和偏見結(jié)果,提供干凈、高質(zhì)量的信息,讓用戶從一個地方就能訪問所需信息,節(jié)省時間。
GitHub Trending 熱榜, 開源的增強(qiáng)型 ChatGPT 克隆 LibreChat:
LibreChat 是一個開源的增強(qiáng)型 ChatGPT 克隆項目,支持多種 AI 模型和 API,包括 OpenAI、Azure、Groq 等,具備 AI 模型切換、消息搜索和多用戶安全系統(tǒng)等功能,并且正在積極開發(fā)中添加更多特性。由 danny-avila 維護(hù)的 LibreChat 在 GitHub 上擁有 12.9k stars 和 2.3k forks。
https://www.librechat.ai/
https://github.com/danny-avila/LibreChat?tab=readme-ov-file
開發(fā)者推薦
1.Omni-Zero: 零樣本風(fēng)格化肖像創(chuàng)作
omni-zero 是一個基于 GitHub 的開源項目,旨在通過擴(kuò)散管道實現(xiàn)零樣本風(fēng)格化肖像創(chuàng)作。此外,項目還提供了一個 Gradio 應(yīng)用程序,并且在 Fal.ai、Replicate 和 HuggingFace Spaces ZeroGPU 上提供了演示。用戶可以通過克隆倉庫并按照指定步驟運行 demo.py 來嘗試使用 omni-zero。
https://github.com/okaris/omni-zero
2.ElevenLabs 的 V2A 視頻自動配音
ElevenLabs Texts to Sounds Effects API ,展示了其通過 AI 為視頻添加聲音效果的能力。用戶可以上傳視頻,客戶端每秒提取 4 個幀,并將這些幀和提示發(fā)送給 GPT-4o,以創(chuàng)建自定義的文本到聲音效果提示。隨后,使用 ElevenLabs Text to Sounds Effects API 根據(jù)提示生成聲音效果,并利用 ffmpeg.wasm 在客戶端將視頻和音頻合并,生成可下載的單個文件。
https://www.videotosoundeffects.com/
3.Hedra Labs 推出 Character-1 研究預(yù)覽版
Hedra Labs 發(fā)布了能夠生成表現(xiàn)力強(qiáng)的說話、唱歌和說唱角色的基礎(chǔ)模型 Character-1 的研究預(yù)覽版,該模型可在桌面和移動設(shè)備上使用,預(yù)覽版提供無限視頻時長,但開放預(yù)覽版限制為 30 秒視頻。如果 H100 供應(yīng)充足,模型能在每 60 秒生成 90 秒的視頻。模型具有生成角色具有強(qiáng)烈的表現(xiàn)力的特點,其愿景是通過構(gòu)建基礎(chǔ)模型并將其融入產(chǎn)品中,激發(fā)人類下一代的故事講述能力,同時還宣布了即將推出的 “Worlds” 功能,允許用戶構(gòu)建虛擬世界。
https://www.hedra.com/
4.GenType創(chuàng)建自定義字母表
GenType 是一個在線工具,它利用 Imagen 2 API 為用戶提供創(chuàng)建自定義字母表的能力。用戶可以通過描述來定制字母的風(fēng)格,例如使用星座地圖、未來科幻飛船、銀色管道等元素。GenType 提醒用戶創(chuàng)作時要尊重他人權(quán)利,鼓勵用戶分享反饋幫助改進(jìn) AI。
https://labs.google/gentype
大牛洞見
最強(qiáng) GenAI/LLM 學(xué)習(xí)資源索引發(fā)布!
Will Brown發(fā)布 《GenAI Handbook》 這本書被譽(yù)為 GenAI 領(lǐng)域最前沿發(fā)展的開源教科書,匯聚了自 ChatGPT 發(fā)布以來的 18 個月里,GenAI/LLM 領(lǐng)域的發(fā)展和系統(tǒng)知識指南。分為 9 個部分,參考了頂尖的 Blog、論文、Youtube 視頻和在線課程,為讀者提供了一個清晰了解 GenAI 發(fā)展的脈絡(luò)。
https://genai-handbook.github.io/
熱門活動
「云啟Attent!on · 深圳站」見面聊 | 網(wǎng)紅AI硬件翻車后,真正的頭號玩家在哪?
6月28日,「Attent!on」深圳站將聚焦 軟件與硬件的融合,以「AI+跨境+硬件=?」為主題,探討AI硬件的機(jī)會和挑戰(zhàn)。
云啟資本聯(lián)合雷峰網(wǎng)將攜手大疆早期孵化投資人、長江商學(xué)院金融學(xué)教授甘潔創(chuàng)辦的創(chuàng)新企業(yè)賦能組織知行研習(xí)院,與來自華為、騰訊、科大訊飛、Kickstarter、元生智能、火火兔、時空壺、蜂巢科技等知名公司的資深人士展開深度交流。
歡迎創(chuàng)業(yè)者、產(chǎn)品負(fù)責(zé)人報名。
https://mp.weixin.qq.com/s/D9YIyKBz0UUdjP3iNqXefA
敬請期待明日的最新動態(tài) !
AI情報局征集情報合伙人,匯集獨家價值線索!如果您可以提供有關(guān)AI最新成果&行業(yè)內(nèi)幕&獨特產(chǎn)品,請?zhí)砑舆\營微信號: AIyanxishe2 備注行業(yè)崗位。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。