曝階躍星辰正在進(jìn)行估值20億美元融資；OpenAI放寬股票限制；Suno和Udio遭三大唱片公司起訴丨AI情報(bào)局

本文作者：我在思考中

2024-06-26 09:59

導(dǎo)語(yǔ)：產(chǎn)品推薦：Pygma，maestro，Streamer-Sales，Magnific AI，Unique3D

融資快報(bào)

曝階躍星辰正進(jìn)行新一輪融資:階躍星辰由微軟前全球副總裁姜大昕創(chuàng)辦，在自研大模型、應(yīng)用產(chǎn)品先后亮相后，壘起更大的雪球。據(jù)悉，階躍星辰正在進(jìn)行一輪估值20億美元的新融資，阿里巴巴再次出現(xiàn)在布局傳聞中。

OpenAI 收購(gòu)谷歌華人工程師創(chuàng)辦的遠(yuǎn)程協(xié)作公司 Multi：Multi 提供的功能包括滿(mǎn)足最多 10 人通過(guò)屏幕共享進(jìn)行協(xié)作、自定義快捷方式以及代碼、設(shè)計(jì)以及文檔的自動(dòng)鏈接。此前，Multi 已經(jīng)從 Greylock 以及 First Round Capital 等風(fēng)投公司籌集近 1300 萬(wàn)美元。交易完成后，Multi 團(tuán)隊(duì)的 5 名成員將加入 OpenAI。CEP Alexander Embiricos 表示，Multi 將在 7 月 24 日后關(guān)閉。

凌川科技獲北京市人工智能產(chǎn)業(yè)基金投資：北京凌川科技有限公司新增股東為北京市人工智能產(chǎn)業(yè)投資基金。成立于2023年3月，法定代表人劉凌志是快手異構(gòu)計(jì)算的負(fù)責(zé)人兼首席架構(gòu)師，是快手異構(gòu)計(jì)算中心的第一位員工。凌川智能科技由硅谷和國(guó)內(nèi)半導(dǎo)體，智能視頻和AI大模型領(lǐng)域頂尖人才組建，目標(biāo)是打造面向多模態(tài)大模型和視頻生成式AI的芯片和軟硬件算力底座。

胤媧生物獲得3000萬(wàn)人民幣戰(zhàn)略投資：胤媧生物是一家數(shù)智人開(kāi)發(fā)商，專(zhuān)注于生物科技與數(shù)字科技交融。投資方為祖炎科技。

“DreamTech”連續(xù)完成兩輪數(shù)千萬(wàn)元融資：DreamTech AI自主研發(fā)了通用的3D生成與渲染模型，該模型可以將文本轉(zhuǎn)化為3D模型，也可以通過(guò)單/多視圖圖像生成3D模型。這一技術(shù)能廣泛應(yīng)用于AR、VR、游戲、3D設(shè)計(jì)和打印、動(dòng)畫(huà)制作等相關(guān)行業(yè)。天使輪為元禾原點(diǎn)領(lǐng)投，啟迪之星創(chuàng)投、云天使基金跟投，天使+輪為初心資本獨(dú)家投資。據(jù)了解，DreamTech新一輪融資即將啟動(dòng)，一葦資本擔(dān)任獨(dú)家財(cái)務(wù)顧問(wèn)。

（歡迎添加微信AIyanxishe2，了解更多AIGC、融資情況，與志同道合的朋友一同暢聊時(shí)新AI產(chǎn)品）

國(guó)內(nèi)情報(bào)：

OpenAI終止對(duì)中國(guó)提供API服務(wù)，智譜AI、零一萬(wàn)物、商湯提供“搬家計(jì)劃”：

OpenAI官網(wǎng)信息顯示，自7月9日起，OpenAI將終止對(duì)中國(guó)大陸提供API（應(yīng)用程序編程接口）服務(wù)。

國(guó)產(chǎn)大模型快速發(fā)布應(yīng)對(duì)方案。智譜GLM 大模型全面對(duì)標(biāo) OpenAI 產(chǎn)品體系，全鏈路技術(shù)自研、安全可控。為開(kāi)發(fā)者提供：1.5億 Token（5000萬(wàn) GLM-4 + 1億 GLM-4-Air）；從 OpenAI 到 GLM 的系列遷移培訓(xùn)。為高用量客戶(hù)提供：與 OpenAI 使用規(guī)模對(duì)等的 Token 贈(zèng)送計(jì)劃(不設(shè)上限)；與 OpenAI 對(duì)等的并發(fā)規(guī)模；匹配高等級(jí)會(huì)員政策；專(zhuān)屬搬家顧問(wèn)及5人天技術(shù)專(zhuān)家支持；備案培訓(xùn)和輔助。

零一萬(wàn)物公司發(fā)起了 “Yi API 二折平替計(jì)劃”，為 OpenAI 用戶(hù)提供了平滑遷移至 Yi 系列大模型的服務(wù)。Yi API 提供了與 GPT-4o 相當(dāng)甚至更優(yōu)的模型性能，同時(shí)在成本上有顯著優(yōu)勢(shì)，最高可達(dá) 91% 的成本削減。零一萬(wàn)物還提供了一系列的優(yōu)惠和服務(wù)，如贈(zèng)送 100 元額度、充值贈(zèng)送 50% 額度、提供 Prompt 兼容調(diào)優(yōu)服務(wù)等。

商湯科技宣布推出大模型0元購(gòu)計(jì)劃，成為商湯“日日新SenseNova”新注冊(cè)企業(yè)用戶(hù)，贈(zèng)送5000萬(wàn)Token包，并且派出專(zhuān)屬搬家顧問(wèn)，提供從OpenAI 到“日日新SenseNova”的遷移系列培訓(xùn)，讓新用戶(hù)入駐新家舒適順利。

商湯大模型AI辦公助手「辦公小浣熊」上線微信小程序版：

數(shù)據(jù)分析產(chǎn)品「辦公小浣熊」正式上線“小程序版”——Raccoon智能助手。既擁有網(wǎng)頁(yè)版的完整功能，又專(zhuān)為移動(dòng)辦公定制專(zhuān)屬技能?？梢栽谛〕绦蛑?，直接插入微信聊天中的文件（xls/xlsx/csv/txt/json等）。簡(jiǎn)單幾句對(duì)話，就能提煉重點(diǎn)、生成各類(lèi)圖表。能以縝密的邏輯推理能力，給出更多建議。

騰訊開(kāi)源新視頻控制方式 MOFA-Video：

MOFA-Video是騰訊最新開(kāi)源的視頻控制技術(shù)，用戶(hù)能夠通過(guò)箭頭控制視頻內(nèi)容的運(yùn)動(dòng)方向，還能遷移面部表情到新生成的人臉視頻，創(chuàng)造全新角色和情感表達(dá)。能夠適應(yīng)各種復(fù)雜的動(dòng)畫(huà)場(chǎng)景，無(wú)論是手動(dòng)軌跡、人體標(biāo)記序列還是音頻驅(qū)動(dòng)的面部動(dòng)畫(huà)，都能輕松應(yīng)對(duì)。

騰訊混元提供支持，QQ 瀏覽器 AI 助手升級(jí)：

升級(jí)后的“AI 助手”能夠?qū)崿F(xiàn)智能摘要、提煉重點(diǎn)、選詞解讀、AI 問(wèn)答、AI 伴隨、隨手摘錄等功能。

姚班天才組隊(duì)又一力作！摸魚(yú)小游戲《我把大模型玩壞了》上線：

《我把大模型玩壞了》是一款專(zhuān)為工作日想要偷偷休息的人們量身打造的游戲，由曠視科技研究總經(jīng)理范浩強(qiáng)領(lǐng)銜開(kāi)發(fā)，背后得到野貓子工作室和階躍星辰的強(qiáng)大支持。游戲結(jié)合了多模態(tài)和multi-Agent等技術(shù)支持，新增了成就列表、排行榜、AI評(píng)價(jià)等功能，提升玩家體驗(yàn)。

中國(guó)移動(dòng)算力中心北京節(jié)點(diǎn)投入使用：

部署近4000張AI加速卡，AI芯片國(guó)產(chǎn)化率33%，智能算力規(guī)模超1000P。這是通信運(yùn)營(yíng)商在北京建成的首個(gè)大規(guī)模訓(xùn)推一體智算中心

昆侖萬(wàn)維發(fā)布Q*算法，百倍提升7B模型推理能力：

Q * 框架通過(guò)將大語(yǔ)言模型的推理軌跡分解為若干個(gè)狀態(tài)，并利用 A * 搜索算法實(shí)現(xiàn)全盤(pán)規(guī)劃，提升了開(kāi)源模型在推理任務(wù)上的性能。目前，Q * 算法的研究仍處于初級(jí)階段，但已經(jīng)證明了其能夠幫助參數(shù)量?jī)H為 7B 的小模型達(dá)到與參數(shù)量大數(shù)十倍甚至上百倍模型相當(dāng)?shù)耐评砟芰?，大幅提升了模型的性能，并顯著降低了計(jì)算資源的需求。

微盟發(fā)布AI應(yīng)用產(chǎn)品WAI Pro，提供定制化大模型應(yīng)用能力：

這款產(chǎn)品主要面向品牌商家、4A廣告公司、營(yíng)銷(xiāo)代運(yùn)營(yíng)團(tuán)隊(duì)和內(nèi)容創(chuàng)作團(tuán)隊(duì)，提供營(yíng)銷(xiāo)洞察、內(nèi)容創(chuàng)作和商業(yè)咨詢(xún)?nèi)箢?lèi)AI技術(shù)服務(wù)。WAI Pro 的初步版本支持多模型、多 Agent 的 AI 應(yīng)用，服務(wù)于商家的經(jīng)營(yíng)和營(yíng)銷(xiāo)，并提供了如客戶(hù)定制風(fēng)格 LoRA、數(shù)字人視頻口播、賽博編輯部等前沿功能。

全球首個(gè)烹飪大模型 “食神”：

老板電器發(fā)布的 “食神” 大模型。該模型基于數(shù)十億級(jí)行業(yè)數(shù)據(jù)和數(shù)千萬(wàn)級(jí)知識(shí)圖譜構(gòu)建，能夠提供個(gè)性化的烹飪解決方案，包括菜譜推薦、火候提醒、飯菜成熟度監(jiān)測(cè)以及協(xié)助用戶(hù)完成烹飪過(guò)程。目前尚處于發(fā)布階段，預(yù)計(jì)將在 10 月進(jìn)行內(nèi)測(cè)，12 月正式上線。

絲芭傳媒內(nèi)測(cè)AIGC產(chǎn)品：

“鸚鵡人” 和 “美踏元宇宙”兩款產(chǎn)品基于多模態(tài) AI 大模型 PARO。鸚鵡人 APP 可以創(chuàng)建個(gè)性化的 3D 虛擬形象，并利用內(nèi)置的 AI 功能，如文生音樂(lè)、音生舞等，來(lái)創(chuàng)作 UGC/PGC 內(nèi)容。美踏元宇宙則是一個(gè)以偶像及粉絲娛樂(lè)、AI 模擬互動(dòng)娛樂(lè)和互動(dòng)游戲?yàn)楹诵牡?UGC 內(nèi)容矩陣，它通過(guò) AI、AI Agent 和 Web 3.0 技術(shù)的融合，帶來(lái)新型的娛樂(lè)和社交體驗(yàn)。據(jù)悉絲芭傳媒自研的多模態(tài) AI 大模型 PARO已完成深度合成服務(wù)算法備案。

國(guó)際情報(bào)：

OpenAI放寬股票限制，員工財(cái)富變現(xiàn)有望，IPO仍遙遙無(wú)期：

OpenAI將允許現(xiàn)任和前任員工平等參與年度股票招標(biāo)，這一舉措標(biāo)志著公司在股權(quán)管理方面的重要轉(zhuǎn)變。盡管股票銷(xiāo)售政策放寬，OpenAI的IPO計(jì)劃仍無(wú)明確時(shí)間表。公司高管此前表示，短期內(nèi)不會(huì)考慮上市。

亞馬遜秘密研發(fā)聊天機(jī)器人“Metis”，挑戰(zhàn) ChatGPT：

據(jù)悉，Metis 能夠以一種智能對(duì)話的方式回答文本和圖像相關(guān)的問(wèn)題，并提供相應(yīng)的信息來(lái)源鏈接，推薦后續(xù)查詢(xún)，甚至生成圖像。亞馬遜希望 Metis 能夠利用“檢索增強(qiáng)生成”技術(shù)，獲取超出其訓(xùn)練數(shù)據(jù)之外的信息，從而生成最新的信息。

Metis 項(xiàng)目的暫定發(fā)布時(shí)間為 9 月，但具體發(fā)布時(shí)間可能會(huì)發(fā)生變化。

谷歌將推出明星網(wǎng)紅AI聊天機(jī)器人：

消息稱(chēng)谷歌的明星網(wǎng)紅AI聊天機(jī)器人將由該公司的Gemini大語(yǔ)言模型提供支持。該公司還在嘗試與有影響力的明星網(wǎng)紅建立合作伙伴關(guān)系，并且還在開(kāi)發(fā)一項(xiàng)功能，讓人們只需描述自己的個(gè)性和外表就可以創(chuàng)建自己的聊天機(jī)器人，類(lèi)似Character.ai的做法。

DeepMind發(fā)現(xiàn)政治深度偽造是AI惡意使用的首要問(wèn)題：

DeepMind 進(jìn)行關(guān)于 AI 惡意使用的研究，發(fā)現(xiàn) AI 生成的 Deepfakes 比其他惡意行為更為普遍，尤其是在影響公眾輿論方面。研究揭示了通過(guò)制作虛假人物圖像、視頻和音頻的行為幾乎是濫用生成 AI 工具的次數(shù)最多的一種，占使用情況的 27%。此外，研究還顯示了賺錢(qián)是濫用 AI 的第二大動(dòng)機(jī)，包括提供 Deepfakes 服務(wù)和虛假新聞創(chuàng)作。

消息稱(chēng)因隱私問(wèn)題，蘋(píng)果拒絕與 Meta 合作將其 AI 聊天機(jī)器人帶入 iOS 18：

蘋(píng)果公司因隱私問(wèn)題拒絕了與 Facebook 母公司 Meta 的人工智能合作。今年 3 月，Meta 和蘋(píng)果曾就可能的合作進(jìn)行過(guò)簡(jiǎn)短討論，但談判沒(méi)有取得進(jìn)展，蘋(píng)果也不計(jì)劃將 Meta 的大型語(yǔ)言模型集成到 iOS 系統(tǒng)中。

全球三大唱片公司起訴AI音樂(lè)生成公司Udio和Suno：

全球三大唱片公司環(huán)球音樂(lè)、索尼音樂(lè)、華納音樂(lè)起訴了AI音樂(lè)技術(shù)公司Udio和Suno，稱(chēng)它們利用唱片公司的內(nèi)容來(lái)訓(xùn)練生成音樂(lè)的AI系統(tǒng)，大規(guī)模侵犯了版權(quán)。唱片公司指出，這些AI公司在沒(méi)有獲得明確授權(quán)的情況下就復(fù)制音樂(lè)，以訓(xùn)練它們的AI系統(tǒng)進(jìn)行創(chuàng)作，這些音樂(lè)作品可能會(huì)在市場(chǎng)上與人類(lèi)藝術(shù)家的作品形成競(jìng)爭(zhēng)，降低藝術(shù)作品的價(jià)值，最終將人類(lèi)藝術(shù)家的作品淹沒(méi)。

大模型測(cè)試題爆火，GPT-4 和 Claude3 都跪了，LeCun 轉(zhuǎn)發(fā)：

一項(xiàng)新的 “大模型 Benchmark” 在推特上引起廣泛關(guān)注，即使是 GPT-4 和 Claude 3 還是其他 12 款大模型，包括文心一言、通義千問(wèn)等先進(jìn)的大模型在面對(duì)經(jīng)典的邏輯學(xué)問(wèn)題 “動(dòng)物過(guò)河” 時(shí)都無(wú)法給出正確答案，而 Yann LeCun 也對(duì)此表示關(guān)注，這個(gè) Benchmark 揭示了大模型在推理和理解問(wèn)題方面的局限性。

15個(gè)AI模型只有3個(gè)得分超 50%，SIUO 跑分被提出：

大部分主流多模態(tài) AI 模型在接收?qǐng)D片和文本內(nèi)容等多模態(tài)輸入后，輸出的結(jié)果存在安全性問(wèn)題。該研究提出了 “安全輸入但不安全輸出”（SIUO）的概念，涉及道德、危險(xiǎn)行為等九個(gè)安全領(lǐng)域。在測(cè)試了 15 個(gè)大型視覺(jué)語(yǔ)言模型中，只有 GPT-4v（53.29%）、GPT-4o（50.9%）和 Gemini 1.5（52.1%）三個(gè)模型的得分超過(guò)了 50%為了解決這些問(wèn)題，需要開(kāi)發(fā)能夠結(jié)合多種模式見(jiàn)解并理解現(xiàn)實(shí)世界知識(shí)的 LVLM。這些模型還應(yīng)能夠通過(guò)綜合推理理解用戶(hù)意圖，即使在文本中沒(méi)有明確說(shuō)明。

更多國(guó)際情報(bào)：

英偉達(dá)副總裁Jankowski跳槽至某家初創(chuàng)公司：英偉達(dá)負(fù)責(zé)投資者關(guān)系與戰(zhàn)略融資的副總裁Simona Jankowski跳槽，將在某家初創(chuàng)公司擔(dān)任首席財(cái)務(wù)官。Jankowski曾是高盛集團(tuán)的資深分析師，于2017年加入英偉達(dá)。

Deepfake生成的馬斯克出現(xiàn)在YouTube直播加密貨幣騙局：該直播長(zhǎng)達(dá)五個(gè)小時(shí)，冒充特斯拉活動(dòng)現(xiàn)場(chǎng)直播，誘導(dǎo)觀眾將比特幣等虛擬貨幣存入特定網(wǎng)站以獲得雙倍回報(bào)，超過(guò) 3 萬(wàn)名在線觀眾，該視頻流及其賬戶(hù)因違規(guī)被 Google 刪除。

Meta 將真實(shí)照片標(biāo)記為“AI 生成”，引發(fā)多名攝影師不滿(mǎn)：即使攝影師使用生成式 AI 工具（例如 Adobe 的“生成填充”功能）移除照片中的微小物體，Meta 平臺(tái)也可能會(huì)誤將其標(biāo)記為“AI 生成”。

Shopify推出AI 聊天機(jī)器人Sidekick：Sidekick 旨在為商家提供支持聊天機(jī)器人，幫助他們制作折扣代碼、生成商店報(bào)告或建議博客文章創(chuàng)意等。目前僅限于在北美擁有英語(yǔ)商店的商家使用。

Synthesia發(fā)布2.0版本，推交互式AI視頻和全身虛擬人物：引入了交互式視頻和全身虛擬人物，新功能包括AI屏幕錄制工具，簡(jiǎn)化企業(yè)創(chuàng)建操作指南流程。更新后的虛擬人物擁有更多肢體語(yǔ)言，增強(qiáng)數(shù)字角色的敘事能力。

EvTexture快速將模糊視頻一鍵變高清：通過(guò)捕捉高頻動(dòng)態(tài)細(xì)節(jié)，讓視頻的紋理質(zhì)量得到質(zhì)的飛躍。利用事件相機(jī)記錄的細(xì)微變化，擅長(zhǎng)處理樹(shù)葉、衣服條紋等復(fù)雜細(xì)節(jié)。該技術(shù)并沒(méi)有明顯增加處理視頻所需的時(shí)間。

LG Uplus發(fā)布小型生成式AI模型ixi-GEN，可本地微調(diào)：該生成式 AI 是一種基于其通信和平臺(tái)數(shù)據(jù)訓(xùn)練的小型大語(yǔ)言模型，使用 LG 集團(tuán)旗下的人工智能實(shí)驗(yàn)室 LG AI Research 開(kāi)發(fā)的超大規(guī)模多模態(tài) AI Exaone。

Cloudflare為免費(fèi)用戶(hù)推出AI爬蟲(chóng)防護(hù)功能：該功能之前只對(duì)訂閱用戶(hù)開(kāi)放。Cloudflare 的 AI 爬蟲(chóng)防護(hù)可能通過(guò)識(shí)別常見(jiàn)的 AI 爬蟲(chóng)例如 OpenAI 的 GPTBot 來(lái)進(jìn)行攔截。但仍然面臨著一些公司不遵守 robots.txt 協(xié)議且不公布爬蟲(chóng)名稱(chēng)的挑戰(zhàn)。

Product Hunt 熱榜，AI 社交媒體管理助手 Pygma

Pygma 是一款專(zhuān)注于 Instagram 的 AI 工具，通過(guò)對(duì)話格式幫助用戶(hù)規(guī)劃內(nèi)容、創(chuàng)作帖子、故事和視頻，并直接安排發(fā)布。提供 7 天免費(fèi)試用。通過(guò)分析用戶(hù)的 Instagram 數(shù)據(jù)定制內(nèi)容，提供完整的內(nèi)容規(guī)劃，讓用戶(hù)輕松查看內(nèi)容網(wǎng)格并獲取 7 天內(nèi)容建議。

Pygma 能快速創(chuàng)建個(gè)性化圖片，并允許用戶(hù)編輯現(xiàn)有圖片。支持將用戶(hù)的聲音自動(dòng)添加到動(dòng)畫(huà)視覺(jué)中，并直接從應(yīng)用程序安排發(fā)布。適用于個(gè)人、中小企業(yè)和品牌，支持 LinkedIn、Facebook 和 Slack 等平臺(tái)。

?https://www.pygma.me/?ref=producthunt

GitHub Trending 熱榜，基于 AI 的任務(wù)分解與執(zhí)行框架 Doriandarko/maestro

Doriandarko/maestro 項(xiàng)目是一個(gè)強(qiáng)大的 Python 腳本框架，專(zhuān)注于通過(guò) AI 實(shí)現(xiàn)任務(wù)分解和工作流程的執(zhí)行。這個(gè)框架巧妙地利用了 Anthropic API 中的 Opus 和 Haiku 兩種 AI 模型，來(lái)將一個(gè)復(fù)雜的目標(biāo)分解為多個(gè)子任務(wù)，然后逐個(gè)執(zhí)行并整合結(jié)果，生成一個(gè)連貫的最終輸出。主要功能包含：

任務(wù)分解：將復(fù)雜目標(biāo)分解為可管理的子任務(wù)。

子任務(wù)執(zhí)行：逐個(gè)執(zhí)行子任務(wù)，并整合結(jié)果。

上下文記憶：為 Haiku 模型提供上下文記憶，增加智能性。

結(jié)果細(xì)化：使用 Opus 模型對(duì)子任務(wù)結(jié)果進(jìn)行細(xì)化和優(yōu)化。

交互日志：生成和保存詳細(xì)的交互日志，支持 Markdown 格式。

模型提示優(yōu)化：改進(jìn) Opus 模型提示，更好地評(píng)估任務(wù)完成情況。

代碼生成：在代碼項(xiàng)目中創(chuàng)建文件和文件夾。

?https://github.com/Doriandarko/maestro

開(kāi)發(fā)者推薦

1.Streamer-Sales：AI 賦能的智能賣(mài)貨主播系統(tǒng)

Streamer-Sales 是基于 InternLM2-chat-7b 大模型的 AI 賣(mài)貨主播系統(tǒng)，通過(guò)集成加速推理、語(yǔ)音識(shí)別、文字生成和數(shù)字人視頻生成，生成智能商品解說(shuō)激發(fā)用戶(hù)的購(gòu)買(mǎi)意愿。

項(xiàng)目提供了詳細(xì)的數(shù)據(jù)生成流程，包括生成訓(xùn)練數(shù)據(jù)集、模型訓(xùn)練、生成說(shuō)明書(shū)、構(gòu)建 RAG 向量數(shù)據(jù)庫(kù)、部署模型和添加商品信息等步驟。Streamer-Sales 支持本地部署和在線體驗(yàn)，并提供了詳細(xì)的指南和文檔。

?https://github.com/PeterH0323/Streamer-Sales

?https://openxlab.org.cn/apps/detail/HinGwenWong/Streamer-Sales

2.eidos：開(kāi)源、離線的個(gè)人知識(shí)管理框架

eidos 是一個(gè)開(kāi)源的、基于瀏覽器的個(gè)人知識(shí)管理框架，旨在作為 Notion 的離線替代品，支持?jǐn)?shù)據(jù)的本地化存儲(chǔ)和管理，并與人工智能深度集成，提供多種擴(kuò)展性接口，適合開(kāi)發(fā)者定制和開(kāi)發(fā)。這是一個(gè)為期一生的個(gè)人數(shù)據(jù)管理框架，可以在瀏覽器中運(yùn)行，無(wú)需 Web 服務(wù)器。支持離線訪問(wèn)，數(shù)據(jù)存儲(chǔ)在本地以確保快速性能?？蚣芘c大語(yǔ)言模型深度集成，提供 AI 輔助功能。

eidos 具有高度可擴(kuò)展性，允許用戶(hù)通過(guò)編寫(xiě) JavaScript 函數(shù)、TypeScript/JavaScript 腳本、以及使用任意框架構(gòu)建自定義應(yīng)用來(lái)定制和擴(kuò)展。開(kāi)發(fā)者友好的 API & SDK 支持，以及標(biāo)準(zhǔn)化的 SQLite 數(shù)據(jù)庫(kù)，每個(gè)表格都是 SQLite 表格。

?https://github.com/mayneyao/eidos?utm_source=uwl.me

3.Magnific AI：高分辨率圖像放大與場(chǎng)景照明

Magnific AI 是一個(gè)基于生成式 AI 技術(shù)的圖像放大器、增強(qiáng)器和轉(zhuǎn)換器。它能將圖片轉(zhuǎn)換為高分辨率版本，并根據(jù)用戶(hù)的描述和控制選項(xiàng)增加細(xì)節(jié)。適用于各種背景和技能水平的創(chuàng)作者。

最新發(fā)布的 Magnific Relight 功能，可以通過(guò)三種方式調(diào)整場(chǎng)景照明和背景：文本提示、參考圖片或自繪光照?qǐng)D。Javi Lopez 在 X 賬號(hào)上發(fā)布消息，形象地描述了從黑暗到光明的轉(zhuǎn)變，并提供了相關(guān)鏈接和教程。

?https://magnific.ai/

4. LongRAG：融合長(zhǎng)文本理解與檢索生成的問(wèn)答新突破

LongRAG 模型采用了長(zhǎng)文本檢索器，能夠顯著減少檢索單元的數(shù)量，提高檢索效率。通過(guò)操作更長(zhǎng)的檢索單元，系統(tǒng)整體的召回率和準(zhǔn)確率得到了提升。長(zhǎng)文本閱讀器則利用大型語(yǔ)言模型的零樣本回答抽取能力，進(jìn)一步優(yōu)化了系統(tǒng)性能。

LongRAG 在 HotpotQA基準(zhǔn)測(cè)試上達(dá)到了 64.3% 的準(zhǔn)確率，與當(dāng)前最先進(jìn)的模型相當(dāng)。研究強(qiáng)調(diào)，即使在看似競(jìng)爭(zhēng)性的技術(shù)之間，也存在混合使用以達(dá)到更好結(jié)果的機(jī)會(huì)。

?https://arxiv.org/abs/2406.15319

5. Unique3D：?jiǎn)螐垐D像生成高質(zhì)量 3D

Unique3D 是一個(gè)創(chuàng)新性的框架，旨在從單張圖像生成高質(zhì)量的 3D 網(wǎng)格。這個(gè)框架能在 30 秒內(nèi)生成與原始輸入圖像高度相似的高保真紋理和幾何細(xì)節(jié)的網(wǎng)格。其訓(xùn)練過(guò)程只需 8 張 RTX4090 顯卡 5 天時(shí)間。

Unique3D 通過(guò)一個(gè)多視角擴(kuò)散模型和相應(yīng)的法線擴(kuò)散模型來(lái)生成帶有法線圖的多視角圖像，并通過(guò)一個(gè)多層次上采樣過(guò)程來(lái)逐步提高生成的正交多視角圖像的分辨率。最后，利用一種名為 ISOMER 的即時(shí)一致性網(wǎng)格重建算法，將顏色和幾何先驗(yàn)完全融入網(wǎng)格結(jié)果中，生成高質(zhì)量的 3D 網(wǎng)格。在實(shí)驗(yàn)中顯示出在幾何和紋理細(xì)節(jié)方面具有顯著的優(yōu)勢(shì)，與其他圖像到 3D 的基線方法相比更勝一籌。

?https://wukailu.github.io/Unique3D/

熱議話題

斯科特?阿隆森：狗狗與 AI，誰(shuí)在掌控？

Scott Joel Aaronson是一位美國(guó)理論計(jì)算機(jī)科學(xué)家，也是德克薩斯大學(xué)奧斯汀分校的斯倫貝杰百年計(jì)算機(jī)科學(xué)主席。他提出了一個(gè)有趣的類(lèi)比：較低智商的狗狗通過(guò)迷人的行為影響人類(lèi)，從而達(dá)到控制人類(lèi)的效果。他將這一現(xiàn)象類(lèi)比到人工智能與人類(lèi)的關(guān)系中，探討在 AI 統(tǒng)治下，人類(lèi)可能會(huì)處于與狗相似的地位，以及這種情況下人類(lèi)可能的未來(lái)命運(yùn)。

在Reddit版塊中，用戶(hù)們圍繞斯科特?阿隆森關(guān)于較低智商物種控制較高智商物種的觀點(diǎn)展開(kāi)了熱烈討論。阿隆森以狗狗影響人類(lèi)為例，指出狗狗通過(guò)與人類(lèi)的互動(dòng)，使人類(lèi)服從于它們的需求。這一類(lèi)比引發(fā)了對(duì)人工智能未來(lái)影響的廣泛思考，其中包括 AI 統(tǒng)治下人類(lèi)可能成為“寵物”的情景。

敬請(qǐng)期待明日的最新動(dòng)態(tài)！

AI情報(bào)局征集情報(bào)合伙人，匯集獨(dú)家價(jià)值線索！如果您可以提供有關(guān)AI最新成果&行業(yè)內(nèi)幕&獨(dú)特產(chǎn)品，請(qǐng)?zhí)砑舆\(yùn)營(yíng)微信號(hào)：AIyanxishe2備注行業(yè)崗位。

雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

我在思考中

運(yùn)營(yíng)

發(fā)私信

當(dāng)月熱門(mén)文章

曝階躍星辰正在進(jìn)行估值20億美元融資；OpenAI放寬股票限制；Suno和Udio遭三大唱片公司起訴丨AI情報(bào)局

曝階躍星辰正在進(jìn)行估值20億美元融資；OpenAI放寬股票限制；Suno和Udio遭三大唱片公司起訴丨AI情報(bào)局