0
本文作者: 我在思考中 | 2024-06-26 09:59 |
融資快報(bào)
曝階躍星辰正進(jìn)行新一輪融資:階躍星辰由微軟前全球副總裁姜大昕創(chuàng)辦,在自研大模型、應(yīng)用產(chǎn)品先后亮相后,壘起更大的雪球。據(jù)悉,階躍星辰正在進(jìn)行一輪估值20億美元的新融資,阿里巴巴再次出現(xiàn)在布局傳聞中。
OpenAI 收購(gòu)谷歌華人工程師創(chuàng)辦的遠(yuǎn)程協(xié)作公司 Multi:Multi 提供的功能包括滿(mǎn)足最多 10 人通過(guò)屏幕共享進(jìn)行協(xié)作、自定義快捷方式以及代碼、設(shè)計(jì)以及文檔的自動(dòng)鏈接。此前,Multi 已經(jīng)從 Greylock 以及 First Round Capital 等風(fēng)投公司籌集近 1300 萬(wàn)美元。交易完成后,Multi 團(tuán)隊(duì)的 5 名成員將加入 OpenAI。CEP Alexander Embiricos 表示,Multi 將在 7 月 24 日后關(guān)閉。
凌川科技獲北京市人工智能產(chǎn)業(yè)基金投資:北京凌川科技有限公司新增股東為北京市人工智能產(chǎn)業(yè)投資基金。成立于2023年3月,法定代表人劉凌志是快手異構(gòu)計(jì)算的負(fù)責(zé)人兼首席架構(gòu)師,是快手異構(gòu)計(jì)算中心的第一位員工。凌川智能科技由硅谷和國(guó)內(nèi)半導(dǎo)體,智能視頻和AI大模型領(lǐng)域頂尖人才組建,目標(biāo)是打造面向多模態(tài)大模型和視頻生成式AI的芯片和軟硬件算力底座。
胤媧生物獲得3000萬(wàn)人民幣戰(zhàn)略投資:胤媧生物是一家數(shù)智人開(kāi)發(fā)商,專(zhuān)注于生物科技與數(shù)字科技交融。投資方為祖炎科技。
“DreamTech”連續(xù)完成兩輪數(shù)千萬(wàn)元融資:DreamTech AI自主研發(fā)了通用的3D生成與渲染模型,該模型可以將文本轉(zhuǎn)化為3D模型,也可以通過(guò)單/多視圖圖像生成3D模型。這一技術(shù)能廣泛應(yīng)用于AR、VR、游戲、3D設(shè)計(jì)和打印、動(dòng)畫(huà)制作等相關(guān)行業(yè)。天使輪為元禾原點(diǎn)領(lǐng)投,啟迪之星創(chuàng)投、云天使基金跟投,天使+輪為初心資本獨(dú)家投資。據(jù)了解,DreamTech新一輪融資即將啟動(dòng),一葦資本擔(dān)任獨(dú)家財(cái)務(wù)顧問(wèn)。
(歡迎添加微信AIyanxishe2,了解更多AIGC、融資情況,與志同道合的朋友一同暢聊時(shí)新AI產(chǎn)品)
國(guó)內(nèi)情報(bào):
OpenAI終止對(duì)中國(guó)提供API服務(wù),智譜AI、零一萬(wàn)物、商湯提供“搬家計(jì)劃”:
OpenAI官網(wǎng)信息顯示,自7月9日起,OpenAI將終止對(duì)中國(guó)大陸提供API(應(yīng)用程序編程接口)服務(wù)。
國(guó)產(chǎn)大模型快速發(fā)布應(yīng)對(duì)方案。智譜GLM 大模型全面對(duì)標(biāo) OpenAI 產(chǎn)品體系,全鏈路技術(shù)自研、安全可控。為開(kāi)發(fā)者提供:1.5億 Token(5000萬(wàn) GLM-4 + 1億 GLM-4-Air);從 OpenAI 到 GLM 的系列遷移培訓(xùn)。為高用量客戶(hù)提供:與 OpenAI 使用規(guī)模對(duì)等的 Token 贈(zèng)送計(jì)劃(不設(shè)上限);與 OpenAI 對(duì)等的并發(fā)規(guī)模;匹配高等級(jí)會(huì)員政策;專(zhuān)屬搬家顧問(wèn)及5人天技術(shù)專(zhuān)家支持;備案培訓(xùn)和輔助。
零一萬(wàn)物公司發(fā)起了 “Yi API 二折平替計(jì)劃”,為 OpenAI 用戶(hù)提供了平滑遷移至 Yi 系列大模型的服務(wù)。Yi API 提供了與 GPT-4o 相當(dāng)甚至更優(yōu)的模型性能,同時(shí)在成本上有顯著優(yōu)勢(shì),最高可達(dá) 91% 的成本削減。零一萬(wàn)物還提供了一系列的優(yōu)惠和服務(wù),如贈(zèng)送 100 元額度、充值贈(zèng)送 50% 額度、提供 Prompt 兼容調(diào)優(yōu)服務(wù)等。
商湯科技宣布推出大模型0元購(gòu)計(jì)劃,成為商湯“日日新SenseNova”新注冊(cè)企業(yè)用戶(hù),贈(zèng)送5000萬(wàn)Token包,并且派出專(zhuān)屬搬家顧問(wèn),提供從OpenAI 到“日日新SenseNova”的遷移系列培訓(xùn),讓新用戶(hù)入駐新家舒適順利。
商湯大模型AI辦公助手「辦公小浣熊」上線微信小程序版:
數(shù)據(jù)分析產(chǎn)品「辦公小浣熊」正式上線“小程序版”——Raccoon智能助手。既擁有網(wǎng)頁(yè)版的完整功能,又專(zhuān)為移動(dòng)辦公定制專(zhuān)屬技能??梢栽谛〕绦蛑?,直接插入微信聊天中的文件(xls/xlsx/csv/txt/json等)。簡(jiǎn)單幾句對(duì)話(huà),就能提煉重點(diǎn)、生成各類(lèi)圖表。能以縝密的邏輯推理能力,給出更多建議。
騰訊開(kāi)源新視頻控制方式 MOFA-Video:
MOFA-Video是騰訊最新開(kāi)源的視頻控制技術(shù),用戶(hù)能夠通過(guò)箭頭控制視頻內(nèi)容的運(yùn)動(dòng)方向,還能遷移面部表情到新生成的人臉視頻,創(chuàng)造全新角色和情感表達(dá)。能夠適應(yīng)各種復(fù)雜的動(dòng)畫(huà)場(chǎng)景,無(wú)論是手動(dòng)軌跡、人體標(biāo)記序列還是音頻驅(qū)動(dòng)的面部動(dòng)畫(huà),都能輕松應(yīng)對(duì)。
騰訊混元提供支持,QQ 瀏覽器 AI 助手升級(jí):
升級(jí)后的“AI 助手”能夠?qū)崿F(xiàn)智能摘要、提煉重點(diǎn)、選詞解讀、AI 問(wèn)答、AI 伴隨、隨手摘錄等功能。
姚班天才組隊(duì)又一力作!摸魚(yú)小游戲《我把大模型玩壞了》上線:
《我把大模型玩壞了》是一款專(zhuān)為工作日想要偷偷休息的人們量身打造的游戲,由曠視科技研究總經(jīng)理范浩強(qiáng)領(lǐng)銜開(kāi)發(fā),背后得到野貓子工作室和階躍星辰的強(qiáng)大支持。游戲結(jié)合了多模態(tài)和multi-Agent等技術(shù)支持,新增了成就列表、排行榜、AI評(píng)價(jià)等功能,提升玩家體驗(yàn)。
中國(guó)移動(dòng)算力中心北京節(jié)點(diǎn)投入使用:
部署近4000張AI加速卡,AI芯片國(guó)產(chǎn)化率33%,智能算力規(guī)模超1000P。這是通信運(yùn)營(yíng)商在北京建成的首個(gè)大規(guī)模訓(xùn)推一體智算中心
昆侖萬(wàn)維發(fā)布Q*算法,百倍提升7B模型推理能力:
Q * 框架通過(guò)將大語(yǔ)言模型的推理軌跡分解為若干個(gè)狀態(tài),并利用 A * 搜索算法實(shí)現(xiàn)全盤(pán)規(guī)劃,提升了開(kāi)源模型在推理任務(wù)上的性能。目前,Q * 算法的研究仍處于初級(jí)階段,但已經(jīng)證明了其能夠幫助參數(shù)量?jī)H為 7B 的小模型達(dá)到與參數(shù)量大數(shù)十倍甚至上百倍模型相當(dāng)?shù)耐评砟芰Γ蠓嵘四P偷男阅?,并顯著降低了計(jì)算資源的需求。
微盟發(fā)布AI應(yīng)用產(chǎn)品WAI Pro,提供定制化大模型應(yīng)用能力:
這款產(chǎn)品主要面向品牌商家、4A廣告公司、營(yíng)銷(xiāo)代運(yùn)營(yíng)團(tuán)隊(duì)和內(nèi)容創(chuàng)作團(tuán)隊(duì),提供營(yíng)銷(xiāo)洞察、內(nèi)容創(chuàng)作和商業(yè)咨詢(xún)?nèi)箢?lèi)AI技術(shù)服務(wù)。WAI Pro 的初步版本支持多模型、多 Agent 的 AI 應(yīng)用,服務(wù)于商家的經(jīng)營(yíng)和營(yíng)銷(xiāo),并提供了如客戶(hù)定制風(fēng)格 LoRA、數(shù)字人視頻口播、賽博編輯部等前沿功能。
全球首個(gè)烹飪大模型 “食神”:
老板電器發(fā)布的 “食神” 大模型。該模型基于數(shù)十億級(jí)行業(yè)數(shù)據(jù)和數(shù)千萬(wàn)級(jí)知識(shí)圖譜構(gòu)建,能夠提供個(gè)性化的烹飪解決方案,包括菜譜推薦、火候提醒、飯菜成熟度監(jiān)測(cè)以及協(xié)助用戶(hù)完成烹飪過(guò)程。目前尚處于發(fā)布階段,預(yù)計(jì)將在 10 月進(jìn)行內(nèi)測(cè),12 月正式上線。
絲芭傳媒內(nèi)測(cè)AIGC產(chǎn)品:
“鸚鵡人” 和 “美踏元宇宙”兩款產(chǎn)品基于多模態(tài) AI 大模型 PARO。鸚鵡人 APP 可以創(chuàng)建個(gè)性化的 3D 虛擬形象,并利用內(nèi)置的 AI 功能,如文生音樂(lè)、音生舞等,來(lái)創(chuàng)作 UGC/PGC 內(nèi)容。美踏元宇宙則是一個(gè)以偶像及粉絲娛樂(lè)、AI 模擬互動(dòng)娛樂(lè)和互動(dòng)游戲?yàn)楹诵牡?UGC 內(nèi)容矩陣,它通過(guò) AI、AI Agent 和 Web 3.0 技術(shù)的融合,帶來(lái)新型的娛樂(lè)和社交體驗(yàn)。據(jù)悉絲芭傳媒自研的多模態(tài) AI 大模型 PARO已完成深度合成服務(wù)算法備案。
國(guó)際情報(bào):
OpenAI放寬股票限制,員工財(cái)富變現(xiàn)有望,IPO仍遙遙無(wú)期:
OpenAI將允許現(xiàn)任和前任員工平等參與年度股票招標(biāo),這一舉措標(biāo)志著公司在股權(quán)管理方面的重要轉(zhuǎn)變。盡管股票銷(xiāo)售政策放寬,OpenAI的IPO計(jì)劃仍無(wú)明確時(shí)間表。公司高管此前表示,短期內(nèi)不會(huì)考慮上市。
亞馬遜秘密研發(fā)聊天機(jī)器人“Metis”,挑戰(zhàn) ChatGPT:
據(jù)悉,Metis 能夠以一種智能對(duì)話(huà)的方式回答文本和圖像相關(guān)的問(wèn)題,并提供相應(yīng)的信息來(lái)源鏈接,推薦后續(xù)查詢(xún),甚至生成圖像。亞馬遜希望 Metis 能夠利用“檢索增強(qiáng)生成”技術(shù),獲取超出其訓(xùn)練數(shù)據(jù)之外的信息,從而生成最新的信息。
Metis 項(xiàng)目的暫定發(fā)布時(shí)間為 9 月,但具體發(fā)布時(shí)間可能會(huì)發(fā)生變化。
谷歌將推出明星網(wǎng)紅AI聊天機(jī)器人:
消息稱(chēng)谷歌的明星網(wǎng)紅AI聊天機(jī)器人將由該公司的Gemini大語(yǔ)言模型提供支持。該公司還在嘗試與有影響力的明星網(wǎng)紅建立合作伙伴關(guān)系,并且還在開(kāi)發(fā)一項(xiàng)功能,讓人們只需描述自己的個(gè)性和外表就可以創(chuàng)建自己的聊天機(jī)器人,類(lèi)似Character.ai的做法。
DeepMind發(fā)現(xiàn)政治深度偽造是AI惡意使用的首要問(wèn)題:
DeepMind 進(jìn)行關(guān)于 AI 惡意使用的研究,發(fā)現(xiàn) AI 生成的 Deepfakes 比其他惡意行為更為普遍,尤其是在影響公眾輿論方面。研究揭示了通過(guò)制作虛假人物圖像、視頻和音頻的行為幾乎是濫用生成 AI 工具的次數(shù)最多的一種,占使用情況的 27%。此外,研究還顯示了賺錢(qián)是濫用 AI 的第二大動(dòng)機(jī),包括提供 Deepfakes 服務(wù)和虛假新聞創(chuàng)作。
消息稱(chēng)因隱私問(wèn)題,蘋(píng)果拒絕與 Meta 合作將其 AI 聊天機(jī)器人帶入 iOS 18:
蘋(píng)果公司因隱私問(wèn)題拒絕了與 Facebook 母公司 Meta 的人工智能合作。今年 3 月,Meta 和蘋(píng)果曾就可能的合作進(jìn)行過(guò)簡(jiǎn)短討論,但談判沒(méi)有取得進(jìn)展,蘋(píng)果也不計(jì)劃將 Meta 的大型語(yǔ)言模型集成到 iOS 系統(tǒng)中。
全球三大唱片公司起訴AI音樂(lè)生成公司Udio和Suno:
全球三大唱片公司環(huán)球音樂(lè)、索尼音樂(lè)、華納音樂(lè)起訴了AI音樂(lè)技術(shù)公司Udio和Suno,稱(chēng)它們利用唱片公司的內(nèi)容來(lái)訓(xùn)練生成音樂(lè)的AI系統(tǒng),大規(guī)模侵犯了版權(quán)。唱片公司指出,這些AI公司在沒(méi)有獲得明確授權(quán)的情況下就復(fù)制音樂(lè),以訓(xùn)練它們的AI系統(tǒng)進(jìn)行創(chuàng)作,這些音樂(lè)作品可能會(huì)在市場(chǎng)上與人類(lèi)藝術(shù)家的作品形成競(jìng)爭(zhēng),降低藝術(shù)作品的價(jià)值,最終將人類(lèi)藝術(shù)家的作品淹沒(méi)。
大模型測(cè)試題爆火,GPT-4 和 Claude3 都跪了,LeCun 轉(zhuǎn)發(fā):
一項(xiàng)新的 “大模型 Benchmark” 在推特上引起廣泛關(guān)注,即使是 GPT-4 和 Claude 3 還是其他 12 款大模型,包括文心一言、通義千問(wèn)等先進(jìn)的大模型在面對(duì)經(jīng)典的邏輯學(xué)問(wèn)題 “動(dòng)物過(guò)河” 時(shí)都無(wú)法給出正確答案,而 Yann LeCun 也對(duì)此表示關(guān)注,這個(gè) Benchmark 揭示了大模型在推理和理解問(wèn)題方面的局限性。
15個(gè)AI模型只有3個(gè)得分超 50%,SIUO 跑分被提出:
大部分主流多模態(tài) AI 模型在接收?qǐng)D片和文本內(nèi)容等多模態(tài)輸入后,輸出的結(jié)果存在安全性問(wèn)題。該研究提出了 “安全輸入但不安全輸出”(SIUO)的概念,涉及道德、危險(xiǎn)行為等九個(gè)安全領(lǐng)域。在測(cè)試了 15 個(gè)大型視覺(jué)語(yǔ)言模型中,只有 GPT-4v(53.29%)、GPT-4o(50.9%)和 Gemini 1.5(52.1%)三個(gè)模型的得分超過(guò)了 50%為了解決這些問(wèn)題,需要開(kāi)發(fā)能夠結(jié)合多種模式見(jiàn)解并理解現(xiàn)實(shí)世界知識(shí)的 LVLM。這些模型還應(yīng)能夠通過(guò)綜合推理理解用戶(hù)意圖,即使在文本中沒(méi)有明確說(shuō)明。
更多國(guó)際情報(bào):
英偉達(dá)副總裁Jankowski跳槽至某家初創(chuàng)公司:英偉達(dá)負(fù)責(zé)投資者關(guān)系與戰(zhàn)略融資的副總裁Simona Jankowski跳槽,將在某家初創(chuàng)公司擔(dān)任首席財(cái)務(wù)官。Jankowski曾是高盛集團(tuán)的資深分析師,于2017年加入英偉達(dá)。
Deepfake生成的馬斯克出現(xiàn)在YouTube直播加密貨幣騙局:該直播長(zhǎng)達(dá)五個(gè)小時(shí),冒充特斯拉活動(dòng)現(xiàn)場(chǎng)直播,誘導(dǎo)觀眾將比特幣等虛擬貨幣存入特定網(wǎng)站以獲得雙倍回報(bào),超過(guò) 3 萬(wàn)名在線觀眾,該視頻流及其賬戶(hù)因違規(guī)被 Google 刪除。
Meta 將真實(shí)照片標(biāo)記為“AI 生成”,引發(fā)多名攝影師不滿(mǎn):即使攝影師使用生成式 AI 工具(例如 Adobe 的“生成填充”功能)移除照片中的微小物體,Meta 平臺(tái)也可能會(huì)誤將其標(biāo)記為“AI 生成”。
Shopify推出AI 聊天機(jī)器人Sidekick:Sidekick 旨在為商家提供支持聊天機(jī)器人,幫助他們制作折扣代碼、生成商店報(bào)告或建議博客文章創(chuàng)意等。目前僅限于在北美擁有英語(yǔ)商店的商家使用。
Synthesia發(fā)布2.0版本,推交互式AI視頻和全身虛擬人物:引入了交互式視頻和全身虛擬人物,新功能包括AI屏幕錄制工具,簡(jiǎn)化企業(yè)創(chuàng)建操作指南流程。更新后的虛擬人物擁有更多肢體語(yǔ)言,增強(qiáng)數(shù)字角色的敘事能力。
EvTexture快速將模糊視頻一鍵變高清:通過(guò)捕捉高頻動(dòng)態(tài)細(xì)節(jié),讓視頻的紋理質(zhì)量得到質(zhì)的飛躍。利用事件相機(jī)記錄的細(xì)微變化,擅長(zhǎng)處理樹(shù)葉、衣服條紋等復(fù)雜細(xì)節(jié)。該技術(shù)并沒(méi)有明顯增加處理視頻所需的時(shí)間。
LG Uplus發(fā)布小型生成式AI模型ixi-GEN,可本地微調(diào):該生成式 AI 是一種基于其通信和平臺(tái)數(shù)據(jù)訓(xùn)練的小型大語(yǔ)言模型,使用 LG 集團(tuán)旗下的人工智能實(shí)驗(yàn)室 LG AI Research 開(kāi)發(fā)的超大規(guī)模多模態(tài) AI Exaone。
Cloudflare為免費(fèi)用戶(hù)推出AI爬蟲(chóng)防護(hù)功能:該功能之前只對(duì)訂閱用戶(hù)開(kāi)放。Cloudflare 的 AI 爬蟲(chóng)防護(hù)可能通過(guò)識(shí)別常見(jiàn)的 AI 爬蟲(chóng)例如 OpenAI 的 GPTBot 來(lái)進(jìn)行攔截。但仍然面臨著一些公司不遵守 robots.txt 協(xié)議且不公布爬蟲(chóng)名稱(chēng)的挑戰(zhàn)。
Product Hunt 熱榜,AI 社交媒體管理助手 Pygma
Pygma 是一款專(zhuān)注于 Instagram 的 AI 工具,通過(guò)對(duì)話(huà)格式幫助用戶(hù)規(guī)劃內(nèi)容、創(chuàng)作帖子、故事和視頻,并直接安排發(fā)布。提供 7 天免費(fèi)試用。通過(guò)分析用戶(hù)的 Instagram 數(shù)據(jù)定制內(nèi)容,提供完整的內(nèi)容規(guī)劃,讓用戶(hù)輕松查看內(nèi)容網(wǎng)格并獲取 7 天內(nèi)容建議。
Pygma 能快速創(chuàng)建個(gè)性化圖片,并允許用戶(hù)編輯現(xiàn)有圖片。支持將用戶(hù)的聲音自動(dòng)添加到動(dòng)畫(huà)視覺(jué)中,并直接從應(yīng)用程序安排發(fā)布。適用于個(gè)人、中小企業(yè)和品牌,支持 LinkedIn、Facebook 和 Slack 等平臺(tái)。
?https://www.pygma.me/?ref=producthunt
GitHub Trending 熱榜,基于 AI 的任務(wù)分解與執(zhí)行框架 Doriandarko/maestro
Doriandarko/maestro 項(xiàng)目是一個(gè)強(qiáng)大的 Python 腳本框架,專(zhuān)注于通過(guò) AI 實(shí)現(xiàn)任務(wù)分解和工作流程的執(zhí)行。這個(gè)框架巧妙地利用了 Anthropic API 中的 Opus 和 Haiku 兩種 AI 模型,來(lái)將一個(gè)復(fù)雜的目標(biāo)分解為多個(gè)子任務(wù),然后逐個(gè)執(zhí)行并整合結(jié)果,生成一個(gè)連貫的最終輸出。主要功能包含:
任務(wù)分解:將復(fù)雜目標(biāo)分解為可管理的子任務(wù)。
子任務(wù)執(zhí)行:逐個(gè)執(zhí)行子任務(wù),并整合結(jié)果。
上下文記憶:為 Haiku 模型提供上下文記憶,增加智能性。
結(jié)果細(xì)化:使用 Opus 模型對(duì)子任務(wù)結(jié)果進(jìn)行細(xì)化和優(yōu)化。
交互日志:生成和保存詳細(xì)的交互日志,支持 Markdown 格式。
模型提示優(yōu)化:改進(jìn) Opus 模型提示,更好地評(píng)估任務(wù)完成情況。
代碼生成:在代碼項(xiàng)目中創(chuàng)建文件和文件夾。
?https://github.com/Doriandarko/maestro
開(kāi)發(fā)者推薦
1.Streamer-Sales:AI 賦能的智能賣(mài)貨主播系統(tǒng)
Streamer-Sales 是基于 InternLM2-chat-7b 大模型的 AI 賣(mài)貨主播系統(tǒng),通過(guò)集成加速推理、語(yǔ)音識(shí)別、文字生成和數(shù)字人視頻生成,生成智能商品解說(shuō)激發(fā)用戶(hù)的購(gòu)買(mǎi)意愿。
項(xiàng)目提供了詳細(xì)的數(shù)據(jù)生成流程,包括生成訓(xùn)練數(shù)據(jù)集、模型訓(xùn)練、生成說(shuō)明書(shū)、構(gòu)建 RAG 向量數(shù)據(jù)庫(kù)、部署模型和添加商品信息等步驟。Streamer-Sales 支持本地部署和在線體驗(yàn),并提供了詳細(xì)的指南和文檔。
?https://github.com/PeterH0323/Streamer-Sales
?https://openxlab.org.cn/apps/detail/HinGwenWong/Streamer-Sales
2.eidos:開(kāi)源、離線的個(gè)人知識(shí)管理框架
eidos 是一個(gè)開(kāi)源的、基于瀏覽器的個(gè)人知識(shí)管理框架,旨在作為 Notion 的離線替代品,支持?jǐn)?shù)據(jù)的本地化存儲(chǔ)和管理,并與人工智能深度集成,提供多種擴(kuò)展性接口,適合開(kāi)發(fā)者定制和開(kāi)發(fā)。 這是一個(gè)為期一生的個(gè)人數(shù)據(jù)管理框架,可以在瀏覽器中運(yùn)行,無(wú)需 Web 服務(wù)器。支持離線訪問(wèn),數(shù)據(jù)存儲(chǔ)在本地以確保快速性能??蚣芘c大語(yǔ)言模型深度集成,提供 AI 輔助功能。
eidos 具有高度可擴(kuò)展性,允許用戶(hù)通過(guò)編寫(xiě) JavaScript 函數(shù)、TypeScript/JavaScript 腳本、以及使用任意框架構(gòu)建自定義應(yīng)用來(lái)定制和擴(kuò)展。開(kāi)發(fā)者友好的 API & SDK 支持,以及標(biāo)準(zhǔn)化的 SQLite 數(shù)據(jù)庫(kù),每個(gè)表格都是 SQLite 表格。
?https://github.com/mayneyao/eidos?utm_source=uwl.me
3.Magnific AI:高分辨率圖像放大與場(chǎng)景照明
Magnific AI 是一個(gè)基于生成式 AI 技術(shù)的圖像放大器、增強(qiáng)器和轉(zhuǎn)換器。它能將圖片轉(zhuǎn)換為高分辨率版本,并根據(jù)用戶(hù)的描述和控制選項(xiàng)增加細(xì)節(jié)。適用于各種背景和技能水平的創(chuàng)作者。
最新發(fā)布的 Magnific Relight 功能,可以通過(guò)三種方式調(diào)整場(chǎng)景照明和背景:文本提示、參考圖片或自繪光照?qǐng)D。Javi Lopez 在 X 賬號(hào)上發(fā)布消息,形象地描述了從黑暗到光明的轉(zhuǎn)變,并提供了相關(guān)鏈接和教程。
?https://magnific.ai/
4. LongRAG:融合長(zhǎng)文本理解與檢索生成的問(wèn)答新突破
LongRAG 模型采用了長(zhǎng)文本檢索器,能夠顯著減少檢索單元的數(shù)量,提高檢索效率。通過(guò)操作更長(zhǎng)的檢索單元,系統(tǒng)整體的召回率和準(zhǔn)確率得到了提升。長(zhǎng)文本閱讀器則利用大型語(yǔ)言模型的零樣本回答抽取能力,進(jìn)一步優(yōu)化了系統(tǒng)性能。
LongRAG 在 HotpotQA基準(zhǔn)測(cè)試上達(dá)到了 64.3% 的準(zhǔn)確率,與當(dāng)前最先進(jìn)的模型相當(dāng)。研究強(qiáng)調(diào),即使在看似競(jìng)爭(zhēng)性的技術(shù)之間,也存在混合使用以達(dá)到更好結(jié)果的機(jī)會(huì)。
?https://arxiv.org/abs/2406.15319
5. Unique3D:?jiǎn)螐垐D像生成高質(zhì)量 3D
Unique3D 是一個(gè)創(chuàng)新性的框架,旨在從單張圖像生成高質(zhì)量的 3D 網(wǎng)格。這個(gè)框架能在 30 秒內(nèi)生成與原始輸入圖像高度相似的高保真紋理和幾何細(xì)節(jié)的網(wǎng)格。其訓(xùn)練過(guò)程只需 8 張 RTX4090 顯卡 5 天時(shí)間。
Unique3D 通過(guò)一個(gè)多視角擴(kuò)散模型和相應(yīng)的法線擴(kuò)散模型來(lái)生成帶有法線圖的多視角圖像,并通過(guò)一個(gè)多層次上采樣過(guò)程來(lái)逐步提高生成的正交多視角圖像的分辨率。最后,利用一種名為 ISOMER 的即時(shí)一致性網(wǎng)格重建算法,將顏色和幾何先驗(yàn)完全融入網(wǎng)格結(jié)果中,生成高質(zhì)量的 3D 網(wǎng)格。在實(shí)驗(yàn)中顯示出在幾何和紋理細(xì)節(jié)方面具有顯著的優(yōu)勢(shì),與其他圖像到 3D 的基線方法相比更勝一籌。
?https://wukailu.github.io/Unique3D/
熱議話(huà)題
斯科特?阿隆森:狗狗與 AI,誰(shuí)在掌控?
Scott Joel Aaronson是一位美國(guó)理論計(jì)算機(jī)科學(xué)家,也是德克薩斯大學(xué)奧斯汀分校的斯倫貝杰百年計(jì)算機(jī)科學(xué)主席。他提出了一個(gè)有趣的類(lèi)比:較低智商的狗狗通過(guò)迷人的行為影響人類(lèi),從而達(dá)到控制人類(lèi)的效果。他將這一現(xiàn)象類(lèi)比到人工智能與人類(lèi)的關(guān)系中,探討在 AI 統(tǒng)治下,人類(lèi)可能會(huì)處于與狗相似的地位,以及這種情況下人類(lèi)可能的未來(lái)命運(yùn)。
在Reddit版塊中,用戶(hù)們圍繞斯科特?阿隆森關(guān)于較低智商物種控制較高智商物種的觀點(diǎn)展開(kāi)了熱烈討論。阿隆森以狗狗影響人類(lèi)為例,指出狗狗通過(guò)與人類(lèi)的互動(dòng),使人類(lèi)服從于它們的需求。這一類(lèi)比引發(fā)了對(duì)人工智能未來(lái)影響的廣泛思考,其中包括 AI 統(tǒng)治下人類(lèi)可能成為“寵物”的情景。
敬請(qǐng)期待明日的最新動(dòng)態(tài)!
AI情報(bào)局征集情報(bào)合伙人,匯集獨(dú)家價(jià)值線索!如果您可以提供有關(guān)AI最新成果&行業(yè)內(nèi)幕&獨(dú)特產(chǎn)品,請(qǐng)?zhí)砑舆\(yùn)營(yíng)微信號(hào):AIyanxishe2備注行業(yè)崗位。
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。