丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給劉潔
發(fā)送

0

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

本文作者: 劉潔 2024-08-03 10:35
導語:這次不卷模型大小,只卷性能。

8月2日,lmsys官方在推特發(fā)布一則消息,恭喜DeepMind研發(fā)的Gemini 1.5 Pro 實驗版 (0801)在Chatbot Arena排名登頂,超越GPT 4o和Claude-3.5奪得第一。

這是繼今年3月Claude 3 “超大杯”O(jiān)pus版本短暫超越GPT-4以來,OpenAI第二次讓出Chatbot Arena的Overall ranking寶座。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 實驗版 (0801)在Chatbot Arena測試一周后。獲得了超過12,000個社區(qū)投票,在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的好成績。之前說GPT-4o有刷分技巧,現(xiàn)在看起來Gemini 1.5 Pro可能也學到了這個技巧呢。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 實驗版(0801)不僅在綜合表現(xiàn)上極為突出,在各個細分領域上也有著出色的表現(xiàn)。它在數(shù)學方面排名前三,指令遵循排名前二,編碼排名前五,硬提示(英語)排名前五。

Gemini 1.5 Pro 實驗版(0801)具有強大的多語言能力,在中文、日語、德語、俄語方面均表現(xiàn)第一。

從總體勝率圖上,也能看出Gemini 1.5 Pro 實驗版 (0801)實力強勁,對陣 GPT-4o 的勝率為 54%,對陣 Claude-3.5-Sonnet 的勝率為 59%。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

前OpenAI的開發(fā)者,現(xiàn)Google AI Studio的產(chǎn)品負責人Logan Kilpatrick火速轉發(fā),向大家宣布Gemini 1.5 Pro 實驗版(0801)目前在 LMSYS 的文本和多模式排名中均位居第一的好消息。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

DeepMind的CEO Demis Hassabis也轉發(fā)了這條消息,祝賀Gemini 1.5 Pro 實驗版(0801)能夠在極具競爭力的榜單中拿下第一,并且宣布這一版本的已經(jīng)可以在 AI Studio上進行試用。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

帶領研發(fā)Gemini的Jeff Dean也隨后轉發(fā),對此次實驗版本的Gemini 1.5 Pro突破1300+elo分數(shù)拿下排名第一的好消息感到非常自豪,也很期待未來能看到其他更好的模型。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5


聽聞這則消息,其他從業(yè)人員也紛紛發(fā)來祝賀。


新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有不少人分享自己的試用體驗。大神elvis對在聊天機器人領域超越了 GPT-4o 和 Claude 3.5 Sonnet的Gemini 1.5 Pro非常感興趣。elvis分享了自己的測試全過程視頻,并總結道,Gemini 1.5 Pro強大的圖像和PDF提取能力給他留下了深刻的印象,Gemini 1.5 Pro有著和GPT-4o不相上下的視覺能力,也有Claude 3.5 Sonnet接近的代碼生成及PDF理解/推理能力。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

有人認為Gemini 1.5 Pro在解決高級數(shù)學難題方面表現(xiàn)相當不錯。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有人說Gemini 1.5 Pro在圖像識別植物和動物方面做得確實要比GPT 4o更好。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有更多的人在期待Gemini 1.5 Pro這一版本的正式上線,希望能夠API實現(xiàn)Gemini 1.5 Pro的實際運用。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

大家對Gemini 1.5 Pro這次發(fā)布的實驗版本有什么看法,歡迎評論區(qū)留言分享~雷峰網(wǎng)雷峰網(wǎng)(公眾號:雷峰網(wǎng))


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說