0
6月23日,網(wǎng)易有道宣布正式開源“子曰3”系列大模型的數(shù)學模型(英文名稱Confucius3-Math)。這是國內(nèi)首個專注于數(shù)學教育,可在單塊消費級GPU上高效運行的開源推理模型。其在一系列數(shù)學推理任務中取得當前最優(yōu)性能,超越了許多規(guī)模更大的通用模型。該模型的開源,為教育領域提供了低成本、高性能的AI解決方案,推動大模型技術向教育領域加速滲透。(雷峰網(wǎng)雷峰網(wǎng)雷峰網(wǎng)(公眾號:雷峰網(wǎng)))
低成本高性能,助力教育公平
據(jù)悉,“子曰3數(shù)學模型”在解決國內(nèi)數(shù)學問題任務中展現(xiàn)出了顯著優(yōu)勢。其通過大規(guī)模增強學習以及一系列的創(chuàng)新算法,推理性能約為DeepSeek R1的15倍。
測試數(shù)據(jù)顯示,在CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500等數(shù)據(jù)集上,14B輕量級的“子曰3數(shù)學模型”各項得分均高于DeepSeek-R1等通用大模型。在GAOKAO-Bench(Math)這一基于高考數(shù)學題的大模型評測框架中,“子曰3數(shù)學模型”的得分高達98.5分。
除了出色的性能,“子曰3數(shù)學模型”的成本優(yōu)勢同樣顯著,其在消費級GPU即可運行,大大降低了教育場景的AI應用門檻。
事實上,中小學教育長期面臨教育資源不平等、個性化輔導資源不足、復雜題型講解成本高等痛點,而教育大模型能有效輔助提升學習效果,但高性能大模型的構建和部署成本卻非常高昂,許多低收入地區(qū)難以負擔。
針對這一問題,“子曰3數(shù)學模型”實現(xiàn)了部署性能的極致突破,服務成本每百萬token低至0.15美元,遠超目前大多數(shù)通用大模型的成本效益。這意味著更廣泛的普通教育機構和開發(fā)者都能以低成本部署專業(yè)級的數(shù)學AI應用。
“對于行業(yè)而言,‘子曰3數(shù)學模型’證明了在低成本情況下,在特定領域構建強大推理模型的可行性,為垂類推理大模型的研發(fā)與應用提供了重要參考?!本W(wǎng)易有道首席科學家段亦濤表示。
“AI+教育”加速進化,子曰釋放教育大模型應用價值
從“子曰”大模型在一年內(nèi)快速推出10余個垂直應用,到今年初發(fā)布國內(nèi)首個輸出分步式講解的推理模型“子曰-o1”,再到如今“子曰3數(shù)學模型”正式開源,網(wǎng)易有道在“AI+教育”領域加速進化,持續(xù)釋放大模型在教育行業(yè)的應用價值。
此次“子曰3數(shù)學模型”發(fā)布及開源,標志著“子曰”大模型系列在輕量級模型推理能力上實現(xiàn)了又一重要突破,也使得有道在教育大模型領域長期積累的技術成果能夠共享給更多的開發(fā)者和從業(yè)者,構建起協(xié)同發(fā)展的行業(yè)格局。
段亦濤強調(diào):“AI+教育的終極目標不是替代教師,而是讓技術成為教育公平的杠桿。希望‘子曰3數(shù)學模型’的開源能夠吸引更多開發(fā)者加入,共同探索推理模型在教育領域的應用價值?!?/p>
雷峰網(wǎng)版權文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。