0
本文作者: nebula | 2025-02-24 14:36 |
今年2月,商湯大裝置萬象平臺正式上線了DeepSeek-R1、DeepSeek-V3等模型,并為免費版提供3個月內(nèi)千萬Token額度,受到客戶的熱烈響應。
為了更好的服務用戶,經(jīng)過系列優(yōu)化,,現(xiàn)正式推出企業(yè)版,同時完成免費版國產(chǎn)化適配與算力擴容,形成專業(yè)強支撐+普惠廣覆蓋的雙擎驅(qū)動!
企業(yè)版上線:高性能+高穩(wěn)定,夯實業(yè)務底座
為滿足各行業(yè)對DeepSeek系列模型應用的迫切需求,提升用戶體驗,商湯大裝置特上線DeepSeek-R1-Enterprise企業(yè)版,提供高性能、高穩(wěn)定的服務保障,助力模型服務效率與質(zhì)量的飛躍。
推理性能領先:自研LightLLM經(jīng)Prefill/Decode優(yōu)化后,可實現(xiàn)推理性能行業(yè)領先
并行計算策略:基于專家/流水/張量/數(shù)據(jù)多種并行技術(shù),提升硬件利用率,最大化推理效率
多維監(jiān)控體系:覆蓋首包延遲/QPS/吞吐量等100+指標,提供一站式監(jiān)控告警
此外,商湯大裝置為企業(yè)用戶提供專家服務,提供端到端解決方案。
模型定制服務:打造輕量化模型定制,基于場景強化學習在特定場景提升基模型,支持蒸餾到小模型高效推理
場景化綜合解決方案:涵蓋模型定制、模型開發(fā)平臺、Agent應用開發(fā)平臺三大核心模塊,提供全鏈路支持
快速全周期交付體系: 專家團隊提供從業(yè)務診斷到系統(tǒng)落地的全周期服務,最快14天完成部署
免費版擴容:國產(chǎn)化優(yōu)化+算力擴容,持續(xù)普惠拓展
商湯大裝置已基于國產(chǎn)算力進行優(yōu)化,并擴容算力,讓DeepSeek-R1模型惠及更多用戶,創(chuàng)造更多可能。
國產(chǎn)化適配:完成多家主流國產(chǎn)芯片國產(chǎn)化適配,支持運行DeepSeek-R1滿血版
國產(chǎn)化優(yōu)化:完成國產(chǎn)芯片的8bit量化版本模型優(yōu)化,同時提供最優(yōu)的算子、并行等方案,保障極致推理性能
算力擴容:全面切換國產(chǎn)算力,支持高并發(fā),多人同時使用,體驗不打折
最近,在知名評測機構(gòu)SuperCLUE連續(xù)兩次發(fā)布的,對第三方平臺DeepSeek-R1滿血版的API服務穩(wěn)定性測評中,結(jié)果顯示,商湯大裝置在回復率、準確率、推理速度等方面均表現(xiàn)優(yōu)異,并在最新評測中位居DeepSeek免費版API排名第一梯隊,展現(xiàn)了商湯大裝置強大的平臺支撐能力。
商湯大裝置始終致力于為企業(yè)和開發(fā)者提供高效率、低成本、規(guī)模化的新型人工智能基礎設施,可支持商湯“日日新”融合大模型 SenseNova、DeepSeek、Qwen、Llama等大模型。未來,商湯還將繼續(xù)提供強大的技術(shù)支持和全方位的服務保障,持續(xù)為行業(yè)輸出高效、易用、普惠的AI云服務,幫助客戶實現(xiàn)業(yè)務場景的提智增效。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。