0
本文作者: nebula | 2025-02-24 14:36 |
今年2月,商湯大裝置萬(wàn)象平臺(tái)正式上線了DeepSeek-R1、DeepSeek-V3等模型,并為免費(fèi)版提供3個(gè)月內(nèi)千萬(wàn)Token額度,受到客戶的熱烈響應(yīng)。
為了更好的服務(wù)用戶,經(jīng)過(guò)系列優(yōu)化,,現(xiàn)正式推出企業(yè)版,同時(shí)完成免費(fèi)版國(guó)產(chǎn)化適配與算力擴(kuò)容,形成專業(yè)強(qiáng)支撐+普惠廣覆蓋的雙擎驅(qū)動(dòng)!
企業(yè)版上線:高性能+高穩(wěn)定,夯實(shí)業(yè)務(wù)底座
為滿足各行業(yè)對(duì)DeepSeek系列模型應(yīng)用的迫切需求,提升用戶體驗(yàn),商湯大裝置特上線DeepSeek-R1-Enterprise企業(yè)版,提供高性能、高穩(wěn)定的服務(wù)保障,助力模型服務(wù)效率與質(zhì)量的飛躍。
推理性能領(lǐng)先:自研LightLLM經(jīng)Prefill/Decode優(yōu)化后,可實(shí)現(xiàn)推理性能行業(yè)領(lǐng)先
并行計(jì)算策略:基于專家/流水/張量/數(shù)據(jù)多種并行技術(shù),提升硬件利用率,最大化推理效率
多維監(jiān)控體系:覆蓋首包延遲/QPS/吞吐量等100+指標(biāo),提供一站式監(jiān)控告警
此外,商湯大裝置為企業(yè)用戶提供專家服務(wù),提供端到端解決方案。
模型定制服務(wù):打造輕量化模型定制,基于場(chǎng)景強(qiáng)化學(xué)習(xí)在特定場(chǎng)景提升基模型,支持蒸餾到小模型高效推理
場(chǎng)景化綜合解決方案:涵蓋模型定制、模型開發(fā)平臺(tái)、Agent應(yīng)用開發(fā)平臺(tái)三大核心模塊,提供全鏈路支持
快速全周期交付體系: 專家團(tuán)隊(duì)提供從業(yè)務(wù)診斷到系統(tǒng)落地的全周期服務(wù),最快14天完成部署
免費(fèi)版擴(kuò)容:國(guó)產(chǎn)化優(yōu)化+算力擴(kuò)容,持續(xù)普惠拓展
商湯大裝置已基于國(guó)產(chǎn)算力進(jìn)行優(yōu)化,并擴(kuò)容算力,讓DeepSeek-R1模型惠及更多用戶,創(chuàng)造更多可能。
國(guó)產(chǎn)化適配:完成多家主流國(guó)產(chǎn)芯片國(guó)產(chǎn)化適配,支持運(yùn)行DeepSeek-R1滿血版
國(guó)產(chǎn)化優(yōu)化:完成國(guó)產(chǎn)芯片的8bit量化版本模型優(yōu)化,同時(shí)提供最優(yōu)的算子、并行等方案,保障極致推理性能
算力擴(kuò)容:全面切換國(guó)產(chǎn)算力,支持高并發(fā),多人同時(shí)使用,體驗(yàn)不打折
最近,在知名評(píng)測(cè)機(jī)構(gòu)SuperCLUE連續(xù)兩次發(fā)布的,對(duì)第三方平臺(tái)DeepSeek-R1滿血版的API服務(wù)穩(wěn)定性測(cè)評(píng)中,結(jié)果顯示,商湯大裝置在回復(fù)率、準(zhǔn)確率、推理速度等方面均表現(xiàn)優(yōu)異,并在最新評(píng)測(cè)中位居DeepSeek免費(fèi)版API排名第一梯隊(duì),展現(xiàn)了商湯大裝置強(qiáng)大的平臺(tái)支撐能力。
商湯大裝置始終致力于為企業(yè)和開發(fā)者提供高效率、低成本、規(guī)?;男滦腿斯ぶ悄芑A(chǔ)設(shè)施,可支持商湯“日日新”融合大模型 SenseNova、DeepSeek、Qwen、Llama等大模型。未來(lái),商湯還將繼續(xù)提供強(qiáng)大的技術(shù)支持和全方位的服務(wù)保障,持續(xù)為行業(yè)輸出高效、易用、普惠的AI云服務(wù),幫助客戶實(shí)現(xiàn)業(yè)務(wù)場(chǎng)景的提智增效。
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。