0
本文作者: Nemo | 2025-02-20 16:57 |
近日,DeepSeek全系列模型在騰訊云TI平臺上第一時間上架,并在業(yè)內(nèi)率先實(shí)現(xiàn)企業(yè)級精調(diào)與推理全鏈路功能。此次支持精調(diào)的模型涵蓋了滿血版DeepSeek V3、R1以及六款蒸餾版模型,為金融、醫(yī)療、制造、零售等多個行業(yè)提供了更高效、便捷的AI模型構(gòu)建及應(yīng)用方案,進(jìn)一步降低企業(yè)在大模型應(yīng)用中的技術(shù)門檻和研發(fā)成本。
隨著DeepSeek引發(fā)行業(yè)廣泛關(guān)注,企業(yè)客戶在模型精調(diào)與部署過程中可能面臨數(shù)據(jù)預(yù)處理難、模型訓(xùn)練門檻高、在線部署及運(yùn)維復(fù)雜等多重挑戰(zhàn)。騰訊云TI平臺憑借全流程AI開發(fā)工具,實(shí)現(xiàn)了從數(shù)據(jù)準(zhǔn)備到模型部署上線的一站式解決方案。
平臺內(nèi)置的數(shù)據(jù)構(gòu)建模塊不僅支持快速清洗、去重與格式轉(zhuǎn)換,還能根據(jù)具體任務(wù)進(jìn)行Prompt優(yōu)化。同時,通過靈活的訓(xùn)練調(diào)度策略和自研的大模型計(jì)算與并行優(yōu)化技術(shù),有效加速訓(xùn)練與推理過程,大幅提升資源利用率。
據(jù)悉,TI平臺同時支持公有云、私有化版本。其中,公有云版本在騰訊云上開箱即用,按需訂閱;私有化版本可部署在客戶本地機(jī)房、專屬云服務(wù)器等自有算力上,更適合金融等更高數(shù)據(jù)安全要求的場景,從而靈活滿足政府和企業(yè)的多樣化需求。
支持DeepSeek的兩種精調(diào)方式,滿足多樣化需求
為適應(yīng)不同行業(yè)的個性化模型構(gòu)建需求,騰訊云TI平臺面向DeepSeek提供了兩種精調(diào)模式。
一、直接精調(diào)滿血版DeepSeek。針對希望直接對原始DeepSeek模型進(jìn)行微調(diào)的用戶,平臺內(nèi)置DeepSeek滿血版等全系模型,并預(yù)置訓(xùn)練鏡像和訓(xùn)練代碼,用戶只需按平臺規(guī)范準(zhǔn)備好訓(xùn)練數(shù)據(jù),并設(shè)置學(xué)習(xí)率、迭代步數(shù)等參數(shù),即可一鍵啟動精調(diào)任務(wù)。
在訓(xùn)練階段,平臺支持全參和LoRA兩種精調(diào)方式,為用戶提供兼顧訓(xùn)練成本和模型效果的靈活選擇,確保模型在金融、醫(yī)療等垂直領(lǐng)域滿足業(yè)務(wù)要求。在數(shù)據(jù)準(zhǔn)備階段,平臺內(nèi)置了可高度自定義的數(shù)據(jù)標(biāo)注和構(gòu)建工具,顯著提升數(shù)據(jù)質(zhì)量,并有效降低數(shù)據(jù)處理成本。
二、基于DeepSeek R1蒸餾其他較小尺寸模型。DeepSeek R1雖具備卓越的長思維鏈(Long CoT)能力,但模型尺寸大(參數(shù)量671B),實(shí)際推理成本較高。針對希望以更低成本、更高響應(yīng)速度應(yīng)用R1的用戶,TI平臺也支持基于R1蒸餾其他較小尺寸模型,可將R1的能力遷移至較小尺寸的“學(xué)生”模型中。
用戶首先在TI平臺部署DeepSeek R1推理服務(wù),然后調(diào)用R1生成包含長思維鏈的高質(zhì)量蒸餾數(shù)據(jù),緊接著進(jìn)行數(shù)據(jù)清洗,最后利用這些數(shù)據(jù)對較小尺寸的“學(xué)生模型”(如Llama 3.2-3B)進(jìn)行精調(diào),從而實(shí)現(xiàn)知識遷移。在保留優(yōu)秀推理性能的同時,大幅降低推理成本或提升模型推理速度,有效滿足高推理性能或成本敏感的場景。
提供模型評測及部署完整工具鏈,助推行業(yè)智能轉(zhuǎn)型
騰訊云TI平臺還提供了全面的模型評測與部署功能。模型評測包括輕量體驗(yàn)、客觀評測和主觀評測三階段能力,幫助企業(yè)多維度驗(yàn)證模型性能。模型部署支持多種模型框架和格式,支持異構(gòu)算力和資源彈性伸縮,可將模型快速發(fā)布為生產(chǎn)級API接口,接入企業(yè)應(yīng)用。
自 DeepSeek 模型發(fā)布以來,TI 平臺已成功助力多個行業(yè)客戶部署專屬 DeepSeek 服務(wù)并開展驗(yàn)證工作,部分已接入企業(yè)應(yīng)用。未來,騰訊云將持續(xù)優(yōu)化TI平臺功能,依托領(lǐng)先的大模型訓(xùn)練推理技術(shù),為客戶提供更安全、穩(wěn)定、高效的AI解決方案,助推各行業(yè)加速數(shù)字化轉(zhuǎn)型。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。