行業(yè)首批！騰訊云TI平臺支持DeepSeek全系模型精調(diào)與推理

本文作者： Nemo

2025-02-20 16:57

導(dǎo)語：未來，騰訊云將持續(xù)優(yōu)化TI平臺功能，依托領(lǐng)先的大模型訓(xùn)練推理技術(shù)，為客戶提供更安全、穩(wěn)定、高效的AI解決方案，助推各行業(yè)加速數(shù)字化轉(zhuǎn)型。

近日，DeepSeek全系列模型在騰訊云TI平臺上第一時間上架，并在業(yè)內(nèi)率先實現(xiàn)企業(yè)級精調(diào)與推理全鏈路功能。此次支持精調(diào)的模型涵蓋了滿血版DeepSeek V3、R1以及六款蒸餾版模型，為金融、醫(yī)療、制造、零售等多個行業(yè)提供了更高效、便捷的AI模型構(gòu)建及應(yīng)用方案，進(jìn)一步降低企業(yè)在大模型應(yīng)用中的技術(shù)門檻和研發(fā)成本。

隨著DeepSeek引發(fā)行業(yè)廣泛關(guān)注，企業(yè)客戶在模型精調(diào)與部署過程中可能面臨數(shù)據(jù)預(yù)處理難、模型訓(xùn)練門檻高、在線部署及運維復(fù)雜等多重挑戰(zhàn)。騰訊云TI平臺憑借全流程AI開發(fā)工具，實現(xiàn)了從數(shù)據(jù)準(zhǔn)備到模型部署上線的一站式解決方案。

平臺內(nèi)置的數(shù)據(jù)構(gòu)建模塊不僅支持快速清洗、去重與格式轉(zhuǎn)換，還能根據(jù)具體任務(wù)進(jìn)行Prompt優(yōu)化。同時，通過靈活的訓(xùn)練調(diào)度策略和自研的大模型計算與并行優(yōu)化技術(shù)，有效加速訓(xùn)練與推理過程，大幅提升資源利用率。

據(jù)悉，TI平臺同時支持公有云、私有化版本。其中，公有云版本在騰訊云上開箱即用，按需訂閱；私有化版本可部署在客戶本地機(jī)房、專屬云服務(wù)器等自有算力上，更適合金融等更高數(shù)據(jù)安全要求的場景，從而靈活滿足政府和企業(yè)的多樣化需求。

支持DeepSeek的兩種精調(diào)方式，滿足多樣化需求

為適應(yīng)不同行業(yè)的個性化模型構(gòu)建需求，騰訊云TI平臺面向DeepSeek提供了兩種精調(diào)模式。

一、直接精調(diào)滿血版DeepSeek。針對希望直接對原始DeepSeek模型進(jìn)行微調(diào)的用戶，平臺內(nèi)置DeepSeek滿血版等全系模型，并預(yù)置訓(xùn)練鏡像和訓(xùn)練代碼，用戶只需按平臺規(guī)范準(zhǔn)備好訓(xùn)練數(shù)據(jù)，并設(shè)置學(xué)習(xí)率、迭代步數(shù)等參數(shù)，即可一鍵啟動精調(diào)任務(wù)。

在訓(xùn)練階段，平臺支持全參和LoRA兩種精調(diào)方式，為用戶提供兼顧訓(xùn)練成本和模型效果的靈活選擇，確保模型在金融、醫(yī)療等垂直領(lǐng)域滿足業(yè)務(wù)要求。在數(shù)據(jù)準(zhǔn)備階段，平臺內(nèi)置了可高度自定義的數(shù)據(jù)標(biāo)注和構(gòu)建工具，顯著提升數(shù)據(jù)質(zhì)量，并有效降低數(shù)據(jù)處理成本。

二、基于DeepSeek R1蒸餾其他較小尺寸模型。DeepSeek R1雖具備卓越的長思維鏈（Long CoT）能力，但模型尺寸大（參數(shù)量671B），實際推理成本較高。針對希望以更低成本、更高響應(yīng)速度應(yīng)用R1的用戶，TI平臺也支持基于R1蒸餾其他較小尺寸模型，可將R1的能力遷移至較小尺寸的“學(xué)生”模型中。

用戶首先在TI平臺部署DeepSeek R1推理服務(wù)，然后調(diào)用R1生成包含長思維鏈的高質(zhì)量蒸餾數(shù)據(jù)，緊接著進(jìn)行數(shù)據(jù)清洗，最后利用這些數(shù)據(jù)對較小尺寸的“學(xué)生模型”（如Llama 3.2-3B）進(jìn)行精調(diào)，從而實現(xiàn)知識遷移。在保留優(yōu)秀推理性能的同時，大幅降低推理成本或提升模型推理速度，有效滿足高推理性能或成本敏感的場景。

提供模型評測及部署完整工具鏈，助推行業(yè)智能轉(zhuǎn)型

騰訊云TI平臺還提供了全面的模型評測與部署功能。模型評測包括輕量體驗、客觀評測和主觀評測三階段能力，幫助企業(yè)多維度驗證模型性能。模型部署支持多種模型框架和格式，支持異構(gòu)算力和資源彈性伸縮，可將模型快速發(fā)布為生產(chǎn)級API接口，接入企業(yè)應(yīng)用。

自 DeepSeek 模型發(fā)布以來，TI 平臺已成功助力多個行業(yè)客戶部署專屬 DeepSeek 服務(wù)并開展驗證工作，部分已接入企業(yè)應(yīng)用。未來，騰訊云將持續(xù)優(yōu)化TI平臺功能，依托領(lǐng)先的大模型訓(xùn)練推理技術(shù)，為客戶提供更安全、穩(wěn)定、高效的AI解決方案，助推各行業(yè)加速數(shù)字化轉(zhuǎn)型。

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

Nemo

編輯

發(fā)私信

當(dāng)月熱門文章

行業(yè)首批！騰訊云TI平臺支持DeepSeek全系模型精調(diào)與推理

行業(yè)首批！騰訊云TI平臺支持DeepSeek全系模型精調(diào)與推理