0
本文作者: 汪思穎 | 2019-08-02 19:05 | 專(zhuān)題:ACL 2019 |
雷鋒網(wǎng) AI 開(kāi)發(fā)者消息,當(dāng)?shù)貢r(shí)間 7 月 28 日至 8 月 2 日,自然語(yǔ)言處理領(lǐng)域頂級(jí)會(huì)議 ACL2019 在意大利佛羅倫薩召開(kāi),會(huì)上滴滴正式宣布開(kāi)源基于深度學(xué)習(xí)的語(yǔ)音和自然語(yǔ)言理解模型訓(xùn)練平臺(tái) DELTA,以進(jìn)一步幫助 AI 開(kāi)發(fā)者創(chuàng)建、部署自然語(yǔ)言處理和語(yǔ)音模型,構(gòu)建高效的解決方案,助力 NLP 應(yīng)用更好落地。
滴滴自然語(yǔ)言處理首席科學(xué)家 Kevin Knight 在 ACL2019 現(xiàn)場(chǎng)
DELTA 主要基于 TensorFlow 構(gòu)建,能同時(shí)支持 NLP(自然語(yǔ)言處理)和語(yǔ)音任務(wù)及數(shù)值型特征的訓(xùn)練,整合了包括文本分類(lèi)、命名實(shí)體識(shí)別、自然語(yǔ)言推理、問(wèn)答、序列到序列文本生成、語(yǔ)音識(shí)別、說(shuō)話(huà)人驗(yàn)證、語(yǔ)音情感識(shí)別等重要算法模型,形成一致的代碼組織架構(gòu),整體包裝統(tǒng)一接口。
用戶(hù)準(zhǔn)備好模型訓(xùn)練數(shù)據(jù),并指定好配置 Configuration,模型訓(xùn)練 pipeline 可以根據(jù)配置進(jìn)行數(shù)據(jù)處理,并選擇相應(yīng)的任務(wù)和模型,進(jìn)行模型訓(xùn)練。在訓(xùn)練結(jié)束之后,自動(dòng)生成模型文件保存。該模型文件形成統(tǒng)一接口,可以直接上線(xiàn)使用,快速產(chǎn)品化,能讓從研究到生產(chǎn)變得更容易。
值得注意的是,除可支持多種模型的訓(xùn)練,DELTA 還支持靈活配置,開(kāi)發(fā)者可基于 DELTA 搭建成多達(dá)幾十種的復(fù)雜的模型;此外,DELTA 在多種常用任務(wù)上提供了穩(wěn)定高效的 benchmark,用戶(hù)可以簡(jiǎn)單快速的復(fù)現(xiàn)論文中的模型的結(jié)果,同時(shí)也可以在此基礎(chǔ)上擴(kuò)展新的模型。在模型構(gòu)建完成后,用戶(hù)可以使用 DELTA 的部署流程工具,迅速完成模型上線(xiàn)。從論文到產(chǎn)品部署無(wú)縫銜接。
目前 AI 開(kāi)發(fā)者可登陸Github(https://github.com/didi/delta)查看 DELTA 的詳細(xì)介紹和源代碼,利用 DELTA 加快實(shí)驗(yàn)進(jìn)度,部署用于文本分類(lèi)、命名實(shí)體識(shí)別、自然語(yǔ)言推理、問(wèn)答、序列到序列文本生成、語(yǔ)音識(shí)別、說(shuō)話(huà)人驗(yàn)證、語(yǔ)音情感識(shí)別等任務(wù)的系統(tǒng)。用戶(hù)亦可在滴滴的開(kāi)源平臺(tái)上(https://didi.github.io/)獲取更多滴滴開(kāi)源項(xiàng)目的相關(guān)信息。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專(zhuān)題其他文章