0
本文作者: 木子 | 2020-10-22 09:46 |
文心(ERNIE)是依托百度深度學(xué)習(xí)平臺飛槳打造的語義理解技術(shù)與平臺,集先進(jìn)的預(yù)訓(xùn)練模型、全面的NLP算法集、端到端開發(fā)套件和平臺化服務(wù)于一體,為企業(yè)和開發(fā)者提供一整套NLP定制與應(yīng)用能力。在2020世界人工智能大會,百度文心(ERNIE)榮獲最高獎項SAIL獎(Super AI Leader,卓越人工智能引領(lǐng)者)。
ERNIE開創(chuàng)性地將大數(shù)據(jù)預(yù)訓(xùn)練與多源豐富知識相結(jié)合,持續(xù)學(xué)習(xí)海量數(shù)據(jù)中的知識,將機(jī)器語義理解水平提升到一個新的高度。以中文模型為例,目前ERNIE已經(jīng)學(xué)習(xí)了1500萬篇百科語料和詞語、實體知識,700萬個人類對話,3億的文章的因果結(jié)構(gòu)關(guān)系,以及10億次的搜索查詢與結(jié)果的對應(yīng)關(guān)系,以及2000萬的語言邏輯關(guān)系知識。模型還在持續(xù)不斷地建模新的海量數(shù)據(jù)與知識,不斷地提升下游的應(yīng)用效果。ERNIE在中英文的16個任務(wù)上已經(jīng)超越了業(yè)界最好模型,全面適用于各類NLP應(yīng)用場景。
目前,EasyDL已預(yù)置了領(lǐng)先的預(yù)訓(xùn)練模型ERNIE2.0,并配套了多種NLP經(jīng)典算法網(wǎng)絡(luò),支持了文本分類、短文本匹配和序列標(biāo)注等典型文本處理任務(wù)。
近日,文心(ERNIE)重磅發(fā)布三項功能,新增定制多標(biāo)簽文本分類、情感傾向分析、文本實體抽取模型等功能,同時數(shù)據(jù)管理能力也進(jìn)一步增強(qiáng),更好地滿足NLP領(lǐng)域開發(fā)者需求,開發(fā)者可通過百度AI開發(fā)平臺EasyDL進(jìn)行使用。
EasyDL是百度大腦面向企業(yè)開發(fā)者推出的零門檻AI開發(fā)平臺,基于百度自主研發(fā)的深度學(xué)習(xí)平臺飛槳,結(jié)合業(yè)界先進(jìn)的工程服務(wù)技術(shù)打造,覆蓋視覺與自然語言處理兩大技術(shù)方向,支持一站式智能標(biāo)注、模型訓(xùn)練、服務(wù)部署等全流程功能。目前EasyDL已經(jīng)被廣泛應(yīng)用在零售、互聯(lián)網(wǎng)、安全生產(chǎn)、工業(yè)質(zhì)檢、教育、醫(yī)療、交通等20多個行業(yè),擁有70多萬用戶。
使用EasyDL簡單三步即可完成NLP任務(wù)配置與訓(xùn)練,性能優(yōu)異。
那么,文心這么厲害,有沒有機(jī)會和高工面對面,快速掌握技術(shù)原理與實際應(yīng)用?
本周六,百度資深研發(fā)工程師空降上海,一個上午從文心(ERNIE)技術(shù)解析到實戰(zhàn)演練為你解析如何定制企業(yè)高精度NLP模型。(文末海報報名哦)
我們先來點(diǎn)技術(shù)干貨稍做預(yù)習(xí),了解下文心(ERNIE)近期重磅上線的多項實用功能!
“多標(biāo)簽文本分類”指對一段文本同時標(biāo)記多個標(biāo)簽,如:“未來的學(xué)和教正在發(fā)生顛覆,學(xué)生將會在家里學(xué)習(xí),機(jī)器人將走上講臺。”可對應(yīng)標(biāo)簽為“教育”、“科技”。該功能應(yīng)用場景廣泛,如媒體場景中對新聞內(nèi)容進(jìn)行自動歸類,在內(nèi)容推薦場景中利用內(nèi)容標(biāo)簽提升召回,通過自動標(biāo)簽功能對知識文檔進(jìn)行多層級分類等。
目前,EasyDL平臺經(jīng)典版和專業(yè)版均新增了這項功能,在“專業(yè)版”的任務(wù)配置過程中,開發(fā)者還可選擇ERNIE Tiny、ERNIE Large、ERNIE Base三種各有所長的預(yù)訓(xùn)練模型。
“情感傾向分析”指對一段文本進(jìn)行“積極情感”或“消極情感”的判斷,如“酒店位置很好,服務(wù)周到熱情,下次一定會再來”的用戶評價,部署模型后可直接得到“Positive(積極情感)”的標(biāo)簽和99%的置信度。
該功能最常應(yīng)用于用戶評論分析和輿情分析,比如商品、店鋪的口碑分析,對事實性的新聞事件或互聯(lián)網(wǎng)話題進(jìn)行輿情分析等,在汽車、餐飲、酒店等多個垂類上,分析準(zhǔn)確率可達(dá)到95%以上。
目前,該功能已經(jīng)上線EasyDL經(jīng)典版,后續(xù)平臺將逐步增加基于實體級和句子級的情感分類,力求覆蓋更多的應(yīng)用需求。
針對開發(fā)者數(shù)據(jù)管理和數(shù)據(jù)標(biāo)注過程中的痛點(diǎn),EasyDL支持了更加靈活的數(shù)據(jù)格式,當(dāng)前可支持zip、Excel、TXT三種文件格式進(jìn)行上傳。除了提供在線標(biāo)注能力外,還提供智能標(biāo)注功能,大幅降低了開發(fā)者的標(biāo)注成本,開發(fā)者可直接上傳未標(biāo)注數(shù)據(jù)體驗該功能。
圖:文本智能標(biāo)注示意圖
10 月 24 日當(dāng)天,百度 AI 快車道【飛槳開源框架高階營】線下課程 “閃現(xiàn)” 上海站,邀請 “魔都程序猿” 和 “滬上程序媛” 來到上海市徐匯區(qū)瑞平路 230 號保利時光里 B1-09——LOFAS 集聚空間,與百度資深高工、各位行業(yè)開發(fā)者相聚一堂。上海站內(nèi)容絕對不會令你 “空腦而歸”,開發(fā)全流程、部署工具、高精度目標(biāo)檢測、模型優(yōu)化方案一一奉上,更有“全能”O(jiān)CR、金牌推薦算法,一起來場硬核趴體吧!
想了解強(qiáng)大文心(ERNIE)背后的技術(shù)原理?
想更進(jìn)一步快速掌握NLP模型開發(fā)方法與技巧?
想線下和百度資深研發(fā)與各行業(yè)開發(fā)者深度溝通?
本周六上午,就在上海徐匯區(qū)復(fù)興路1199號A座5層,百度AI快車道【EasyDL零門檻模型訓(xùn)練營】,資深研發(fā)工程師詳解NLP技術(shù)能力,并帶來現(xiàn)場實操與面對面答疑解惑,助你三小時掌握EasyDL的NLP模型開發(fā)秘籍!
點(diǎn)擊"鏈接"即可體驗!
雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。