丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給skura
發(fā)送

0

國際語義評(píng)測比賽收官,百度獲論壇評(píng)論建議挖掘評(píng)測任務(wù)冠軍

本文作者: skura 2019-02-26 17:44
導(dǎo)語:從海量評(píng)論中挖掘用戶建議,百度以F值78.12%斬獲國際語義評(píng)測比賽冠軍

雷鋒網(wǎng) AI 科技評(píng)論按,國際賽事上屢傳佳報(bào)的百度,2019 年開年再次拿下「一血」。2019 年 2 月 1 日,第十三屆國際語義評(píng)測比賽(International Workshop on Semantic Evaluation, SemEval 2019)落下帷幕。在論壇評(píng)論建議挖掘任務(wù)評(píng)測(Task 9A: Suggestion Mining from Online Reviews and Forums)中,百度一舉擊敗來自全球的 210 余支隊(duì)伍,最終以 F 值 78.12% 的成績奪得冠軍,表明了百度率先在評(píng)論建議挖掘領(lǐng)域嘗試并取得喜人的成果。

國際語義評(píng)測比賽收官,百度獲論壇評(píng)論建議挖掘評(píng)測任務(wù)冠軍

SemEval-2019 Task 9A 最終榜單,百度排名第一

SemEval 評(píng)測是自然語言處理領(lǐng)域的國際性權(quán)威競賽,由國際計(jì)算語言學(xué)協(xié)會(huì)(Association for Computational Linguistics, ACL)下屬的 SIGLEX 主辦。ACL 是自然語言處理與計(jì)算語言學(xué)領(lǐng)域最高級(jí)別的學(xué)術(shù)會(huì)議,是世界上影響力最大、最具活力的國際學(xué)術(shù)組織。自 2001 年起,SemEval 至今已成功舉辦十二屆,吸引了世界范圍內(nèi)的多所大學(xué)和研究機(jī)構(gòu)的參加,在業(yè)界和學(xué)術(shù)界具有極高影響力。本次評(píng)測聚焦的任務(wù)是論壇評(píng)論建議挖掘,旨在抽取從網(wǎng)絡(luò)論壇或評(píng)論中自動(dòng)識(shí)別建議性的句子,用于幫助企業(yè)、政府機(jī)關(guān)等組織持續(xù)不斷的從海量數(shù)據(jù)中提取有價(jià)值的信息。

如今,用戶喜歡在網(wǎng)絡(luò)中發(fā)表評(píng)論,表達(dá)自己對(duì)個(gè)人、產(chǎn)品、服務(wù)和社會(huì)事件等的意見和想法,這些評(píng)論不僅蘊(yùn)含用戶豐富的情感表達(dá),有些還包含著用戶對(duì)產(chǎn)品或服務(wù)的建議。比如「我喜歡吃這家餐廳」是用戶表達(dá)喜歡這種情感的評(píng)論,但在「我喜歡吃這家餐廳,如果環(huán)境再好一點(diǎn)就更好了」這條評(píng)論中,還包含了用戶對(duì)這家餐廳的建議。以往的情感分析研究更關(guān)注用戶是否存在負(fù)面情感,上述這條評(píng)論往往會(huì)被忽略,實(shí)際上建議類評(píng)論對(duì)提升企業(yè)服務(wù)具有極高價(jià)值。目前,業(yè)界有大量針對(duì)用戶情感分析的研究,但建議挖掘還處于初步階段,百度率先在評(píng)論建議挖掘領(lǐng)域嘗試。

建議挖掘是一項(xiàng)新的研究任務(wù),該任務(wù)需要綜合考慮句子的語義、語態(tài)、 情緒、句式、上下文等信息,才能做出準(zhǔn)確的判斷。例如「可以考慮在節(jié)假日增加幾趟航班」,「假如房間里提供熱水壺,我下次還愿意訂在這里」等句子雖然句式、形態(tài)、評(píng)論的對(duì)象完全不同,但都是有價(jià)值的建議。對(duì)「建議」內(nèi)涵和外延的理解存在比較大的主觀性,使得問題定義及語料標(biāo)注難以取得一致,這給建議挖掘帶來了很多困難。

此次比賽中,百度團(tuán)隊(duì)采用多種技術(shù)手段解決難題,并最終取得了亮眼成果。首先,針對(duì)任務(wù)標(biāo)注數(shù)據(jù)過于稀疏的問題,團(tuán)隊(duì)構(gòu)建了以大規(guī)模無監(jiān)督數(shù)據(jù)為基礎(chǔ)的跨領(lǐng)域、多句式深度語義分類模型。采用融合淺層學(xué)習(xí)和深度學(xué)習(xí)的 Ensemble 學(xué)習(xí)模型,以解決樣本不平衡問題。面對(duì)網(wǎng)絡(luò)文本形式多樣、表達(dá)不規(guī)范的現(xiàn)狀,團(tuán)隊(duì)采用精細(xì)化粒度特征和注意力遷移機(jī)制進(jìn)行處理。最終,百度團(tuán)隊(duì)以 F 值 78.12% 的成績戰(zhàn)勝了來自全球的 210 余支隊(duì)伍,奪得冠軍。

企業(yè)期待及時(shí)獲取消費(fèi)者的評(píng)價(jià)以改進(jìn)服務(wù)、政府和媒體希望從海量文本中提取意見以成為決策參考與新聞素材……而互聯(lián)網(wǎng)上還有大量評(píng)論數(shù)據(jù)沉淀,亟待深度應(yīng)用。評(píng)論建議挖掘用于輔助決策,無疑是極具實(shí)用價(jià)值的自然語言處理任務(wù)!

賦予機(jī)器「認(rèn)知」能力,是人工智能最具挑戰(zhàn)的技術(shù)領(lǐng)域之一,自然語言處理屬于認(rèn)知部分的重要內(nèi)容。更深入地理解語言,讓機(jī)器具備人類的思考和理解能力意義重大。百度在自然語言處理(NLP)領(lǐng)域已經(jīng)過十余年積累與沉淀,具備了最前沿、最全面、最領(lǐng)先的技術(shù)布局,不僅專注于前瞻技術(shù)探索,更致力通過技術(shù)應(yīng)用解決實(shí)際問題。目前,百度語義理解技術(shù)已廣泛應(yīng)用于百度內(nèi)外,在搜索、信息流等一系列產(chǎn)品應(yīng)用中發(fā)揮重要作用。

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

國際語義評(píng)測比賽收官,百度獲論壇評(píng)論建議挖掘評(píng)測任務(wù)冠軍

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說