0
本文作者: sanman | 編輯:汪思穎 | 2018-07-13 17:15 | 專題:ACL 2018 |
雷鋒網(wǎng) AI 科技評論按:7 月 9 日,自然語言處理頂會 ACL 公布了最佳 demo 論文的四篇候選論文,名單如下:
CRUISE: Cold-Start New Skill Development via Iterative Utterance Generation
Out-of-the-box Universal Romanization Tool
Platforms for Non-Speakers Annotating Names in Any Language
YEDDA: A lightweight Collaborative Text Span Annotation Tool
值得注意的是,四篇論文中有三篇論文的一作是中國研究者,他們分別是目前任職于三星美國研究中心的 Yilin Shen,倫斯勒理工學院博士生 Ying Lin,新加坡科技設計大學(SUTD)博士生 Jie Yang。最佳 demo 論文獎將在主會最佳論文 session 環(huán)節(jié)揭曉,屆時雷鋒網(wǎng) AI 科技評論將會第一時間帶來現(xiàn)場報導。
本文將對這四篇論文進行簡單介紹。
CRUISE: Cold-Start New Skill Development via Iterative Utterance Generation
CRUISE:基于迭代語料生成的冷啟動新技能開發(fā)
論文摘要:我們提出了 CRUISE 系統(tǒng),它可以指導普通軟件開發(fā)者從頭開始構建高質量的自然語言理解(NLU)引擎。構建該引擎是給個人助手(智能語音助手)添加新技能的基礎步驟。與開發(fā)者或眾包手動標注大量語料的現(xiàn)有解決方案不同,我們設計了一種基于規(guī)則和數(shù)據(jù)驅動的混合方法,該方法可以迭代生成越來越多的語料。我們的系統(tǒng)只需要少量人工在迭代中修改錯誤語料即可。CRUISE 系統(tǒng)會生成一個「訓練有素」的 NLU 引擎,同時還會生成一個大型已注釋語料庫,第三方可以基于此來開發(fā)自定義技能。通過使用基準數(shù)據(jù)集和自定義數(shù)據(jù)集,我們收集到了現(xiàn)實世界的設定,NLU 性能比賽和人類評價則證實了 CRUISE 生成語料的高質量。我們的工作大幅降低了人類認知負荷,同時縮短了人工剪枝時間。
論文作者:Yilin Shen, Avik Ray, Abhishek Patel,Hongxia Jin
Out-of-the-box Universal Romanization Tool
開箱即用的通用羅馬化工具
論文摘要:我們想介紹 uroman,這個工具可以把五花八門的語言和文字(如中文、阿拉伯語、西里爾文)轉換為普通拉丁文。該工具基于 Unicode 數(shù)據(jù)以及其他表,可以處理幾乎所有的字符集(包括一些晦澀難懂的語言比如藏文和提非納文)。uroman 還可以將不同文本中的數(shù)字轉換為阿拉伯數(shù)字。羅馬化讓比較不同文本的字符串相似性變得更加容易,因為不再需要將兩種文字翻譯成中間文字再比較。本工具作為一個 Perl 腳本,可以免費提供,可用于數(shù)據(jù)處理管道和交互式演示網(wǎng)頁。
論文作者:Ulf Hermjakob, Jonathan May,Kevin Knight
Platforms for Non-Speakers Annotating Names in Any Language
未知語言標注平臺
論文摘要:我們將演示兩個標注平臺,在該平臺上,英語母語者即使不熟悉某種語言也可以用該語言進行標注。這些平臺可以為低資源語言提供高質量的「銀標」注釋。平臺目前在 LoreHLT20171 上的奧羅莫語和提格里尼亞語上取得了最佳成績,在 TAC-KBP EDL2017 的十項語言上取得了最佳成績。我們討論了平臺的優(yōu)點和局限性,并與其他的未知語言標注方法進行了比較。我們將向研究者們公開該工具。
論文作者:Ying Lin, Cash Costello, Boliang Zhang, Di Lu, Heng Ji, James Mayfield,Paul McNamee
YEDDA: a lightweight collaborative text span annotation tool
YEDDA:一種輕量型文本范圍注釋工具
論文摘要:在論文中,我們將介紹 YEDDA——一個輕量、高效且全面的開源文本范圍注釋工具。Yedda 為文本范圍注釋提供了系統(tǒng)化的解決方案,涵蓋了用戶協(xié)作標注到管理員評估與分析等需求。Yedda 可以用命令行和快捷鍵對文本進行標注,并以此克服傳統(tǒng)文本標注工具的低效率,用戶可以自定義命令行和快捷鍵。Yedda 還可以通過學習最新標注文本智能化為用戶提供標注意見。我們還開發(fā)了管理員客戶端用以評估多個注釋器的標注質量,并為每個注釋器生成詳細的比較報告。實驗表明,相較于現(xiàn)有標注工具,我們的系統(tǒng)可以節(jié)省一半的時間,使用智能推薦還能再節(jié)省 16.47% 的時間。
論文作者:Jie Yang, Yue Zhang, Linwei Li and Xingxuan Li
via:https://acl2018.org/2018/07/09/best-demo-candidates/
雷鋒網(wǎng) AI 科技評論將會第一時間為大家?guī)?ACL 現(xiàn)場報道,敬請關注。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。