丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能學術(shù) 正文
發(fā)私信給貝爽
發(fā)送

0

科大訊飛認知智能,從場景中來,到行業(yè)中去

本文作者: 貝爽 2021-12-06 15:28
導語:關(guān)鍵技術(shù)頂天,行業(yè)認知立地。

科大訊飛認知智能,從場景中來,到行業(yè)中去

導語:關(guān)鍵技術(shù)頂天,行業(yè)認知立地。當打破了實驗室和現(xiàn)實的隔閡之后,技術(shù)不再局限于自身,而是和廣大的外部場景做關(guān)聯(lián),最終成就了科大訊飛AI技術(shù)能夠迅速從研發(fā)到規(guī)模化落地的能力。


自然語言處理(NLP)一直是人工智能渴望攻克的難題。

直到2006年,來自上世紀末的互聯(lián)網(wǎng)時代累積的大量電子化的文本數(shù)據(jù),以及深度學習的加持,終于讓機器翻譯乃至自然語言處理,走上了快車道。

深度學習秉承統(tǒng)計方法的概率傳統(tǒng),不同的是,它基本不需要做特征工程,而特征工程需要大量的專家知識。

但盛志超發(fā)現(xiàn),即便是十幾年后的現(xiàn)在,將基于深度學習技術(shù)的NLP應用進行落地時,他們也必須拋棄對技術(shù)的執(zhí)念,回歸行業(yè)的專家知識。

這是他在科大訊飛鉆研NLP技術(shù)8年來,最珍貴的經(jīng)驗。

2011年從復旦大學畢業(yè)后,盛志超在一家創(chuàng)業(yè)公司做NLP的研究,經(jīng)過兩年多的實踐積累,他希望尋找更大的平臺用科技創(chuàng)造真正的社會價值。而彼時的科大訊飛,也憑借剛剛發(fā)布的訊飛輸入法和語音云而在人工智能語音領域小有名氣。因著語音合成技術(shù)中前端文本韻律預測和文本關(guān)聯(lián)的契機,早已開始了NLP的涉足和探索,并且已經(jīng)在語音交互和機器翻譯上有所實踐。

渴望用科技創(chuàng)造真正社會價值的人選擇了一家希冀“用人工智能建設美好世界”的公司,一切都如此順理成章。


1、黎明前夜,轉(zhuǎn)型成了必由之路

NLP 的歷史幾乎跟計算機和人工智能(AI)的歷史一樣長。而由于其天然具有實現(xiàn)人與計算機之間用自然語言進行有效溝通的橋梁屬性,也就帶來一個非常有趣的現(xiàn)象,那就是在開始探索感知智能的時候也總會連同認知智能一起被牽涉其中。

這種現(xiàn)象在科大訊飛也得到了演繹。

語音合成技術(shù)中,前端的文本韻律預測,就和文本關(guān)聯(lián)很大。所以科大訊飛在成立初期開始語音探索時便涉足NLP領域,不過早期局限于文本預測、語音識別的語言模型和文本檢索等內(nèi)容。

2005年,科大訊飛成立AI研究院,正式將NLP與語音合成、評測和識別作為核心研究方向。

由此,科大訊飛NLP在落地方面的嘗試便開始在跌跌撞撞中一路行進。

2005年語音測評技術(shù)已經(jīng)基本成熟,普通話測試系統(tǒng)通過了國家語委鑒定;語音合成技術(shù)也在2008年首次超過普通人說話水平,并連續(xù)多年在國際英文語音合成大賽中奪冠。

然而包括知識圖譜、語義檢索、短信分類、文字客服在內(nèi)的多個方向,由于技術(shù)不夠成熟,遷移成本太高,基于文本方向的技術(shù)落地大多以失敗告終。

“那個時候大家其實是立足于技術(shù)去思考匹配它未來可能使用的場景,慢慢地就發(fā)現(xiàn)這條路特別難走。” 這段艱難探索經(jīng)歷所復盤出的經(jīng)驗教訓,也在后來實踐中確切印證,也許是時候顛倒一下這種思維模式了。

既然“拿著蘿卜去找坑”不奏效,那倒不如反其道而行。

一個基于實際業(yè)務場景和需求去反向倒逼技術(shù)打磨的思維開始逆轉(zhuǎn)當前的坎坷局面。

2014年,基于編碼器-解碼器結(jié)構(gòu)的神經(jīng)機器翻譯模型誕生,機器翻譯正式進入了深度學習的時代。

同年,科大訊飛AI研究院首席科學家魏思敏銳覺察到,未來公司內(nèi)部要想在業(yè)界形成自己的技術(shù)優(yōu)勢,必須要形成數(shù)據(jù)+模型的雙輪驅(qū)動模式,而深度學習正是這一模式成功的關(guān)鍵。


科大訊飛認知智能,從場景中來,到行業(yè)中去

剛剛?cè)肼毑痪玫氖⒅境?,迎來了科大訊NLP技術(shù)發(fā)展的重要轉(zhuǎn)折點,這一次,他親歷其中。2015年年初,盛志超所在的NLP認知群組建起“7人攻堅團隊”,拉開了科大訊飛在NLP領域應用深度學習的大幕:他們首先檢索了市場上所有與之相關(guān)的論文,并分成了幾個不同的“Paper reading”小組,分頭研究不同的方向,之后再互相講解代碼,同時動手嘗試復現(xiàn)論文中的模型、算法等。

就這樣“7人攻堅團隊”成功將深度學習應用于NLP技術(shù),并很快在公司范圍內(nèi)推廣開來。

“當時我們的探索是走在很多高校和同行之前的”,回憶這段經(jīng)歷,盛志超說,團隊彼此的信任、凝聚力和共同的決心是他們成功不可或缺的因素。時至今日,當初的 7人小組成員也早已成為科大訊飛不同業(yè)務方向的核心骨干。

應用深度學習和基于場景倒逼技術(shù)打磨的思維轉(zhuǎn)變,科大訊飛的NLP終于要從黎明前夜得見破曉來臨。


2、從場景中來,到行業(yè)中去

許多優(yōu)秀演員在塑造角色的時候,經(jīng)常在前期去到角色真實的工作或生活場景中去“體驗生活”,在表演時力求達到忘我境界。

這種塑造方式淳樸而又難能可貴,卻和盛志超在落地NLP時的路徑相通。

2014年9月,剛剛?cè)肼?0天的盛志超被派到科大訊飛北京研究院,參與語文作文評閱的技術(shù)研發(fā)和落地工作。

作文評閱分為評分和批改兩個方向,評分就是給文檔判定一個分數(shù),批改則需要根據(jù)文章中的語法使用是否正確、句式表達是否高級、內(nèi)容是否符合主旨要求等維度進行綜合評定。

前者技術(shù)相對簡單,后者因為涉及認知問題則更為復雜。

如大家所知,小初高到大學,不同學習階段對高級表達和詞匯的定義標準差異巨大,所以在具體批改的時候也需要根據(jù)各學習階段的具體情況來具體“定義”。

正像盛志超所說,“評閱技術(shù)不但是要評分也要給出合理的反饋,必須基于場景知識做模塊化處理,逐層拆解之后,才能給出相對科學的評分和用戶學習想要的反饋結(jié)果?!?/p>

“訊飛智學網(wǎng)剛剛上線的時候,作文評閱技術(shù)還是翻車出了異常。”盛志超說,這是他畢生難忘的經(jīng)歷。

當時學校要求一場考試覆蓋1000個人,并且不能有一個人的評閱出現(xiàn)錯誤,但深度學習和傳統(tǒng)的機器學習都是統(tǒng)計意義上的模型,考慮的都是整體的概率,不會兼顧到每個學生的情況。

于是,狀況出現(xiàn)了。

英文作文的試卷開頭都會給出一段引言,要求學生續(xù)寫,而機器把引言當成了需要評閱的作答內(nèi)容,其中一份作文即便是白卷也給了分數(shù)。試卷評分是一個非常嚴肅的事,這樣的失誤所影響的考試客觀公平性,不管是老師層面還是盛志超自己都覺得是不可彌補的。

而反觀其后,這次落地失敗的根源還是在于我們關(guān)注的指標和用戶實際場景關(guān)注的指標不一致。

這之后盛志超和團隊開始長期頻繁地“體驗學習生活”,和老師、學生、家長這些每一個與學習相關(guān)的關(guān)鍵角色去溝通交流,嘗試全面而真實地理解和定義在教育領域每一個細枝末節(jié)的需求問題。

“想要真的做好教育領域的認知落地,首先要忘記自己原來的身份,成為一名學生、家長或者老師”。

盛志超說的這個思路恰與當年張三豐傳授張無忌太極武功時的要義如出一轍:“太極拳只重其義,不重其招。你忘記所有的招式,就練成太極拳了?!?/p>


科大訊飛認知智能,從場景中來,到行業(yè)中去

2016年,盛志超及團隊終于成功將作文評閱技術(shù)應用到高考和中考里面,這也是國內(nèi)首次在大規(guī)模正規(guī)考試中使用教育評測技術(shù)。

如果說這個只是解決了教育某一個特定“場景”的問題,那此后的“因材施教和個性化學習”則證明了科大訊飛在教育領域深耕的決心。

2020年初,盛志超回歸教育開始攻關(guān)難度更高的因材施教的個性化學習方向。

盛志超坦言,自己也曾是學生,在學校度過二十多年的時光,即便作為學習的佼佼者他也依然無法總結(jié)出自己所謂的經(jīng)驗給到其他求學者以參考。這背后的原因或許不是一句簡單的“畢竟適合每個人的學習方法是不一樣的”可以總結(jié)概括的。

或許它更指向一個數(shù)千年前就萌生的美好理想:“因材施教,有教無類”。我們追尋了千年,而現(xiàn)在盛志超和團隊正在一步步靠近它。

一個結(jié)合學習者的知識水平,為其提供定制化的動態(tài)教學策略的個性化方案開始了“減負增效”的使命。

以題目推薦為例,廣大師生都非常推崇的“題海戰(zhàn)術(shù)”,就此可以找到“有效刷題”的解法。這背后涉及到了認知診斷、深度學習、知識圖譜等一系列的技術(shù)集合。

參照著名心理學家維果茨基提出的“最近發(fā)展區(qū)理論”,個性化推題激發(fā)學生“潛能”的邏輯理解起來就很簡單:在現(xiàn)有水平上為學生推薦的學習題型,既不會太難,產(chǎn)生畏難情緒,也不會太簡單,浪費過多的時間,用盛志超的話來說就是“跳一跳就能夠得著”的學習資源。

但是想要精準定位到每個學生“跳一跳就能夠得著”的學習資源并非易事,這需要通過知識圖譜對學生的認知方式進行建模。

科大訊飛早有知識圖譜技術(shù)積淀。從2013年開始投入研發(fā),2016年獲得國際知識圖譜構(gòu)建大賽NIST TAC (KBP2016) 第一名,如今訊飛的知識圖譜技術(shù)已經(jīng)積累了7年。

這張圖展示了一個學生的認知建模案例,其中紅色是掌握較差的知識點,黃色是掌握一般的知識點,綠色是掌握較好的知識點。

科大訊飛認知智能,從場景中來,到行業(yè)中去

學生立足于綠色知識點,然后先學黃色知識點、再學紅色知識點,這就構(gòu)成了每個學生獨特的學習路徑。這種循序漸進的方式,不僅提高了學習效率,也可以真正做到因人而異、因材施教。

深入場景和行業(yè)的方法論在教育領域得到了最佳驗證,可以預見,人工智能對生產(chǎn)生活的改變也將不斷涌現(xiàn),甚至那些不曾找到破題思路的重大歷史命題,或許也會在人工智能領域找到新解。


3、重大歷史命題的破題新解

科大訊飛認知智能,從場景中來,到行業(yè)中去

但是,由于教育、醫(yī)療、司法這些關(guān)聯(lián)民生剛需的重大歷史命題本身就是多個復雜問題的集合,所以人工智能即便能夠給出解法,那也一定不再依賴于單一技術(shù),必須是復雜系統(tǒng)的合力。

“就拿教育的AI學習機來說,這個里面就涉及到了語音交互和評測、圖文識別、認知理解、知識圖譜、多維度學情畫像等一系列的相關(guān)技術(shù)。” 盛志超說的不假,除了上文中我們已經(jīng)提到的個性化學習環(huán)節(jié)中的認知診斷、知識圖譜,一個普通學習鏈路的完成,遠比想象中復雜:

一個學生通過AI學習機把做完的作業(yè)進行拍照上傳,圖文識別技術(shù)把照片進行曲面矯正、畫面降噪等處理后即可對布滿印刷體和手寫體甚至是公式的作業(yè)進行識別;此后NLP等技術(shù)開始針對問題以及文本中提到的信息去自行推斷答案和批改;而對于做錯的題目,基于知識圖譜的技術(shù)可以針對其所涵蓋的知識點去進行最近發(fā)展區(qū)相關(guān)練習題型的推薦。

創(chuàng)新鏈條上各個關(guān)鍵技術(shù)深度融合,串聯(lián)打通了一個體系化的學習鏈路。

倘若我們向前追溯,會發(fā)現(xiàn)關(guān)鍵技術(shù)深度融合也需要至關(guān)重要的底層基建——單點核心技術(shù)突破并跨越應用鴻溝。

我們或許可以從多語種交互的實踐中印證這個結(jié)論。

當前,語音已成為萬物互聯(lián)時代人機交互的關(guān)鍵入口,語音輸入、語音搜索、語音交互等技術(shù)已經(jīng)成為手機、車載、玩具等智能產(chǎn)品的標配。另一方面,“一帶一路”國家戰(zhàn)略的建設依賴語言互通,多語種翻譯技術(shù)價值凸顯。但是要將多語種的智能語音語言技術(shù)做到實用水平,并沒有那么容易。

不同語言獨特的語言現(xiàn)象十分復雜、小語種語言分析研究的積累和投入不足、訓練數(shù)據(jù)稀缺……這些客觀存在的難題就擺在眼前。

大家選擇了迎難而上、各個擊破。

數(shù)據(jù)方面,科大訊飛研發(fā)了基于人機協(xié)同的多語種數(shù)據(jù)標注平臺;算法方面,重點開展了多語種端到端統(tǒng)一建模框架、無監(jiān)督/弱監(jiān)督訓練,以及語音/圖片翻譯多任務協(xié)同優(yōu)化等方向的研究;研發(fā)訓練效率優(yōu)化方面,則構(gòu)建了多語種模型自動訓練及定制優(yōu)化平臺,以推動多語種系統(tǒng)的批量研發(fā),解決人工耗時耗力的問題。

這些努力終于迎來了反饋。2021年10月26日,哈工大訊飛聯(lián)合實驗室(HFL)團隊以總平均分84.1位列權(quán)威多語言理解評測XTREME(由谷歌舉辦,旨在全面考察模型的多語言理解與跨語言遷移能力)榜首,四個賽道中獲得三項最好成績。而后11月10日,國際低資源多語種語音識別競賽OpenASR落下帷幕,科大訊飛-中科大語音及語言信息處理國家工程實驗室(USTC-NELSLIP)聯(lián)合團隊參加了所有15個語種受限賽道和7個語種非受限賽道,并全部取得第一名的成績。

從單點的核心技術(shù)效果上取得突破,跨過應用門檻,再到把創(chuàng)新鏈條上各個關(guān)鍵技術(shù)進行深度融合,“系統(tǒng)性創(chuàng)新”卻仍沒有形成嚴格意義上的閉環(huán)。

畢竟解決問題的方法路徑雖然撥開迷霧逐漸清晰,但是“要解決什么問題”才是困擾這些科學家們的難題本源。

教育、醫(yī)療、司法、城市生態(tài),每一個詞語都無比厚重,一時間竟也無法用某幾個詞來總結(jié)和概括清楚其背后所牽連出的問題核心所謂何物:不管是教育的“減負增效”、“因材施教”、“資源均衡”,還是醫(yī)療的“醫(yī)療水平”、“就醫(yī)體驗”······

這些重大系統(tǒng)性命題到科學問題的轉(zhuǎn)化,也許正回歸了NLP或者說是認知智能的本真——定義問題。

“360行行行有專家,如何把各個行業(yè)的問題和知識特色定義好,怎么樣形成一個框架把模型能夠不斷復制應用到各個行業(yè)”,這是盛志超和團隊面臨的挑戰(zhàn),也是科大訊飛未來繼續(xù)突破的關(guān)鍵。

當重大系統(tǒng)性命題到科學問題的轉(zhuǎn)化能力愈加強勁,單點的核心技術(shù)不斷突破后深度融合、有機串聯(lián),系統(tǒng)性創(chuàng)新也就真正可以成為宏大歷史命題的破題新解。


4、無限拓寬的神經(jīng)網(wǎng)絡

我們曾經(jīng)在對話科大訊飛AI研究院CV群的時候,將科大訊飛比喻為一個很寬、很深的生成式神經(jīng)網(wǎng)絡。

一個典型的生成式神經(jīng)網(wǎng)絡包括了輸入層、編碼層、輸出層,對于一個AI企業(yè)而言,輸入是AI三要素:算力、數(shù)據(jù)、算法,輸出是技術(shù)和產(chǎn)品,編碼層則是企業(yè)的組織方式和技術(shù)方法論,以及企業(yè)的人才。

在《不一樣的科大訊飛,他們把計算機視覺踢進“世界杯”》這篇文章中,我們了解了科大訊飛對人才的重視,以及獨特的組織方式。

研究院設立的3個研究方向——CV方向、認知方向、語音方向,相互獨立,又深度融合,為優(yōu)秀的人才提供了平等、開放的交流平臺,讓他們得以鍛煉自身、發(fā)揮潛力、博采眾長。

但這只解開了科大訊飛這個神經(jīng)網(wǎng)絡的編碼層的一半秘密,另一半秘密,也許可以從盛志超和團隊在NLP落地路徑上一窺究竟:不管是當初勢在必行的轉(zhuǎn)型之路,還是后來在教育、醫(yī)療等場景領域的打磨,一切核心都是在做一件事兒,那就是定義并建立對不同行業(yè)的真正認知。

認知行業(yè)和定義問題,使得科大訊飛在選擇方向時不受自身行動能力的限制,進而無限拓寬了科大訊飛這個神經(jīng)網(wǎng)絡的寬度。

關(guān)鍵技術(shù)頂天,行業(yè)認知立地,當打破了實驗室和現(xiàn)實的隔閡之后,技術(shù)不再局限于自身,而是和廣大的外部場景做關(guān)聯(lián),最終成就了科大訊飛AI技術(shù)能夠迅速從研發(fā)到規(guī)?;涞氐哪芰?。我們也就有理由相信,“用人工智能建設美好世界”的使命絕不是紙上談兵。

雷峰網(wǎng)雷峰網(wǎng)(公眾號:雷峰網(wǎng))雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

科大訊飛認知智能,從場景中來,到行業(yè)中去

分享:
相關(guān)文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說