丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給劉芳平
發(fā)送

0

首發(fā) | 阿里iDST總監(jiān)初敏加盟思必馳,將建立北京研發(fā)團(tuán)隊(附專訪)

本文作者: 劉芳平 2017-08-28 13:55
導(dǎo)語:擔(dān)任思必馳VP、思必馳北京研發(fā)院院長,拓展語音技術(shù)在物聯(lián)網(wǎng)外的新業(yè)務(wù)、新場景的落地。

雷鋒網(wǎng)消息,8月28日,智能語音交互技術(shù)公司思必馳宣布,阿里iDST總監(jiān)初敏博士加入思必馳,擔(dān)任思必馳VP、思必馳北京研發(fā)院院長,拓展語音技術(shù)在物聯(lián)網(wǎng)外的新業(yè)務(wù)、新場景的落地。

初敏原來的團(tuán)隊交給了阿里 iDST 語音組總監(jiān)鄢志杰管理,“他很能干的”。

在接受雷鋒網(wǎng)專訪時,初敏表示自己選擇加入思必馳的原因主要是,“對人工智能特別是語音交互的未來的觀點(diǎn)”和后者很一致,而且創(chuàng)業(yè)公司可以做到十分專注。

加入思必馳后,初敏將領(lǐng)導(dǎo)建立思必馳北京研發(fā)院,初期目標(biāo)是在一年左右建立50人的團(tuán)隊,二年達(dá)到100人的規(guī)模。研發(fā)院不僅將進(jìn)行基礎(chǔ)技術(shù)的研究,也將探索語音在更多場景里的應(yīng)用。

首發(fā) | 阿里iDST總監(jiān)初敏加盟思必馳,將建立北京研發(fā)團(tuán)隊(附專訪)

關(guān)于初敏博士

初敏是中科院聲學(xué)所博士,主要研究方向覆蓋語音識別與合成、自然語言處理、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘、大數(shù)據(jù)處理和計算等,在相關(guān)領(lǐng)域發(fā)表了近百篇學(xué)術(shù)論文并取得20多項國內(nèi)外專利。

2000年,初敏博士加入微軟,在微軟亞洲研究院從事科學(xué)研究近10年,創(chuàng)建并領(lǐng)導(dǎo)語音合成研究小組,研制出了第一個中英文雙語語音合成系統(tǒng)“木蘭”;

2009年入職阿里巴巴,擔(dān)任阿里iDST智能語音交互方向負(fù)責(zé)人,使Yun OS、支付寶、手機(jī)淘寶、釘釘?shù)犬a(chǎn)品具備語音交互能力;

2017年加入思必馳,擔(dān)任思必馳VP、思必馳北京研發(fā)院院長,拓展語音技術(shù)在物聯(lián)網(wǎng)外的新業(yè)務(wù)、新場景的落地。


以下為采訪實(shí)錄,雷鋒網(wǎng)作了不改變原意的刪減。

雷鋒網(wǎng):為什么離開阿里加入思必馳?

初敏:其實(shí)我跟老高(高始興)和俞凱很早以前就認(rèn)識了,但是沒有聊這方面的事。在阿里八年,感覺也是時候迎接一些新的變化和挑戰(zhàn),陸續(xù)收到很多大公司的橄欖枝,恰巧最近有些機(jī)會和老高深聊,我覺得我們對人工智能特別是語音交互的未來的觀點(diǎn)其實(shí)蠻一致的。

未來的3到5年是一個AI技術(shù)實(shí)用化成型的過程,是我們的一個共識。跟俞凱也談了很多技術(shù),包括深度學(xué)習(xí)怎么在自然語言中去更好的應(yīng)用,怎么能讓機(jī)器更快地從人這里學(xué)習(xí)。我覺得蠻談得來的,有很多共識做事會很方便,這是一個很重要的原因。

阿里的團(tuán)隊是我建起來的,團(tuán)隊來說我們是一個相當(dāng)好的團(tuán)隊。公司大有大量的好處,比如資金更充足資源更豐富一些,數(shù)據(jù)、計算能力這種技術(shù)環(huán)境會更好,但是思必馳專注只做一件事情的公司,這對我來講是有吸引力的。

其實(shí)也跟朋友聊是不是要創(chuàng)業(yè),我覺得自己還沒有這個勇氣自己去創(chuàng)業(yè),哈哈,這個過程太痛苦了。

但是加入一個思必馳這樣在創(chuàng)業(yè)過程的公司,對我來說逃避了最開頭的那一段,希望通過我的加入能幫助這家公司更快地成長。

雷鋒網(wǎng):加入思必馳后,對于將來的工作有什么樣的規(guī)劃?

初敏:因為其實(shí)就是這兩天的事情。我們希望做的事情是,原來思必馳基本上的團(tuán)隊是在蘇州,至少技術(shù)團(tuán)隊是,北京這邊幾乎沒有技術(shù)人員,但是其實(shí)北京是人才最豐富的地方,所以我會在北京建立一個北京的研發(fā)院。

這個研發(fā)院會做一些核心技術(shù)的研發(fā),也會做一些工程上的,包括真正在應(yīng)用場景中的一些落地。不只是把原來的東西做得更精細(xì),而是開辟出更多新場景,使整個語音交互為核心的技術(shù)能有更強(qiáng)更多的輻射面。

我們這些做技術(shù)出身的人,就是希望自己做的技術(shù)真的被很多人用,這是最大的成功。掙多少錢是附帶的,因為這個過程中不掙錢的話做不到那一步,只要能做到那步一定能掙到錢。但是最大的是自我的成就感,一定是來自于很多人用而且感覺很好。

雷鋒網(wǎng):關(guān)于北京團(tuán)隊的規(guī)劃您現(xiàn)在有比較詳細(xì)的一些想法嗎?

初敏:在規(guī)劃之中,主要思路是主要以研發(fā)人員為主,核心技術(shù)以及工程落地的,以后可能會有一些業(yè)務(wù)落地的。

希望在一年左右能招到50人左右,兩年左右可能是一百人的規(guī)模。

細(xì)的東西還要更細(xì)致地做工作以后才能把詳細(xì)計劃落實(shí),但是現(xiàn)在開始我們也開始在招聘,包括北京新的HR開始要招募了。因為原來都是蘇州整個管掉,現(xiàn)在也會在這配套。

雷鋒網(wǎng):語音識別公司現(xiàn)在是不是到了拼市場份額,合作案例經(jīng)驗積累的時候了,研究上的進(jìn)步只是錦上添花,不起決定作用?

初敏:我們建立的團(tuán)隊不是一個純研究的團(tuán)隊。今天我覺得中國所有的團(tuán)隊都不是一個像以前在微軟MSRA一樣的研究團(tuán)隊,包括iDST也不是。

北京的團(tuán)隊我稱之為研發(fā),有研究的成員,但最終一定是開發(fā)成一個完整的東西,然后這個東西是可以用的。

你剛才說的這個,我有非常多的實(shí)踐經(jīng)驗,特別是在過去這幾年碰到了很多用戶的實(shí)際問題,的確是這樣子的。但是也不能說技術(shù)就是錦上添花,而是說這兩個腿都不能短。一個是核心技術(shù)的研發(fā),一個是所謂的工程導(dǎo)向或者是產(chǎn)品導(dǎo)向??偠灾?,要把產(chǎn)品用戶體驗做到完備兩個都必須有。

我們在兩塊都會做,思必馳不是定位在產(chǎn)業(yè)鏈條的某一個環(huán)節(jié),而是希望至少把語音交互這個完整場景做出來,包含了鏈條中的每個環(huán)節(jié)。

因為這個過程是相輔相成的,過程有好多環(huán)節(jié),這些環(huán)節(jié)是個鏈條,只要有一個鏈條出問題,最后的用戶體驗就會很差。所以要把整個鏈條閉合,從核心技術(shù)到平臺到產(chǎn)品一直到用戶體驗。

鏈條上的基礎(chǔ)建設(shè),好多都是核心技術(shù),比如語音識別本身深度學(xué)習(xí)的建模技術(shù)可以做到更好。

但是下一個問題是如果數(shù)據(jù)是在A場景采集的,拿到B場景不好了,模型換成B場景可能不太好了,那么要多快,用什么樣的數(shù)據(jù)規(guī)模,多長時間把它帶過去,這時候會有一個困難的轉(zhuǎn)移過程。可以從頭到尾訓(xùn),也可以做Transfer Learning,這個就是比核心技術(shù)了。

但是話又說回來,最終還是需要一個鏈條。最后希望達(dá)到的是,客戶給我上傳,比如說多少多少小時的一個標(biāo)準(zhǔn)數(shù)據(jù),我很快就得到一個模型,那在他這個地方就好了。所以實(shí)際上是場景的適應(yīng)能力,解決一些這樣的問題,最終才能大規(guī)模的把這個技術(shù)鋪開。

我在這邊也會去搭建這種基礎(chǔ)設(shè)施,核心實(shí)力我認(rèn)為就是快。對于核心實(shí)力我一直認(rèn)為,特別是在今天這種所謂的大數(shù)據(jù)時代,數(shù)據(jù)很多(理論上很多,但實(shí)際上分散在不同領(lǐng)域)。要把數(shù)據(jù)管理好,把不同場景的數(shù)據(jù)更好地用起來,包括在一個新的場景中用起來。這里就有核心算法的的提升空間了,也有很多工程上要把這件事情做順暢的方面。

還是剛才說的,這兩個腿都做起來,迭代效率快,那你將來去實(shí)施就很快,才真正具備商業(yè)化的能力,要不然都是A項目B項目C項目,做一個項目花的成本差不多,那就很辛苦。

我們要做到的是,做第一個項目,比如花費(fèi)是1,第二個項目花費(fèi)可能是0.5,第三個項目花費(fèi)就是0.3了,以后可能每一個項目生成就是花個0.1、0.15的代價,甚至做到更低,這時候才能從一個到一百個或者到幾百個。

磨就是這個過程。每復(fù)制一次,成本都下降,實(shí)現(xiàn)規(guī)?;罱K產(chǎn)生經(jīng)濟(jì)效益。

雷鋒網(wǎng):對于場景落地這塊您有什么規(guī)劃嗎?

初敏:思必馳在一些現(xiàn)有的地方還是蠻強(qiáng)的,比如在汽車,特別是后裝,還有智能家居包括音箱,其實(shí)好多家用的都是我們的解決方案。

我希望我進(jìn)來不是在這些地方添點(diǎn)磚加點(diǎn)瓦,而是會試圖去探索一些新場景,現(xiàn)在有很多可能性,是什么今天還沒有完全弄清楚。所以會從招聘開始,和底層一些技術(shù)建設(shè),場景還是要慢慢看的,沒有那么快,但是一定會去探索更多的,我相信是很多的。

雷鋒網(wǎng):有沒有想法做一個消費(fèi)品牌?

初敏:目前還沒有,原因也比較清晰,就是實(shí)際上這個鏈條很長,如果我們什么都做了,很有可能做不好。而且做了這個端實(shí)際上和別的端是競爭的關(guān)系,所以今天我覺得可能不會往實(shí)際產(chǎn)品做,但是也不排除自己去做一兩個demo,更好地展示技術(shù)。

雷鋒網(wǎng):您怎么看現(xiàn)在火爆的智能音箱?

初敏:我覺得蠻有爭議的,不是特別看好。首先,我覺得Echo是不是真的叫成功,就是看你怎么定義成功,如果從品牌、影響的角度來看,是挺成功的,因為它利用了這整個潮流,出了影響,一堆人跟著做。

但是我也跟有些人聊過,實(shí)際上它的粘性并不見得好,大家因好玩新鮮,所以買了一個回家,但是有多少人在買回家三個月后還在天天用,很少。換句話說這個音箱是不是真的解決了問題,變成一個必需品,這個問題沒有看到。

美國市場和中國市場也不太一樣,美國市場大概只聽到這兩個(Echo和Google Home)。中國沒有這樣的領(lǐng)導(dǎo)產(chǎn)品,一堆公司在做。中國今天最大的問題還是沒解決核心問題,很多人只是買它來玩一下,知道它能干啥,之后可能就沒興趣了,真的有什么事總找音箱做的很少。

有幾個原因,一是他上頭能干的事情真的太少了,一個東西必須讓我覺得能信賴他,至少一類事情我持續(xù)找它,它都能做,對這我才會養(yǎng)成習(xí)慣。所以我覺得這不光是語音技術(shù)的問題了,是背后他到底能干什么事。今天還大家還稱之為音箱,那就是聽音樂,那顯然這樣子的音箱聽音樂都不是最好的選擇,就是大幾百塊錢的音箱,也不是好到哪里的。

Echo稍微好一點(diǎn),接入了很多控制功能,美國人房子大,在樓上關(guān)下樓下的燈什么的,這種需求可能還稍微強(qiáng)一點(diǎn),在中國沒有這么強(qiáng),當(dāng)然從某種角度講還是存在的。

所以我覺得最后的爭論不是技術(shù)問題,不是說語音識別準(zhǔn)不準(zhǔn)(當(dāng)然它也有問題),是說它能聽懂的話,我想干的事情里他能做多少,這是我覺得最關(guān)鍵的。

雷鋒網(wǎng):這幾年智能語音交互借著新的AI技術(shù)實(shí)現(xiàn)了快速的發(fā)展,不過前段時間也看到一些觀點(diǎn),說深度學(xué)習(xí)正遇到瓶頸。所以想問,您認(rèn)為語音識別、NLP這塊,在接下來幾年技術(shù)上會有怎樣的發(fā)展,是否會遇到瓶頸?

初敏:深度學(xué)習(xí)到今天雖然已經(jīng)很火了,好像已經(jīng)到處都是了,一般相關(guān)的學(xué)術(shù)會議可能至少一半或者更高的論文都和它相關(guān)。但是我今天的觀點(diǎn)是還沒有到飽和期,技術(shù)的替代是一個過程。就像語音識別從深度學(xué)習(xí)獲得的第一步成功,是在原有的HMM框架后加了一塊,把原來的模型提升了。

所以這個(技術(shù)替代)過程中還是有很多嘗試可以做的。語音現(xiàn)在的這套統(tǒng)計的深度學(xué)習(xí)框架,不是一個完全的理論推導(dǎo)的技術(shù),是有個基本的理論框架,最后它是否work,是靠實(shí)驗來做的。

包括它們的拓?fù)浣Y(jié)構(gòu),建模單元的大小,因為起步都是依賴原來那套體系,所以后續(xù)能做的事情還有很多,比如變一變建模單元。會慢慢的把原來的那些東西換掉,然后去嘗試新的東西,像現(xiàn)在很多新的模型其實(shí)就是在改變單元,因為單元一大解碼速度就快很多。

另外一方面是場景適應(yīng),傳統(tǒng)我們叫它adaptation,或者你也可以叫它Transfer Learning,這塊也可以嘗試不同的方法。

還有,語音里頭現(xiàn)在更多是聲學(xué)模型上用了深度學(xué)習(xí),語言模型上有嘗試,但沒有特別的成功,因為語言模型計算復(fù)雜度高。但是今天雞肋并不證明這個方法不對,而是還沒有做出最好的方法,這一部分也有很多人在嘗試。所以我覺得至少還有個五年、十年的空間它才會飽和。

但是,也不排除在這個過程中會長出新的分支,比這個看起來還更優(yōu)秀,那也是有可能的,特別是在自然語言上,我覺得空間更大。

我覺得自然語言處理還處于非常早期的階段。語音的識別很難,但是他是一個定義非常清晰的問題,進(jìn)去這段錄音出來就是這個字,沒有二義性,所以是最適合學(xué)習(xí)。自然語言是問題沒定義清楚,你可以這樣定義問題,把它定一個分類問題,也可以把它變成一個序列轉(zhuǎn)換問題,而且一個任務(wù)是由好多小問題組成,還是作為一個整體。所以在自然語言里還需要想怎么更好地使用深度學(xué)習(xí),包括可能需要引入強(qiáng)化學(xué)習(xí)的概念,那么要怎么引入?

比如強(qiáng)化學(xué)習(xí)里一直擔(dān)心什么是reward,怎么定義成功失敗,有很多這些問題。這塊明顯的還能走更長,包括問題怎么定義法,以前分的小問題是不是可以用一個問題就能解等,這些地方我覺得有很多可嘗試的空間。


4月16日 20:30-21:30 ,雷鋒網(wǎng)旗下學(xué)術(shù)頻道 AI 科技評論聯(lián)合AI慕課學(xué)院、騰訊課堂邀請思必馳CMO龍夢竹為大家?guī)硪粓鲋辈シ窒?!點(diǎn)擊鏈接報名參與吧??!

課程主題:《人工智能需要科學(xué)家,也需要普通人》

報名鏈接:https://ke.qq.com/huodong/aiqzzty_pc/index.html#tuin=8f7939df


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

首發(fā) | 阿里iDST總監(jiān)初敏加盟思必馳,將建立北京研發(fā)團(tuán)隊(附專訪)

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說