0
本文作者: 木子 | 2017-07-21 17:26 |
近日,被業(yè)界譽(yù)為人臉識(shí)別年度「世界杯」的微軟百萬(wàn)名人識(shí)別競(jìng)賽落下帷幕,一家來(lái)自中國(guó)的人工智能公司——獵戶星空在此次比賽中奪得頭魁,引來(lái)不少業(yè)內(nèi)玩家側(cè)目。
在如此高級(jí)別的國(guó)際會(huì)議上摘得頭籌,充分體現(xiàn)了獵戶星空?qǐng)F(tuán)隊(duì)在人臉識(shí)別領(lǐng)域的技術(shù)實(shí)力。據(jù)悉,獵戶星空已經(jīng)聯(lián)合喜馬拉雅推出小雅 AI 智能音箱,為其提供全鏈路自研的遠(yuǎn)場(chǎng)語(yǔ)音交互系統(tǒng),此次在人臉識(shí)別比賽中的奪冠,將成為獵戶星空在語(yǔ)音系統(tǒng)之外的又一核心突破。一年內(nèi)占領(lǐng)兩大人工智能高地,獵戶星空的未來(lái)值得期待。
據(jù)了解,本次競(jìng)賽由微軟研究院主辦,借助計(jì)算機(jī)視覺(jué)領(lǐng)域頂級(jí)會(huì)議 ICCV 2017 的平臺(tái),既包括大規(guī)模人臉識(shí)別競(jìng)賽(Hard Set 及 Random Set),也推出全新的、更具挑戰(zhàn)性的小樣本學(xué)習(xí)(Low-Shot Learning)競(jìng)賽,堪稱「級(jí)別最高」「難度最大」的技術(shù)賽事。全世界人臉識(shí)別的頂尖團(tuán)隊(duì)都躍躍一試,希望能夠在這次比賽中顯露頭角,一展身手。
在眾多大神級(jí)別的玩家中,獵戶星空憑借強(qiáng)大的技術(shù)實(shí)力和積累,獲得百萬(wàn)名人識(shí)別子命題(Challenge 1)有限制類(只使用競(jìng)賽提供數(shù)據(jù))第一名。
此外,Panasonic-NUS(新加坡國(guó)立大學(xué))獲得無(wú)限制類(可以自由使用外部數(shù)據(jù))第一名;在小樣本學(xué)習(xí)(Low-Shot Learning)子命題(Challenge 2)中,美國(guó)東北大學(xué)獲得有限制類第一名;NUS-Panasonic (新加坡國(guó)立大學(xué))獲得無(wú)限制類第一名。
此次比賽中,和可以無(wú)限制地使用外部數(shù)據(jù)不同,有限制類別只能在限定的數(shù)據(jù)集內(nèi)調(diào)用,比拼的是團(tuán)隊(duì)的算法能力。
獵戶星空?qǐng)F(tuán)隊(duì)選擇直接向更公平,完全純技術(shù)比拼的有限制類別發(fā)起了攻堅(jiān)戰(zhàn)。
他們面臨的困難重重:競(jìng)賽數(shù)據(jù)噪聲很大,無(wú)法直接用于訓(xùn)練;而整個(gè)訓(xùn)練數(shù)據(jù)集非常大,適合人臉模型大規(guī)模訓(xùn)練的模型對(duì)資源的要求又很高,很難做到又快又好。
好在團(tuán)隊(duì)一直以來(lái)都在算法上不斷地追求極致。經(jīng)過(guò)研究,他們?cè)O(shè)計(jì)了一種魯棒的去噪算法,可以針對(duì)各類不同程度的噪聲數(shù)據(jù)都進(jìn)行有效地去噪。同時(shí)選擇采用適合大規(guī)模訓(xùn)練的 triplet 模型,并創(chuàng)新地使用了一種巧妙的設(shè)計(jì),在有限資源下加速了 triplet 網(wǎng)絡(luò)的訓(xùn)練,也大大提升了性能。
這些創(chuàng)新性的做法,成為獵戶星空此次比賽的殺手锏,最終獵戶星空?qǐng)F(tuán)隊(duì)獲得 0.75/0.606(random set/hard set)的高分。要知道,random set成績(jī)已經(jīng)達(dá)到了不使用外部數(shù)據(jù)的極限,遠(yuǎn)超以往的記錄,實(shí)力碾壓了去年所有團(tuán)隊(duì)的成績(jī),用比賽舉辦方的話來(lái)說(shuō),0.75 已經(jīng)接近滿分,是一個(gè)非常難以達(dá)到的成績(jī)。而在 hard set 上 0.606 的成績(jī),也是遠(yuǎn)遠(yuǎn)超過(guò)去年的最好成績(jī)(0.534)。
此時(shí),距離獵戶星空成立還不過(guò)一年的時(shí)間。在此之前,獵戶星空還在另一項(xiàng)人臉識(shí)別國(guó)際賽事 LFW 的評(píng)測(cè)中取得了前三名的成績(jī),與只追求精度的團(tuán)隊(duì)不同的是,獵戶星空是用盡量小的網(wǎng)絡(luò)來(lái)追求盡量高的精度的事情,僅用Single Model就達(dá)到了99.65%的成績(jī),賽后該成績(jī)已被刷新至99.70%,該項(xiàng)成績(jī)讓眾人眼前一亮。
這家低調(diào)務(wù)實(shí)的技術(shù)公司背后有著哪些秘密,它是如何在短時(shí)間內(nèi)獲得如此矚目的成績(jī)?
仔細(xì)調(diào)查不難發(fā)現(xiàn),獵戶星空全名為北京獵戶星空科技有限公司,創(chuàng)立于 2016 年 9 月,竟然是獵豹移動(dòng)旗下人工智能子公司,從官方的介紹中可知:獵戶星空成立初就匯聚了全球人工智能的精英人才,初創(chuàng)團(tuán)隊(duì)擁有來(lái)自美國(guó)硅谷,日本,臺(tái)灣地區(qū),中國(guó)北京,深圳等全球一流科技公司技術(shù)大牛和產(chǎn)品極客,博士占比近 5 成。公司致力于以人工智能技術(shù)為基礎(chǔ),打造下一代革命性科技產(chǎn)品,讓人們真正從繁復(fù)的體力勞動(dòng)中解放出來(lái),享受更加有趣美好的家庭生活。
盡管有著深厚的技術(shù)積累,自主創(chuàng)新的知識(shí)產(chǎn)權(quán),公司仍然不斷追求技術(shù)和產(chǎn)品的結(jié)合,取得多個(gè)領(lǐng)域的突破進(jìn)展。今年 6 月份,他們就聯(lián)合喜馬拉雅發(fā)布了一款面向用戶的小雅 AI 音箱。
作為獵戶星空 AI 生態(tài)鏈上的第一款產(chǎn)品,小雅 AI 音箱背后的核心便是獵戶星空全鏈路自研的遠(yuǎn)場(chǎng)語(yǔ)音交互系統(tǒng),這套系統(tǒng)從有呼必應(yīng)、優(yōu)質(zhì)點(diǎn)播體驗(yàn)和海量?jī)?nèi)容等多方面打造完美的用戶體驗(yàn)。音箱一經(jīng)推出,就獲得業(yè)界和市場(chǎng)的好評(píng),為喧囂的智能音箱市場(chǎng)帶來(lái)一股清新之風(fēng)。
這次人臉識(shí)別的比賽技術(shù),也會(huì)被獵戶星空運(yùn)用到實(shí)際場(chǎng)景中,團(tuán)隊(duì)的技術(shù)突破將會(huì)落地在門(mén)禁、機(jī)器人、移動(dòng) APP 等具體的產(chǎn)品里。
據(jù)了解,獵戶星空的人臉識(shí)別技術(shù)已經(jīng)有效應(yīng)用到獵豹移動(dòng)旗下的一款直播產(chǎn)品 Live.me 中,在 Live.me 上,每天產(chǎn)生超過(guò) 20 萬(wàn)小時(shí)的直播內(nèi)容,Live.me 始終堅(jiān)持「綠色直播」原則,杜絕不健康內(nèi)容。要實(shí)現(xiàn)這一目標(biāo),僅依靠人工檢測(cè),工作量大且效果差,而運(yùn)用圖像識(shí)別技術(shù)進(jìn)行 24 小時(shí)的實(shí)時(shí)監(jiān)控,可以極大地提高工作效率和成果。
短短一年的時(shí)間內(nèi),獵戶星空一舉拿下了人工智能兩座高地——語(yǔ)音系統(tǒng)和圖像識(shí)別,取得如此豐碩的成果,在創(chuàng)業(yè)公司中實(shí)屬罕見(jiàn)。在團(tuán)隊(duì)的不斷攻堅(jiān)和突破之下,獵戶星空還將取得更加耀眼的成績(jī),它的未來(lái)值得期待。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。