0
本文作者: 趙晨希 | 2018-12-24 11:00 | 專題:2018 AI最佳掘金案例榜 |
科技界當(dāng)紅IP兼KOL凱文·凱利曾經(jīng)說過,未來二三十年,人工智能將會廣泛存在于人類生活中的方方面面,“人工智能+X”將會成為企業(yè)的創(chuàng)業(yè)趨勢。2017年被稱為AI人工智能的元年,兩年間各行各業(yè)涌現(xiàn)出大量的“人工智能+X”型創(chuàng)業(yè)企業(yè)。
AI人工智能以超越想象以外的速度,穿透生活,觸摸行業(yè)的脈搏,消融山與山之間的壁壘和邊界。信息、數(shù)據(jù)的存在形態(tài)由固態(tài)、限定變得流動、不定?!翱萍急旧硎且环N生命體”,拋開人工智能創(chuàng)造的思維、思考,能否真正優(yōu)于生命體的感知、認(rèn)知?!叭f里蹀躞,以此為歸”。推動AI內(nèi)容的落地生根,回歸技術(shù)本位,才是AI浪潮下的“必然”結(jié)果。
近日,雷鋒網(wǎng)揭曉的AI最佳掘金案例年度榜單中,搜狗同傳、圖普科技、網(wǎng)易云易盾、影譜科技、品友互動成為AI+內(nèi)容領(lǐng)域中的翹楚。企業(yè)發(fā)展的成長速度擁有兩條曲線,“第一曲線”處于發(fā)展初期,是均速、緩慢的,增長到一定階段會停止、下降。達(dá)到“第二曲線”后,企業(yè)發(fā)展呈指數(shù)級增長。
這五家AI+內(nèi)容公司,無一例外,沒有停滯于已有現(xiàn)狀。面對“變革”,不僅知曉趨勢,更找了到邁入“第二曲線”、實現(xiàn)“二次增長”的鑰匙。
2016年誕生,2016年首次亮相烏鎮(zhèn)互聯(lián)網(wǎng)大會。精準(zhǔn)、及時的實時翻譯給行業(yè)留下了極為深刻的印象。2016年至2018年,兩年多的時間,搜狗同傳已經(jīng)成為國內(nèi)、國際各種會議的“標(biāo)配”,支持過GMIC大會、TechCrunch國際創(chuàng)新峰會、2018 CNCC中國計算機(jī)大會、2018中國網(wǎng)球公開賽、2018世界物聯(lián)網(wǎng)博覽會、GATIC、數(shù)博會、世界電信和信息大會等等百余場會議。
搜狗同傳具備聽、譯、改三種功能,根據(jù)用戶發(fā)音、語音短劇、語音識別、文本斷句完成機(jī)器翻譯功能。傳統(tǒng)機(jī)器翻譯,將流程分為對齊模型、分層模型等,再將不同模型串聯(lián)起來,不同環(huán)節(jié)的模型上下游影響甚密,連帶關(guān)系較強(qiáng)。與傳統(tǒng)的機(jī)器翻譯不同,搜狗疊加了語音識別和機(jī)器翻譯的技術(shù)。將神經(jīng)網(wǎng)絡(luò)精簡為五層,低于谷歌的GNMT八層結(jié)構(gòu)。采用端到端神經(jīng)網(wǎng)絡(luò)翻譯技術(shù),通過循環(huán)神經(jīng)網(wǎng)絡(luò)生成最終結(jié)果。即將多個模型融合統(tǒng)一為一個模型,直接將影射文本輸出為文字。
搜狗同傳在語音識別方面,采用CLDNN+CTC結(jié)合的聲學(xué)模型和RNNLM語言模型,將通過語音斷句后的片段,經(jīng)過聲學(xué)模型、語言模型轉(zhuǎn)化成文本。文本斷句處理在語音識別和翻譯之間,以規(guī)則、模型兩種方法進(jìn)行語句劃分和標(biāo)點,平滑去掉無意義的詞語。
語音斷句方面,基于能量檢測和DNN模型的方法,疊加后處理平滑算法,對語音信號進(jìn)行語音、靜音判斷。從而,跳過靜音片段處理提高解碼效率,語音片段分割為多句并行識別,提高語音識別效率。保證識別輸出結(jié)果更加通順、流暢,符合正常的發(fā)言習(xí)慣。
機(jī)器翻譯方面,采用雙向 GRU 技術(shù)構(gòu)建編碼端的結(jié)構(gòu),attention 機(jī)制。添加命名實體標(biāo)注模型(NER)和神經(jīng)網(wǎng)絡(luò)實體翻譯器、多模型集成(ensemble)、重打分/重排序(rescore or rerank)、網(wǎng)絡(luò)層正則化(layer normalization)等機(jī)器學(xué)習(xí)模塊提高翻譯質(zhì)量。
搜狗同傳在算法和數(shù)據(jù)領(lǐng)域的雙重積累,可以流暢紀(jì)錄、較好時別詞語和句子的停頓,輸出翻譯內(nèi)容。
互聯(lián)網(wǎng)每分鐘、每小時之內(nèi)就會產(chǎn)生大量的用戶視頻、圖片數(shù)據(jù),這些數(shù)據(jù)的處理、審核已經(jīng)成為不同平臺管理者最為頭痛的事情之一。而圖普科技就是一家以“鑒黃”、“鑒暴”在業(yè)界小有名氣的AI公司。圖普科技成立于2014年,是一家專注于AI識別的云服務(wù)公司,是國內(nèi)最早為互聯(lián)網(wǎng)企業(yè)提供內(nèi)容審核的AI公司。其客戶來自于各行各業(yè),包括大家熟知的美拍、秒拍、酷狗音樂、唱吧、唯品會、bilibili、花椒直播、迅雷等等互聯(lián)網(wǎng)公司。
圖普科技采用螺旋式漸進(jìn)的商業(yè)模式,即客戶提出需求,圖普根據(jù)需求進(jìn)行開發(fā),平臺增加新的功能,客戶再提出新的需求。循環(huán)模式下,進(jìn)行業(yè)務(wù)能力的積累和改進(jìn)。今年5月,順應(yīng)市場監(jiān)管需求,圖普科技上線內(nèi)容審核產(chǎn)品2.0。增加對低俗內(nèi)容的審核、視頻理解等等,完善內(nèi)容審核服務(wù)。但圖普科技的AI技術(shù)又不局限于內(nèi)容安全的審核工作。從內(nèi)容推薦、視頻內(nèi)容識別的增值服務(wù)再到對零售門店視覺感知智能化改造,圖普科技的觸角在與時俱進(jìn)地不斷延伸。
圖普科技每日處理圖像識別量超過10億次,云端擁有幾百個圖像識別接口。巨大的處理需求,需要AI公司具備數(shù)十億級海量AI服務(wù)框架、海量數(shù)據(jù)管理構(gòu)架、商業(yè)級AI服務(wù)架構(gòu)三個層次的互聯(lián)網(wǎng)架構(gòu)。圖普科技的圖像識別云服務(wù)提供包括人臉識別、物體識別、人行為分析、文字OCR、圖像搜索等在內(nèi)的幾百個圖像識別定制與開放接口。
目前,圖普科技的色情召回率較行業(yè)排名第二的公司高10%,在百萬規(guī)模識別的面目識別算法測試中,圖普科技獲得全球第二名。在行人再識別測試中,圖普科技數(shù)據(jù)在已公開論文中排名第一。內(nèi)容審核產(chǎn)品1.0,囊括了危險行為,如酗酒、飆車等;成癮性行為,如吸煙、性暗示等;亞文化,如荒誕、未成年人直播等;以及網(wǎng)絡(luò)暴力言論四類低俗化問題。內(nèi)容審核產(chǎn)品2.0在此基礎(chǔ)上有了更為細(xì)致的劃分、升級。
在新零售行業(yè),圖普科技利用AI技術(shù)深入到零售的每個環(huán)節(jié),如店外客流、進(jìn)店客流、購買客流、復(fù)買客流;坪效、貨效、場效、錢效等環(huán)節(jié)數(shù)據(jù)分析,助力企業(yè)吸引客流、分析客流、提升客流購買轉(zhuǎn)化率等。85%的商業(yè)行為發(fā)生在線下,零售行業(yè)是安防領(lǐng)域以外使用攝像頭最多的應(yīng)用場景。圖普科技利用云+端服務(wù)的模式,螺旋漸進(jìn)廣度擴(kuò)展建立商業(yè)閉環(huán)。在除圖片、視頻識別外,對新零售等新領(lǐng)域進(jìn)行技術(shù)服務(wù)的探索。
網(wǎng)易云易盾為網(wǎng)易云旗下一站式云安全服務(wù),2016年正式上線。產(chǎn)品包括四大類:內(nèi)容安全、業(yè)務(wù)安全、移動安全、網(wǎng)絡(luò)安全。內(nèi)容安全具體細(xì)分為,文本檢測、圖片檢測、視頻檢測、音頻檢測。業(yè)務(wù)安全有行為式驗證碼、短信驗證碼、注冊保護(hù)、登陸保護(hù)、營銷反作弊、實人信息認(rèn)證。移動安全包括手游智能反外掛、Android應(yīng)用加固、IOS應(yīng)用加固、SDK加固、安全組件。網(wǎng)絡(luò)安全產(chǎn)品包括,DDoS高防、滲透測試、Web應(yīng)用防火墻??傆嫈?shù)十條產(chǎn)品線。
解決方案囊括社交、短視頻、直播、游戲、媒體等等。在內(nèi)容安全領(lǐng)域擁有21年專業(yè)防護(hù)經(jīng)驗和大數(shù)據(jù)積累,隨著圖片、視頻在內(nèi)的內(nèi)容形態(tài)爆發(fā)增長,網(wǎng)易云易盾每日過濾有害信息超10億條。依靠海量的特征庫和成熟的安全機(jī)制,結(jié)合云計算和人工智能技術(shù),具備多場景解決方案。服務(wù)客戶包括攜程、和訊、魅族、OPPO、秒拍、一直播、滴滴、恒大、adidas、NIKE等企業(yè)。
信息理解方面使用深度網(wǎng)絡(luò)方式提取圖片語義信息,以NLP技術(shù)來對OCR抓取的文字信息進(jìn)行情感、意義的理解,綜合對圖像、文字的理解進(jìn)行有效的信息判定。聲紋識別技術(shù)方面嘗試端到端聲紋技術(shù)輔助身份驗證。技術(shù)層面擁有機(jī)器算法模型、海量樣本庫,具備秒級違規(guī)鏡頭處理能力。支持視頻過檢,以及視頻中涉嫌違規(guī)音頻的過濾。配合智能電視墻,可節(jié)省人力成本90%以上。
網(wǎng)易云易盾第三代人工智能內(nèi)容安全服務(wù)提供鑒黃、鑒暴恐、涉政、ASMR、廣告等八個大類數(shù)十種小類有害內(nèi)容智能識別過濾服務(wù),智能識別精準(zhǔn)率超過99.8%。2018年,網(wǎng)易云易盾助力國內(nèi)互聯(lián)網(wǎng)企業(yè)出海,陸續(xù)推出海外版本產(chǎn)品。支持多語言、多民族內(nèi)容安全服務(wù),對英語、馬來西亞語、泰語、印尼語等海外語種提供策略支持。并在該國家設(shè)立政策研究員、AI算法工程師、策略優(yōu)化、運營服務(wù)等在內(nèi)的專項服務(wù)小組。提升語種識別、處理效率、安全標(biāo)準(zhǔn)提升、審核內(nèi)容團(tuán)隊運營的能力。
據(jù)雷鋒網(wǎng)了解,網(wǎng)易云易盾內(nèi)容安全技術(shù)實力強(qiáng)悍。不久前,易盾實驗室AI算法研究員方正的論文《MULTI-VIEW AUTOENCODER FOR IMAGE FEATURE LEARNING WITH STRUCTURED NONNEGATIVE LOW RANK》提出了一種對多視角多模態(tài)特征信息進(jìn)行有效融合的自編碼器神經(jīng)網(wǎng)絡(luò),在準(zhǔn)確率、NMI、Purity、ARI等各項性能指標(biāo)上創(chuàng)新高,較當(dāng)下多項國際先進(jìn)的多視角多模態(tài)信息融合技術(shù)有顯著性領(lǐng)先。有效地提高了有害內(nèi)容的識別率,網(wǎng)易云易盾內(nèi)容安全的準(zhǔn)確率和召回率更上一個臺階。
2017年底,工信部公示網(wǎng)絡(luò)安全示范項目中,網(wǎng)易云易盾“自適應(yīng)DDoS攻擊深度檢測和防御系統(tǒng)”入選為示范項目。2018年,成功入選2018安全全景圖。2018年11月,網(wǎng)易云易盾成為中國短視頻及直播聯(lián)盟常務(wù)理事。共享違禁MD5視頻公庫,實時攔截違規(guī)視頻,支持企業(yè)自定義添加私庫。特別針對短視頻行業(yè),提供鑒黃、登錄保護(hù)、視頻評論檢測、視頻彈幕檢測、活動防刷等一站式安全解決方案。
影譜科技成立于2009年,致力于智能影像生產(chǎn)技術(shù)落地應(yīng)用的視覺技術(shù)企業(yè)。聚焦于AI+大文娛產(chǎn)業(yè),專注計算機(jī)視覺、視頻結(jié)構(gòu)化、深度學(xué)習(xí)、大數(shù)據(jù)、視頻廣告投放、網(wǎng)絡(luò)視頻互動技術(shù)等領(lǐng)域,面向互聯(lián)網(wǎng)、影視、視頻等大文娛產(chǎn)業(yè)細(xì)分領(lǐng)域提供AI影像場景商業(yè)化服務(wù)。產(chǎn)品包括植入易、Video易,提供廣告投放平臺、媒資管理平臺、數(shù)據(jù)管理平臺三個方面服務(wù)。
合作伙伴包括騰訊視頻、暴風(fēng)影音、搜狐視頻、迅雷、芒果TV、華數(shù)TV等。具備像素及子像素計算、三維重建、3D視覺、視頻細(xì)粒度分析、結(jié)構(gòu)化等準(zhǔn)入技術(shù),利用大數(shù)據(jù)和AI+video技術(shù)提供代替人工拍攝及制作工作的完整數(shù)字化媒體解決方案。是互聯(lián)網(wǎng)視頻垂直領(lǐng)域訪問流量最大、活躍用戶數(shù)最多、覆蓋資源最廣的平臺。2017年影譜科技完成4.46億秒工程處理積累,累計為15萬部內(nèi)容提供技術(shù)服務(wù),行業(yè)用戶滲透率超70%。
國內(nèi)熱播的《聲臨其境》、《我是歌手》、《爸爸去哪兒》、《快樂大本營》、《天天向上》等綜藝熱播欄目,2017年的《楚喬傳》《擇天記》《三生三世十里桃花》等影視作品,都大量采用了影譜科技的人工智能視覺技術(shù)。
2018年8月,影譜科技完成D輪13.6億元融資,投資方來自商湯科技Sensetime、PAC、軟銀中國等。緊接著,9月,影譜科技再獲曜為資本追加的2億元D輪融資。此輪融資后,影譜科技不但獲得商湯增強(qiáng)現(xiàn)實、視頻分析、底層AI算法的支持,還將繼續(xù)深耕影像技術(shù)的優(yōu)化、AI+大文娛行業(yè)的應(yīng)用拓展、完善人才梯隊建設(shè)等。
品友互動創(chuàng)立于2008年,采用全球數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)算法,在廣告營銷領(lǐng)域引入大數(shù)據(jù)研究方法。實時競價架構(gòu)和算法、人群分析專利技術(shù)結(jié)合運營商在內(nèi)的第三方數(shù)據(jù)商建立資本、戰(zhàn)略合作關(guān)系擁有數(shù)據(jù)資產(chǎn),進(jìn)行一站式智能營銷決策管理和優(yōu)化。
2011年,品友互動發(fā)布實時競價廣告決策系統(tǒng)。2012年,發(fā)布了數(shù)字廣告人群類目體系(DAAT),用標(biāo)簽方式實現(xiàn)人群畫像分析。2016年,推出全透明的智能數(shù)字營銷決策平臺(Trading Platform) —擎天柱(Optimus Prime),以系統(tǒng)性的方式保障透明和安全的廣告投放。
2017年,品友推出人工智能決策平臺——Marketing Intelligence Platform(MIP)。每天處理數(shù)據(jù)高達(dá) PB 級別, 每秒智能決策 40 萬次。占有國內(nèi)品牌程序化廣告市場59.8%的市場份額,為超過1800家企業(yè)提供數(shù)字廣告技術(shù)服務(wù)。與國航、通用、聯(lián)想、華為、蘇寧易購、亞馬遜、中國電信、聯(lián)合利華等300家世界500強(qiáng)企業(yè)展開合作,為數(shù)十家客戶搭建DMP平臺。
2017年上線的MIP(Marketing Intelligence Platform)平臺,有效整合了DMP數(shù)據(jù)管理平臺、CMP內(nèi)容管理平臺和PDB智能投放管理系統(tǒng)三大模塊。智能策略引擎DMP整合媒體價值洞察、人群深刻洞察、科學(xué)歸因模型,智能內(nèi)容引擎CMP包括創(chuàng)意內(nèi)容云端管理、產(chǎn)品改建創(chuàng)意測試、自動創(chuàng)意物料調(diào)優(yōu)。導(dǎo)出智能化營銷策略,對接到智能投放管理系統(tǒng)(程序化廣告投放、常規(guī)廣告投放管理、社交廣告管理、電商投放管理)。最后,智能投放管理系統(tǒng)再反哺于DMP、CMP。其中,擎天柱系統(tǒng)Optimus Prime具備自動化、實時化、智能化、透明化四個特點。
2018年9月,世界人工智能大會上,品友互動聲稱將40%-50%的費用用于研發(fā)投入。成立了AI Lab企業(yè)級AI 實驗室,與海內(nèi)外多家頂級院校進(jìn)行合作。與此同時,宣布設(shè)立10億人民幣AI 投資基金,聚焦于中早期、有技術(shù)優(yōu)勢、有潛力的企業(yè)級產(chǎn)品和項目,進(jìn)一步專注AI+實際場景的結(jié)合應(yīng)用。
2018年是人工智能企業(yè)加速分化的一年,一方面,人工智能技術(shù)在持續(xù)、不斷地迭代。另一方面,人工智能技術(shù)技術(shù)在與實際落地場景的結(jié)合上,仍然存在很多痛點。從整體行業(yè)環(huán)境來看,2018年下半年,BAT均進(jìn)行了組織架構(gòu)調(diào)整。無論是騰訊的云與智慧產(chǎn)業(yè)事業(yè)群CSIG、阿里巴巴云事業(yè)群升級為阿里云智能事業(yè)群,還是百度將ABC智能云事業(yè)部升級為智能云事業(yè)群組ACG。智能、云計算、To B都成了三家企業(yè)架構(gòu)調(diào)整的關(guān)鍵詞匯。
2018年末,資本漸漸開始理智,動作變得緩慢、有節(jié)制,行業(yè)“凜冬”到來的論調(diào)被廣泛傳播。然而,搜狗同傳、圖普科技、網(wǎng)易云易盾、影譜科技、品友互動這五家雷鋒網(wǎng)評選出的AI內(nèi)容領(lǐng)域獨角獸絲毫未受到任何不良環(huán)境的影響,企業(yè)業(yè)務(wù)仍在高速增長,融資金額在持續(xù)加大。仔細(xì)觀察這幾家獨角獸的特質(zhì)將會發(fā)現(xiàn),激戰(zhàn)市場的籌碼,從來不是隨便虛晃一槍,而是過硬的技術(shù)儲備、技術(shù)積累,在AI深耕的決心與魄力。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。