0
2019年,人工智能遇冷。一年半以前,騰訊云副總裁王龍在與騰訊系創(chuàng)業(yè)公司內(nèi)部分享時提出,AI期望值已經(jīng)到了一個比較高的階段,潛在風險浮現(xiàn)。2019年這樣的趨勢變得更加明顯,最典型的事實是從2017年的頂點到2019年,AI投資融資事件頻次降落了70%。
本質上各大人工智能平臺都是廠商自身能力外化的結果,和廠商原有業(yè)務屬性高度相似。騰訊云上的AI能力首先來自于騰訊內(nèi)部,如社交、游戲場景等,在各個場景里經(jīng)過反復的積累和打磨,放到騰訊云上用戶直接可以用,這也是目前大多數(shù)人工智能平臺廠商還在做的事情:第一,與行業(yè)客戶、開發(fā)者不斷交流、調(diào)研和訪談,了解大家需要什么樣的能力;第二,不斷和內(nèi)部團隊交流,看看不同團隊有什么樣的能力可以放到騰訊云上,服務客戶和合作伙伴、開發(fā)者。
騰訊云副總裁王龍
人工智能不是互聯(lián)網(wǎng)式的野蠻圈地,隨著行業(yè)向縱深化發(fā)展,做人工智能就是做產(chǎn)品。王龍對此有清晰的認知,也因此他并沒有講宏觀而空洞的構想,小處著眼,產(chǎn)品才是他最關心的方向。
“我不是做市場而是做產(chǎn)品的,我們一直秉持滿足行業(yè)趨勢、滿足客戶需求,來決定現(xiàn)在應該做什么,將來應該做什么?!?/p>
AI技術本身依賴于幾個要素:好的數(shù)據(jù)、好的算法、高性價比的計算框架,王龍?zhí)岬?,能找到好的?shù)據(jù)的地方,能夠使用好的低成本框架計算進行訓練,以及能夠找到好的算法模型,這三點的發(fā)展現(xiàn)在都到了瓶頸了?!按蟛糠智闆r下,大家都知道這里數(shù)據(jù)很好,但哪里有更好的數(shù)據(jù),不知道。大家都知道這個算法模型很不錯,但如何找到更好的算法、模型呢,不知道。同樣的,大家算力、框架上比拼也變得越來越透明化?!?/p>
人工智能發(fā)展至今,或許是一場白刃戰(zhàn)。
也因此,騰訊云的AI策略遵循兩個大的基本方向,一方面,在技術成熟的領域持續(xù)不斷地提升自己的性價比,在一些細分的方向上力求不斷做得更好,例如AntiFakes(AI換臉甄別技術)。
王龍?zhí)岬剑还苁侨四樧R別,還是數(shù)據(jù)分析,其實技術都趨于成熟,但同時競爭也趨于同質化。幾個小時的培訓課程再加上幾個小時的訓練,用戶就可以滿足自己人臉識別的需求,競爭激烈進入到比拼性價比的時代。
另一方面,在產(chǎn)業(yè)互聯(lián)網(wǎng)持續(xù)加大投入,去幫助場景更加復雜同時價值可能也更高的這一部分市場客戶,提供AI及大數(shù)據(jù)價值。反映到產(chǎn)品層,也是遵循了這個思路。
產(chǎn)業(yè)互聯(lián)網(wǎng)就是人工智能更廣闊的空間,更豐富的想象力,金融、制造、工業(yè)、交通、零售等等這些領域,在更好的數(shù)據(jù)獲取,更好的算法模型以及更好的資源調(diào)度上,都有非常多的不確定性,包括騰訊云在內(nèi)的廠商都在摸索期,一個數(shù)據(jù)獲取在零售領域的方法論,到底在交通領域能不能泛化?一個算法模型在另外一個領域能不能使用?挑戰(zhàn)與試錯是主旋律。
在視覺AI領域,騰訊云集合了騰訊優(yōu)圖、騰訊安平AI安全實驗室、騰訊AI Lab、微信開放平臺等團隊的能力,此次共發(fā)布AntiFakes假臉甄別、微碼、信息流智能圖像以及智能相冊四大新品。
其中,AntiFakes是對當下熱門deepfake的回應,基于圖像算法和視覺AI技術,AntiFakes假臉甄別技術實現(xiàn)了對圖片或視頻中的人臉真?zhèn)芜M行高效快速的檢測和分析,鑒別圖片中的人臉是否為AI換臉算法、APP 所生成的假臉,最終對圖像或視頻的風險等級進行評估。
“騰訊云在這個事情上面既做了矛,又做了盾,一方面通過矛來去讓大家在視頻的新玩法上面能夠有更新的玩法去用,但是另外一方面,我們要防止這些玩法被壞人利用,去做一些壞事?!彬v訊云人工智能產(chǎn)品總經(jīng)理劉黎春表示。
微碼是和微信同款的掃碼能力放到了騰訊云上,與開源掃碼功能比較,騰訊云的微碼經(jīng)過微信十幾億用戶的場景錘煉,比如一個圖里有多個碼,或者圖非常大但碼非常小,還有可能出現(xiàn)二維碼模糊,一般算法很難識別等問題,細致到十幾億用戶每天的各種場景,微碼可以做到“一碼掃天下”。
信息流智能圖像應用于信息流的推薦,平臺需要判斷哪個信息有更好的點擊率,會更受用戶的歡迎,信息流智能圖像源于騰訊內(nèi)部信息流能力整合,幫助平臺能夠更好地從海量圖片庫里挑選出一些更受用戶歡迎的,有更高的點擊率的圖片,節(jié)省大量的人工篩選圖片的成本。
智能相冊主要是圖片智能打標簽、智能分類,騰訊的微云、QQ空間、QQ手機管家,都涉及到圖片存儲、自動打標簽,自動分類功能。
騰訊云還發(fā)布了語言模型自學習工具和NLP自定義訓練平臺。
通用語音識別能力已擁有很高的識別率,但特定企業(yè)場景下存在大量生僻名詞,目前行業(yè)內(nèi)通用識別的效果較差。通過添加企業(yè)典型業(yè)務對話場景下的字詞句,自助提升特定場景下特定名詞識別的準確率,從而讓語音機器人、電話錄音質檢等行業(yè)的語音識別效果得到大幅提升。
在NLP領域,為了達到更好的效果,預訓練語言模型的使用已經(jīng)成為一個很普遍的做法,但效果提升的同時也帶來了模型訓練成本的不斷攀升,以目前行業(yè)較大規(guī)模的模型訓練為例,用200G語料訓練一個3億參數(shù)的bert模型,需要1400多張V100的GPU,訓練500多分鐘才能得到一個可用的模型。騰訊云新發(fā)布的AutoNLP依托騰訊云語料積累和公有云算力,一次訓練多次使用,提供數(shù)十個騰訊自研的預訓練模型,極大地降低訓練成本,提升模型創(chuàng)新及應用效率,縮短定制化項目交付的周期。
同時,針對圖計算在行業(yè)領域的應用難題,騰訊云推出的圖計算引擎騰訊星圖封裝了微信Plato圖計算框架,可大幅提升圖計算性能,在內(nèi)存消耗降低7-10倍的情況下,性能提升了近50倍。
騰訊云也在持續(xù)構建平臺來簡化各種工具使用和集成的難度。例如大數(shù)據(jù)平臺TBDS,靈活搭載全場景大數(shù)據(jù)存儲、分析和管理工具,一站式的協(xié)助企業(yè)構建符合其自身需要的數(shù)據(jù)中臺。該平臺源自于騰訊內(nèi)部多年的技術積累,支持了20萬算力彈性資源池,每日分析任務數(shù)達1500萬,每日接入35萬億條數(shù)據(jù),每日實時計算次數(shù)達30萬億次。
另外,人工智能平臺云智天樞TI Matrix持續(xù)降低構建與應用AI能力的門檻,無縫聯(lián)動騰訊內(nèi)部各大實驗室、以及微信與企業(yè)微信的集成能力,為開發(fā)者提供全鏈路的人工智能應用開發(fā)、部署和管理能力。今年以來,平臺新增接入算法模型1000+,聯(lián)動AI領域合作伙伴超過100家,支撐50多個AI應用場景落地。
不只是企業(yè),當下比較傳統(tǒng)的公安、政府等行業(yè)也開始越來越多運用大數(shù)據(jù),大數(shù)據(jù)驅動企業(yè)發(fā)展,成為一個越來越流行的趨勢。
騰訊云研發(fā)總監(jiān)雷小平以公安大數(shù)據(jù)平臺的構建舉例,平臺成本主要分為兩部分,第一是整個平臺的構建,包括運維成本;第二,有了平臺之后,數(shù)據(jù)如何應用給企業(yè)帶來比較大的價值,騰訊云想從這兩個問題出發(fā),來解決客戶遇到的問題。
騰訊在大數(shù)據(jù)的積累以十年計數(shù),大概分為四層:
最下面是云的基礎設施,體現(xiàn)云的極致彈性,企業(yè)、用戶需要多少資源可以馬上從云上獲?。?br/>
依托于基礎云的平臺,上面會有一層大數(shù)據(jù)的基礎設施,騰訊云把大數(shù)據(jù)的場景抽象成五、六個典型場景,企業(yè)可以比較快的從云上面構建一個場景,比如現(xiàn)成的數(shù)據(jù)倉庫和搜索等。
平臺之上是推薦產(chǎn)品,這塊涉及到比較新的技術門檻,騰訊云會封裝一些領域型的產(chǎn)品,把之前積累的能力封裝到里面。雷小平主要介紹了企業(yè)畫像、公共趨勢分析、智能選址、智能推薦四個應用。
在這之上,每個行業(yè)對能力應用要求還不一樣,數(shù)據(jù)需求也不一樣,所以騰訊云根據(jù)每個行業(yè)的訴求點做成了一層專門的行業(yè)解決方案。從上到下的四層關系,形成解決企業(yè)大數(shù)據(jù)的領域的架構圖。
新品發(fā)布環(huán)節(jié),騰訊云發(fā)布了三款產(chǎn)品。彈性MapReduce,騰訊云表示它基本上能解決所有大數(shù)據(jù)在應用當中的問題,可以很方便地在云上購買服務;ES產(chǎn)品,解決客戶在大量日志的檢索以及搜索的場景,通過內(nèi)核深度優(yōu)化,ES集群支撐千級節(jié)點,內(nèi)存占用減少80%,寫入性能也提升很多;云端數(shù)據(jù)倉庫,針對中小型企業(yè)不希望耗費人力去培養(yǎng)非常大的數(shù)據(jù)團隊,而又希望做一些數(shù)據(jù)分析的需求。
此外,騰訊云還發(fā)布了企業(yè)畫像平臺,企業(yè)畫像平臺是騰訊云推出的面向智慧城市、金融監(jiān)管、企業(yè)評估等場景的企業(yè)大數(shù)據(jù)綜合服務平臺,通過構建百億級的知識圖譜,洞察企業(yè)風險和價值。雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。