丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給亞萌
發(fā)送

0

Facebook AML實驗室負責人:將AI技術落地的N種方法(上)

本文作者: 亞萌 2017-02-22 23:32
導語:AML實驗室負責人Joaquin Candela在@Scale大會上發(fā)表了一次演講,他講述了Facebook在規(guī)?;瘧肁I技術的方方面面

Facebook AML實驗室負責人:將AI技術落地的N種方法(上)

(Facebook AML實驗室負責人 Joaquin Candela)

雷鋒網(wǎng)按:在Facebook,有兩個實驗室領導著AI發(fā)展方向,一個是Yann LeCun領導的FAIR實驗室,偏向AI的基礎研究;另一個,就是AML實驗室,偏向機器學習應用,負責將AI技術落地在Facebook各種產(chǎn)品。本月初,AML實驗室負責人Joaquin Candela在@Scale大會上發(fā)表了一次演講,他講述了Facebook在規(guī)模化應用AI技術的方方面面,包括Facebook人工智能母體FB Learner Flow平臺、圖像處理引擎Lumos、文本理解、語音識別、視頻風格變換等各領域的應用。

   

下面是演講文字版,由雷鋒網(wǎng)亞萌和夏睿共同編輯整理。

我在Facebook已經(jīng)工作了五年,這是令人愉悅的經(jīng)歷。今天,我想要跟大家分享一下Facebook是如何設計AI來改善人們每天的生活。

每次你使用Facebook、Instagram和Messanger的時候,可能你沒有意識到,你的使用體驗已經(jīng)是由AI技術做支撐了。

而實際上,我想強調(diào)的一點是,Facebook如果沒有AI,那就會失去存在根基。

我們在AI上面加入了雙倍的投資,幫助用戶彼此之間聯(lián)系更加緊密,及時得知最關心的消息和內(nèi)容。我們AML團隊,與FAIR團隊及公司內(nèi)其它產(chǎn)品團隊緊密合作。

我們面臨的一個挑戰(zhàn)就是,我們的工作是在Facebook這么大的一個規(guī)模上進行的。這周三,F(xiàn)acebook發(fā)布了統(tǒng)計數(shù)據(jù):我們每天支持了12億用戶。也就是說,每一天就有12億人使用Facebook 。而其中的11億用戶,都是在手機上使用Facebook 的。所以手機的使用,占據(jù)主導地位。

如何規(guī)模化設計AI(design AI at scale)?

首先,我們需要回過頭去,思考“工程”這件事情,好好思考“工程”對于Facebook的價值所在。其中有2個關鍵的價值:關注影響力(foucus on impact)和快速行動(move fast)。前者是指,要時刻清楚了解我目前所能解決的最重要的問題是什么。關于第二點,快速行動,F(xiàn)acebook對于“犯錯”的容忍度極大,我們反復提醒自己,有時最危險的做法就是不去冒險,不去行動其實是非常冒險的一件事情。我們需要在Facebook這么大的體量上去快速行動。

Facebook AML實驗室負責人:將AI技術落地的N種方法(上)

這些價值觀,啟發(fā)了AML的戰(zhàn)略,這個戰(zhàn)略包括 3 大基本支柱:

Facebook AML實驗室負責人:將AI技術落地的N種方法(上)

推進最新技術,最大程度實現(xiàn)產(chǎn)品影響力。我們一直與FAIR實驗室及產(chǎn)品團隊合作,推進最新的技術。我們進入非常具體的問題領域,雖然我們可能起初并不知道如何去解決,但是我們知道,一旦我們攻克這個問題,其價值將異常巨大。

通過AI打造全新產(chǎn)品體驗。當你在現(xiàn)今最前沿領域工作時,你往往會遇到別人從未想過的產(chǎn)品體驗。待會后面,我會就此舉一個具體的例子來說明。

使AI大眾化。“規(guī)?;笔莻€大事情。對于Facebook來說,你需要不斷地在平臺、實驗室和服務項目上進行創(chuàng)新,讓整個公司都能用你的新技術。

設計FB Learner Flow平臺五要素

很久之前,我還是一名Phd學生,當時致力于貝葉斯非參數(shù)法(bayesian nonparametric method),我在其中感受了一種類似于“巫師”的力量,當被給予一個任務時,比如在不同的域里做分類和遞歸任務,這種解決具體問題的感覺非常好。

之后,我去了工業(yè)界。我為此感到興奮,因為工業(yè)界充滿了亟待解決的諸多問題。但很快,我變得有點“被淹沒”了,因為預測任務的類型、域的數(shù)量、訓練數(shù)據(jù)的數(shù)量,這些比你所能想象的要龐大的多。

我意識到,巫師不知道如何“規(guī)?;薄.斘以趯W術界的時候,關注點在于“準確度”,我能建造一個模型,以期比其它已經(jīng)發(fā)表的研究成果,多出那么0.1%的AUC值。但是在工業(yè)界我發(fā)現(xiàn),最重要的事情是“迭代速度”,是你每天可以運行多少次實驗。因為,你無法忽視一個事實,那就是你所做的事情是融合各方利益的,如果你每周都可以將一個新的模型投入生產(chǎn)中(當然在我剛加入Facebook的時候這是很困難的一件事情),最終的成果是建立在一次又一次的嘗試之上的。

如果你仔細想一想,你需要探索的參數(shù)、模型架構(gòu)、輸入值特征等如此龐大,實驗的加速會產(chǎn)生非常非常大的影響。

所以,你必須建造一個“工廠”(就是后面要講到的FB Learner Flow平臺),成為一個巫師很酷,但是建造一個強大的“工廠”,讓公司的每個人能夠并行探索這個廣闊的領域,將會讓你以很穩(wěn)定的節(jié)奏取得進步,不斷地輸出對產(chǎn)品的影響力。

當我們在設計一個“工廠”時,我們主要考慮五個方面的事情。

  • 性能(performance)。我們必須加快速度,之前需要花幾天時間進行的實驗,現(xiàn)在要在一個小時內(nèi)完成。這種速度的提升,對人們的心理狀態(tài)會產(chǎn)生很大影響,當你工作到晚上回到家的時候,在這一天里你實際上已經(jīng)完成了實驗的一部分。而在之前,可能你一天里只能弄出一個模型,回家后可能就有點忘了,再過幾天,這個模型可能會崩潰掉。

  • 自動化(automation)。這非常重要,拖慢速度的永遠都是人自己。比如,我曾經(jīng)有一些系統(tǒng),要進行轉(zhuǎn)移到新的服務器等操作,但是運行不好,最后崩潰了,這浪費了我?guī)滋斓臅r間。所以你必須將事情自動化。

  • 重復使用(reusability)。這點非常重要,你必須得確保其中的工作內(nèi)容,是可以一遍又一遍地使用。

  • 成套系統(tǒng)(turnkey)。讓整個系統(tǒng)變得容易使用,大部分工程師都是局限于一個小的領域,沒有那么全面的知識和技術。

  • 應用研究社群(applied research community)。對于建造研究社群這一點,我充滿熱情,我將會對此多談一點,關于在整個公司內(nèi)部打造“應用研究社群”的力量。

而我們建造的這個“工廠”確實是有效果的,而且效果很不錯。

Facebook AML實驗室負責人:將AI技術落地的N種方法(上)

我們這個平臺的建造工作,目前只進行了1%,也就是說,一切還是開始。整個Facebook公司使用這個平臺的人數(shù)中,超過25%的人是該平臺的活躍用戶。而其中令人驚訝的是,如果你仔細觀察這些工程師的背景,大部分人并不是AI或ML方面的專家。

另一件事就是,我們構(gòu)建了一個非常強大的應用研究社群(applied research community)。我們?yōu)檫@個平臺的“重復使用”性能感到興奮,當一個工程師寫了一個AI 工作流(workflow),可以被其它工程師拿過來接著使用。這有一個關于Instagram的例子。去年6月,Instagram開始對它的feed進行排序,幾個工程師共同完成了這個功能,而這其中花費的時間之少令人驚訝。作為對比,F(xiàn)acebook的feed功能在前幾年進行的,這在當時就是一個大工程,因為它是從無到有建立起來的?,F(xiàn)在,Instagram的工程師,就可以進入一個公共的實驗平臺,找到其它產(chǎn)品類似功能實現(xiàn)時的工作流和模型。也就是說,工程師們可以借用前人的工作成果,“站在巨人的肩膀上”建立Instagram的feed功能,而且他們也能很快找到相關同事去請教。

其中有一個數(shù)據(jù),我很驕傲。在過去的6個月時間里,這個平臺的ML工作流的數(shù)量增長了6倍。

FB Learner Flow平臺

FB Learner Flow平臺是一個非常有彈性的環(huán)境,用于書寫和執(zhí)行AI工作流。生產(chǎn)力是最重要的事。其中有一件很酷的事情,那就是如果你要運行某個任務,F(xiàn)B Learner Flow將會把一整個流程都規(guī)劃好,比如硬件用什么、如何規(guī)?;鹊?。

FB Learner Flow平臺設計之初,就把“重復使用”的理念植入其中。如果你是一個Instagram工程師,想要訓練和部署你的排序模型,F(xiàn)B Learner Flow就像是一個放滿了工作流的圖書館庫(library),你可以在當中搜索、索引、發(fā)現(xiàn)各種工作流,然后對此重復利用。你還可以進入到算法里,你可以看到不同參數(shù)下的各種學習曲線,最重要的是,你可以看到某個特定工作流的作者是誰,這是最重要的,因為這時你就知道找誰去請教問題了。

FB Learner Flow非常綜合,這里有一個有趣的故事。有一次,我對團隊成員說:“伙計們,你們在這個平臺上運行PyTorch、Caffe和Caffe 2,我們試試Tensorflow怎么樣?”。三天后,他們跟我說,我們試了一下Tensorflow,可以運行。所以它是兼容各種語言的,這很重要。

接下來我會講解一些關于基于FB Learner Flow平臺的一些系統(tǒng),包括計算機視覺引擎、文本和語言理解系統(tǒng)、語音等方面的內(nèi)容。

更多雷鋒網(wǎng)文章:

對話百度IDL負責人林元慶:人臉識別獲評十大突破性科技背后百度的布局和野心

百度引入Ring Allreduce算法,大規(guī)模提升模型訓練速度

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

Facebook AML實驗室負責人:將AI技術落地的N種方法(上)

分享:
相關文章

編輯

關注人工智能(AI)報道
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說