特寫(xiě) | 人工智能背后的臨時(shí)工：谷歌如何訓(xùn)練AI識(shí)別網(wǎng)絡(luò)視頻質(zhì)量？

本文作者：晴天

2017-04-25 16:04

導(dǎo)語(yǔ)：Google 廣告質(zhì)量評(píng)估員,為 Youtube 視頻內(nèi)容評(píng)估耗費(fèi)心血的一類人。

雷鋒網(wǎng)按：我們都關(guān)注人工智能有多厲害，它們可以在圍棋、德州撲克和人臉識(shí)別上戰(zhàn)勝人類，但人工智能變得聰明，背后是海量數(shù)據(jù)的支撐，而且這些數(shù)據(jù)是需要標(biāo)注的。因而隨著人工智能的繁榮，從事數(shù)據(jù)標(biāo)注的人也越來(lái)越多。Wired的這篇文章就介紹了谷歌如何雇傭人工標(biāo)注YouTube視頻來(lái)訓(xùn)練AI。本文由雷鋒網(wǎng)編譯。

目前，Google 的“廣告質(zhì)量評(píng)估員”已廣泛存在于全國(guó)各地。這些臨時(shí)雇員通常由外部機(jī)構(gòu)代為聘請(qǐng)，其工作即是為 YouTube 視頻過(guò)濾暴力、敏感廣告信息。這一工作目前單憑電腦本身尚無(wú)法完成，Google現(xiàn)在也似乎迫切需要這些人的幫助。

YouTube 每天都會(huì)出售數(shù)百萬(wàn)條視頻廣告，廣告播出位置會(huì)由系統(tǒng)自動(dòng)分配，所以廣告商往往不知道自己的廣告具體會(huì)在哪條視頻后播放。最近，這種“不確定性”令 Google 大為頭疼，公司甚至因此受到相關(guān)方的審查。

Google 方面則一直積極解釋，以防止輿論擴(kuò)大化。在他們看來(lái)，媒體其實(shí)夸大了視頻廣告問(wèn)題，目前已標(biāo)記的視頻數(shù)尚未達(dá)總數(shù)的千分之一，Google 首席營(yíng)銷(xiāo)官 Philipp Schindler 也表示這個(gè)問(wèn)題根本不足為訓(xùn)。

由于 Google 超過(guò) 90 ％的收入都來(lái)源于廣告，因此他們也需要快速解決問(wèn)題來(lái)防止廣告商撤位。但是，YouTube 每天都有近 60 萬(wàn)小時(shí)的新視頻上傳量，如此巨大的數(shù)量使得采用人工過(guò)濾很困難，軟件所要處理完成的標(biāo)記量可謂“前所未有”。但問(wèn)題是，公司仍然需要投入人力進(jìn)行 AI 訓(xùn)練。因此，Google 仍然依賴于人工完成廣告標(biāo)記工作，以此構(gòu)建好AI學(xué)習(xí)所需的數(shù)據(jù)。

評(píng)估員任務(wù)

技術(shù)公司會(huì)長(zhǎng)期雇用內(nèi)容管理員，這項(xiàng)工作也隨著人們上傳和分享量的增加而變得越來(lái)越重要。有廣告評(píng)估員說(shuō)，他們的角色不僅僅在于監(jiān)控視頻，他們會(huì)閱讀評(píng)論，標(biāo)記用戶之間的濫用行為；會(huì)檢查 Google提供的各種網(wǎng)站，確保符合公司標(biāo)準(zhǔn)；也會(huì)按類別進(jìn)行網(wǎng)站分類，點(diǎn)擊廣告鏈接查看狀態(tài)正常與否。

具體而言，某些情況下評(píng)估員們需要在不到兩分鐘內(nèi)查看幾小時(shí)長(zhǎng)的影片，這就意味著這份工作更強(qiáng)調(diào)數(shù)量和速度。此外，他們也不僅只是將視頻簡(jiǎn)單標(biāo)記為不合適——從標(biāo)題到內(nèi)容，他們都需要進(jìn)行細(xì)致的評(píng)估并進(jìn)行分類。存在評(píng)估內(nèi)容與既定已有類別不匹配的情況時(shí)，他們會(huì)將材料標(biāo)記為“不可評(píng)估類”。

也多名廣告評(píng)估員說(shuō)，公司要求他們觀看內(nèi)容震撼的視頻，比如有人試圖在車(chē)上殺自己的狗——視頻中的人放火燒了自己的車(chē)，然后走出來(lái)以一槍結(jié)束了自己的生命。此外，還有人會(huì)看暴力侵害婦女兒童和動(dòng)物的視頻。其實(shí)評(píng)價(jià)員們并不知道 Google 是如何進(jìn)行視頻任務(wù)選取與下達(dá)的- 他們只有在開(kāi)始工作的才能看到視頻的標(biāo)題和縮略圖。

總而言之，Google 仍然需要人力來(lái)協(xié)助處理 YouTube 的廣告問(wèn)題。公司高管和代表們也一再?gòu)?qiáng)調(diào)，只有機(jī)器智能才能解決 YouTube 中的規(guī)?；蝿?wù)問(wèn)題，但是在 Google 機(jī)器或其他任何人都能夠自覺(jué)識(shí)別不宜言論之前，這樣的工作仍然需要依賴人去完成。

Google 發(fā)言人 Chi Hea Cho 說(shuō)：“我們一直將技術(shù)與人類評(píng)論結(jié)合進(jìn)行綜合分析已被標(biāo)記的內(nèi)容，因?yàn)閷?duì)于視頻的理解是很主觀的。最近我們也增加人力加快評(píng)估速度，這些評(píng)論有助于我們完善算法很有幫助?！?/p>

評(píng)估員來(lái)源

據(jù)悉，廣告質(zhì)量評(píng)估員這一工作開(kāi)始于 2004 年。雇傭機(jī)構(gòu)的始祖是ABE，他們會(huì)付給大家每小時(shí) 20 美元的薪水，但是 2006 年 WorkForceLogic 收購(gòu)了 ABE 之后，評(píng)估員工作條件就不如從前了。2012 年，一家名為 ZeroChaos 的公司收購(gòu) WorkForceLogic，如今則采取合同制方式進(jìn)行人員雇傭。

廣告評(píng)估員可以隨時(shí)隨地工作，滿足每周 10 小時(shí)的最低工作要求即可。只是這項(xiàng)工作不是那么穩(wěn)定，雖然大多數(shù)人都蠻喜歡這份工作，但他們幾乎沒(méi)有機(jī)會(huì)成為永久的全職員工。

本次調(diào)查的廣告評(píng)估員都是通過(guò) ZeroChaos 聘用的，大家每小時(shí)賺取 15 美元，每周最多可以工作 29 個(gè)小時(shí)。如果每周工作時(shí)長(zhǎng)達(dá)到 25 個(gè)小時(shí)，則可申請(qǐng)福利，但是想達(dá)到這個(gè)工作量可以說(shuō)相當(dāng)困難。有人說(shuō)他們會(huì)面臨毫無(wú)預(yù)兆就被解雇的情況，公司一封電子郵件，你們的勞務(wù)關(guān)系就終止了。

實(shí)際上由于無(wú)法與 Google 直接進(jìn)行明確的溝通，評(píng)估者對(duì)這份工作會(huì)產(chǎn)生不安全感。谷歌只會(huì)給評(píng)估員一個(gè)通用郵箱用于工作方面的聯(lián)系，并且采用自動(dòng)回復(fù)方式回答大家的郵件。也就是說(shuō)，Google 會(huì)告訴評(píng)估員他們所做的工作相當(dāng)重要，也會(huì)非常重視工作成果評(píng)估，但他們并不會(huì)給出詳細(xì)說(shuō)明解釋原因。

Google 會(huì)將已審查的內(nèi)容整合到廣告評(píng)估員的任務(wù)中用以績(jī)效衡量。這些測(cè)試內(nèi)容會(huì)通過(guò)郵件的方式混雜在日常任務(wù)中一起發(fā)給評(píng)估員們，并以最終成績(jī)來(lái)評(píng)估大家的表現(xiàn)，沒(méi)有通過(guò)測(cè)試的人會(huì)面臨解雇危險(xiǎn)。

即使如此，每小時(shí) 15 美元的酬勞仍然高于大多數(shù)城市的最低工資。會(huì)有人很高興 ZeroChaos 給他的工作機(jī)會(huì)。

評(píng)估員與AI

跨技術(shù)行業(yè)的大公司雇用臨時(shí)員工參加用于培訓(xùn)AI系統(tǒng)的重復(fù)任務(wù)。一位廣告評(píng)估員曾在幾年前參與評(píng)估了 Microsoft Bing 的搜索結(jié)果，他們每人每小時(shí)要瀏覽多達(dá)80頁(yè)的搜索結(jié)果。LinkedIn 和 Facebook 也會(huì)通過(guò)進(jìn)行類似的任務(wù)測(cè)試。

臨時(shí)性工作所帶來(lái)的安全感的缺乏和廣泛存在的短期合同工，使得現(xiàn)任和之前的雇員們感到不安，他們認(rèn)為，Google 正在漸漸失去系統(tǒng)知識(shí)和經(jīng)驗(yàn)，這些東西原本為那些工作上投入了更多時(shí)間的雇員所掌握。他們花時(shí)間花時(shí)間訓(xùn)練新人，接著又把他們掃地出門(mén)，實(shí)在是浪費(fèi)時(shí)間。

但是，通過(guò)人類廣告評(píng)估員也許會(huì)找到能夠使 AI 更為聰明的最佳做法。AI 需要許多內(nèi)容輸入，特別是一些令人反感的內(nèi)容，所以定期輸入培訓(xùn)人員數(shù)據(jù)更適合于訓(xùn)練 AI。為機(jī)器輸入更為多元的信息，結(jié)果自然會(huì)更好。

另一方面，AI 研究人員普遍認(rèn)為，不良的人類習(xí)氣不一定會(huì)影響機(jī)器學(xué)習(xí)，反而可能會(huì)由于特別工作環(huán)境和經(jīng)驗(yàn)而產(chǎn)生更微妙的影響?？的螤柎髮W(xué) AI 教授 Bart Selman 說(shuō)：“人們通常的觀點(diǎn)是訓(xùn)連 AI 模型需要大量的信息輸入。這種觀點(diǎn)適用于一般情況，但涉及道德判斷時(shí)，我們就要考慮到大多群體中會(huì)存在明顯的根深蒂固的偏見(jiàn)的，人們認(rèn)為男性會(huì)比女性更好的勝任某些工作就是明證。所以，如果你是通過(guò)一般性或以往的信息輸入訓(xùn)練 AI，那么必然也會(huì)受這些信息中所隱藏偏見(jiàn)的影響?！?/p>

“你應(yīng)該不想用那些普通人的日常做法來(lái)訓(xùn)練AI的道德吧，那些對(duì)于潛在的偏見(jiàn)和倫理問(wèn)題有著更為深入、仔細(xì)思考的想法才是你所想要的信息輸入?！盨elman 說(shuō)。

Google 員工在 Mountain View 總部享有絕佳的環(huán)境，而典型的廣告評(píng)估員的生活卻與之相差甚遠(yuǎn)。為世界上最有價(jià)值的科技公司工作意味著享有優(yōu)渥的福利和極高的薪水，但也可能意味著作為臨時(shí)工作者，你僅僅是在培訓(xùn)這些公司的機(jī)器做同樣的工作。

via：wired

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

1人收藏

相關(guān)文章

晴天

編輯

發(fā)私信

當(dāng)月熱門(mén)文章

特寫(xiě) | 人工智能背后的臨時(shí)工：谷歌如何訓(xùn)練AI識(shí)別網(wǎng)絡(luò)視頻質(zhì)量？

評(píng)估員任務(wù)

評(píng)估員來(lái)源

評(píng)估員與AI

特寫(xiě) | 人工智能背后的臨時(shí)工：谷歌如何訓(xùn)練AI識(shí)別網(wǎng)絡(luò)視頻質(zhì)量？