0
本文作者: 晴天 | 2017-04-25 16:04 |
雷鋒網(wǎng)按:我們都關(guān)注人工智能有多厲害,它們可以在圍棋、德州撲克和人臉識(shí)別上戰(zhàn)勝人類,但人工智能變得聰明,背后是海量數(shù)據(jù)的支撐,而且這些數(shù)據(jù)是需要標(biāo)注的。因而隨著人工智能的繁榮,從事數(shù)據(jù)標(biāo)注的人也越來(lái)越多。Wired的這篇文章就介紹了谷歌如何雇傭人工標(biāo)注YouTube視頻來(lái)訓(xùn)練AI。本文由雷鋒網(wǎng)編譯。
目前,Google 的“廣告質(zhì)量評(píng)估員”已廣泛存在于全國(guó)各地。這些臨時(shí)雇員通常由外部機(jī)構(gòu)代為聘請(qǐng),其工作即是為 YouTube 視頻過(guò)濾暴力、敏感廣告信息。這一工作目前單憑電腦本身尚無(wú)法完成,Google現(xiàn)在也似乎迫切需要這些人的幫助。
YouTube 每天都會(huì)出售數(shù)百萬(wàn)條視頻廣告,廣告播出位置會(huì)由系統(tǒng)自動(dòng)分配,所以廣告商往往不知道自己的廣告具體會(huì)在哪條視頻后播放。最近,這種“不確定性”令 Google 大為頭疼,公司甚至因此受到相關(guān)方的審查。
Google 方面則一直積極解釋,以防止輿論擴(kuò)大化。在他們看來(lái),媒體其實(shí)夸大了視頻廣告問(wèn)題,目前已標(biāo)記的視頻數(shù)尚未達(dá)總數(shù)的千分之一,Google 首席營(yíng)銷(xiāo)官 Philipp Schindler 也表示這個(gè)問(wèn)題根本不足為訓(xùn)。
由于 Google 超過(guò) 90 %的收入都來(lái)源于廣告,因此他們也需要快速解決問(wèn)題來(lái)防止廣告商撤位。但是,YouTube 每天都有近 60 萬(wàn)小時(shí)的新視頻上傳量,如此巨大的數(shù)量使得采用人工過(guò)濾很困難,軟件所要處理完成的標(biāo)記量可謂“前所未有”。但問(wèn)題是,公司仍然需要投入人力進(jìn)行 AI 訓(xùn)練。因此,Google 仍然依賴于人工完成廣告標(biāo)記工作,以此構(gòu)建好AI學(xué)習(xí)所需的數(shù)據(jù)。
技術(shù)公司會(huì)長(zhǎng)期雇用內(nèi)容管理員,這項(xiàng)工作也隨著人們上傳和分享量的增加而變得越來(lái)越重要。有廣告評(píng)估員說(shuō),他們的角色不僅僅在于監(jiān)控視頻,他們會(huì)閱讀評(píng)論,標(biāo)記用戶之間的濫用行為;會(huì)檢查 Google提供的各種網(wǎng)站,確保符合公司標(biāo)準(zhǔn);也會(huì)按類別進(jìn)行網(wǎng)站分類,點(diǎn)擊廣告鏈接查看狀態(tài)正常與否。
具體而言,某些情況下評(píng)估員們需要在不到兩分鐘內(nèi)查看幾小時(shí)長(zhǎng)的影片,這就意味著這份工作更強(qiáng)調(diào)數(shù)量和速度。此外,他們也不僅只是將視頻簡(jiǎn)單標(biāo)記為不合適——從標(biāo)題到內(nèi)容,他們都需要進(jìn)行細(xì)致的評(píng)估并進(jìn)行分類。存在評(píng)估內(nèi)容與既定已有類別不匹配的情況時(shí),他們會(huì)將材料標(biāo)記為“不可評(píng)估類”。
也多名廣告評(píng)估員說(shuō),公司要求他們觀看內(nèi)容震撼的視頻,比如有人試圖在車(chē)上殺自己的狗——視頻中的人放火燒了自己的車(chē),然后走出來(lái)以一槍結(jié)束了自己的生命。此外,還有人會(huì)看暴力侵害婦女兒童和動(dòng)物的視頻。其實(shí)評(píng)價(jià)員們并不知道 Google 是如何進(jìn)行視頻任務(wù)選取與下達(dá)的- 他們只有在開(kāi)始工作的才能看到視頻的標(biāo)題和縮略圖。
總而言之,Google 仍然需要人力來(lái)協(xié)助處理 YouTube 的廣告問(wèn)題。公司高管和代表們也一再?gòu)?qiáng)調(diào),只有機(jī)器智能才能解決 YouTube 中的規(guī)?;蝿?wù)問(wèn)題,但是在 Google 機(jī)器或其他任何人都能夠自覺(jué)識(shí)別不宜言論之前,這樣的工作仍然需要依賴人去完成。
Google 發(fā)言人 Chi Hea Cho 說(shuō):“我們一直將技術(shù)與人類評(píng)論結(jié)合進(jìn)行綜合分析已被標(biāo)記的內(nèi)容,因?yàn)閷?duì)于視頻的理解是很主觀的。最近我們也增加人力加快評(píng)估速度,這些評(píng)論有助于我們完善算法很有幫助?!?/p>
據(jù)悉,廣告質(zhì)量評(píng)估員這一工作開(kāi)始于 2004 年。雇傭機(jī)構(gòu)的始祖是ABE,他們會(huì)付給大家每小時(shí) 20 美元的薪水,但是 2006 年 WorkForceLogic 收購(gòu)了 ABE 之后,評(píng)估員工作條件就不如從前了。2012 年,一家名為 ZeroChaos 的公司收購(gòu) WorkForceLogic,如今則采取合同制方式進(jìn)行人員雇傭。
廣告評(píng)估員可以隨時(shí)隨地工作,滿足每周 10 小時(shí)的最低工作要求即可。只是這項(xiàng)工作不是那么穩(wěn)定,雖然大多數(shù)人都蠻喜歡這份工作,但他們幾乎沒(méi)有機(jī)會(huì)成為永久的全職員工。
本次調(diào)查的廣告評(píng)估員都是通過(guò) ZeroChaos 聘用的,大家每小時(shí)賺取 15 美元,每周最多可以工作 29 個(gè)小時(shí)。如果每周工作時(shí)長(zhǎng)達(dá)到 25 個(gè)小時(shí),則可申請(qǐng)福利,但是想達(dá)到這個(gè)工作量可以說(shuō)相當(dāng)困難。有人說(shuō)他們會(huì)面臨毫無(wú)預(yù)兆就被解雇的情況,公司一封電子郵件,你們的勞務(wù)關(guān)系就終止了。
實(shí)際上由于無(wú)法與 Google 直接進(jìn)行明確的溝通,評(píng)估者對(duì)這份工作會(huì)產(chǎn)生不安全感。谷歌只會(huì)給評(píng)估員一個(gè)通用郵箱用于工作方面的聯(lián)系,并且采用自動(dòng)回復(fù)方式回答大家的郵件。也就是說(shuō),Google 會(huì)告訴評(píng)估員他們所做的工作相當(dāng)重要,也會(huì)非常重視工作成果評(píng)估,但他們并不會(huì)給出詳細(xì)說(shuō)明解釋原因。
Google 會(huì)將已審查的內(nèi)容整合到廣告評(píng)估員的任務(wù)中用以績(jī)效衡量。這些測(cè)試內(nèi)容會(huì)通過(guò)郵件的方式混雜在日常任務(wù)中一起發(fā)給評(píng)估員們,并以最終成績(jī)來(lái)評(píng)估大家的表現(xiàn),沒(méi)有通過(guò)測(cè)試的人會(huì)面臨解雇危險(xiǎn)。
即使如此,每小時(shí) 15 美元的酬勞仍然高于大多數(shù)城市的最低工資。會(huì)有人很高興 ZeroChaos 給他的工作機(jī)會(huì)。
跨技術(shù)行業(yè)的大公司雇用臨時(shí)員工參加用于培訓(xùn)AI系統(tǒng)的重復(fù)任務(wù)。一位廣告評(píng)估員曾在幾年前參與評(píng)估了 Microsoft Bing 的搜索結(jié)果,他們每人每小時(shí)要瀏覽多達(dá)80頁(yè)的搜索結(jié)果。LinkedIn 和 Facebook 也會(huì)通過(guò)進(jìn)行類似的任務(wù)測(cè)試。
臨時(shí)性工作所帶來(lái)的安全感的缺乏和廣泛存在的短期合同工,使得現(xiàn)任和之前的雇員們感到不安,他們認(rèn)為,Google 正在漸漸失去系統(tǒng)知識(shí)和經(jīng)驗(yàn),這些東西原本為那些工作上投入了更多時(shí)間的雇員所掌握。他們花時(shí)間花時(shí)間訓(xùn)練新人,接著又把他們掃地出門(mén),實(shí)在是浪費(fèi)時(shí)間。
但是,通過(guò)人類廣告評(píng)估員也許會(huì)找到能夠使 AI 更為聰明的最佳做法。AI 需要許多內(nèi)容輸入,特別是一些令人反感的內(nèi)容,所以定期輸入培訓(xùn)人員數(shù)據(jù)更適合于訓(xùn)練 AI。為機(jī)器輸入更為多元的信息,結(jié)果自然會(huì)更好。
另一方面,AI 研究人員普遍認(rèn)為,不良的人類習(xí)氣不一定會(huì)影響機(jī)器學(xué)習(xí),反而可能會(huì)由于特別工作環(huán)境和經(jīng)驗(yàn)而產(chǎn)生更微妙的影響??的螤柎髮W(xué) AI 教授 Bart Selman 說(shuō):“人們通常的觀點(diǎn)是訓(xùn)連 AI 模型需要大量的信息輸入。這種觀點(diǎn)適用于一般情況,但涉及道德判斷時(shí),我們就要考慮到大多群體中會(huì)存在明顯的根深蒂固的偏見(jiàn)的,人們認(rèn)為男性會(huì)比女性更好的勝任某些工作就是明證。所以,如果你是通過(guò)一般性或以往的信息輸入訓(xùn)練 AI,那么必然也會(huì)受這些信息中所隱藏偏見(jiàn)的影響?!?/p>
“你應(yīng)該不想用那些普通人的日常做法來(lái)訓(xùn)練AI的道德吧,那些對(duì)于潛在的偏見(jiàn)和倫理問(wèn)題有著更為深入、仔細(xì)思考的想法才是你所想要的信息輸入?!盨elman 說(shuō)。
Google 員工在 Mountain View 總部享有絕佳的環(huán)境,而典型的廣告評(píng)估員的生活卻與之相差甚遠(yuǎn)。為世界上最有價(jià)值的科技公司工作意味著享有優(yōu)渥的福利和極高的薪水,但也可能意味著作為臨時(shí)工作者,你僅僅是在培訓(xùn)這些公司的機(jī)器做同樣的工作。
via:wired
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。