0
雷鋒網(wǎng) AI 研習社按:本篇是來自 Schibsted 多媒體組的數(shù)據(jù)科學經(jīng)理 Alex 發(fā)布于 Medium 上的一篇文章,作者結合自身四年的行業(yè)經(jīng)驗,詳細介紹了實際的數(shù)據(jù)科學工作,以及如何管理好數(shù)據(jù)科學團隊,雷鋒網(wǎng) AI 研習社對原文進行了編譯整理。
本文為下篇,主要講了如何管理一支數(shù)據(jù)科學團隊。上篇主要介紹了實際的數(shù)據(jù)科學工作。
和許多其它公司一樣,Schibsted 有兩條職業(yè)路線——「個人貢獻者」和「人事經(jīng)理」。在數(shù)據(jù)科學領域,前者適用于那些真正想要減少數(shù)據(jù)科學專業(yè)知識,并通過實踐工作和技術為公司做出貢獻的人。而經(jīng)理的路線則是為那些對開發(fā)人員和領導團隊更感興趣的人而準備的。
實際上一開始我也非常不確定自己最適合哪一條路線,我最終決定試試經(jīng)理人路線。幸運的是,在決定不久之后我便發(fā)現(xiàn)這是條適合我的路線,盡管這一決策導致我面臨許多的挑戰(zhàn)。
你將面臨的第一個挑戰(zhàn)便是,你會發(fā)現(xiàn)在這個世界上只有很少的人從事數(shù)據(jù)科學經(jīng)理這一工作。如果你認為經(jīng)驗豐富的數(shù)據(jù)科學家非常罕見,實際上經(jīng)驗豐富的數(shù)據(jù)科學經(jīng)理的數(shù)量比這個還少。所以在工作中你基本上只能依靠自己。
但是管理一支數(shù)據(jù)科學家團隊真的就和管理其他團隊如此不同嗎?
如果你以前從未管理過一個團隊,那么你肯定會從閱讀 Andrew Grove 所寫的《高產(chǎn)出管理》一書中獲益匪淺。此外,主動向其他更多高級管理人員尋求建議也至關重要。
但是,數(shù)據(jù)科學家團隊在幾個關鍵方面與其他團隊有著本質(zhì)不同,所以接下來我將重點關注與數(shù)據(jù)科學家團隊特別相關的內(nèi)容。
每當我們談到團隊時,大多數(shù)人腦海中的第一反應也許是聯(lián)想到以下的畫面:
像巴薩羅那這樣的足球隊具有哪些特質(zhì)呢?在我看來至少有三個方面:
一個共同的目標
團隊中有不同的角色,并且每個角色都有自己不同的分工職責
每個人都擁有實現(xiàn)目標的自主權
如果你要管理一支僅由數(shù)據(jù)科學家組成的團隊,那么以上的這些特質(zhì)可能都不適用。你的團隊將具有:
多樣、多變的目標
高度專業(yè)化,并且他們都擅長于同一件事情:數(shù)據(jù)科學
需要與其他團隊協(xié)作,最終對用戶的收入產(chǎn)生影響
比起足球隊,對數(shù)據(jù)科學團隊一個更合適的類比是:
X-檔案
Mulder 和 Scully 的服務需求會隨著時間的推移而發(fā)生變化。當需要他們的專業(yè)知識時,他們會被帶進去。但是如果不與聯(lián)邦調(diào)查局(FBI)之外的人交談,他們將永遠不會解決任何案件。
為什么這種區(qū)別如此重要呢?
因為如果你擁有一支數(shù)據(jù)科學團隊,然后以管理“傳統(tǒng)”團隊的方式管理他們,也就是給團隊設立統(tǒng)一的目標、不同的角色分工和完全的自主權。那么你很快就會感到團隊的表現(xiàn)令人沮喪。
我曾經(jīng)見過有人將數(shù)據(jù)科學團隊按產(chǎn)品或者是工程團隊的方式進行運營,這么做無法避免的后果是:除了數(shù)據(jù)科學之外,團隊中的數(shù)據(jù)科學家們什么都需要做,他們最終將變成做工程、開發(fā)或者是產(chǎn)品管理。
因此數(shù)據(jù)科學家是不同的。但是這樣我們又將面臨另外一個問題,即怎樣保證數(shù)據(jù)科學家不被束縛于象牙塔中?
當你將數(shù)據(jù)科學家和產(chǎn)品經(jīng)理、工程師、用戶體驗專員、市場銷售以及其他成員組合到一塊的時候,神奇的事情將發(fā)生。
基本上,你希望最大化的目標函數(shù)是:團隊中的數(shù)據(jù)科學家與其他團隊的成員能夠展開頗有建樹的合作。
我喜歡用寬信道(Wide channel)的概念來思考這一問題。讓我們使用產(chǎn)品經(jīng)理作為數(shù)據(jù)科學家的合作對象來說明這一點。
最糟糕的情況就是數(shù)據(jù)科學家和產(chǎn)品經(jīng)理之間沒有任何信道:
數(shù)據(jù)科學家(DS)和產(chǎn)品經(jīng)理(PM)之間沒有任何信道
這意味著數(shù)據(jù)科學家和產(chǎn)品經(jīng)理之間沒有任何交流和溝通。換言之,就是數(shù)據(jù)學家對產(chǎn)品經(jīng)理所面臨的產(chǎn)品挑戰(zhàn)沒有一絲了解,這就使得數(shù)據(jù)科學家不可能分析和解決這些問題。
稍微好點的情況就是,數(shù)據(jù)科學家和產(chǎn)品經(jīng)理之間有一條很窄的信道:
數(shù)據(jù)科學家和產(chǎn)品經(jīng)理間有一條很窄的信道
在這種情況下,信息可以進行流動,但通常非常有限,而且是異步進行的。任何一種信息都可以通過第三者(例如管理者)或請求表單等手段來實現(xiàn)。當數(shù)據(jù)科學家需要服務于很多不同的利益相關者時,這種類型的交流是非常常見的。但這可能令人沮喪,因為商業(yè)環(huán)境通常不存在,并且會導致誤解和無意義的來回折騰。
而最高效的配置方式則是擁有一條寬信道:
數(shù)據(jù)科學家和產(chǎn)品經(jīng)理之間存在寬信道
從最直觀的角度理解寬信道就是,數(shù)據(jù)科學家就坐在產(chǎn)品經(jīng)理旁邊。這自然能夠促使他們更高效地進行溝通。雖然要讓人們總是能夠坐在一起進行協(xié)作并不方便,而且也不容易實現(xiàn)(我們 Schibsted 的成員分布于 22 個不同的國家),但是已經(jīng)有很多軟件足以支持我們在線協(xié)作,例如 Slack 和 Hangouts。
當然我們不可能讓隊伍中每一位產(chǎn)品經(jīng)理和團隊中每一位數(shù)據(jù)科學家建立一條寬信道——這樣不便于擴展。而這正是你作為數(shù)據(jù)科學家經(jīng)理的職責,你需要負責確定哪些寬信道是需要建立的,一旦完成建立,你就可以離開了。
這里有一個來自 Schibsted 的例子,證明我們正積極致力于建立一個寬信道。該例子涉及一款汽車評估工具的開發(fā),這個工具可以幫助你在出售汽車時設定價格(在我們的挪威市場 Finn 進行了測試)。最初我只有一條非常窄的信道,然后嘗試構建最準確的定價模型。但是我們發(fā)現(xiàn)這樣做效率非常低,因為有很多產(chǎn)品決策,如果我們不及早對用戶進行試驗,就無法進行正確回答。
過了一段時間之后,我們最終將一位數(shù)據(jù)科學家融入了產(chǎn)品團隊中,并且取得了不錯的結果。你可以在該博客的文章中閱讀到我們關于汽車評估工具的一些早期工作。
我們一個寬信道的例子是數(shù)字新訂閱的預測模型。該模型有助于將銷售額轉(zhuǎn)化率提高 540%,并在 2017 年榮獲 INMA 的“數(shù)據(jù)分析最佳使用獎”。
在《高產(chǎn)出管理》一書中,Andy Grove 曾表示「作為一個經(jīng)理,你掌握了你們團隊的產(chǎn)出」。這意味著一個數(shù)據(jù)科學經(jīng)理必須要盡全力來為數(shù)據(jù)科學家創(chuàng)建一個最佳環(huán)境,以便于數(shù)據(jù)科學家能夠保持高產(chǎn)。
高效的組裝車間
這在很多方面是對前述嵌入模型的一股反作用力。如果每個人都始終處于嵌入狀態(tài),那么你很可能會多次面臨數(shù)據(jù)孤島(Data silos)和次優(yōu)基礎架構。
一些工程經(jīng)理聲稱,當你成為經(jīng)理時你應該停止編程。作為數(shù)據(jù)科學經(jīng)理,我認為你應該花高達 10% 的時間來親自完成一些編程工作,如訓練模型、數(shù)據(jù)可視化等。這些工作可以幫助你以一個數(shù)據(jù)科學家的角度看待問題。
每次我想進行特設分析(Ad-hoc analysis)時,我都必須花費 15 分鐘等待這個集群啟動!必須有一個更快的方式來實現(xiàn)。
我們架構格式的文檔說明似乎有點過時了——如何測量不同網(wǎng)站上這種按鈕的點擊次數(shù)?
諸如此類。當然,這種類型的實踐工作不應該取代獲取團隊反饋意見,成為你的主職。但是它肯定有助于你發(fā)現(xiàn)關鍵問題,以讓數(shù)據(jù)科學家更輕松地工作。
你還可以更加有條不紊,使用精益管理等框架,以消除各種數(shù)據(jù)科學流程中出現(xiàn)的浪費現(xiàn)象。這篇 xkcd 的文章可以作為一個很好的起點:
還需要謹記的是,數(shù)據(jù)科學家的工作需要相當多的靈活性和探索空間。你不是在經(jīng)營工廠!
了解自己作為數(shù)據(jù)科學經(jīng)理的「政治」背景非常重要——特別是在一個龐大而復雜的機構中。運營數(shù)據(jù)科學團隊意味著你可以管理稀缺和高度需求的資源。這反過來又意味著你必須偶爾處理一下政治事務。
權力的游戲
一些假設:
副總裁正準備提出一項新的戰(zhàn)略措施。她的幻燈片已經(jīng)完成了 98%,但是希望你的團隊用數(shù)據(jù)來支持她的提議(......盡管結論已經(jīng)出來了)。
業(yè)務部門拒絕與你的團隊共享數(shù)據(jù),因為擔心你會發(fā)現(xiàn)一些他們不知道的數(shù)據(jù)。
一個部門堅持認為他們需要數(shù)據(jù)科學家的支持,但是當你深入了解的時候,發(fā)現(xiàn)這里并不存在真正的需求。
另一個有著類似職責的團隊拒絕分享技術方案,擔心你會剽竊他們的工作。
你花費在這些事情上的時間很大程度上取決于公司文化,以及激勵人們?nèi)绾涡惺碌臋C制。但是,能提前意識到可能發(fā)生這些事情總是好事。
我有一個天真的想法,公開透明是最好的良藥:所有會議記錄都向公司的每個人開放。所有 Slack 信道都是開放的。公司內(nèi)部任何人都可以檢查所有其它團隊(和個人)的目標。實際上這意味著以身作則。
另外,公開透明是不夠的。你必須積極與利益相關者建立信任。建立信任需要很長時間,但打破信任卻可以非???!
現(xiàn)在,只要讓團隊成員掌握到能夠理解自己當前工作環(huán)境的程度就足夠了,不需要讓他們接觸政治。這并不意味著讓你的員工處于黑箱之中,但這確實能讓他們專注于做好數(shù)據(jù)科學。
不要讓政治剝奪了你的大部分精力。請記住,當你有權訪問數(shù)據(jù)和資源以從中獲取價值的時候,你就立即擁有了權利,政治將永遠圍繞著權利展開。
現(xiàn)在許多公司都在招聘數(shù)據(jù)科學家。在很多情況下,這些公司根本不知道該用這些數(shù)據(jù)科學家來干什么。這些公司只是迷信他們肯定會產(chǎn)生某些魔力。
如果你購買了法拉利,就不要把它放在車庫里。
另外,不要只用它來購買雜貨。
用斯柯達干這事可能會更好
法拉利就該用來干它該干的事。
法拉利在它的自然棲息地奔馳
數(shù)據(jù)科學家是一群雄心勃勃、聰明、有商業(yè)頭腦的人。這意味著你必須確保他們正在處理那些不僅富有挑戰(zhàn)性,而且有很高的投資回報(ROI)的問題。
數(shù)據(jù)科學經(jīng)理在這里起著關鍵作用。你必須始終將正確的業(yè)務挑戰(zhàn)與團隊中擅于此題的人員相匹配。
回到我們的第一個觀點,我們往往最容易關注到那些最復雜的挑戰(zhàn)。根據(jù)我的經(jīng)驗,在考慮往哪投入資源時,主要應該考慮在哪里使用團隊中的員工 。
不論你是一名管理人員還是一名數(shù)據(jù)科學家,擁有一個好使的工具箱對大家而言同等重要。我的經(jīng)理工具箱(Manager toolbox)中最強大的工具是目標和關鍵結果(Objectives and Key Results, OKRs)。簡而言之,OKRs 就是要設定一些遠大的定性目標,并將量化的關鍵結果與這些目標聯(lián)系起來。通常你在每個季度都需要這么做。盡管 OKRs 還有很多其它內(nèi)容,但這是它的本質(zhì)。
OKRs 非常重要,因為它以一種簡單明晰的方式讓所有人知道我們將前進的方向,以及我們正在嘗試去實現(xiàn)的東西。
從管理者的角度來看,它們也很吸引人。OKRs 的方法非常容易學習,但是實際上卻難以掌握。通常情況下,你需要幾個季度的時間才能正確做到:如何設置合理的 OKRs,然后跟進和審核。
當提到 OKRs 時,我有兩項理解,并且認為這對于管理者非常有幫助。
第一點:鼓勵團隊中的每個人分別設立自己的 OKRs。你的個人「總體」的 OKRs 應該以團隊的 OKRs 為基礎,然后具體細化到個人在該季度應該完成的任務。當我說「總體」的時候,這意味著個人成長目標以及個人對組織和團隊的貢獻。將這兩件事放在一起非常重要。雖然它是一件很基本的事情,但它確實能幫助你將個人目標和公司目標保持一致。
想要了解更多關于 LSTMs 的內(nèi)容?我會給大家介紹一些 LSTMs 將被用到的項目,以便于大家參與進來做出貢獻??释岣咦约旱难葜v技巧?你可以和市場營銷一起來完成這個留存分析項目。對經(jīng)理職業(yè)感到好奇?那么嘗試領導這個小組,致力于細分用戶以實現(xiàn)盈利。
隨著個人目標和公司目標的一致,所有的團隊成員將擁有一頁 OKRs,他們可以將其打印出來然后張貼在顯示器旁邊。
理想情況下,公司所有人都可以看到其他人的 OKRs。這創(chuàng)造了一種關注員工成長并互相幫助實現(xiàn)各自目標的文化。
其次:幫助團隊成員將 OKRs 集成到他們的日常工作和每周例程中。我開始使用一個簡單的電子表格,盡管它并不好看但是卻有效:
每周五回家前,我們會花費大約 10 分鐘來填寫本周的專欄。其實你寫的內(nèi)容并不是那么重要——真正的價值來自于填寫專欄本身,這有助于提醒你本季度自己的首要任務。
在跟進 OKRs 時,沒有一種最佳的方法可以適用于每個人——關鍵是幫助你的團隊成員找到一種方法,將它們自然地構建到日常工作和每周例行程序中。
最后一點也是最重要的一點。
谷歌曾花了兩年多的時間對他們團隊進行研究,以了解團隊表現(xiàn)得好和表現(xiàn)不佳的原因,他們發(fā)現(xiàn)一個因素非常突出,那就是心理安全。
心理安全可以被簡單概括為,你相信自己在犯下錯誤之后不會受到懲罰。
現(xiàn)在,該對第一部分的介紹進行反思了。在數(shù)據(jù)科學中,冒名頂替者綜合癥(Impostor syndrome)是真實存在的。當你覺得自己像是個騙子的時候,你擔心的是什么?那就是犯錯誤。
多年來,我發(fā)現(xiàn)許多擁有各色各樣知識背景的人進入到了數(shù)據(jù)科學領域,例如 Schibsted 的團隊中,有來自金融、研究、教育、咨詢、軟件工程等多個領域的專業(yè)人員。
假設這些人都知道同樣的事情是件愚蠢的行為。擁有如此多種不同方向人員的價值在于,每個人都能為團隊帶來新的東西。
數(shù)據(jù)科學家獨角獸的概念是心理安全的毒素。
是否存在快速解決方法以增加心理安全?我不這么認為。但是我確實認為,作為一名經(jīng)理,它需要成為你事務列表中優(yōu)先級最高的那一個——尤其是當你正在建立一個新團隊,或者有新成員加入時。雖然沒有快速解決辦法,但是你依然可以通過采取一些明確的行動來增加成員們的心理安全。以下是我們的一些實踐經(jīng)驗:
建立起反饋文化。在團隊內(nèi)指明每個人在做完報告之后需要大家給出意見。并培訓人們?nèi)绾握_給出建設性反饋意見——因為并不是每個人都擅長這么做。
增加面對面交流的時間。兩兩結對編程、在白板上解決問題……這對于遠程協(xié)作的團隊而言尤為重要。為此而花費的機票費用肯定是值得的。
兩兩結隊或者是組成小團體。作為一個團隊,你可能會做更少的事情,但你會做得更好。而那些一起工作的人會相互建立起信任。
鼓勵大家在全體會議上進行公開和坦誠的討論。積極平衡所有參與者的對話時間——因為有些人可能需要被指定才會發(fā)言。
注意文化差異。你可能關注平等主義、顯性文化(Explicit Culture)和直接文化(Direct culture)。那么你很可能會錯過來自等級文化、隱性文化(Implicit culture)和非直接文化(Indirect culture)成員的信號。
進行團隊實驗以持續(xù)提升團隊。讓整個團隊參與到「如何成功運營團隊」這個問題上,讓每個人都對團隊的幸福感擁有主人翁意識。
衡量幸福和心理安全。找到一些簡單的方法來定期測評幸福感與心理安全。如果你沒有這個花哨的 HR 系統(tǒng),那么只需要從一個 Typeform 開始,并一直迭代,直到你和團隊成員們發(fā)現(xiàn)它是有用的。與團隊分享(匿名)平均得分或調(diào)查結果,并讓他們一同參與改進。
恭喜你,你已經(jīng)閱讀完了這篇文章!希望這篇文章對作為數(shù)據(jù)科學家或者是數(shù)據(jù)科學經(jīng)理的你能有所幫助。
via 4 Years of Data Science at Schibsted Media Group,雷鋒網(wǎng) AI 研習社編譯整理。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。