丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能開(kāi)發(fā)者 正文
發(fā)私信給恒亮
發(fā)送

0

對(duì)創(chuàng)業(yè)公司的忠告:這么玩數(shù)據(jù)才不會(huì)死

本文作者: 恒亮 2017-03-03 18:32
導(dǎo)語(yǔ):作為一個(gè)初創(chuàng)公司的項(xiàng)目主管,怎樣才能更好地應(yīng)對(duì)數(shù)據(jù)科學(xué)挑戰(zhàn)呢,這里有幾條實(shí)踐指導(dǎo)。

雷鋒網(wǎng)按:本文原作者 Matthew Coffman,他是專注于企業(yè)云的風(fēng)投基金 High Alpha 的產(chǎn)品經(jīng)理,具有豐富的大數(shù)據(jù)行業(yè)經(jīng)驗(yàn),也參與和見(jiàn)證了許多數(shù)據(jù)類公司的創(chuàng)立和發(fā)展。根據(jù)自己在行業(yè)里多年的觀察和思考,Matthew Coffman 提出了以下幾條針對(duì)初創(chuàng)公司的數(shù)據(jù)科學(xué)實(shí)踐指南。雷鋒網(wǎng)編譯。

對(duì)創(chuàng)業(yè)公司的忠告:這么玩數(shù)據(jù)才不會(huì)死

Matthew Coffman


首先,我們需要明確一個(gè)概念:什么是數(shù)據(jù)科學(xué)家?

一般的定義是:能夠采用科學(xué)方法、運(yùn)用數(shù)據(jù)挖掘工具對(duì)復(fù)雜多量的信息進(jìn)行數(shù)字化重現(xiàn)與認(rèn)識(shí),并能從中找出新的數(shù)據(jù)洞察的工程師或?qū)<?。這里,從實(shí)際工程的角度,來(lái)自知名信息聚合平臺(tái) Slack 的首席數(shù)據(jù)工程師 Josh Wills 對(duì)數(shù)據(jù)科學(xué)家下了這樣一個(gè)更精辟的定義:軟件工程師里統(tǒng)計(jì)學(xué)最好的,統(tǒng)計(jì)學(xué)家里編程能力最強(qiáng)的那些人,就是數(shù)據(jù)科學(xué)家。

對(duì)創(chuàng)業(yè)公司的忠告:這么玩數(shù)據(jù)才不會(huì)死

下面進(jìn)入正題,作為一個(gè)初創(chuàng)公司的項(xiàng)目主管,怎樣才能更好地應(yīng)對(duì)數(shù)據(jù)科學(xué)挑戰(zhàn)呢,有如下幾條實(shí)踐指導(dǎo)。

第一步:理解數(shù)據(jù)科學(xué)的格局

首先需要明確的一點(diǎn)是,當(dāng)前的數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和 AI 作為一個(gè)獨(dú)立的行業(yè)都已經(jīng)具備了相當(dāng)?shù)捏w量。利用各種供應(yīng)商提供的各種平臺(tái)、工具和算法,我們幾乎可以解決所有應(yīng)用程序的相關(guān)問(wèn)題。

但這些工具和平臺(tái),與真正的數(shù)據(jù)科學(xué)家是兩回事。事實(shí)上,目前所有的大公司都在競(jìng)聘行業(yè)里頂尖的數(shù)據(jù)科學(xué)家。因此,對(duì)于那些專注于研究下一代的智能聊天機(jī)器人或者大數(shù)據(jù)分析應(yīng)用的創(chuàng)業(yè)者來(lái)說(shuō),機(jī)會(huì)已經(jīng)不多了。

如果你的公司足夠幸運(yùn),已經(jīng)招到了一位珍貴的數(shù)據(jù)科學(xué)家,那就一定要讓他作為你的合伙人,共同規(guī)劃和執(zhí)行公司的項(xiàng)目。同時(shí)你需要明確的一點(diǎn)是,在構(gòu)建和擴(kuò)展應(yīng)用程序的所有其他復(fù)雜功能方面,數(shù)據(jù)科學(xué)家們很多時(shí)候并不具備其他工程師的專業(yè)知識(shí)和經(jīng)驗(yàn)。一定要讓數(shù)據(jù)科學(xué)家和工程師協(xié)同合作,共同參與項(xiàng)目的規(guī)劃,才能最大限度地確保成功。

那么,在缺少主題專家的情況下,項(xiàng)目主管要怎樣為其產(chǎn)品尋求有意義的數(shù)據(jù)科學(xué)驅(qū)動(dòng)功能呢?這里推薦一個(gè)非常實(shí)用的方法:就像大多數(shù)其他產(chǎn)品的規(guī)劃流程一樣,做到理智的取舍。在當(dāng)前豐富而強(qiáng)大的工具和平臺(tái)的幫助下,團(tuán)隊(duì)可以實(shí)現(xiàn)幾乎任何想要的功能。因此,對(duì)項(xiàng)目主管來(lái)說(shuō),重點(diǎn)就在于確定真正核心的功能并平衡其影響。

對(duì)創(chuàng)業(yè)公司的忠告:這么玩數(shù)據(jù)才不會(huì)死

第二步:最小化的可用數(shù)據(jù)產(chǎn)品(Minimum viable data products,MVDP)

創(chuàng)業(yè)圈流行這樣一個(gè)理念:開(kāi)發(fā)產(chǎn)品時(shí)先做出一個(gè)簡(jiǎn)單的原型——最小化的可用產(chǎn)品(Minimum Viable Product, MVP),然后通過(guò)測(cè)試并收集用戶的反饋,快速迭代,不斷修正產(chǎn)品,最終適應(yīng)市場(chǎng)的需求,推出讓用戶滿意的產(chǎn)品。這一點(diǎn)放在數(shù)據(jù)產(chǎn)品上也同樣適用。

要做到 MVDP,有以下三點(diǎn)需要注意:

1. 對(duì)客戶真正有價(jià)值:增強(qiáng)或加深他們與產(chǎn)品的關(guān)系;

2. 可用和足夠的數(shù)據(jù):即使是最好的算法,也不能沒(méi)有數(shù)據(jù)去執(zhí)行;

3. 實(shí)時(shí)性的交付:團(tuán)隊(duì)是否可以利用現(xiàn)有的資源和現(xiàn)成的解決方案實(shí)現(xiàn)功能。

項(xiàng)目主管可以從產(chǎn)品特性討論開(kāi)始,優(yōu)先考慮那些對(duì)客戶最有價(jià)值的特性。并且與工程師團(tuán)隊(duì)(以及潛在的數(shù)據(jù)科學(xué)專業(yè)人員)一起討論,確定待實(shí)現(xiàn)的特性與現(xiàn)有的數(shù)據(jù)、資源是否匹配。

不要擔(dān)心縮小范疇,MVDP 本身的目標(biāo)就是快速輸出一個(gè)對(duì)客戶有價(jià)值的原型產(chǎn)品。只要能證明這個(gè)原型有價(jià)值,后續(xù)可以再添加額外的復(fù)雜功能。這一點(diǎn)放在數(shù)據(jù)科學(xué)項(xiàng)目上尤其重要,因?yàn)閿?shù)據(jù)產(chǎn)品在很大程度上就是要盡量防止過(guò)多的復(fù)雜性,以減少項(xiàng)目落空的機(jī)會(huì)。

第三步:制定對(duì)工程師友好的解決方案

當(dāng)前,一般的工程師和產(chǎn)品團(tuán)隊(duì)在實(shí)現(xiàn)產(chǎn)品性能方面都表現(xiàn)優(yōu)異,但是他們通常都需要一些工具包或者框架的幫助。數(shù)據(jù)科學(xué)家們提供了給定數(shù)據(jù)集的深層次的理解,提供了正確的工具/技術(shù)來(lái)幫助實(shí)現(xiàn)產(chǎn)品特性,并成功將這些工具和產(chǎn)品應(yīng)用到產(chǎn)品研發(fā)的過(guò)程中。可能有些創(chuàng)業(yè)公司目前并沒(méi)有自己的數(shù)據(jù)科學(xué)家,但可喜的是,現(xiàn)在互聯(lián)網(wǎng)上充滿了相關(guān)教程和學(xué)習(xí)資料,還有豐富的程序Demo和API接口,可以幫助這些公司實(shí)現(xiàn)數(shù)據(jù)科學(xué)的相關(guān)功能。

而且,目前幾乎所有的算法和技術(shù)都可以找到第三方實(shí)現(xiàn)好的現(xiàn)成的工具包,工程師團(tuán)隊(duì)真正的研發(fā)重點(diǎn)應(yīng)該是數(shù)據(jù)的準(zhǔn)備和加載,訓(xùn)練和選擇合適的模型/算法/工具,并將其成功應(yīng)用在產(chǎn)品里。必須明確的一點(diǎn)是:團(tuán)隊(duì)不應(yīng)該完全從零開(kāi)始構(gòu)建所有東西,這是一種寶貴資源的浪費(fèi)。

隨著 MVDP 的實(shí)現(xiàn),下面需要找到最實(shí)用的方法來(lái)實(shí)現(xiàn)產(chǎn)品特性。當(dāng)然,需要首先明確的一點(diǎn)是:并不存在某個(gè)單一的工具或平臺(tái)適合所有產(chǎn)品。對(duì)此,我們給出以下幾條建議。

對(duì)創(chuàng)業(yè)公司的忠告:這么玩數(shù)據(jù)才不會(huì)死

1. 通用的機(jī)器學(xué)習(xí)平臺(tái)和預(yù)測(cè)服務(wù):Google Prediction APIAmazon Machine Learning API,Microsoft Azure Machine Learning API 以及 BigML。通過(guò)這些開(kāi)放 API 接口,用戶可以將數(shù)據(jù)輸入到預(yù)先構(gòu)建好的或者自定義的模型,實(shí)現(xiàn)快速測(cè)試,并合并到產(chǎn)品中。這種類型的服務(wù)非常適合于預(yù)測(cè)用戶行為,在大數(shù)據(jù)集中標(biāo)記用戶和產(chǎn)品,以及對(duì)數(shù)據(jù)集進(jìn)行優(yōu)先級(jí)排序等場(chǎng)景。

對(duì)創(chuàng)業(yè)公司的忠告:這么玩數(shù)據(jù)才不會(huì)死

2. 特定用途的 AI 平臺(tái):這一類的工具似乎發(fā)展勢(shì)頭強(qiáng)勁,初創(chuàng)公司可以直接接入這些平臺(tái),然后通過(guò)云端計(jì)算實(shí)現(xiàn)各種各樣的創(chuàng)新功能。主要的供應(yīng)商包括 IBM Watson(語(yǔ)音識(shí)別,圖像識(shí)別,翻譯)和 Google Cloud(語(yǔ)音,文字,圖像和其他服務(wù)),并且每天都有許多這一類的新興的初創(chuàng)公司涌現(xiàn)。

3. 博客,資源和社區(qū)討論:與大多數(shù)其他領(lǐng)域的發(fā)展一樣,互聯(lián)網(wǎng)提供了一個(gè)分享互助的基礎(chǔ),初創(chuàng)公司可以相對(duì)容易地與其他團(tuán)隊(duì)分享和交流他們的數(shù)據(jù)科學(xué)項(xiàng)目經(jīng)驗(yàn),并相互學(xué)習(xí),取長(zhǎng)補(bǔ)短。這里建議 KDnuggetsO'Reilly 這兩個(gè)社區(qū)。

這里還需要強(qiáng)調(diào):無(wú)論借助哪種工具或者框架的幫助,項(xiàng)目主管都需要明確:始終聚焦于向客戶提供有價(jià)值的最小化的可行產(chǎn)品,然后其他所有的各項(xiàng)措施都是圍繞這一核心目標(biāo)展開(kāi)的。明確這一點(diǎn),有助于保持?jǐn)?shù)據(jù)科學(xué)的相關(guān)項(xiàng)目始終在可控的范圍內(nèi)成長(zhǎng)。

第四步:根據(jù)用戶反饋迭代產(chǎn)品

在做任何一個(gè)特性之前,都需要首先明確如何衡量客戶對(duì)該特性的滿意度。考慮到數(shù)據(jù)科學(xué)項(xiàng)目額外的復(fù)雜性,因此,在客戶反饋和特性迭代之間建立一個(gè)緊密的循環(huán)機(jī)制就變得更加重要。而且由于對(duì)數(shù)據(jù)和模型的巨大依賴,因此通常情況下研發(fā)人員很難排查為什么最終實(shí)現(xiàn)的特性沒(méi)有預(yù)想的效果好。另外,項(xiàng)目主管在制定每一輪迭代的預(yù)期工作量時(shí)都發(fā)揮著至關(guān)重要的作用,并且通常還需要針對(duì)一些計(jì)劃外的工作價(jià)值做出判斷。在某些極端的情況下,如果一個(gè)特性看起來(lái)需要太多的工作投入或者結(jié)果仍然不可預(yù)測(cè),那么就有可能選擇完全放棄該特性。

值得注意的是:一個(gè)好的項(xiàng)目主管應(yīng)該在客戶和數(shù)據(jù)之間保持一種勤奮的工作關(guān)系。當(dāng)客戶實(shí)測(cè)一個(gè)數(shù)據(jù)科學(xué)驅(qū)動(dòng)的新特性時(shí),及時(shí)準(zhǔn)確地考察來(lái)自這兩個(gè)來(lái)源的反饋將變得至關(guān)重要。

總結(jié):重視數(shù)據(jù)科學(xué)

Slack的首席數(shù)據(jù)工程師 Josh Wills 表示:當(dāng)前對(duì)許多公司而言,數(shù)據(jù)科學(xué)方面的投入只是其眾多產(chǎn)品投入的一部分。在大多是情況下,只需要一項(xiàng)或者兩項(xiàng)的投入起作用,就能支撐起整個(gè)產(chǎn)品。而且,數(shù)據(jù)科學(xué)的入門(mén)真的很難,他稱之為信仰的行為(an act of faith)。像Facebook、谷歌和亞馬遜這樣的巨頭公司,他們的發(fā)展規(guī)模其實(shí)早已超出了建立時(shí)的初衷,數(shù)據(jù)科學(xué)幾乎變成了所有業(yè)務(wù)的核心驅(qū)動(dòng)力?,F(xiàn)在,機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)幾乎變成了所有大公司用來(lái)創(chuàng)造價(jià)值的主要工具,他們通過(guò)考察用戶體驗(yàn)掌握先機(jī),然后通過(guò)自動(dòng)化的方法通過(guò)特定的產(chǎn)品使客戶的生活變得越來(lái)越便捷。

從實(shí)用的觀點(diǎn)來(lái)說(shuō),當(dāng)下的項(xiàng)目主管應(yīng)該要開(kāi)始嘗試將數(shù)據(jù)科學(xué)的相關(guān)特性融入到產(chǎn)品中去。雖然趕超大公司可能仍然是一個(gè)不小的挑戰(zhàn),但我們需要聚焦于我們自己的目標(biāo)客戶的實(shí)際需求,并盡一切可能的努力去提升他們的使用體驗(yàn)。

來(lái)源:kdnuggets,雷鋒網(wǎng)編譯

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

對(duì)創(chuàng)業(yè)公司的忠告:這么玩數(shù)據(jù)才不會(huì)死

分享:
相關(guān)文章

編輯

歡迎交流,微信:whl123465
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)