丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能開發(fā)者 正文
發(fā)私信給三川
發(fā)送

0

數(shù)據(jù)咨詢師經(jīng)驗(yàn)之談:90% 的公司并不需要機(jī)器學(xué)習(xí)

本文作者: 三川 2017-03-06 08:44
導(dǎo)語(yǔ):機(jī)器學(xué)習(xí)本是工具,現(xiàn)在卻變成了“趕時(shí)髦”。

編者按:掌握一件工具之前,首先要搞清楚用它做什么。而本質(zhì)是工具的機(jī)器學(xué)習(xí),近年來逐漸演變成一股潮流。

在美國(guó)企業(yè)數(shù)據(jù)方案咨詢師 Eric Brown 看來,當(dāng)下無數(shù)公司置其數(shù)據(jù)資本和實(shí)際問題與不顧,一窩蜂上馬機(jī)器學(xué)習(xí),實(shí)在是荒唐可笑。他特地發(fā)文表達(dá)了對(duì)該現(xiàn)象的批判和反思。雷鋒網(wǎng)編譯。

數(shù)據(jù)咨詢師經(jīng)驗(yàn)之談:90% 的公司并不需要機(jī)器學(xué)習(xí)

Eric Brown

Eric Brown:數(shù)據(jù)科學(xué)家要用數(shù)據(jù)說話。從數(shù)據(jù)上來看:你,和你的公司,并不需要機(jī)器學(xué)習(xí)。

我是認(rèn)真的。

或許你不同意,那么聽我解釋。我說“從數(shù)據(jù)上看”,指的是對(duì)于當(dāng)今世界的絕大多數(shù)公司,機(jī)器學(xué)習(xí)(ML)既非必要也無益處。各公司想要利用 ML 來處理的絕大部分任務(wù),都是十分直接的問題——使用某種形式的回歸即可完美解決。后者或許不是你在高中代數(shù)課上學(xué)到的線性回歸,但仍會(huì)是某個(gè)回歸函數(shù)。雷鋒網(wǎng)了解到,著名經(jīng)濟(jì)學(xué)家 Robin Hanson 最近發(fā)表了相同觀點(diǎn),他在推特上說道:

數(shù)據(jù)咨詢師經(jīng)驗(yàn)之談:90% 的公司并不需要機(jī)器學(xué)習(xí)

“一個(gè)優(yōu)秀的計(jì)算機(jī)專家會(huì)說:大多數(shù)公司以為他們需要先進(jìn)的 AI、ML 技術(shù),其實(shí),他們真的只需要在干凈的數(shù)據(jù)上做線性回歸?!?/em>

這句話中,“干凈的數(shù)據(jù)“是重點(diǎn)。它極度、極度重要,但相當(dāng)多的公司總是在處理數(shù)據(jù)時(shí)忘記、或者忽視這一點(diǎn)。若沒有合格的數(shù)據(jù)質(zhì)量,以及到位的數(shù)據(jù)治理、管理流程和系統(tǒng),有極大的可能性你會(huì)陷入垃圾數(shù)據(jù)陷阱——“向模型輸入的是垃圾,輸出的也是垃圾”。太多數(shù)據(jù)項(xiàng)目如此,結(jié)果不了了之。

大多數(shù)公司并不知道數(shù)據(jù)管理是什么

數(shù)據(jù)咨詢師經(jīng)驗(yàn)之談:90% 的公司并不需要機(jī)器學(xué)習(xí)

我并不是一個(gè)數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量方面的專家導(dǎo)師。但我對(duì)這個(gè)領(lǐng)域有一定的了解——足夠讓我清楚不合格、不到位的數(shù)據(jù)管理是什么樣。況且我經(jīng)常遇到這些情況。在我與公司客戶合作、幫助他們開展新數(shù)據(jù)項(xiàng)目的工作經(jīng)歷中(到現(xiàn)在已經(jīng)變成了主要是討論 ML 和深度學(xué)習(xí)),我問客戶的第一個(gè)問題永遠(yuǎn)是:“告訴我你的數(shù)據(jù)管理流程”。如果對(duì)方不能合理地描述出這些流程,那么很顯然 ML 并不合適——他們還沒有做好準(zhǔn)備。

過去的五年里,我估計(jì)有 75% 的情況下,客戶對(duì)我的數(shù)據(jù)管理問題的回答是:

“ 嗯……我們有一部分?jǐn)?shù)據(jù)存在一個(gè)數(shù)據(jù)庫(kù)里,其他數(shù)據(jù)存在有合法權(quán)限的文件共享里。”

這不是數(shù)據(jù)管理,是數(shù)據(jù)存儲(chǔ)。

如果你或你的公司并沒有高質(zhì)量、干凈的數(shù)據(jù),幾乎可以斷定,你并不適合機(jī)器學(xué)習(xí)(機(jī)器學(xué)習(xí)也不適合你)。搞任何數(shù)據(jù)項(xiàng)目,數(shù)據(jù)管理都是第一步。

如果你有搞數(shù)據(jù)管理

數(shù)據(jù)咨詢師經(jīng)驗(yàn)之談:90% 的公司并不需要機(jī)器學(xué)習(xí)

來找我的公司機(jī)構(gòu)里,有一小部分安排了合格的數(shù)據(jù)管理工作。他們理解對(duì)于好的數(shù)據(jù)、好的分析而言,質(zhì)量、治理和管理有多么重要。如果你的公司也是如此——恭喜你,在這方面你已經(jīng)超過了絕大部分競(jìng)爭(zhēng)對(duì)手。

但我要給你潑點(diǎn)冷水。僅僅因?yàn)橛懈蓛?、高質(zhì)量的數(shù)據(jù),不意味你應(yīng)該/需要搞機(jī)器學(xué)習(xí)。當(dāng)然你可以搞,但大多數(shù)情況下真沒這個(gè)必要。

過去五年向我咨詢過的所有公司里,我會(huì)說:他們?cè)疽脵C(jī)器學(xué)習(xí)解決的問題,有 90% 最后只用了普通回歸方式就完美解決。每當(dāng)我推薦用簡(jiǎn)單的回歸,來解決客戶眼中的“復(fù)雜、高深”問題(雷鋒網(wǎng)?。核麄兿露Q心要研發(fā)多重 ML、DL 模型來對(duì)付),人們總是相當(dāng)驚訝。我也總是不得不向他們解釋,他們可以走機(jī)器學(xué)習(xí)的路線,而且那樣做或許也有價(jià)值。但能搞清楚基礎(chǔ)建模、回歸能為你做什么,ML/DL 是否在一些領(lǐng)域比基礎(chǔ)回歸函數(shù)更好,難道不是一件好事嗎?

你說:我鐵了心要搞機(jī)器學(xué)習(xí)

我還能說啥?那就大膽去做!沒什么能阻擋你一直跋涉到 ML 和 DL 的深水區(qū)。畢竟機(jī)器學(xué)習(xí)有它的用處和舞臺(tái)。只是記?。?strong>在充分了解你的數(shù)據(jù),搞明白“經(jīng)典”方法能為你要解決的難題做到哪一步之前,不要一股腦兒得栽進(jìn)機(jī)器學(xué)習(xí)。

via Eric Brown

相關(guān)文章:

自動(dòng)化機(jī)器學(xué)習(xí)將成為下一個(gè)AI研究主流?聽聽數(shù)據(jù)科學(xué)家怎么說

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

數(shù)據(jù)咨詢師經(jīng)驗(yàn)之談:90% 的公司并不需要機(jī)器學(xué)習(xí)

分享:
相關(guān)文章

用愛救世界
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄