0
上周,你加入了 Bean 先生的冒險(xiǎn)之旅,學(xué)習(xí)了關(guān)于訓(xùn)練、驗(yàn)證和測(cè)試的基礎(chǔ)知識(shí)。關(guān)于如何成為一個(gè) AI 白癡的規(guī)則自然地遵循這些內(nèi)容,但是讓我明確地為你闡明它們。
圖片來(lái)源于 tenor
到目前為止的故事
在上一集中,你扮演了 Mr. Bean——你的 AI 的耐心教授。既然你越來(lái)越在行了,那就讓你堅(jiān)持下去吧。我常說(shuō),避免應(yīng)用人工智能陷阱的最好方法是永遠(yuǎn)不要忘記學(xué)習(xí)基本的知識(shí),所以我暗地里希望你永遠(yuǎn)保持當(dāng) Bean 教授的思維方式。
永遠(yuǎn)不要忘記學(xué)習(xí)和教學(xué)的基礎(chǔ)!
三個(gè)階段的快速提醒:
訓(xùn)練階段:Mr. Bean 從在課堂上看到的例子中尋找模式,然后將這些模式轉(zhuǎn)換成模型(食譜)。
驗(yàn)證階段:看看 Mr. Bean 的食譜在他沒(méi)有明確研究的例子上的表現(xiàn)。如果分?jǐn)?shù)看起來(lái)不錯(cuò),就讓他去考試,否則就重新開(kāi)啟訓(xùn)練階段。
考試階段:Mr. Bean 參加期末考試,成績(jī)決定是否允許他進(jìn)行實(shí)際生產(chǎn)或換專(zhuān)業(yè)。
訓(xùn)練階段相當(dāng)簡(jiǎn)單,你可以把例子推到學(xué)生身上(把數(shù)據(jù)推到機(jī)器學(xué)習(xí)算法中),并且大多希望是最好的(我只是在開(kāi)玩笑)。進(jìn)一步了解它在這里的工作原理:http://bit.ly/quaesita_emperor 。
在我們列出成為 AI 白癡的方法之前,讓我們從你尊敬的教授的角度來(lái)談?wù)劯⒚畹碾A段——驗(yàn)證和測(cè)試。
驗(yàn)證和測(cè)試之間的細(xì)微差別
如果你只關(guān)心掛掉那些成績(jī)較差學(xué)生,你不需要驗(yàn)證階段,你只需要測(cè)試:可憐的 Mr. Bean 進(jìn)行訓(xùn)練,找到一個(gè)模式(這是一個(gè)愚蠢的模式),沖到你的考試中,結(jié)果考試不及格,并被踢出數(shù)學(xué)專(zhuān)業(yè)。你抓到并處決了一個(gè)無(wú)知的人,干得好!
測(cè)試是關(guān)于把關(guān)的,只有有價(jià)值的人才會(huì)通過(guò)!測(cè)試使你免于發(fā)布?jí)牡脑汀?/p>
好老師幫助學(xué)生進(jìn)步
但你想幫助學(xué)生進(jìn)步的愿望在哪里呢?你想幫助他們變得更好的承諾在哪里?他們的救贖和自我完善的機(jī)會(huì)在哪里?驗(yàn)證,這就是答案。
驗(yàn)證就是救贖,這是一個(gè)讓你振作起來(lái)再試一次的機(jī)會(huì),驗(yàn)證允許你迭代以獲得更好的原型。
如果你真的關(guān)心你的學(xué)生,當(dāng)你發(fā)現(xiàn)他們看起來(lái)很愚蠢的時(shí)候,你會(huì)很難過(guò)的。期末考試的時(shí)候,你是老師還是劊子手?
如果你的最終目標(biāo)是培養(yǎng)合格的學(xué)生,你將需要提供實(shí)踐問(wèn)題(來(lái)自驗(yàn)證數(shù)據(jù)集)來(lái)幫助你的學(xué)生在專(zhuān)業(yè)測(cè)試之前提高。
如何避免成為 AI 白癡?
雖然人工智能項(xiàng)目的領(lǐng)導(dǎo)者可能不必知道他們的工程師和數(shù)據(jù)科學(xué)家所處理的數(shù)學(xué)問(wèn)題,但他們沒(méi)有理由忘記學(xué)習(xí)和教學(xué)的基本知識(shí)。如果你曾經(jīng)考慮過(guò)設(shè)置一個(gè)考試,你已經(jīng)有了大多數(shù)常識(shí)性的工具,你需要防止一些主要的問(wèn)題。這里有幾個(gè)例子。
永遠(yuǎn)不要忘記人工智能就是用例子來(lái)解釋
如果你的例子不好,你應(yīng)該感覺(jué)不好。如果你不給學(xué)生提供足夠高質(zhì)量的例子來(lái)學(xué)習(xí),你怎么能指望他們有效地學(xué)習(xí)呢?哦,如果你給學(xué)生舉一些有偏見(jiàn)的例子,你會(huì)得到一個(gè)有偏見(jiàn)的學(xué)生。那是你的錯(cuò),教授。
從在測(cè)試數(shù)據(jù)上進(jìn)行訓(xùn)練
如果只需要背誦就能通過(guò)考試,那沒(méi)有任何好處。機(jī)器學(xué)習(xí)是為了在新的例子上取得成功——如果你關(guān)心的只是在舊的東西上表現(xiàn)良好的話(huà),就可以跳過(guò) ML/AI 的麻煩,使用一個(gè)查找表就好了。為了保證你評(píng)估的是正確的東西,而不是記憶舊數(shù)據(jù)的能力,確保你的學(xué)生從來(lái)沒(méi)有機(jī)會(huì)學(xué)習(xí)你的任何測(cè)試?yán)印?/p>
不要在期末考試中使用訓(xùn)練或驗(yàn)證數(shù)據(jù),這只會(huì)降低你正確測(cè)試學(xué)生能力的機(jī)會(huì)。
永遠(yuǎn)不要把你的數(shù)據(jù)集弄混
如果在深入研究之前沒(méi)有仔細(xì)地整理和拆分?jǐn)?shù)據(jù),你將如何防止上述問(wèn)題?數(shù)據(jù)拆分是最好的數(shù)據(jù)科學(xué)快速修復(fù)方法。在你開(kāi)始教你的學(xué)生之前,一定要把測(cè)試的例子鎖在一個(gè)安全的地方。
在你確定考試標(biāo)準(zhǔn)之前,千萬(wàn)不要開(kāi)始考試
馬上就開(kāi)始?住手!雖然這一點(diǎn)似乎太明顯了,但你會(huì)驚訝的發(fā)現(xiàn),真正的項(xiàng)目團(tuán)隊(duì)在領(lǐng)導(dǎo)能力薄弱的情況下,往往會(huì)進(jìn)行測(cè)試,然后改變,這樣他們的學(xué)生的成績(jī)就足夠好。不管怎樣,別這樣。
從不重用測(cè)試數(shù)據(jù)
如果你想對(duì)那些堅(jiān)持說(shuō)你不能多次使用一個(gè)測(cè)試數(shù)據(jù)集的統(tǒng)計(jì)學(xué)家翻白眼,那么讓我們?cè)囍昧硪环N方式來(lái)表達(dá):「如果你給同一個(gè)學(xué)生兩次相同的期末考試,不要相信他們第二次的表現(xiàn)?!共灰貜?fù)使用這些試題!
不要跳過(guò)測(cè)試
測(cè)試可以讓你免于災(zāi)難,這是你防止發(fā)布有問(wèn)題原型的保護(hù)措施。如果你真的不在乎它,那么你有勇氣把你的要求的性能標(biāo)準(zhǔn)設(shè)置得很低嗎?如果不能,那就好好測(cè)試。
永遠(yuǎn)不要太相信自己
還有一個(gè)薄弱環(huán)節(jié),那就是你自己,教授。如果你沒(méi)有意識(shí)到你的考試設(shè)置得不好怎么辦?比較少 最好的人也可能犯下這個(gè)錯(cuò)誤。為了以防萬(wàn)一,一定要建立一些安全網(wǎng),以將你沒(méi)畢業(yè)的學(xué)生和外界隔絕。
如何成為 AI 白癡
當(dāng)團(tuán)隊(duì)缺乏熟練的人工智能領(lǐng)導(dǎo)能力,或者當(dāng)他們過(guò)于沉迷于工程的細(xì)節(jié)時(shí),他們的常識(shí)可能會(huì)被忽略。他們可能會(huì)忽略基礎(chǔ)知識(shí),最終發(fā)布真正糟糕的解決方案。幾乎我在現(xiàn)實(shí)生活中看到的每一個(gè)糟糕的 ML/ai 災(zāi)難都可以追溯到上面列表中的一個(gè)條目,所以如果你在尋找 AI dunce 帽子,我給了你一個(gè)很好的錯(cuò)誤列表供你選擇,請(qǐng)自便!
但是,如果你想建立一個(gè)好的,有用的,有效的人工智能解決方案,那么請(qǐng)時(shí)刻記住教授的觀點(diǎn)。關(guān)于幾區(qū)學(xué)習(xí)教學(xué),就這些了!
via:https://towardsdatascience.com/how-to-be-an-ai-idiot-8559c65d91a8
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。