1
本文作者: 亞萌 | 2016-09-01 17:49 |
Makoto Koike 原本在日本的一家車(chē)企當(dāng)工程師,大約一年前,他辭去工作回到老家?guī)透改附?jīng)營(yíng)黃瓜農(nóng)場(chǎng)。農(nóng)場(chǎng)并不大,然而給黃瓜分類的工作卻讓 Makoto 吃了不少苦頭。
日本各個(gè)農(nóng)場(chǎng)對(duì)于黃瓜有不同的分類標(biāo)準(zhǔn),并不是我們所想的分個(gè)大小那么簡(jiǎn)單。單是 Makoto 自己家的農(nóng)場(chǎng),同一個(gè)品種的黃瓜的分類就達(dá)了 9 種之多。一般來(lái)說(shuō),顏色鮮艷、刺多、體態(tài)勻稱的才算是好瓜。
以下是令人震撼的 Makoto 家 9 類黃瓜圖表,由上至下質(zhì)量依次遞減。
手里剛摘了一根黃瓜,你得仔細(xì)觀察它的長(zhǎng)短、粗細(xì)、顏色、紋理、是否有小刮痕、彎的還是直的、刺多不多......要跟9類標(biāo)準(zhǔn)對(duì)應(yīng),看它屬于哪一等級(jí),這并不是一個(gè)容易學(xué)的工作。
一個(gè)人要花好幾個(gè)月才能熟練掌握整個(gè)分類標(biāo)準(zhǔn)體系,所以到了采摘旺季,Makoto 家忙不過(guò)來(lái),卻又不能臨時(shí)雇人幫忙。
但是 Makoto 始終認(rèn)為,給黃瓜分類不應(yīng)該是瓜農(nóng)的主要的工作,瓜農(nóng)最重要的任務(wù)應(yīng)該是專注于種植出美味的黃瓜。所以他決定,要把分類的工作交給機(jī)器,但是市面上的黃瓜分類器要么性能差要么太貴,不適合小農(nóng)場(chǎng)。
而這時(shí)他看到了阿爾法狗的圍棋大賽,一下子被人工智能吸引了,萌生了用機(jī)器學(xué)習(xí)造黃瓜分類機(jī)的想法,并開(kāi)始研究谷歌開(kāi)源的 TensorFlow 平臺(tái)。
值得一提的是,使用 TensorFlow,并不需要具備高等數(shù)學(xué)模型、優(yōu)化算法等專業(yè)知識(shí),你只需下載簡(jiǎn)單的代碼,然后閱讀教程,就可以開(kāi)始著手工作了。
這是 Makoto 制作的黃瓜分類機(jī)工作的場(chǎng)景:如果一根黃瓜屬于某一個(gè)品類,小刷子就會(huì)把它推到相應(yīng)的箱盒里。
Makoto 使用樹(shù)莓派 3 作為主控制器,配備一個(gè)相機(jī)拍攝照片。這些照片傳到 TensorFlow 平臺(tái)上,起初在一個(gè)小型的神經(jīng)網(wǎng)絡(luò)上運(yùn)行,以判斷是否是黃瓜。之后,已經(jīng)被判定為黃瓜的照片接著傳輸?shù)揭粋€(gè)更大的基于 Linux 服務(wù)器的神經(jīng)網(wǎng)絡(luò),來(lái)對(duì)黃瓜按照不同的特質(zhì)進(jìn)行分類。
以下是黃瓜分類機(jī)的系統(tǒng)圖:
機(jī)器學(xué)習(xí)首先是需要一個(gè)數(shù)據(jù)庫(kù)的,為了訓(xùn)練這個(gè)模型,Makoto 花了 3 個(gè)月的時(shí)間給它“喂”了 7000張黃瓜照片,這些照片都是由 Makoto 的媽媽分類貼上的標(biāo)簽。
Makoto 測(cè)試時(shí)的準(zhǔn)確率很高,達(dá)到了 95%,但是當(dāng)他真的將這個(gè)系統(tǒng)用于實(shí)踐時(shí),識(shí)別準(zhǔn)確率一下子降到了 70%。Makoto 懷疑是因?yàn)檫@個(gè)神經(jīng)網(wǎng)絡(luò)模型有了“過(guò)擬合”的問(wèn)題,這是數(shù)據(jù)庫(kù)數(shù)據(jù)不足而出現(xiàn)的現(xiàn)象。
另外,深度學(xué)習(xí)所需的計(jì)算量大,而 Makoto 使用典型的 Windows PC 機(jī)來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò),效率比較低。盡管他已經(jīng)事先將所有的照片降低到 80 x 80 像素,系統(tǒng)仍然需要 2-3 天來(lái)完成 7000 張照片的訓(xùn)練。
這樣低分辨率的照片導(dǎo)致的結(jié)果是,系統(tǒng)目前還并不能識(shí)別出顏色、紋理、刮痕和小刺,只能分辨出形狀、長(zhǎng)度和是否彎曲。而如果要提高照片分辨率,系統(tǒng)的計(jì)算量猛增,效率又會(huì)拖慢。
所以 Makoto 目前正打算使用谷歌的云機(jī)器學(xué)習(xí)(Cloud Machine Learning)平臺(tái),來(lái)進(jìn)一步改善他的黃瓜分類機(jī)。
Via Engadget
延伸閱讀:
揭秘TensorFlow:Google開(kāi)源到底開(kāi)的是什么?
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。