1
雷鋒網 AI 科技評論按:在深度學習仍然需要不少的數學和計算機編程能力的現在,如果突然出現了一個不需要寫任何公式和代碼的深度學習應用開發(fā)平臺,你會是什么感覺?震驚?鄙夷?
Verge 的一篇文章就近距離觀察了這個新的可視化開發(fā)平臺 Lobe,并詢問了領域內的研究者和開發(fā)人員的意見。我們是否應當和他們一樣充滿信心還是抱有疑慮呢?雷鋒網 AI 科技評論全文編譯如下。
Lobe 是一種新型的人工智能開發(fā)工具,它專注于可視化界面而不是編程
許多公司都在努力讓人工智能技術更加易于使用,但是很少有公司能夠做到像 Lobe(http://lobe.ai/)這樣簡單。今年早些時候成立的這個初創(chuàng)公司,為用戶提供了一個簡潔的界面,用戶通過拖拽操作即可從頭開始構建深度學習算法。這個工具的側重點主要是計算機視覺。這意味著如果你想要構建一個能識別不同的盆栽植物,或者可以統(tǒng)計出一棵樹上的鳥的數量的工具,你可以在不輸入任何一行代碼的情況下在 Lobe 中完成所有的工作。
該公司的聯合創(chuàng)始人Mike Mata 告訴《Verge》網站,他們開發(fā) Lobe 系統(tǒng)并不是為了和那些專業(yè)的機器學習人員使用的軟件(如 Pytorch 和TensorFlow)競爭。相反,他們是想要為業(yè)余愛好者提供一個簡單的構建深度學習算法的方式。Matas說:「人們往往在機器學習領域由自己想要嘗試的一些想法,但是并不是所有人都有正確的方式構建原型系統(tǒng)」。Lobe 讓這些業(yè)余愛好者在沒有受過任何訓練的情況下邁出了第一步,使得深度學習相對于從建筑學到天文學等各個領域的專業(yè)人士的準入門檻更低。Matas 補充道:「我們希望具備更廣泛的吸引力」。
為了驗證以上的說法,本文作者自己動手嘗試了一下 Lobe。作者構建了一個通過攝像頭識別拼字游戲的深度學習算法。如果我們向攝像頭展示一個字母「a」,機器就會說出「a」;如果向它展示字母「b」,機器則會說出「b」,以此類推。(這是具有開創(chuàng)性的工作。)為了做到這一點,我們只需要完成大多數機器學習應用程序的通用步驟。首先我們需要收集數據集(拼字游戲的圖片),對數據進行標注(將數據按照字母分到不同的文件夾中),接著讓神經網絡仔細檢查每一張圖片,然后慢慢學習構成每個字母的形狀。
用 Lobe 構建這種應用程序真是再簡單不過了!你不需要下載任何東西,只需要在你的瀏覽器中加載 Lobe.ai,通過谷歌賬號登陸,你就可以開始進行這項工作了。你可以選擇一個模版(在這種情況下,使用預訓練好的標簽和圖像進行匹配),從你的桌面將數據加載進去,然后讓這個模版為你處理信息。目前還只有少量幾個可供選擇的模版,但是Lobe 的創(chuàng)建者說它們打算通過加入新的神經網絡架構來進行擴展,并且創(chuàng)建一個用戶可以分享它們的最佳模型的社區(qū)。
神經網絡的不同部分在屏幕上以方框的形式顯示出來(這種方框被大家自然地稱作「lobes」),這些方框通過線條連接成一個類似于流程圖的結構。你還可以查看每個節(jié)點的「內部」結構,并調整它們處理數據的方式。當你完成這些組織工作后,你可以將最終得到的模型導出到不同的平臺上,包括谷歌的 TensorFlow 和蘋果在 iOS 上運行的 CoreML。
Lobe.ai 目前還處于測試階段,所以在設計中還存在一些粗糙的補丁和許多不直觀的細節(jié)。但是它整體的外觀和感覺還是很炫酷的,令人印象深刻,這有一部分歸功于 Matas 的背景。作為一名商業(yè)設計師,他曾任職于蘋果公司,為第一代 iPhone 和第一代iPad 完成了用戶界面的設計工作。之后,他轉投到 Nest 公司,為公司的恒溫器產品進行設計來;再接下來,他在 Facebook 和他的團隊一起開發(fā)了一款顏值超高(但注定要失?。┑拿麨椤窹aper」(https://www.theverge.com/2014/2/3/5373488/facebook-paper-app-review)的應用。
在構建我們的拼字游戲探測器時,我一開始確實遇到了一些困難(主要原因是沒有給系統(tǒng)輸入足夠的數據),但是通過反復地修修補補、調整模型,這些問題得到了解決。不久之后,我在瀏覽器中運行出了一個拼字游戲識別程序。
我的拼字游戲探測器簡單易構建。
很明顯,我所構建的系統(tǒng)是相當簡單的。但是我們也要看到,這種技術是十分具有潛力的,不要把它看作人工智能應用。不妨將它想象為一只在家中訓練好的聽話的猴子,你已經教會了它識別你選擇的視覺線索。只要猴子發(fā)現了你要求它尋找的東西,它除了發(fā)出「eee eee eee」的叫聲,啥也做不了!但是有這樣一只猴子還是很方便的。有了合適的訓練素材和一點點耐心,你可以教它做各種各樣有用的事情,比如識別出惡性的痣和良性的痣之間的區(qū)別;或者觀察嬰兒監(jiān)控器,看看你的寶寶是否從嬰兒床中跑了出來。如果你講音頻信號轉化成了視覺數據的格式來表示聲波,你甚至可以讓猴子識別出不同的聲音。是的,這都是我們可以使用 Lobe 構建的真實應用程序。
當然,盡管 Lobe 通過其簡單易用的特性吸引了機器學習的業(yè)余愛好者,這也并不意味著它就沒有缺陷。一些專家爭論道,這樣的工具對這個學科進行的扁平化處理是沒有益處的,它知識使用可視化的替身代替了編程的過程,但實際上并不能教會用戶如何構建高質量的算法。Jeremy Howard 是一位數據科學家和企業(yè)家,也是 Fast.AI 的聯合創(chuàng)始人,這是一個通過工具和教程使人們更容易使用深度學習技術的研究實驗室。他說,他早就預見到了這一切!
Howard 說道:「出于某種原因,每個一兩年,就會有人出來設計一個機器學習訓練系統(tǒng),這樣的系統(tǒng)的功能包括從工具箱中拖拽出方框,然后用線條將他們連接在一起。我還不是十分明白為什么構造這樣的系統(tǒng)會如此吸引人,但事實就是如此」?!高@樣的系統(tǒng)往往會受到一定程度的關注,因為專業(yè)社區(qū)之外的人認為這些工具讓機器學習變得更加簡單易用了,但是事實上它們并沒有做到這一點?!?/p>
Howard 說,這樣的可視化界面并沒有太大意義;這樣構建深度學習系統(tǒng)的過程在本質上和編寫代碼是一樣的。但是它卻比編程「更加笨拙,更加費時,而且你一次性地從屏幕上看到的信息更少。」他指出,要想構建最基礎的應用(就像我設計的拼圖游戲探測器)之外的任何東西,你仍然需要知道:「你想要使用哪些組件」,「如何將他們連接在一起」這樣的技術細節(jié)。但是由于 Lobe 這樣的工具將這些信息封裝在了方框和連接線中,這些信息就不像在代碼中那樣容易獲知了?!?strong>數據科學的難點不在于打字!」Howard 說道。「難的是知道應該寫些什么。」
他還建議,Lobe 的一些更加復雜的設定是出于美觀的考慮,而不是實際的功能性?!杆鼈兛梢燥@示出你改變了模型架構,但事實上并沒有人手動編寫了架構」Howard 說道?!高@種通過把數字輸入方框構建深度學習模型的想法說明它們完全不知道人們需要做的是什么?!?/p>
如果你贊同 Howard 對Lobe 的批評,那么 Lobe 似乎是一種過于復雜的讓人們開始構建機器學習模型的方式。(與其他免費的類似產品相比,Lobe 可能會付費使用,盡管 Matas 說價格還沒有最終敲定。)但是即使像這樣的可視化工具只是現有軟件的一個皮膚,它們仍然是有其價值的。如今代碼的流行的文化形象——那些不停滾動的,無窮無盡的難以理解的符號——是一種讓人生畏的形象。Lobe 使人們開始構建機器學習模型的過程不再那么可怕,反過來說,它也可以幫助那些從最新的機器學習技術中受益的專業(yè)人士。
Jean-olivier Irisson 是這種現象的一個很好的例子。作為位于「Villefranche-sur-Mer,」的法國海洋學實驗室的助理教授,Irisson 在接受Verge 采訪時說,他對編程并不是一無所知,但是他在使用Lobe 之前對于深度學習并沒有一個直接的經驗?,F在他是Lobe 的封閉測試人員中的一份子,并且正在使用該公司的軟件幫助實驗室對浮游生物圖片進行分類。
Irisson 說,他和她的同事們都意識到新的深度學習技術的性能會在他們的領域超越傳統(tǒng)的方法。「但是深度學習目前的發(fā)展速度是我們這些非專業(yè)人士跟不上的。」他說 Lobe 意味著:他可以在不用購買新的硬件或掌握新的編程框架的情況下,開始使用最新的神經網絡架構。他說:「它讓我專注于閱讀論文,理解概念,并且應用到那些我認為前景光明的方向上去」。
與本文作者一樣,Irisson 說他發(fā)現 Lobe 用戶界面的某些部分還存在一些問題。但我們在這里需要再次強調的是,現在我們使用的僅僅是測試版的軟件??偟膩碚f,他認為,這種體驗是非常直觀的。他通過電子郵件對 Verge 網站說:「我認為 Lobe 這樣的工具可以幫助非專業(yè)人士打開神秘的『黑箱』(深度學習模型通常被認為是一種黑箱模型),并且理解它們,Lobe 實實在在地幫助了我」。
這似乎與 Matas 對 Lobe 的愿景是吻合的:這是一款幫助人們盡可能快地開始構建人工智能應用的工具。Matas 說道:「如果你對某件事已經有了一個概念,并且你擁有訓練數據,你可以通過Lobe 很快地訓練一個機器學習模型」。「如果它可能利用你所擁有的1000 個樣本能夠訓練出很好的結果,你可以找到能夠進行提升的地方,并且這會給你繼續(xù)前進的動力」。
如果說人工智能技術真的要改變世界,那么很顯然,參與到其中的人越多越好——尤其是科技界外的人。有些科學領域的專業(yè)人士可能認為自己沒有時間學習編程,但是它們可以在瀏覽器中構建這種模型從而獲得某種研究的感覺。從這一點上來說,Lobe 看上去就像是一個完美的為機器學習革命打 call 的宣傳工具!
via verge,雷鋒網 AI 科技評論編譯
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。