丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給AI研習社-譯站
發(fā)送

0

第二彈!CS231n 2017中文字幕視頻:如何訓練機器進行視覺識別?

本文作者: AI研習社-譯站 2017-11-17 11:35
導語:11月10日正式開課,每周五更新,預計持續(xù)12周!

雷鋒網:CS231n 2017雙語字幕版獨家上線!Lecture 2 | Image Classification 更新了!

2017春季CS231n中文版終于上線,課程中文版已經在AI慕課學院(mooc.ai )發(fā)布( free free free ),11月10日正式開課,每周五更新,預計持續(xù)12周!

雷鋒網中文版課程鏈接:http://www.mooc.ai/course/26

什么是CS231n 2017?

CS231n 的全稱是 CS231n: Convolutional Neural Networks for Visual Recognition,即面向視覺識別的卷積神經網絡。

該課程是斯坦福大學計算機視覺實驗室推出的課程。需要注意的是,我們這次翻譯的是 2017 春季(4 月至 6 月)的最新版本。

雷鋒網引用課程主頁上的官方課程描述如下:

計算機視覺已經在我們的社會中無處不在,并廣泛運用在搜索、圖像理解、應用程序、測繪、醫(yī)藥、無人機和自動駕駛汽車等領域。這些應用程序的核心技術是視覺識別任務,如圖像分類、圖像定位和圖像檢測。近期,神經網絡(又名 “深度學習”)方法上的進展極大地提高了這些代表最先進水平的視覺識別系統(tǒng)性能。

本課程深入探討深度學習架構的細節(jié)問題,重點學習視覺識別任務(尤其是圖像分類任務)的端到端學習模型。在為期 10 周的課程中,學生將學習如何實現、訓練和調試自己的神經網絡,并建立起對計算機視覺領域前沿研究方向的詳細理解。最后的任務將涉及訓練一個有數百萬參數卷積神經網絡,并將其應用于最大的圖像分類數據庫(ImageNet)上。

我們將著重教授如何設置圖像識別問題,學習算法(例如反向傳播),用于訓練和微調(fine-tuning)網絡的工程實踐技巧,引導學生完成實踐作業(yè)和最終課程項目。本課程的大部分背景知識和素材都來源于 ImageNet Challenge 競賽。

Lecture 2 | Image Classification 圖像分類內容提要

Lecture 2 | Image Classification 由 Justin Johnson授課 ,帶著同學們一起討論了數據驅動方法、K-最近鄰算法、線性分類,深層次地了解算法是如何運行的,關注各類算法的技術細節(jié)。導師還布置了第一次課程作業(yè),需要同學們在看完本期視頻后,學著完成 K-最近鄰分類器、線性分類器(SVM,Softmax)、兩層神經網絡、提取圖像特征集,作業(yè)通過Python+Numpy完成。不會Python和Numpy的新手們,要盡快開始學習,他們特地寫了個教程教你入門上手。

聊完作業(yè)和工具,開始進入正題, Justin重點講了以下幾個問題:

Q1:我們怎么研究圖像處理的任務?(計算機視覺中真正核心的任務)

Justin:簡而言之,就是通過數據。當你做圖像分類時,分類系統(tǒng)接收一些輸入圖像(比如阿貓阿狗),并且系統(tǒng)已經清楚了一些已經確定了的分類或者標簽,這里有一些設定了好了的分類標簽數據集,那計算機的工作就是看圖片,并且給它分配其中一些固定的分類標簽。這對于人類來說,太簡單不過了,但是對于機器而言,真的是一個非常非常困難的問題。計算機呈現圖片的方式其實就是一大堆數字,所以圖像可能就是800*600的像素,像素會給出紅、綠、藍三個值。所以這是一個巨大的數字陣列。

Q2:哪些發(fā)展推動了圖像識別問題的實現?

Justin:數據驅動的方法。抓取大量圖片數據集,機器會搜集所有數據用某種方式總結然后生成一個模型,識別不同類的對象的核心要素,然后用模型來識別新的圖片。我們的接口需要寫兩個函數,一個是訓練函數(接收圖片和標簽,輸出模型),一個是預測函數(接收模型,對圖片種類預測),正是運用了這種方法,過去十幾二十年里,圖像識別領域的進步非常之大。這種數據驅動類的算法比深度學習更廣義的一種理念。

Q3:訓練機器進行視覺識別的過程是什么?

Justin:單純記錄所有的訓練數據,數據集會不斷尋找新的圖片,給出新的標簽。比如,CIFAR -10訓練數據集,其中就有5W訓練圖,1W測試圖。右欄Test images and nearest neighbors圖中,左側是測試圖,右側是訓練圖,訓練圖中會顯示與測試圖最接近的圖片。特殊情況下,我們如何來對比兩幅圖片呢?這就要選擇比較函數了。我們用了L1距離(又稱為“曼哈頓距離”),對單個像素進行比較,只取測試圖(左上角的像素)- 訓練圖(相應的左上角像素)的絕對值,就是兩幅圖的像素差別??梢园l(fā)現兩幅圖中有456處不同。(這里使用的是Numpy提供的向量運算,只需要一兩行Python代碼,用于最近鄰算法,就能實現)

Q4:在訓練集中,訓練和測試的過程可以多快呢?

Justin:所需的時間是,存儲數據的時間(恒定)+比較訓練圖和測試圖時間(慢)。一般來說,訓練過程在數據中心完成的(快),測試過程是在手機、瀏覽器其它低能耗的設備上完成的(慢),這種方式相當落后。為了讓速度加快,我們選擇卷積神經網絡和其他參數模型,讓測試過程加快。使用了最近鄰算法。

Q5: 我們想訓練圖像分類算法,具體怎么操作?

Justin:我們常見的做法,是把數據分為三組,大部分數據作為訓練集,然后再建立一個驗證集和測試集,在訓練集上用不同的超參來訓練算法,在驗證集上進行評估,然以后再用超參,來選擇在驗證集上表現最好的,再把這組驗證集上表現最佳的分類器拿出來在測試集上跑一跑,這才是你要寫到論文中的數據。這個數據告訴你,你的算法在未見的新數據上表現如何。記得,要分隔驗證集和測試集,通常到最后一刻我們才會接觸到測試集。

Q6:線性分類是什么?

Justin:線性分類是一種非常簡單的學習算法,可以幫助我們建立起整個神經網絡和卷積網絡。神經網絡就像玩樂高,你可以擁有不同種類的神經網絡組件,并且可以將這些組件組合,來構建不同的大型卷積網絡,它是我們在不同類型的深度學習應用程序中,看到的最基本的構建塊之一。卷積神經關注圖像,而循環(huán)神經關注語言,我們可以把這兩個網絡放在一起,再一起訓練,最終得到一個超級厲害的系統(tǒng)。深層神經網絡像樂高玩具,而線性分類器就像這個巨大網絡中的基礎模塊。這是線性分類器的基本工作原理。

以上是Lecture 2 | Image Classification的重點內容,當然導師還具體回答了同學們的提問,詳細解答了K-最近鄰算法、線性分類器的相關技術細節(jié)。

為了方便大家交流,AI研習社專門開辟了社區(qū)供大家交流。在社區(qū)中,目前支持大家提問/回答,以及發(fā)布文章,可以插入圖片、視頻、超鏈接、代碼塊、公式編輯器,歡迎大家在社區(qū)中進行更多形式的交流~社區(qū)地址:www.mooc.ai/bbs 

現在我們誠摯邀請正在學習CS231n課程的小伙伴來講解這門課的課后作業(yè),這門課共有3個 Assignments 以及1個 Final Project ,你可以選擇其中一個或幾個來進行分享講解~詳情鏈接:http://cs231n.github.io/

目前雷鋒字幕組還有許多優(yōu)秀AI課程仍在翻譯中,希望和我們一起翻譯學習進步,歡迎微信聯(lián)系 julylihuaijiang,加入我們。

第二彈!CS231n 2017中文字幕視頻:如何訓練機器進行視覺識別?

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

第二彈!CS231n 2017中文字幕視頻:如何訓練機器進行視覺識別?

分享:
相關文章

知情人士

AI研習社(yanxishe.com)譯站頻道,傳播前沿人工智能知識,讓語言不再成為學習知識的門檻。(原雷鋒字幕組)
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說