<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能開發者 正文
      發私信給三川
      發送

      0

      看一遍你也會做!用英偉達 DIGITS 進行圖像分割(下)

      本文作者: 三川 2017-06-30 11:36
      導語:英偉達的無門檻圖像處理工具。

      看一遍你也會做!用英偉達 DIGITS 進行圖像分割(下)

      雷鋒網按:本文上接看一遍你也會做!用英偉達 DIGITS 進行圖像分割(上)。已閱讀的小伙伴兒可直接跳到教程部分。

      DIGITS 是什么?

      7 月 8 日,英偉達深度學習學院 DLI 線下訓練營即將來到深圳,主題是圖像分類、目標檢測與圖像分割的零基礎開發入門。

      雖然是全球范圍內頂級的 AI 培訓項目,但 DLI 進入中國的時間太晚,中文網頁也才上線沒多久,導致國內開發者只知英偉達的顯卡,卻不知道英偉達有線上、線下的 AI 技術培訓。此前雷鋒網曾撰文介紹過 DLI,詳情戳這里

      閑話少說,本期深圳 DLI 訓練營主要用到 DIGITS 和 TensorFlow 兩個工具。TensorFlow 大家都知道,不必介紹。但對 DIGITS 就很陌生了,它是什么呢?

      DIGITS 是英偉達為普及深度學習開發的圖形化操作界面,簡單易用,旨在幫助初學者跨越入門障礙,迅速上手。因此,DLI 的入門培訓均建議學員從 DIGITS 起步。 

      說白了, DIGITS 就是一個新手工具。但由于 DLI 剛剛進入中國,關于 DIGITS 的教程和信息并不充足,為初學者帶來信息鴻溝。 因此,雷鋒網對這篇英偉達博客發布的官方教程進行了編譯。該教程指導讀者用 DIGITS 5 和 Caffe 進行圖像分割,它脫胎于 DLI 的線上實驗室(online labs)培訓課。后者收費且只用英文授課,并不對非會員開放。但大家能從這篇教程對其了解一個大概。

      更重要的,7 月 8 日深圳的 DLI 線下訓練營,三場主要培訓分別是用 DIGITS 進行圖像分類,用 DIGITS 目標檢測,以及用 TensorFlow 進行圖像分割(了解詳情請點此)。雖然前兩場的內容與本教程并不一致,最后一場的難度比本文高出許多,而且用的是 TensorFlow 而非 Caffe,但這篇教程與 DLI 付費培訓的內容已十分接近。

      感謝三位童鞋朱婷、彭艷蕾與馬曉培編譯本文花費的心血。

      教程:用 DIGITS 5 進行圖像分割(下)

      基于FCN的圖像分割

      前一節展示了如何設計一個FCN ,來預測每個窗口的某個類的概率分布。顯然,窗口的數量取決于輸入圖像的大小、窗口的大小和掃描輸入圖像時窗口之間的步長。理想情況下,一個圖像分割模型將生成圖像中所有像素的概率分布。在實踐中如何做到呢?這里將使用FCN paper上的一個方法。

      當輸入圖像遍歷卷積化的 Alexnet 的連續層時,像素數據的輸入被高效地壓縮成一組粗化的、更高級的特性表征。圖像分割的目的是篡改這些粗化的特征來重建細分類,對輸入中的每個像素都是如此。事實證明,這在解卷積層中很容易實現。這些層執行與卷積層相反的操作:給定了卷積輸出,一個解卷積層會將輸入生成輸出,從而給出過濾器的定義。記住,卷積中的跨層(或池化層)定義了處理輸入時窗口的滑動距離,以此來衡量下游輸出。相反,解卷積層的步幅是衡量上游取樣的輸出。若選擇步幅為4,那么輸出將是4倍大!

      下一個問題是:給定模型中的最終卷積層,需要對其激活做多大幅度的升采樣,才能使輸出與輸入圖像的大小相同?我需要仔細檢查每層并寫下它的縮放因子。一旦每一層都這樣處理,我只需將縮放因子相乘并匯總。讓我們看看第一個卷積Alexnet層。


      看一遍你也會做!用英偉達 DIGITS 進行圖像分割(下)

      conv1的步幅是4,因此縮放因子是1/4。所有層都重復這樣做,我確定了總縮放因子在模型中是1/32,如Table 2中概述那樣。這樣,解卷積層的步幅就是32了。


      看一遍你也會做!用英偉達 DIGITS 進行圖像分割(下)

      出于嚴謹,我不得不說,“在所有的空間維度上,一個步幅為S的卷積層,產生的輸出都是輸入的1 / S”這句話并不是完全正確的。在實踐中,向輸入加入填充P > 0將會增加激活數。相反,使用大小為 K > 1的核(kernels)將會減少輸入端的激活數。在此限制下,如果你為卷積層提供了一個無限長的輸入,輸入/輸出大小的比例在所有的(空間)維度上實際是1 / S。現實中,每一個卷積(池)層的輸出被偏移了(P -(k - 1)/ 2)/ S。 

      例如,考慮conv1:因為這一層在兩側各有100像素的填充,它的輸出比無填充的更大。通過上面的公式,我們可以計算出輸出的每一側在理論上有23.75個額外像素。隨著添加更多層,這會累積起來。通過向后運行圖,可以計算所有層的累計抵消。L1與L2層的組合(i.e. 在Caffe術語中,L2是L1的底層,L1、L2 又分別抵消 O1、O2) 會抵消O2 / F + O1,這里F是L2的累積縮放因子。

      參考表2對那些計算的匯總

      看一遍你也會做!用英偉達 DIGITS 進行圖像分割(下)

      表2:卷積化的Alexnet中,遍布連續層的縮放因子和抵消補償。* 對反卷積層來說縮放因子等于步幅,抵消等于(k - 1)/ 2 p。

      表2表明,通過所有conv1到upscore的層時,神經網絡的輸出被18個像素根據輸入做了相應移動。最后一個分割模型中的技巧,是一個修剪網絡輸出、移除每個邊界上額外的18像素的層。這很容易在Caffe 的 Crop layer 中實現,下面的清單中對這些做了定義。

      你可能會注意到,這個版本的Alexnet的內邊距(padding)比你經常在conv1層遇到的多一點。這背后有兩個原因:一個原因是,產生了更大的初始化偏移,以補償連續層沒有吃進圖像的缺失。然而,主要的原因是網絡以最佳方式處理輸入圖像的邊界 ,以命中網絡可接受域的中心,大概就是這樣。

      現在,我有了從FCN paper復制FCN FCN-Alexnet模型所需的一切。我們可以放松一下,欣賞一些SYNTHIA數據集里的圖像。

      SYNTHIA 數據集

      SYNTHIA數據集最初發表在paper [5]。

      SYNTHIA數據集的樣本圖像見圖9。這些圖像展示了用不同的對象類合成的城市場景,比如不同條件下的建筑物、道路、車輛和行人, 如晝夜。有趣的是,圖片看起來特真實以致于有時候人們會被它們吸引:嗯,第一張圖片上那個在路中間看報紙的人有點反常,這么干很危險。

      看一遍你也會做!用英偉達 DIGITS 進行圖像分割(下)

      在 DIGITS 5.0 中,創建一個圖像分割數據集十分簡單,只需要選中輸入和真實樣本圖像文件夾,點擊“Create”按鍵。DIGITS 支持多種標簽格式,比如畫板圖片(它的標簽圖像中的像素值是彩色畫板的指數)和 RGB 圖片(每種顏色指示一個類)。

      在 DIGITS 中創建數據集之后,你可以探索數據庫在視覺上檢查它們的內容,見圖10。

      看一遍你也會做!用英偉達 DIGITS 進行圖像分割(下)

      訓練模型

      在DIGITS里訓練模型,有數據集和對神經網絡的描述就夠了。如果你覺得用卷積Alexnet太復雜太耗時的話,別煩惱:DIGITS 5.0版有一個模型商店,而且就像你能想象的那樣,FCN-Alexnet可以從這個模型商店里下載!

      但如果你決定要走一條更難的路,去創造自己的模型描述,就可能要找一個合適的權重初始值方案,比如說Kaiming方法(另名MSRA),是目前最前沿的修正流線性單元形式。這個在Caffe里很容易實現,只要加上一個權重過濾器 { type: "msra" }指向你的參數層就好了。如果在DIGITS里用這種方法訓練模型,很有可能得到像圖11的曲線。從圖中可以看出,結果并不盡如人意。驗證集的準確程度在35%的時候達到最高(意思是說只有在驗證數據集里35%的像素被準確地標記出來)。訓練損失跟驗證損失一致,意味著這個網絡(模型)對訓練數據集欠擬合。

      看一遍你也會做!用英偉達 DIGITS 進行圖像分割(下)


      圖11: 用Synthia數據訓練FCN-Alexnet網絡(模型),在DIGITS里面利用隨機權重初始值方法得到的訓練集/驗證集的損失和準確率:藍線--訓練集的損失走勢,綠線--驗證集的損失走勢,黃線--模型結果在驗證集里的準確率

      你可以在一個樣例圖片上試試運氣,讓DIGITS幫你完成圖片分割的可視化。你會發現網絡(模型)會不分青紅皂白的把所有元素都歸類成“建筑物”,就像圖12所示。原來在SYNTHIA數據中,“建筑物”是最具代表性的目標類別,而網絡(模型)只是懶洋洋地進行了學習并把所有圖片元素都標記成了“建筑物”才達到了35%的準確率。那么,一般可接受的處理這種網絡(模型)在訓練集里欠擬合的方法都有哪些呢?

      1. 拉長訓練時間:只觀察損失曲線的走勢,訓練過程貌似達到了最高,然而這很可能沒什么幫助。網絡(模型)很有可能進入了局域最小值而且不能從中脫離出來。

      2. 提高學習率同時減少每批量的大小:這樣做可以鼓勵陷入局域最小值不能自拔的網絡(模型)去探索周圍環境之外的區域,盡管這樣會增大網絡(模型)發散的風險。

      3. 增加模型大小:這種方法可以加大模型的表現力。

      還有一種方法我發現在計算機視覺中應用得非常好:轉化學習。更多請繼續往下讀。

      看一遍你也會做!用英偉達 DIGITS 進行圖像分割(下)


      圖12:圖片分割可視化的樣本展示:網絡(模型)把所有元素都歸類成了“建筑物”。此樣本是利用隨機權重初始值的方法,在DIGITS里用Synthia數據訓練FCN-Alexnet網絡(模型)得到的。

      遷移學習

      你不用非得從隨機初始化權重開始,來訓練一個模型。很多情況下,重新利用網絡(模型)訓練另外一組數據中的得到的認知,會很有幫助。這種方法在計算機視覺里通過CNN網絡(模型)尤其奏效,因為很多低級的特征(線路,拐角,形狀,紋理)可以馬上應用在任意數據中。由于圖片分割是在像素水平下做分類分析,從類似ILSVRC2012這樣的圖片分類數據集里做遷移學習十分合理。利用Caffe這樣做就變得相當簡單---當然需要設立一個或兩個陷阱!

      記得在Alexnet的fc6模型中(圖8),權重的形狀是4096×9216。在FCN-Alexnet的conv6模型中,權重的形狀是4096x256x6x6。這其實是一樣的權重值,但是由于形狀不同,Caffe不能自動把權重轉交到FCN-Alexnet模型里。這個任務可以交給“net surgery(網絡手術)”腳本來履行,腳本例子可以在Github網站里的DIGITS知識庫找到。網絡手術腳本的功能在于把參數從全連接層移植到對應的卷積層里。然而,你會發現從公共的DIGITS模型商店里下載提前訓練好的模型會更簡單一些。圖13展示了模型商店的界面:在“FCN-Alexnet”旁邊,點擊“導入”,DIGITS就會下載提前訓練好的模型。

      看一遍你也會做!用英偉達 DIGITS 進行圖像分割(下)


      圖13:DIGITS模型商店

      你可能會有另外一個顧慮,那就是怎樣初始化早先加入到該文本的升采樣層呢?別忘了,此升采樣層并不是原始Alexnet模型中的一部分。在FCN那篇論文中,作者建議隨機初始化對應的權重,然后讓網絡(模型)學習它們。該篇論文的作者后來意識到,初始化這些權重其實很簡單,通過做雙線性插值,讓升采樣層充當放大鏡就可以了。在Caffe里,這種方法可以通過加上一個權重過濾器 { type: "bilinear" }指向升采樣層來實現。

      利用一個提前訓練好的FCN-Alexnet模型,你會注意到,在檢測圖14這種個別圖像的時候,準確率會快速超過90%。檢測到9個不同的類別,圖形分割結果會變得更有說服力。但你還是會有點失望,因為物體輪廓仍然非常模糊。請繼續往下讀本文的最后一個章節:如何進一步提高分割模型的精確性和準確性。

      看一遍你也會做!用英偉達 DIGITS 進行圖像分割(下)


      圖14:圖片分割可視化的樣本展示。此樣本是利用一個提前訓練好的ILSVRC2012-Alexnet模型,在DIGITS里用Synthia數據訓練FCN-Alexnet網絡(模型)得到的。

      啟用細化分割

      之前加進FCN-Alexnet的升采樣層,把conv7的輸出值擴大了32倍。在實際應用中,這意著對于每個32×32的像素塊,神經網絡會做一次預測。這也就解釋了為啥目標物體輪廓會那么模糊。那篇FCN文章介紹了另外一個非常棒的主意來解決上面的局限:跳過那些被加入的連接層,直接把pool3和pool4的輸出值重新定向到網絡的輸出值上。由于那些匯總層(pool3, pool4)位于網絡的靠后方向,它們就可以在低水平的特征上運作,從而能夠抓到更細致的細節。

      在一個叫做FCN-8s的網絡結構中,那篇FCN文章介紹了一個基于VGG-16的網絡,利用這個網絡,最后輸出結果可以是pool3的總和采樣層×8,可以是pool4的采樣層×2,還可以是conv7的采樣層×4,如圖15所示。這就引導出一種網絡,能夠在更細分的紋路生成預測,向下到8×8的像素塊。

      看一遍你也會做!用英偉達 DIGITS 進行圖像分割(下)


      圖15: FCN-8s跳過連接層的演示圖。來源:FCN文獻

      為了方便使用,用戶可以在公共的DIGITS模型商店里下載一個提前訓練好的FCN-8s。(你肯定不想自己動手卷積VGG-16)如果你用DIGITS在SYTHIA數據上訓練FCN-8s,你會發現僅僅經過幾個epoch(時期),驗證集的準確率就能超越95%。更重要的是,當你在一個樣本圖片上做實驗,觀察DIGITS的高超圖片分割可視化的時候,你會看到更為清晰的物體輪廓,像圖16中那樣。

      看一遍你也會做!用英偉達 DIGITS 進行圖像分割(下)


      圖16: 圖片分割可視化的樣本展示。此樣本是利用DIGITS在Synthia數據上訓練FCN-8s網絡(模型)得到的。

      現在該你了

      讀過本文之后,怎樣開始做圖片分割,你應該心里有譜了。DIGITS 5會在12月份的第一個星期發布。訪問DIGITS網站繼續學習,注冊NVIDIA Developer program賬號,以便下載版本可用時及時收到通知。

      DIGITS在GitHub上是一個可共享的開源項目。如果你想上手實踐圖片分割技術,請直接訪問DIGITS GitHub項目網頁,以便得到源代碼。

      論文索引

      [1] Krizhevsky, A., Sutskever, I. and Hinton, G. E. “ImageNet Classification with Deep Convolutional Neural Networks”. NIPS Proceedings. NIPS 2012: Neural Information Processing Systems, Lake Tahoe, Nevada. 2012.

      [2]  Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, Andrew Rabinovich. “Going Deeper With Convolutions”. CVPR 2015.

      [3] Simonyan, Karen, and Andrew Zisserman. “Very deep convolutional networks for large-scale image recognition.” arXiv technical report arXiv:1409.1556. 2014.

      [4] Long, Jonathan, Evan Shelhamer, and Trevor Darrell. “Fully convolutional networks for semantic segmentation.” Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition 2015: 3431-3440.

      [5] Ros, German, Laura Sellart, Joanna Materzynska, David Vazquez, and Antonio M. Lopez; “The SYNTHIA Dataset: A large collection of synthetic images for semantic segmentation of urban scenes.” Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition 2016: 3234-3243.

      [6] He, Kaiming, Xiangyu Zhang, Shaoqing Ren, and Jian Sun “Delving deep into rectifiers: Surpassing human-level performance on imagenet classification.” Proceedings of the IEEE International Conference on Computer Vision 2015: 1026-1034.

      via nvidia

      相關文章:

      看一遍你也會做!用英偉達 DIGITS 進行圖像分割(上)

      你聽說過英偉達深度學習學院 DLI 嗎?

      雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知

      看一遍你也會做!用英偉達 DIGITS 進行圖像分割(下)

      分享:
      相關文章

      用愛救世界
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 伊人久久大香线焦av综合影院| 男女性高爱潮免费网站| 国产在线拍偷自揄观看视频网站| 日韩成人无码影院| 色婷久久| 成全视频在线观看免费高清动漫 | 星座| 国产香蕉在线视频| 亚洲人成色77777在线观看| 日韩成人综合| 国产福利视频在线观看| 日韩中文字幕免费在线观看| av无码不卡| 九色91| 亚洲国产成人麻豆精品| 人妻少妇亚洲| 亚洲人成网7777777国产| 色噜噜狠狠色综合av| 久久久国产成人一区二区| 69亚洲精品| 产精品视频在线观看免费| 色欲久久久天天天综合网| 亚洲精品久久久无码一区二区| 看亚洲黄色不在线网占| 国产精品A片| 国产亚洲AV电影院之毛片| 免费人成黄页在线观看美国| 亚洲一区二区三区 无码| 亚洲国产超清无码专区| 亚洲精品影视| 三年高清在线观看全集下载 | 亚洲变态另类天堂AV手机版| 欧美色人妻| 欧美成人片一区二区三区| 国产国拍精品av在线观看| 国产AV中文字幕| 久久99热这里只有精品8| 黑人大群体交免费视频| 色伊人亚洲综合网站| 日韩精品极品视频在线观看免费| 欧美黑吊大战白妞最新章节|