<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能開發者 正文
      發私信給MrBear
      發送

      0

      Kaggle 冰山圖像分類大賽近日落幕,看冠軍團隊方案有何亮點

      本文作者: MrBear 編輯:汪思穎 2018-04-04 10:31
      導語:計算機視覺入門到精通,可能比你想象的更簡單!

      雷鋒網 AI 研習社按,在日前結束的 Kaggle「Statoil/C-CORE Iceberg Classifier Challenge」(冰山圖像分類大賽)中,由 David Austin 和 Weimin Wang 組成的隊伍一舉拔得頭籌,獲得 25000 美元獎金。據介紹,他們的解決方案能有效應用于實際生活,保證艦船在危險的水域更加安全地航行,降低船和貨物的損傷,避免人員傷亡。

      據 Kaggle 官網介紹,這次冰川圖像分類大賽是 Kaggle 上最火的圖像分類競賽——擁有史上最多參賽隊伍。而在所有數據競賽中,本次比賽熱度位列第 7。

      不久前,外媒對 David Austin 進行了一次深入采訪,在采訪中,他們討論了以下問題:

      • 冰山圖像分類競賽是什么;

      • 冠軍方案中的處理方法、核心算法以及相關技術;

      • 在競賽中遇到的最大的難題及解決方案;

      • 對想參加 Kaggle 比賽的人的建議。

      以下是具體的采訪內容,雷鋒網 AI 研習社編譯整理:

      Kaggle 冰山圖像分類大賽近日落幕,看冠軍團隊方案有何亮點

      圖 1:Kaggle 冰山分類挑戰賽的任務目標是建立一個圖像分類器,將輸入衛星圖像劃分為冰山或者船

      問:你好,David,十分感謝你能接受我的采訪,也恭喜你們在冰山圖像分類挑戰賽中取得第一名的好成績。你是如何對計算機視覺和深度學習產生興趣的呢?

      答:在過去兩年里,我對深度學習的興趣與日俱增。因為我看到人們利用它從數據中獲得了難以置信的結果。我對深度學習領域的前沿研究和實際應用都很感興趣,我認為 Kaggle 是一個非常棒的平臺。通過比賽,我能保持對前沿技術的掌控能力,可以在合適的場景下嘗試新的技術。

      問:你在參加這次比賽之前,在計算機視覺和機器學習領域的學術背景如何?你之前參加過其他 Kaggle 競賽嗎?

      答:大概十年前,我首次接觸機器學習,那時我開始學習梯度提升樹和隨機森林相關知識并將其應用到分類問題中。近幾年,我開始更廣泛地關注深度學習和計算機視覺。不到一年前,我開始參加 Kaggle 競賽,這是提升技能的一種方式,本次比賽是我第三次參加 Kaggle 競賽。

      Kaggle 冰山圖像分類大賽近日落幕,看冠軍團隊方案有何亮點

      圖 2:冰山

      問:能再談談冰山分類挑戰賽嗎?是什么驅使你參加了本次比賽?

      答:冰山分類挑戰賽是一個圖像二分類問題,這個比賽要求參賽者在衛星圖像中將船和冰山區分開來。這項工作在能源勘探領域尤為重要,它讓我們能夠識別并且避開類似浮冰這樣的威脅。

      本次比賽的數據有兩個特別有意思的地方:

      • 首先,數據集規模相當小,訓練集中只有 1604 張圖片。這樣一來,從硬件的角度來說,參與競賽的門檻很低。然而,另一方面,使用有限的數據完成圖像分類任務又是十分困難的。

      • 其次,如果用肉眼去觀察這些圖片,它們看上去就像電視屏幕上出現的「雪花」圖——一堆亂七八糟的噪點。人類用肉眼完全不可能看出來哪些圖像是船,哪些圖像是冰山。

      Kaggle 冰山圖像分類大賽近日落幕,看冠軍團隊方案有何亮點

      圖 3:人眼很難準確判斷輸入圖片是「冰山」還是「船」

      要讓人類僅憑肉眼準確地區分圖片類別十分困難。我認為這是一個很好的契機——測試深度學習和計算機視覺能夠做到人類做不到的事情。

      Kaggle 冰山圖像分類大賽近日落幕,看冠軍團隊方案有何亮點

      圖 4: 冠軍團隊采用集成的卷積神經網絡結構

      問:接下來,讓我們討論稍微技術性一些的問題。能介紹一下你們優勝策略中所使用的數據處理方法、算法和相關技術嗎?

      答:好的,總體上我們的數據處理方法和大多數傳統的計算機視覺問題中所使用的方法很相似。我們都會事先花費一些時間去理解數據。

      使用無監督學習方法是一種我最喜歡的技術,通過學習這些模式,我們可以決定接下來將要使用什么樣的深度學習方法。

      在這個任務中,標準的 KNN(K 最近鄰算法)就能夠識別出幫助定義模型結構的關鍵信號。我們使用了一個十分龐大的卷積神經網絡結構,包含超過 100 個改造過的卷積神經網絡和類似于 VGG 的結構,然后我們使用 greedy blending 策略和兩層結合了其他的圖像特征的集成學習算法將模型結果融合起來。

      這聽起來是個很復雜的方法。但是請記住!這里的目標函數是要最小化對數損失誤差。在這個任務中,我們僅僅像這樣加入了一些模型,因為它們能夠在不發生過擬合的情況下減小對數損失。所以,這又是一個很好的例子,說明了將許多弱機器學習模型集成之后的威力。

      我們最后再次訓練了許多和之前一樣的卷積神經網絡結構,但是這里我們僅僅是使用了一開始通過無監督學習挑選出的原始數據的子集作為輸入,這同樣也提高了我們模型的性能。

      Kaggle 冰山圖像分類大賽近日落幕,看冠軍團隊方案有何亮點

      圖5:過擬合是它們在本次比賽中遇到的最棘手的問題

      問:對于你們來說,本次比賽中遇到的最大難題是什么?

      答:在比賽中最困難的部分當屬驗證模型沒有過擬合。

      說實話,這個數據集對于圖像分類問題來說是相當小的,所以我們擔心過擬合會是一個很大的問題。為此,得確保所有的模型都要經過4折交叉驗證,盡管這會增加計算開銷,但是卻能降低過擬合的風險。尤其是在處理像對數損失這樣非常嚴格的損失函數時,需要時刻注意過擬合問題。

      問:訓練模型需要花費多長時間呢?

      答:盡管我們選用的卷積神經網絡規模巨大,并且在所有的模型訓練過程中都使用了4折交叉驗證,訓練過程僅僅花費了一到兩天。沒有交叉驗證的單個模型可以在幾分鐘內完成訓練。

      問:如果要你選出一項本次比賽中你所使用的最重要的技術或者小竅門,你會選什么呢?

      答:毫無疑問,最重要的步驟當屬預先進行的探索性分析,從而對數據有更好的了解。

      探索性分析的結果表明,有一個圖像數據之外的特征中非常重要,它能夠幫助消除數據中大量的噪聲。

      在我看來,我們在計算機視覺或者深度學習問題中最容易忽視的步驟之一,就是需要事先理解數據,并且利用這些知識幫助我們做出最佳設計選擇。

      現成的算法如今更加易于獲得和引用,我們往往會不假思索、簡單粗暴地將這些算法應用于待解決的問題上。然而我們卻沒有真正想清楚這些算法是不是這一任務的最佳選擇,或者沒有想清楚在訓練之前或之后是否需要對數據進行一些適當的處理工作。

      Kaggle 冰山圖像分類大賽近日落幕,看冠軍團隊方案有何亮點

      圖 6:優勝解決方案用到了 Tensorflow、Keras、XGBoost 框架

      問:本次比賽中,你選擇了哪些工具和程序庫?

      答:就我個人而言,我認為 TensorFlow 和 Keras 是最好用的,因此在處理深度學習問題時,我會傾向于選擇它們。

      至于 stacking 和 boosting 兩種集成學習方法,我使用 XGBoost 去實現,這也是因為我對它很熟悉以及它已經被證實有好的運算結果。

      比賽中,我使用了我的 dl4cv 虛擬環境(這是計算機視覺深度神經網絡中用到的 Python 虛擬環境),并且將 XGBoost 加入其中。

      問:對于初次參加 Kaggle 競賽的新手們,你有什么好的建議嗎?

      答:Kaggle 有著很棒的社區文化,其上的比賽是依靠這個機制運行的。

      社區中有很多供選手進行討論的論壇,也有各種各樣討論的方式。如果參賽選手愿意,他們可以將自己的代碼分享出來。當你試著學習通用的方法并將代碼應用于具體問題上時,這將十分有幫助。

      當我第一次參加 Kaggle 比賽時,我花了幾個小時仔細閱讀了論壇中的文章以及其它高質量的代碼,我發現這是學習的最佳途徑之一。

      問:下一步的打算如何?

      答:目前我手頭上有很多項目要去做,因此我將會忙上一段時間。還有一些 Kaggle 比賽看上去十分有趣,所以之后我很有可能再回來參與到其中。

      問:如果讀者想要和你交流,你的聯系方式是什么呢?

      答:最好方式的話,在我的 LinkedIn 用戶資料中有寫到。大家同樣可以通過 LinkedIn 聯系 Weimin Wang。同時,我會參加 PyImageConf2018,如果大家想要和我當面交流,那時候可以來找我。

      via PyImageSearch

      雷鋒網 AI 研習社編譯整理。

      雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知

      Kaggle 冰山圖像分類大賽近日落幕,看冠軍團隊方案有何亮點

      分享:
      相關文章

      知情人士

      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 亚洲?欧美?人妻| 无玛视频| 策勒县| 亚洲一区二区中文av| √8天堂资源地址中文在线| 成人免费区一区二区三区 | 久草国产视频| 福利在线不卡| 国产一区二区三区色噜噜| 中文无码一区二区不卡av| 久久综合久久综合九色| 桃色91| www.艹| 免费无码又爽又刺激一高潮| 无码中文人妻| 鲁鲁AV| 诸城市| 一本综合丁香日日狠狠色| 国产丝袜极在线| 人妻综合网| 岛国在线无码| 大帝av| 久久国产精品夜色| 无遮挡1000部拍拍拍免费| 中文一区二区| 中文字幕日产乱码中| 91久久精品美女高潮不断| 天天综合天天添夜夜添狠狠添| 九九热在线观看| 久久久久人妻精品一区三寸| 九九热爱视频精品| 18禁美女裸体无遮挡网站| 日本免费精品一区二区三区| aaa少妇高潮大片免费看| 吃奶呻吟打开双腿做受在线视频| 国产午夜一区二区在线观看| 欧美啪啪视频| 国产xxxxxxx| 91视频免费| 国产精品美女| 南城县|