0
| 本文作者: 汪思穎 | 2017-11-14 16:59 |
雷鋒網(wǎng) AI科技評(píng)論按,伴隨著最近幾年的機(jī)器學(xué)習(xí)熱潮,遷移學(xué)習(xí) (Transfer Learning)也成為目前最炙手可熱的研究方向。遷移學(xué)習(xí)強(qiáng)調(diào)通過(guò)不同領(lǐng)域之間的知識(shí)遷移,來(lái)完成傳統(tǒng)機(jī)器學(xué)習(xí)較難完成的任務(wù)。它是解決標(biāo)定數(shù)據(jù)難獲取這一基礎(chǔ)問(wèn)題的重要手段,也是未來(lái)更好地研究無(wú)監(jiān)督學(xué)習(xí)的重要方法。
在近日雷鋒網(wǎng) AI研習(xí)社的公開(kāi)課上,來(lái)自中國(guó)科學(xué)院計(jì)算技術(shù)研究所的在讀博士王晉東帶來(lái)了題為《遷移學(xué)習(xí)的發(fā)展和現(xiàn)狀》的分享。
王晉東,現(xiàn)于中國(guó)科學(xué)院計(jì)算技術(shù)研究所攻讀博士學(xué)位,研究方向?yàn)檫w移學(xué)習(xí)和機(jī)器學(xué)習(xí)等。他在國(guó)際權(quán)威會(huì)議ICDM、UbiComp等發(fā)表多篇文章。同時(shí),也是知乎等知識(shí)共享社區(qū)的機(jī)器學(xué)習(xí)達(dá)人(知乎用戶名:王晉東不在家)。他還在Github上發(fā)起建立了多個(gè)與機(jī)器學(xué)習(xí)相關(guān)的資源倉(cāng)庫(kù),成立了超過(guò)120個(gè)高校和研究所參與的機(jī)器學(xué)習(xí)群,熱心于知識(shí)的共享。個(gè)人主頁(yè):http://jd92.wang
分享內(nèi)容:
各位聽(tīng)眾各位同學(xué)大家晚上好,很榮幸收到雷鋒網(wǎng) AI研習(xí)社的邀請(qǐng),這次的主題是《遷移學(xué)習(xí)的發(fā)展及現(xiàn)狀》。

我是中國(guó)科學(xué)院計(jì)算技術(shù)研究2014級(jí)直博生王晉東,主要研究方向是遷移學(xué)習(xí)及其應(yīng)用,下面是我的一些基本資料。今天主要是來(lái)分享知識(shí),歡迎大家批評(píng)指正。

今天主要分為五部分。一是遷移學(xué)習(xí)的基本介紹,即為什么要用遷移學(xué)習(xí);二是遷移學(xué)習(xí)方法的常見(jiàn)分類;三是把遷移學(xué)習(xí)與深度學(xué)習(xí)結(jié)合起來(lái)的研究;四是遷移學(xué)習(xí)的一些最新進(jìn)展;五是學(xué)習(xí)資源的推薦以及總結(jié)。

遷移學(xué)習(xí)基本介紹
先做一個(gè)小小的引子,吳恩達(dá)曾經(jīng)說(shuō)過(guò),遷移學(xué)習(xí)將會(huì)是機(jī)器學(xué)習(xí)的下一個(gè)驅(qū)動(dòng)力。

我們先來(lái)看一下背景:在智能大數(shù)據(jù)時(shí)代,面對(duì)數(shù)據(jù)量以及數(shù)據(jù)類型的不斷增加,需要能快速構(gòu)建具有強(qiáng)泛化能力的機(jī)器學(xué)習(xí)模型。大部分?jǐn)?shù)據(jù)往往沒(méi)有標(biāo)注,收集標(biāo)注數(shù)據(jù)或者從頭開(kāi)始構(gòu)建模型,代價(jià)高昂且費(fèi)時(shí)。這時(shí)候就產(chǎn)生了一個(gè)問(wèn)題:如何基于已有的數(shù)據(jù)和模型,對(duì)新數(shù)據(jù)快速構(gòu)建相應(yīng)的模型?

這個(gè)問(wèn)題引出了遷移學(xué)習(xí),遷移學(xué)習(xí)可以解決上述標(biāo)定數(shù)據(jù)難以獲取的問(wèn)題。
遷移學(xué)習(xí)基本思想是利用學(xué)習(xí)目標(biāo)和已有知識(shí)之間的相關(guān)性,把知識(shí)從已有的模型和數(shù)據(jù)中遷移到要學(xué)習(xí)的目標(biāo)上去,如下圖中所示。目前,遷移學(xué)習(xí)已被廣泛應(yīng)用于機(jī)器學(xué)習(xí)的許多應(yīng)用中。 
從數(shù)據(jù)、模型和應(yīng)用這三個(gè)角度來(lái)說(shuō),遷移學(xué)習(xí)都很有必要。



總的來(lái)說(shuō),遷移學(xué)習(xí)可以減少對(duì)標(biāo)定數(shù)據(jù)的依賴,通過(guò)和已有數(shù)據(jù)模型之間的遷移,更好地完成機(jī)器學(xué)習(xí)任務(wù)。

遷移學(xué)習(xí)常見(jiàn)方法分類
下面是遷移學(xué)習(xí)的集中方法,目前常用的主要是同構(gòu)和異構(gòu)遷移學(xué)習(xí),最常用的是下圖右邊的幾種方法。

先看基于實(shí)例的遷移學(xué)習(xí)方法。假設(shè)是源域中的一些數(shù)據(jù)和目標(biāo)域會(huì)共享很多共同的特征。方法是對(duì)源域進(jìn)行instance reweighting,篩選出與目標(biāo)域數(shù)據(jù)相似度高的數(shù)據(jù),然后進(jìn)行訓(xùn)練學(xué)習(xí)。

下面為大家介紹幾個(gè)經(jīng)典的基于實(shí)例的遷移學(xué)習(xí)方法,方法比較簡(jiǎn)單,容易實(shí)現(xiàn)。

第二是基于特征的遷移學(xué)習(xí)方法。
假設(shè)是源域和目標(biāo)域含有一些公共的交叉特征,方法是通過(guò)特征變換,將兩個(gè)域的數(shù)據(jù)變換到同一特征空間,然后進(jìn)行學(xué)習(xí)。

下面是幾種比較經(jīng)典的方法。

第三種是基于模型的遷移學(xué)習(xí)方法。
特點(diǎn)是模型相同部分直接進(jìn)行遷移,好處是可以直接把已有的模型拿來(lái)用,針對(duì)目標(biāo)任務(wù)做相應(yīng)的修改。

代表工作有下面幾個(gè)比較經(jīng)典的,優(yōu)點(diǎn)是充分利用模型之間的相似性。

最后是基于關(guān)系的遷移學(xué)習(xí)方法,可以由師生關(guān)系類比上下級(jí)關(guān)系,也可以從生物病毒的傳播規(guī)律類比計(jì)算機(jī)病毒的傳播。

假設(shè)是如果兩個(gè)域是相似的,那么它們會(huì)共享某種相似關(guān)系。方法是利用源域?qū)W習(xí)邏輯關(guān)系網(wǎng)絡(luò),再應(yīng)用于目標(biāo)域上。這部分的研究工作比較少。

深度遷移學(xué)習(xí)
下面來(lái)分析深度遷移學(xué)習(xí)。深度學(xué)習(xí)可以學(xué)習(xí)到更魯棒的、泛化能力更強(qiáng)的特征表達(dá),遷移學(xué)習(xí)能學(xué)習(xí)到領(lǐng)域無(wú)關(guān)的特征表達(dá),這和深度學(xué)習(xí)不謀而合,將兩者結(jié)合,能充分利用神經(jīng)網(wǎng)絡(luò)的表達(dá)能力,學(xué)習(xí)域不變的特征表示。

下面看下最近的一些工作,14年有一篇論文探討了神經(jīng)網(wǎng)絡(luò)的可遷移性,橫軸是層數(shù),縱軸是精度。

第二篇也是14年的,這篇文章是在AlexNet的分類器層前加入domain loss層,目前引用量也比較多。

15年發(fā)表的DAN網(wǎng)絡(luò)對(duì)AlexNet網(wǎng)絡(luò)的后三層都進(jìn)行了域適配,還利用了Multi-kernel MMD進(jìn)行距離度量,這是核心的亮點(diǎn)貢獻(xiàn)。

17年的ICML提出了JAN網(wǎng)絡(luò),兩個(gè)核心貢獻(xiàn)如下:一是聯(lián)合適配x和y的分布(JMMD度量),二是在網(wǎng)絡(luò)中加入了adversarial學(xué)習(xí)。

這個(gè)工作加了soft labels,同時(shí)進(jìn)行domain和task transfer,網(wǎng)絡(luò)看起來(lái)比較復(fù)雜,大家可以看原文,也可以看我的專欄鏈接。

ADDA提出用adversarial的思想去進(jìn)行domain adaptation,這篇文章也特別新,代碼也開(kāi)源了。

以上介紹都是我認(rèn)為的比較經(jīng)典的方法,是目前來(lái)說(shuō)在深度遷移學(xué)習(xí)里面比較好的工作。
遷移學(xué)習(xí)的最新進(jìn)展
下面來(lái)談?wù)勥w移學(xué)習(xí)的最新發(fā)展。做遷移學(xué)習(xí)最重要的點(diǎn)是找到相似度,當(dāng)源域和目標(biāo)域相似度減少,如何進(jìn)行成功遷移呢。15年的Transitive transfer learning給我們?cè)谶@個(gè)領(lǐng)域開(kāi)辟了道路。17年的Distant domain transfer learning是對(duì)15年的論文的延伸。

第二個(gè)比較新的進(jìn)展是利用物理學(xué)知識(shí)輔助學(xué)習(xí)任務(wù)。實(shí)驗(yàn)效果是實(shí)線部分,作者的想法非常具有開(kāi)創(chuàng)性。

第三個(gè)是學(xué)習(xí)遷移。我的理解是把遷移學(xué)習(xí)和增量學(xué)習(xí)進(jìn)行結(jié)合,作者提出從已有的知識(shí)里自動(dòng)學(xué)習(xí)比較適合的算法和參數(shù),這個(gè)很有前瞻性,也非常有意義。

學(xué)習(xí)資源推薦及總結(jié)
下面給大家推薦一些學(xué)習(xí)資源,前面是比較經(jīng)典的兩個(gè)綜述,第一個(gè)是楊強(qiáng)老師的。下面也給大家推薦一些比較知名的學(xué)者、會(huì)議、期刊等。最后是我的GitHub,在持續(xù)更新,我的知乎專欄是《小王愛(ài)遷移》,歡迎大家投稿。

今天主要是希望大家了解到遷移學(xué)習(xí),知道遷移學(xué)習(xí)的常用方法,大概了解到深度遷移學(xué)習(xí)以及一些最新的方向。

視頻:
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。