Lecture 12:领域自适应(Domain Adaptation)概述

Lectured by HUNG-YI LEE (李宏毅)

Recorded by Yusheng zhao(yszhao0717@gmail.com


Lecture 12:领域自适应(Domain Adaptation)概述Domain ShiftDomain AdaptationDomain Adversarial TrainingLimitationOutlookDomain Adaptation另外几种情景


在完成一个分类器的训练的过程中,会发生训练资料和测试资料差异过大的现象;从而导致未知资料上的泛化误差过大。

image-20220410225641437

这个问题叫做Domain Shift: Training and testing data have different distributions

为了克服/削弱Domain Shift,我们提出了Domain Adaptation这个技术(也可以看作是迁移学习transfer learning的一种/环节)

A任务上学到的技能可以用在B任务上

所谓Domain Adaptation:就是训练集上一个domain,测试集上另一个domain,你要把前者的domain学到的资讯用到另一个domain上

Domain Shift

两者可能性:

以下的内容我们默认训练集来自Source Domain,测试集来自Target Domain

Domain Adaptation

情景描述如下:

我们有一堆训练资料,来自Source Domain,且资料是有标注的(labeled)image-20220410231641932

为了把在训练资料上得到的domain用在测试资料上,我们必须要对测试资料上的即target domain有一些了解——随着了解程度不同,我们有不同的Domain Adaptation的方法。

image-20220410231859890

第三个情景的Basic Idea:

image-20220410233105576

我们想要找一个Feature Extractor,这个也是一个network,吃一张图片为输入,输出一个vector(feature)。虽然Source Domain和Target Domain表面上看起来不一样,而Feature Extractor作用就是丢掉不一样的部分,保留两个domain相似的部分。以上图为例,Feature Extractor需要学会忽视颜色(ignore colors),即把颜色的资讯滤掉。然后,我们就可以在Source Domain上用feature训练一个模型,就可以直接用在Target Domain上。

Domain Adversarial Training

找到Feature Extractor的方法:(假s设一个classifier有10层)——最basic的想法

结果:image-20220411202405884

Limitation

image-20220411202437775

我们更希望右边的状况而避免左边这个……怎么做👇

Outlook

image-20220411203410626

关于这个问题,我们可以参见Universal domain adaptation这篇文章。

Domain Adaptation另外几种情景

image-20220411204338627

你的Target Domain不仅没有label而且量少,如此将Target和Source Domain去align一起非常困难。一种解决这个情景的方法就是Testing Time Training

更严峻的情况——对Target Domain一无所知;这时候我们的任务称之为Domain Generalization。分两种情况:


image-20220411210121031