Skip to content

Commit 7df0c7b

Browse files
committed
commit files
1 parent 231c406 commit 7df0c7b

72 files changed

Lines changed: 5494 additions & 2 deletions

Some content is hidden

Large Commits have some content hidden by default. Use the searchbox below for content that may be hidden.

README.md

Lines changed: 61 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -1,2 +1,61 @@
1-
# transferlearning-tutorial
2-
《迁移学习简明手册》
1+
# 《迁移学习简明手册》
2+
3+
这是《迁移学习简明手册》的LaTex源码。主要目的是方便有兴趣的学者一起来贡献维护。
4+
5+
### 下载
6+
7+
下载地址:[V1.0版本](http://jd92.wang/assets/files/transfer_learning_tutorial_wjd.pdf)
8+
9+
### 编译方式
10+
11+
在任何装有较新版TexLive的电脑上,使用`xelatex`方式进行编译。
12+
13+
### 主要文件介绍
14+
15+
以下是本手册的主要文件与其内容介绍:
16+
17+
| 章节 | 名称 | 文件名 | 内容 | 状态 |
18+
|:----------:|:--------------------------:|:---------------------:|:----------------------------------:|:----:|
19+
| 主文件 | .. | main.tex | 题目、摘要、推荐语、目录、文件组织 | V1.0 |
20+
| 写在前面等 | .. | prefix.tex | 写在前面、致谢、说明 | V1.0 |
21+
| 第1章 | 迁移学习基本概念 | introduction.tex | 迁移学习基本介绍 | V1.0 |
22+
| 第2章 | 迁移学习的研究领域 | research_area.tex | 研究领域 | V1.0 |
23+
| 第3章 | 迁移学习的应用 | application.tex | 应用 | V1.0 |
24+
| 第4章 | 基础知识 | basic.tex | 基础知识 | V1.0 |
25+
| 第5章 | 迁移学习的基本方法 | method.tex | 四类基本方法 | V1.0 |
26+
| 第6章 | 第一类方法:数据分布自适应 | distributionadapt.tex | 数据分布自适应 | V1.0 |
27+
| 第7章 | 第二类方法:特征选择 | featureselect.tex | 特征选择 | V1.0 |
28+
| 第8章 | 第三类方法:子空间学习 | subspacelearn.tex | 子空间学习法 | V1.0 |
29+
| 第9章 | 深度迁移学习 | deep.tex | 深度和对抗迁移方法 | V1.0 |
30+
| 第10章 | 上手实践 | practice.tex | 实践教程 | V1.0 |
31+
| 第11章 | 迁移学习前沿 | future.tex | 展望 | V1.0 |
32+
| 第12章 | 总结语 | conclusion | 总结 | V1.0 |
33+
| 第13章 | 附录 | appendix.tex | 附录 | V1.0 |
34+
35+
所有的源码均在`src`目录下。其中,除去主文件`main.tex`外,所有章节都在`chaps/`文件夹下。
36+
37+
所有的图片都在`figures/`文件夹下。推荐实用eps或pdf格式高清文件。
38+
39+
参考文件采用`bibtex`方式,见`refs.bib`文件。
40+
41+
### 未来计划
42+
43+
- [ ] 丰富和完善现有的V1.0
44+
- [ ] 单独写一章介绍基于实例的迁移学习方法(instance-based),以及相关的instance selection method,如比较经典的tradaboost等
45+
- [ ] 深度和对抗迁移学习方法分成两章,再结合有关文献进行补充
46+
- [ ] 上手实践部分增加对深度方法的说明
47+
- [ ] ……
48+
49+
### 参与方式
50+
51+
欢迎有兴趣的学者一起加入,让手册更完善!参与方式:
52+
53+
-[这个issue](https://github.com/jindongwang/transferlearning-tutorial/issues/1)下留言你的Github账号和邮箱,我将你添加到协作者中
54+
- 直接fork,然后将你的修改提交pull request
55+
- 如果不熟悉git,可直接下载本目录,然后将你修改的部分发给我(jindongwang@outlook.com)
56+
57+
然后在下面的贡献者信息中加入自己的信息。
58+
59+
### 贡献者信息
60+
61+
- [@jindongwang](https://github.com/jindongwang) 王晋东,中国科学院计算技术研究所

src/chaps/appendix.tex

Lines changed: 367 additions & 0 deletions
Large diffs are not rendered by default.

src/chaps/application.tex

Lines changed: 70 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,70 @@
1+
\newpage
2+
3+
\section{迁移学习的应用}
4+
5+
迁移学习是机器学习领域的一个重要分支。因此,其应用并不局限于特定的领域。凡是满足迁移学习问题情景的应用,迁移学习都可以发挥作用。这些领域包括但不限于计算机视觉、文本分类、行为识别、自然语言处理、室内定位、视频监控、舆情分析、人机交互等。图~\ref{fig-app-all}展示了迁移学习可能的应用领域。
6+
7+
下面我们选择几个研究热点,对迁移学习在这些领域的应用场景作一简单介绍。
8+
9+
\begin{figure}[htbp]
10+
\centering
11+
\includegraphics[scale=0.42]{./figures/fig-app-all.pdf}
12+
\caption{迁移学习的应用领域概览}
13+
\label{fig-app-all}
14+
\end{figure}
15+
16+
\subsection{计算机视觉}
17+
18+
迁移学习已被广泛地应用于计算机视觉的研究中。特别地,在计算机视觉中,迁移学习方法被称为Domain Adaptation。Domain adaptation的应用场景有很多,比如图片分类、图片哈希等。
19+
20+
图~\ref{fig-app-cv}展示了不同的迁移学习图片分类任务示意。同一类图片,不同的拍摄角度、不同光照、不同背景,都会造成特征分布发生改变。因此,使用迁移学习构建跨领域的鲁棒分类器是十分重要的。
21+
22+
\begin{figure}[htbp]
23+
\centering
24+
\includegraphics[scale=0.42]{./figures/fig-app-cv.pdf}
25+
\caption{迁移学习图片分类任务}
26+
\label{fig-app-cv}
27+
\end{figure}
28+
29+
计算机视觉三大顶会(CVPR、ICCV、ECCV)每年都会发表大量的文章对迁移学习在视觉领域的应用进行介绍。
30+
31+
\subsection{文本分类}
32+
33+
由于文本数据有其领域特殊性,因此,在一个领域上训练的分类器,不能直接拿来作用到另一个领域上。这就需要用到迁移学习。例如,在电影评论文本数据集上训练好的分类器,不能直接用于图书评论的预测。这就需要进行迁移学习。图~\ref{fig-app-text}是一个由电子产品评论迁移到DVD评论的迁移学习任务。
34+
35+
\begin{figure}[htbp]
36+
\centering
37+
\includegraphics[scale=0.4]{./figures/fig-app-text.pdf}
38+
\caption{迁移学习文本分类任务}
39+
\label{fig-app-text}
40+
\end{figure}
41+
42+
文本和网络领域顶级会议WWW和CIKM每年有大量的文章对迁移学习在文本领域的应用作介绍。
43+
44+
\subsection{时间序列}
45+
46+
\textit{行为识别}(Activity Recognition)主要通过佩戴在用户身体上的传感器,研究用户的行为。行为数据是一种时间序列数据。不同用户、不同环境、不同位置、不同设备,都会导致时间序列数据的分布发生变化。此时,也需要进行迁移学习。图~\ref{fig-app-activity}展示了同一用户不同位置的信号差异性。在这个领域,华盛顿州立大学的Diane Cook等人在2013年发表的关于迁移学习在行为识别领域的综述文章~\cite{cook2013transfer}是很好的参考资料。
47+
48+
\begin{figure}[htbp]
49+
\centering
50+
\includegraphics[scale=0.42]{./figures/fig-app-time.pdf}
51+
\caption{不同位置的传感器信号差异示意图}
52+
\label{fig-app-activity}
53+
\end{figure}
54+
55+
\textit{室内定位}(Indoor Location)与传统的室外用GPS定位不同,它通过WiFi、蓝牙等设备研究人在室内的位置。不同用户、不同环境、不同时刻也会使得采集的信号分布发生变化。图~\ref{fig-app-location}展示了不同时间、不同设备的WiFi信号变化。
56+
57+
\begin{figure}[htbp]
58+
\centering
59+
\includegraphics[scale=0.42]{./figures/fig-app-location.pdf}
60+
\caption{室内定位由于时间和设备的变化导致的信号变化}
61+
\label{fig-app-location}
62+
\end{figure}
63+
64+
\subsection{医疗健康}
65+
66+
医疗健康领域的研究正变得越来越重要。不同于其他领域,医疗领域研究的难点问题是,\textit{无法获取足够有效的医疗数据}。在这一领域,迁移学习同样也变得越来越重要。
67+
68+
最近,顶级生物期刊细胞杂志报道了由张康教授领导的广州妇女儿童医疗中心和加州大学圣迭戈分校团队的重磅研究成果:基于深度学习开发出一个能诊断眼病和肺炎两大类疾病的AI系统~\cite{kermany2018identifying},准确性匹敌顶尖医生。这不仅是中国研究团队首次在顶级生物医学杂志发表有关医学人工智能的研究成果;也是世界范围内首次使用如此庞大的标注好的高质量数据进行\textbf{迁移学习},并取得高度精确的诊断结果,达到匹敌甚至超越人类医生的准确性;还是全世界首次实现用AI精确推荐治疗手段。细胞杂志封面报道了该研究成果。
69+
70+
我们可以预见到的是,迁移学习对于那些不易获取标注数据的领域,将会发挥越来越重要的作用。

0 commit comments

Comments
 (0)