Time Series Classification(TSC) 时间序列分类

时间序列分类定义

定义1: Definition 1
A univariate tie series $X =[x_1,x_2,…,x_T]$ is an ordered set of realvalues.
The length of X is equal to the number of real values T.
一个单变量时间序列$X =[x_1,x_2,…,x_T]$是一个实数值的有序集。X的长度等于实值T的个数。

定义2:Definition 2
An M-dimensional MTS, $X =[X^1, X^2,…,X^M]$ consists of M different univariate time series with $X^i \in \mathbb R^T$.
一个M维MTS, $X =[X^1, X^2,…,X^M]$由M个不同的单变量时间序列组成,其中$X^i \in \mathbb R^T$。

定义3:Definition 3
A dataset $D = {(X_1,Y_1),(X_2,Y_2),…,(X_N,Y_N) }$ is a collection of pairs $(X_i,Y_i)$ where $X_i$ could either be a univariate or multivariate time series with $Y_i$ as its corresponding one-hot label vector.
For a dataset containing K classes, the one-hot label vector $Y_i$ is a vector of length K where each element $j \in [1,K]$ is equal to 1 if the class of $X_i$ is j and 0 otherwise.
一个数据集 $D = {(X_1,Y_1),(X_2,Y_2),…,(X_N,Y_N) }$ 是对$(X_i,Y_i)$的集合,其中$X_i$可以是单变量时间序列,也可以是多变量时间序列。$Y_i$是对应的一个热标记向量。
对于包含K个类的数据集,单热标签向量$Y_i$是一个长度为K的向量,其中类为X时,每个元素$j \in [1,K]$都等于1,如果$X_i$为j,其他为0。

TSC的任务是在数据集D上训练分类器,以便从可能输入的空间映射到类变量值(标签)的概率分布。

时间序列分类的深度学习

$ f_L(\theta_L,x) = f_{L-1}(\theta_{L-1},f_{L-2}(\theta_{L-2},…,f_1(\theta_1,x)))$

feed-forward propagation 前馈传播
transfer learning 转移学习
首先,权值被随机初始化(LeCun et al. 1998b),尽管一个健壮的替代方法是对源数据集使用一个预先训练好的模型,然后对目标数据集进行微调(Pan和Yang 2010)。这个过程被称为转移学习。

MLP
CNN
ESN