【时间序列】TimeMixer (ICLR2024)
原文链接:TIMEMIXER: DECOMPOSABLE MULTISCALE MIXING
FOR TIME SERIES FORECASTING
代码仓库:https://github.com/kwuking/TimeMixer

符号定义
| 符号 | 含义 |
|---|---|
| P | 用于预测的历史序列长度(seq_len) |
| F | 预测序列长度(pred_len) |
| C | 变量数量(通道数量) |
| M | 划分的尺度数(降采样次数) |
| L | Past Decomposable Mixing的层数 |
Multiscale Mixing Architecture
设输入序列为 X ∈ R P ∗ C X\isin R^{P*C} X∈RP∗C,为获得不同尺度下的时间序列,对原序列进行降采样:
X m ∈ R ⌊ P 2 m ⌋ ∗ C , m ∈ { 0 , 1 , . . . , M } . X_m \isin R^{\lfloor \frac{P}{2^m} \rfloor * C}, m\isin \{0, 1,..., M\}. Xm∈R⌊2mP⌋∗C,m∈{
0,1,...,M}.
简单来说第 2 m 2^m 2m层降采样,就是每隔 2 m 2^m 2m个点取一个点
然后对m层降采样的结果分别进行嵌入(Embed),得到多尺度的时间序列输入。
Past Decomposable Mixing
PDM模块一共有L层,每层的输入为前一层的结果:
X L = P D M ( X L − 1 ) , l ∈ { 0 , 1 , . . . , L } . \mathcal{X}^L = PDM(\mathcal{X}^{L-1}), l\isin\{0, 1,..., L\}. XL=PDM(XL−1),l∈{
0,1,...,L}.
其中, X l = { X 0 l , X 1 l , . . . , X M l } , X m l ∈ R ⌊ P 2 m ⌋ ∗ d m o d e l \mathcal{X}^l = \{X^l_0, X^l_1,...,X_M^l\}, X_m^l \isin R^{\lfloor \frac{P}{2^m} \rfloor * d_{model}} Xl={
X0l,X1l</

3269

被折叠的 条评论
为什么被折叠?



