基于深度学习的复杂时间序列分析.pdf
摘要
时间序列分析指对一定时间段内的时间序列数据的特征提取和建模,在宏
观经济学、天文学、海洋学、医学等学科中有着广泛地应用。随着大数据时代
的到来,随着计算机技术在金融、医疗、艺术等各个领域的应用,时间序列数
据越来越频繁地在工作与生活中产生,并且,相较早年的时间序列数据,现在
的时间序列数据具有数据量更大与数据更加复杂的特点。其中数据量地提升一
方面给更复杂的模型的训练提供了条件,另一方面又对算法的效率提出了更高
的要求;而数据复杂程度的提升则意味着传统针对简单时间序列的模型可能不
再适用,需要诸如深度神经网络的模型来处理复杂时间序列。
除了数据量的提升和数据复杂程度的提升外,伴随海量数据而来的数据缺
失也是时间序列研究中所面临的新问题,如何进行劣质复杂时间序列修复与如
何使得复杂时间序列预测算法可以容忍数据缺失都成为了新的研究方向。
秉承“从简单到复杂”的原则,针对数据缺失与算法效率问题,本文首先
就时间序列提出了一种容忍数据缺失的任意时间时间序列预测算法,以高效地
利用含缺失的劣质时间序列训练模型,本文给出了其收敛性的理论界限,并且
利用实验验证了算法的有效性。
再而,在通过对比实验发现传统方法的局限性后,本文利用条件随机场与
循环神经网络,分别以基于Stacking的模型融合和深度学习两种方式提出了复
杂时间序列预测模型,以解决复杂时间序列的预测和修复问题。利用天气数据、
风机组数据等生产生活中的真实复杂时间序列数据,本文验证了算法的效果。
最后,本文将研究目光集中在利用生成对抗网络解决复杂时间序列问题,
在研究生成对抗网络的前沿进展后,本文提出了一种复杂时间序列修复模型,
直接利用缺失数据生成完整数据,并尝试利用生成对抗网络的训练模式对其进
行训练,在真实工业数据上的实验结果表明,该模型相较于基于预测的修复模
型,不仅更加实用,在效果上也有显著提升。
关键词:复杂时间序列;数据缺失;条件随机场;模型融合;深度学习;生成
对抗网络
Abstract
Time-seriesanalysingmeansfeatureextrationandmodelingforacertainperiod
oftime-sereisdata.Ithasbeenwidlyusedinmanyfieldssuchasmacro-economics,
astronomy,oceanographyandmedicalscience.Followingtheageofbigdata,the
time-seriesdatanowadaysaremorelargeinbothnumberofdimensionsandlength
comparedwithformertime-seriesdata.Whichononehandmakesitpossibletouse
morecomplexmodelstohandletheproblems,butontheotherhandrequiresthe
algorithmsbemoreefficient.Besides,thetraditionalmethodsfortime-series
analysingmightnotworkwellresultfromthegrowingcomplexityoftime-seriesdata,
morecomplexmodelslikedeepneuralnetworksmaybesuitableforthiscase.
Inaddtiontothegrowingofcomplexityandlength,masssivedataoftencomes
withmissingobservations,howtorepairingtime-serieswithmissiongobservations
ordirectlylearningfromtime-serieswithmissi