文档详情

神经网络预报模型的过拟合研讨.pdf

发布：2017-12-21约1.64万字共8页下载文档

文本预览下载声明

神经网络预报模型的过拟合研究* 金龙况雪源黄海洪覃志年王业宏 ( 广西气象减灾研究所南宁 530022; 广西气候中心南宁 530022; 南京气象学院南京 210044) 摘要针对神经网络方法在预报建模中存在的过拟合 (overfitting)现象和提高泛化性能 generalization capability 问题提出了采用主成分分析构造神经网络低维学习矩阵的预报建模方法研究结果表明这种新的神经网络预报建模方法通过浓缩预报信息降维去噪使得神经网络的预报建模不需要进行适宜隐节点数的最优网络结构试验没有过拟合现象并且与传统的神经网络预报建模方法及逐步回归预报模型相比泛化能力有显著提高关键词神经网络泛化性能过拟合现象预报建模 1 引言 20世纪90年代以来国内外在气象学科中开展了很多有关神经网络预报建模和气候分析等应用研究[1-5] 然而随着神经网络方法在大气科学领域应用研究的不断深入发现人工神经网络方法在实际业务天气预报应用中存在一个最重要的瓶颈问题即在利用神经网络方法进行气象预报建模时对已知训练样本集的学习训练达到什么样的拟合精度才能使预报模型对未知样本具有最好的预报能力该问题的研究不仅关系到在大气科学中能否进一步深入开展有关神经网络方法的业务预报应用并且也是目前人工神经网络应用理论研究中尚未得到很好解决的有关神经网络模型的过拟合和泛化性能的最关键问题[67] 本文针对实际的气象预报问题尝试从如何构造一种能够全面反映预报因子与预报量关系的低维学习矩阵的主动性方法来探讨神经网络的泛化性能和过拟合现象 2 影响泛化性能的因子分析 2.1网络隐层节点人工神经网络在众多学科的应用研究中已在理论上证明一个三层的前馈网络能够实现任意精度的连续函数映射并且人们在神经网络的学习算法方面进行了大量的研究提出了很多关于前馈网络的改进学习算法使得大多数有关问题的神经网络学习精度都能达到要求但是在神经网络的预报建模研究中最关键的问题是关于神经网络预报模型的泛化能力,它在天气预报问题中就是神经网络天气预报模型根据训练样本建立预报模型后对未参加学习训练样本即独立样本的预报能力这显然是神经网络预报模型好坏及该方法能否应用于实际业务预报的核心问题因此如何提高神经网络预报模型的泛化能力成为神经网络理论研究和实际应用研究最为重要的研究课题该问题研究的主要内容包括神经网络的网络结构主要是适宜隐节点数的确定和网络结构的学习算法对泛化性能和过拟合现象的影响研究[8-11] 而一般关于网络结构的影响研究认为网络结构增大容易产生过拟合现象使网络泛化性能下降一般只要在网络收敛的条件下 *国家自然科学基金项目 1 小的网络结构泛化能力强且训练速度快并且认为隐节点数应小于样本数但是在隐节点数小于样本数的情况下怎样确定适宜的隐节点数能使模型的泛化能力达到最大至今没有很好的结论[69 10] 为了寻找泛化性能好的适宜网络结构一些研究工作提出了一些确定适宜隐节点数的原则性计算公式[12] n k Ch (1) i i0 h n m a (2) h log n (3) 2 其中k 为样本数 n 为输入层节点数 m 为输出

显示全部

相似文档