基于样本协方差矩阵的多维随机数生成方法-纯粹数学与应用数学.pdf
文本预览下载声明
年 月 纯粹数学与应用数学
第 卷 第 期
基于样本协方差矩阵的多维随机数生成方法
孙梦哲 包研科
辽宁工程技术大学理学院 辽宁 阜新
摘要:对于概率模型未知的多维数据样本容量扩充问题 根据主成分分析原理以及多维
正态分布的性质 讨论并给出了与已知多维样本数据有相同协方差结构的模拟数据生成
算法 并在此基础上给出了变量的离散化处理方法 实现了在小样本数据基础上不改变
变量间协方差结构的样本容量扩充 为小样本条件下的数学建模、检验和分析提供样本
数据支撑
关键词:多维数据 样本协方差矩阵 模拟 离散化处理
中图分类号: 文献标识码: 文章编号:
:
引引引言言言
通常 在各方面条件限制的情况下 由观察或试验得到的样本容量总是有限的 这些容量有
限的样本有可能不足以支撑试验结论的验证或数学模型的建立 因此 当样本容量不够所需时
有必要通过模拟样本数据来扩充样本容量
对于一维样本数据的模拟 大致可分为两种情形 一种是在概率模型和先验知识已知的情
况下 生成与样本数据同分布的模拟数据 此类问题属于经典的蒙特卡洛模拟问题 相关论述与
文献资料 较为丰富 较为权威的书籍如参考文献 另一种情形是对动态时间序列的模
拟 此类问题的相关讨论也较为充分 此类问题的共同技术特征是先提取出时间序列的趋势特
征、周期性特征等 之后再通过适当的加噪技术生成模拟数据
然而 多维样本数据的模拟问题就复杂多了 文献中偶有讨论 且模拟过程多集中在几种特
定类型的概率分布模型下进行 同样 在概率模型和先验知识未知的情况下 如何模拟出满足
问题所需的样本数据 目的或旨意明确的文献较为匮乏 本文研究在已有样本数据的基础上生
成模拟数据 使其在容量扩充的同时 保证模拟数据的协方差结构与样本数据的协方差结构一
致,即协方差矩阵统计相等
收稿日期:
基金项目:国家自然科学基金
作者简介:孙梦哲 硕士生 研究方向:数据分析
第 期 孙梦哲等 基于样本协方差矩阵的多维随机数生成方法
样样样本本本数数数据据据的的的模模模拟拟拟原原原理理理
本文借鉴平稳随机过程研究 以正态过程为“模特”的思想方法 在确保模拟数据与样本
数据协方差结构统计相等的条件下 赋予模拟数据以正态性 方便进一步的统计分析
问问问题题题的的的数数数学学学描描描述述述
设 维随机向量 · · · 其协方差矩阵 是非对角阵 通常 模拟生成容
量为 的 的样本数据矩阵时 一般未知
( )
设 是已知的容量为 ≥ 的 的样本数据矩阵 样本协方差矩
阵为 样本均值向量为 显然
本文讨论由线性变换 和 生成容量为 的 的模拟数据矩阵
( )
显示全部