统计学与数据分析交叉学科作业指导书.doc
统计学与数据分析交叉学科作业指导书
TOC\o1-2\h\u6841第一章引言 3
18201.1绪论 3
97541.2统计学与数据分析概述 3
322211.3交叉学科的发展趋势 3
29904第二章数据收集与预处理 4
327582.1数据收集方法 4
37022.2数据清洗与预处理 4
49412.3数据质量评估 4
29485第三章描述性统计分析 5
189613.1常用统计量介绍 5
237593.1.1众数(Mode) 5
116543.1.2平均数(Mean) 5
294373.1.3中位数(Median) 5
175283.1.4四分位数(Quartiles) 5
205643.1.5极值(Range) 5
148553.1.6方差(Variance)和标准差(StandardDeviation) 5
272753.2数据可视化方法 6
40573.2.1直方图(Histogram) 6
154383.2.2条形图(BarChart) 6
243263.2.3散点图(ScatterPlot) 6
181833.2.4箱线图(Boxplot) 6
13343.3统计分布及其应用 6
296983.3.1正态分布(NormalDistribution) 6
183703.3.2二项分布(BinomialDistribution) 6
224073.3.3指数分布(ExponentialDistribution) 6
12463.3.4卡方分布(ChiSquareDistribution) 6
117373.3.5F分布(FDistribution) 7
2837第四章假设检验与推断统计 7
269554.1假设检验的基本概念 7
127004.2单样本与双样本检验 7
86384.2.1单样本检验 7
246484.2.2双样本检验 8
310454.3非参数检验 8
27694第五章回归分析 8
263125.1线性回归模型 8
56765.2非线性回归模型 9
78965.3回归诊断与优化 9
8952第六章多变量统计分析 10
215296.1主成分分析 10
1026.1.1基本概念 10
50896.1.2分析步骤 10
189386.1.3应用领域 11
268866.2聚类分析 11
202356.2.1基本概念 11
322446.2.2常见聚类方法 11
38406.2.3应用领域 11
1206.3因子分析 11
11336.3.1基本概念 11
237846.3.2分析步骤 11
77046.3.3应用领域 12
21393第七章时间序列分析 12
320527.1时间序列的基本概念 12
170457.2时间序列建模方法 12
26337.3时间序列预测 13
3987第八章数据挖掘与机器学习 13
160488.1数据挖掘的基本方法 13
143008.1.1统计方法 13
119068.1.2机器学习方法 13
7668.1.3数据可视化方法 14
326218.1.4关联规则挖掘方法 14
294168.2机器学习算法概述 14
68658.2.1决策树算法 14
97218.2.2支持向量机算法 14
76888.2.3神经网络算法 14
170768.2.4集成学习方法 14
250458.3模型评估与选择 15
4998.3.1交叉验证 15
312988.3.2混淆矩阵 15
214538.3.3超参数调优 15
231588.3.4模型选择准则 15
15498第九章统计模拟与蒙特卡洛方法 15
256839.1统计模拟的基本原理 15
128909.1.1引言 15
107079.1.2随机数 15
188609.1.3模拟过程 16
57619.2蒙特卡洛方法的应用 16
116099.2.1引言 16
106209.2.2蒙特卡洛方法的基本思想 16
23009.2.3蒙特卡洛方法的应用实例 16
278889.3模拟