文档详情

统计学复习整理解析.doc

发布:2016-04-28约1.92千字共23页下载文档
文本预览下载声明
1、一组数据中出现次数最多的变量值,称为众数(mode),用M0表示。 2、一组数据排序后,处于中间位置的变量值,称为中位数(median),用Me表示。 3、一组数据排序后处于25%和75%位置上的值,称为四分位数,也称四分点。 4、一组数据相加后除以数据的个数而得的结果,称为均值(mean),也称平均值。 5、各变量值倒数的平均倒数,称为调和平均数(harmonic mean),它是均值的另一种表现形式, 用Hm表示。 6、n个变量值乘积n次方根,称为几何平均数(geometric mean)。 7、非众数组的频数占总频数的比率,称为异众比率(variation ratio),用Vr表示。 8、上四分位数与下四分位数之差,称为四分位差(quartile deviation),也称为内距或四分间距(inter-quartile range),用Qd表示。 9、一组数据的最大值与最小值之差,称为极差(range),也称全距,用R表示。 10、各变量值与其均值离差绝对值(之和)的平均数,称为平均差(mean deviation),也称平均离差,用Md表示。 11、各变量值与其均值离差平方和的平均数,称为方差(variance)。 12、方差的平方根,称为标准差(standard deviation)。 13、变量值与其平均数的离差除以标准差后的值,称为标准分数(standard score) ,也称标准化值或 z 分数。 14、一组数据的标准差与其相应的均值之比,称为离散系数(coefficient of variation),也称变异系数。 15、数据分布的不对称,成为偏态(skewness) 16、对数据分布不对称性的度量值,称为偏态系数。 17、数据分布的平峰或尖蜂程度,成为蜂态(kurtosis)。 18、对数据分布峰态的度量值,称为峰态系数。 19、抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。 20、从含有N个元素的总体中,抽取n个元素作为样本,使得每一个容量为n的样本都有相同的机会(概率)被抽中,这样的抽样方式称为简单随机抽样,也称纯随机抽样。 21、从总体中抽取一个元素后,把这个元素放回总体中再抽取第二个元素,直至抽取n个元素为止。这样的抽样方法称为重复抽样。 22、一个元素后被抽中后不再放回总体,然后再从剩下的元素中抽取第二个元素,直至抽取n个元素为止。这样的抽样方法称为不重复抽样。 23、用来估计总体参数的统计量的具体数值,称为估计量,用符号θ表示。 24、用来估计总体参数时计算出来的估计量的具体数值,称为估计值 25、用样本估计量θ的值直接作为总体参数θ的估计值,称为参数的点估计。 26、在点估计的基础上,给出总体参数估计的一个范围,称为参数的区间估计值。 27、估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为θ,所选择的估计量为θ,如果E(θ)=θ,称θ为θ的无偏估计 28、对同一总体参数的两个无偏估计量θ1和θ2,若D(θ1)D(θ2),称θ1是比θ2更有效的估计量。 29、随着样本容量的增大,点估计量的值越来越接近总体的参数 30、由样本统计量所构造的总体参数的估计区间,称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。 31、如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率,称为置信水平或置信系数。 32、对总体参数的数值所作的陈述,称为统计假设(hypothesis) 33、对总体参数的数值提出某种假设,然后利用样本所提供的信息检验假设是否成立的过程,称为假设检验(hypothesis testing)。 34、通常将研究者想收集证据予以支持的假设称为备(选)择假设(alternativel hypothesis),记作 Hα或 H1 。 35、通常将研究者想收集证据予以反对的假设称为原假设(null hypothesis),或零假设,用H0表示。 36、能够作出拒绝原假设这一结论的所有可能样本取值范围,称为拒绝域。 37、根据样本数据计算出来的,并据以对原假设和备择假设作出决策的某种统计量,称为检验统计量。 38、 众数: 未分组数据的众数:就是次数最多的那个值 分组数据的众数: 中位数:未分组数据 分组数据的中位数: 四分位数: 未分组: 分组: 均值: 调和平均数 几何平均数 异众比率 四位分差 平均差 总体方差与标准差 样本方差与标准差 标准分数(值-平均值 / 标准差) 离散系数 偏态与峰度
显示全部
相似文档