文档详情

非参数统计学讲义(第六章)讲稿.doc

发布:2018-11-04约5.9千字共8页下载文档
文本预览下载声明
WORD格式可编辑 PAGE 0 专业技术 资料整理 非参数统计学讲义 第六章 分布检验和某些卡方检验 §1 引 言 本章属于拟合优度检验问题,即模型检验或分布的检验,属于非参数检验的范畴。在初等统计中,人们要想知道数据是否服从某一特定分布,可以通过直方图,或P-P图,Q-Q图来直接判断,但这种直观的方式很不精确。 本章将介绍几种分布的检验:K-S检验,Lilliefors检验和检验。 实际上,K-S检验是在针对检验的缺点 检验与K-S检验均属拟合优度检验,但检验常用于定类尺度测量数据,K-S检验还用于定序尺度测量数据;当预期频数较小时, 检验与K-S检验均属拟合优度检验,但检验常用于定类尺度测量数据,K-S检验还用于定序尺度测量数据;当预期频数较小时,检验常需要合并邻近的类别才能计算,K-S检验则不需要,因此它能比检验保留更多的信息;对于特别小的样本数目,检验不能应用,而K-S检验则不受限制。 §2 Kolmogorov检验 基本假设 一般地要检验手中的样本是否来自某个已知,假定其真实分布为,对应的检验类型有 对 至少有一个x 对 至少有一个x 对 至少有一个x 设为该组数据的经验分布函数,则 基本方法 Kolmogorov于三十年代提出了一种基于经验分布的检验方法,基本思想是:由格里文科定理,当时,样本经验分布以概率1一致收敛到总体分布F,为此可以定义到的距离为 当H0成立时,由格氏定理,D以概率1收敛到0,因此D的大小可以度量对总体分布拟合的好坏。 可供选择的检验统计量分别为; 类型A 类型B 类型C 在实际操作时,如果有n个观察值,用下面的统计量代替上面的D NOTE:①由的取值是离散的,考虑到跳跃性,该能够保证S与F0之间取得最大距离; ②在H0下的分布有表可查,P201 ③在大样本时,有近似分布,这里的分布函数有表达式,P122,该分布有表可查P203: 应用举例 【例6-1】轴承的内径检验 检验某车间生产的20个轴承外座圈的内径,测得数据如下(单位:mm) 表6-1 轴承内径数据 15.04 15.36 14.57 14.53 15.57 14.69 15.37 14.66 14.52 15.41 15.34 14.28 15.01 14.76 14.38 15.87 13.66 14.97 15.29 14.95 按照设计要求,这个内径应在15±0.2mm,检验是否符合标准,即检验该数据是否来自均值,方差的正态分布。 分析:方法一,可以利用直方图、Q-Q图、P-P图进行直观判断; 方法二,利用Kolmogorov检验 由P122表中数据得:,拒绝H0,认为不满足要求。 近似,P-值=0.979>0.05,接受H0。 【例6-2】《数理统计与管理》论文作者服从洛特卡分布 洛特卡定律是1926年6月19日洛特卡(Vlachy)在美国颇有影响的学术刊物《华盛顿科学院杂志》上首先提出,它第一次提示了作者与文献量的统计规律性。在这之后,洛特卡进一步发展了洛特卡定律,得出这样的一个关系:若以x表示每一作者所著的论文数,与其相应的写x篇论文的作者数为y,则y与x成反比关系。 将46期的《数理统计与管理》的文章按第一作者统计,得到表7-2的结果。论文作者数是否服从洛特卡分布。 表6-2 论文数目与作者数的统计表 论文数(x) 1 2 3 4 5 6 7 作者(y) 343 27 9 1 1 1 2 分析:洛特卡得出这样的一个关系:若以x表示每一作者所著的论文数,与其相应的写x篇论文的作者数为y,则y与x成反比关系。即有 MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT ( SEQ MTSec \c \* Arabic \* MERGEFORMAT 0. SEQ MTEqn \c \* Arabic \* MERGEFORMAT 1) 式中,N为论文总数,m、C为两个特定的常数,在不同的学科领域数值不同。 假定根据表6—2提供的数据,认为论文作者服从洛特卡分布,并对其真实性进行检验,首先必须确定它的理论分布,即计算出m、C的值。估计m的值,通常采用最小二乘法。将(6.1)式进行对数变换,使其线性化,得到: MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT ( SE
显示全部
相似文档