chapter2非参数统计讲解.ppt
文本预览下载声明
第二章 基本概念;非参数统计的特点:
非参数统计方法对总体的额家丁相对较少,效率高,结果一般有较好的稳定性;
非参数统计可以处理所有类型的数据,有广泛的适用性;
非参数统计思想容易理解,计算容易。
非参数统计的历史:
; 20世纪60年代,Hodges 和Lehmann 从秩检验统计量出发,导出了若干估计量和置信区间;
20世纪70-80年代,非参数统计借助于计算机获得了更稳健的估计和预测,促进了促进了非参数统计在应用领域的发展.
20世纪90年代后,有关非参数统计的应用和研究主要集中在非参数回归和非参数密度领域.;§2.2 假设检验回顾;(2) 检验的 p 值和显著性水平的作用
p 值:在一个假设检验中拒绝零假设的最小显著水平.
判断法则:
(3) 两类错误
第一类错误(弃真错误): H0为真,拒绝H0
一般由检验显著性水平控制
第二类错误(取伪错误): H0为假,接受H0
两类错误相互制衡,不能同时都减到很小.
检验的势;
;置信区间和假设检验的关系
就单变量位置参数而言,置信区间和双边假设检验有密切的联系.
检验显著水平 a 和置信水平 1-a 是两个对立事件的概率
若水平为 a的拒绝域为 W,则其对立事件是置信水平为 1-a 的置信区间;
若 H0在1-a的置信区间内则接受 H0,否则拒绝 H0.
置信区间和假设检验的这种关系成为对偶关系.
例:正态总体在方差已知情况下对均值的U检验.
;§2.3 经验分布和分布探索;① 从定义可以看出,在 x 处的 函数值是 n 个观察值中小于或等于 x 的频率.
② 给定 x, 是一个随机变量,n 服从二项分布 B(n,F(x)).
; 证明利用伯努利大数定律很容易得到证明;2.3.2 生存函数
生存分析是研究生存现象和响应时间数据及其统计规律的一门学科。该学科在生物学、医学、保险学、可靠性工程学、人口学、社会学、经济学等方面都有重要应用。
基本方法:
(1)参数法:指数分布法、Weibull分布法
(2)非参数法:如 非参数法:如 乘积极限法 、寿命表法、 logrank 检验检验、 Gehan比分检验
(3) 半参数法:如 半参数法:如 Cox回归模型
生存函数定义:设T为生存时间,是一个随机变量,???分布函数为F(t),生存函数定义为
S(t)=P(T=t)=1-F(t).;生存函数的性质:
S(0)=1, S(+ )=0;
S(t)是递减函数;
用经验分布函数估计生存函数
表示生存时间超过 t 的数据所占的频率.
危险函数:
表示个体生存时间超过给定时间的瞬时死亡率,是在某一时刻(附近),对死亡发生的可能进行度量的量.
;危险函数的表达式:;§2.4 检验的相对效率
渐进相对效率:
;计算渐进效率应满足的条件如下定理:;例;顺序统计量中各分量既不独立,也不同分布。;证明;2.分位数;3.分位数的估计;4.分位数的图形表示;2) Q-Q图;(2) 分布;(3) 边缘分布;推论2.3;线性符号秩统计量;2.有结数据的秩;结统计量;§2.7 U统计量;一致最小方差无偏估计的求解:
(1) 有充分统计量,无偏估计
(2)求条件期望E(充分统计量|无偏估计);1.单一样本的U统计量和主要特征;构造对称核;U统计量的性质;例1.11
例1.12;U统计量的数学特征;引理证明:;(2) 方差的证明;则;例2.13;两样本的U检验统计量和分布;2.3证明:由
显示全部