概率分布函数学生氏t〔na〕.doc
文本预览下载声明
学生t-分布
在概率论和统计学中,学生t-分布(Students t-distribution)应用在当对呈正态分布的母群体的均值进行估计。它是对两个样本均值差异进行显著性测试的学生t测定的基础。t检定改进了Z检定(en:Z-test),不论样本数量大或小皆可应用。在样本数量大(超过30等)时,可以应用Z检定,但Z检定用在小的样本会产生很大的误差,因此样本很小的情况下得改用学生t检定。在数据有三组以上时,因为误差无法压低,此时可以用变异数分析代替学生t检定。
当母群体的标准差是未知的但却又需要估计时,我们可以运用学生t-分布。
学生t-分布可简称为t分布。其推导由威廉·戈塞于1908年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student)这一笔名。之后t检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布。
假设X是呈正态分布的独立的随机变量(随机变量的期望值是μ,方差是σ2)。 令:
为样本均值。
为样本方差。
它显示了数量
呈正态分布并且均值和方差分别为0和1。另一个相关数量
T 的概率密度函数是:
ν 等于n ? 1。 T 的分布称为t-分布。参数ν 一般被称为自由度。
Γ 是伽玛函数。
分布的矩为:
学生t-分布置信区间的推导
假设数量A 在当T 呈t-分布(T 的自由度为n???1)满足
这与 。。。。。。。是相同的
A是这个概率分布的第95个百分点
那么 。。。。。。。。等价于
因此μ的90%置信区间为:
表格
下表列出了自由度为ν的t-分布的单侧和双侧区间值。例如,当样本数量n=5时,则自由度ν=4,我们就可以查找表中以4开头的行。该行第5列值为2.132,对应的单侧值为95%(双侧值为90%)。这也就是说,T小于2.132的概率为95%(即单侧),记为Pr(?∞??T??2.132)?=?0.95;同时,T值介于-2.132和2.132之间的概率为90%(即双侧),记为Pr(?2.132??T??2.132)?=?0.9。
这是根据分布的对称性计算得到的,
Pr(T???2.132)?=?1???Pr(T???2.132) = 1???0.95 = 0.05,
因此,
Pr(?2.132??T??2.132) = 1???2(0.05) = 0.9.
注意 关于表格的最后一行的值:自由度为无限大的t-分布和正态分布等价
注意 关于表格的最后一行的值:自由度为无限大的t-分布和正态分布等价。
单侧 75% 80% 85% 90% 95% 97.5% 99% 99.5% 99.75% 99.9% 99.95% 双侧 50% 60% 70% 80% 90% 95% 98% 99% 99.5% 99.8% 99.9% 1 1.000 1.376 1.963 3.078 6.314 12.71 31.82 63.66 127.3 318.3 636.6 2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 14.09 22.33 31.60 3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 7.453 10.21 12.92 4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610 5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869 6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959 7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408 8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041 9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781 10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587 11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437 12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055 3.428 3.93
显示全部