统计学(置信度).pdf
统计学基础置信度与置信区间[原创2006-08-0621:27:49]
置信度与置信区间
如何确定测定数据的可靠程度?
数据的可信程度与偶然误差的存在及出现的几率有着直接关系。
对于不含系统误差的无数个测定数据,其误差分布可用正态分布曲线(高斯曲线)来表征。以
(x-μ)为横坐标,误差出现的频率y为纵坐标,误差正态分布曲线如图所示。
曲线的形状受总体标准偏差σ控制,越小,曲线又高又窄,表明数据精密度好。
σ的数值等于曲线上的拐点到对称轴的距离,曲线的峰高等于1/[σ(2π)1/2]。
正态分布曲线与横轴所包围的面积代表了大小误差出现的概率(可由高斯方程积分获得)。
曲线下面积几率
-∞~+∞100%
±σ68.3%
±2σ99.5%
±3σ99.70%
由数据可见,偶然误差出现在m±3σ范围内的几率高达99.7%。
置信度是指人们所做判断的可靠性,所测数据的可信程度,在数值上与几率相等。对于分析
化学来讲:
置信度:以测量值为中心,在一定范围内,真值出现在该范围内的几率。
置信区间:在某一置信度下,以测量值为中心,真值出现的范围。
t=(X-m)/s
平均值的置信区间可表示为:
s有限次测定的标准偏差;
t值表
置信度
测定次数n
50%90%95%99%99.5%
21.0006.31412.70663.657127.32
30.8162.9204.3039.92514.089
40.7652.3533.1825.8417.453
50.7412.1322.7764.6045.598
60.7272.0152.5714.0324.773
平均偏差与标准偏差
一、平均偏差
平均偏差又称算术平均偏差,用来表示一组数据的精密度。
平均偏差:
优点:简单;缺点:大偏差得不到应有反映。
二、标准偏差
S=
标准偏差又称均方根偏差。标准偏差的计算分两种情况:
1.当测定次数趋于无穷大时
标准偏差:
μ为无限多次测定的平均值(总体平均值);即:
当消除系统误差时,μ即为真值。
2.当有限测定次数时
标准偏差:
相对标准偏差(变异系数):
用标准偏差比用平均偏差更科学更准确.
例:两组数据
1.X-X:0.11,-0.73,0.24,0.51,-0.14,0.00,0.30,-0.21,
n=8d1=0.28S1=0.38
2.X-X:0.18,0.26,-0.25,-0.37,0.32,-0.28,0.31,-0.27
n=8d2=0.28S2=0.29
可见:d1=d2,而:S1S2
三、平均值的标准偏差
m个n次平行测定的平均值:
由统计学可得上列m个数据的标准偏差(平均值的标准偏差)SX与n次平行测定的标准
偏差S之间的关系:
由SX/S—n关系曲线:
当n大于5以后,曲线变化趋缓;
当n大于10以后,曲线变化不大。故n大于5即可。
可以用X±SX的形式来表示分析结果。
例:水垢中Fe2O3的百分含量6次测定数据为:
79.58%,79.45%,79.47%,79.50%,7