样本量估计汇编.ppt
文本预览下载声明
样本量估计 概述 医学研究没有绝对的样本量标准,不同的研究方法、研究目的,研究要求和研究资料决定了样本量。一般而言,样本越大,结果的估计越精确。但样本过大或过小均可影响研究的可行性。因此,科学地确定样本量可增加研究的可靠性,得到可信的研究结果。 样本量估算的影响因素 在科学研究方法中,现在越来越强调样本量的估算。确定适当的样本含量,可节约资源,并防止因为样本含量过少引起的检验效能偏低,出现了非真实的阴性结果,这是当前医学研究中值得注意的问题。确定样本含量的主要用途是保证科研设计有适当的样本含量,而且可考察当前的样本含量是否能够保证足够大的检验效能。 样本量估算的影响因素 样本量的估算方法很多,不同的统计检验方法使用的计算公式也不一样,一般影响样本量的因素比较多: 研究事件的发生率:研究事件预期出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 样本量估算的影响因素 研究因素的有效率:有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。 设定检验的第Ⅰ类错误概率α,即检验水准或显著性。即假设检验第一类错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者根据具体情况决定,通常α取0.05或0.01。 样本量估算的影响因素 设定检验的第Ⅱ类错误概率β,或检验效能1-β 。检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为0.2,0.1或0.05。即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。 样本量估算的影响因素 了解由样本推断总体的一些信息。总体标准差一般未知,用样本标准差s代替。 处理组间差别σ的估计,即确定容许误差。如果调查均数时,则先确定样本的均数和总体均数之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信区间的一半。 样本量估算的影响因素 用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时,其α或β的Ua界值通过查标准正态分布的分位数表即可得到。 样本量估算的影响因素 这些影响因素中,确定样本含量最重要的四个因素为第Ⅰ类错误概率α、第Ⅱ类错误概率β、推断总体的一些信息和容许误差σ。 抽样调查样本量的估计 对总体率π做估计调查的样本大小计算公式为: 式中:δ为容许的误差,即允许样本率(p)和总体率(P)的最大容许误差为多少。 为总体患病率。 单样本与已知总体检验时样本量的估计 单样本与已知总体检验的样本量估计公式类似。其估计公式为: 式中:δ为容许的误差,即允许样本率和已知总体率 的最大容许误差为多少 . 为已知总体患病率。 两样本率比较样本量估计 两样本率比较,当例数相等时,其样本量估计公式为: 此公式计算得到的样本量为两样本合计样本量。式中 、 分别代表两组总体率, 代表两组的合并率。N为两组合计之样本含量。 配对设计总体率比较的样本量估计 配对分类资料多用 检验进行处理的,资料的样本含量估计公式为 抽样调查总体参数估计时的样本量估计 抽样调查估计总体均数的样本含量公式为: 式中:δ为容许的误差,即允许样本和总体的最大容许误差为多少。 为总体标准差。 单样本与已知总体检验时样本量的估计 样本均数与总体均数的比较,估计的样本量计算公式为: 式中:N为所需样本例数, 为总体标准差估计值,δ为容许误差。uα和uβ由界值表查得。 两总体均数比较的样本量估计 两样本均数比较,按下式计算: 式中N为所需样本例数,两组合计的样本含量,σ为总体标准差估计值,δ为容许误差. u α、 u β分别是对应于α和β的u值,可由t界值表,自由度υ=∞-行查出来,α有单侧、双侧之分,β只取单侧值。。 配对设计两样本均数比较的样本量估计 配对设计两样本均数比较的样本量估计公式为: 式中N为观察的对子数,σ为两样本差值标准差估计值,δ为容许误差。 小结 在科学研究方法中,现在越来越强调样本量的估算。确定适当的样本含量,可节约资源,并防止因为样本含量过少引起的检验效能偏低,出现了非真实的阴性结果,这是当前医学研究中值得注意的问题。确定样本含量的主要用途是保证科研设计有适当的样本含量,而且可考察当前的样本含量是否能够保证足够大的检
显示全部