文档详情

心脑血管药理食管癌放疗增敏样本大小.ppt

发布:2020-01-14约8.89千字共150页下载文档
文本预览下载声明
样本含量 Sample Size 估计样本含量 是研究设计中的重要内容 是课题申请书质量的一个标志 是实际研究工作的需要 估计样本含量 主要依赖正态分布理论 只有在一些简单的研究设计中能够估计样本含量 估计得好不好,取决于所给条件 样本含量太大 成本大, 费钱, 费时, 费人力 往往降低研究质量 即使保证研究质量, 对结论的影响可能很小 因此 不要轻易说 样本含量越大越好 样本含量太小 估计的精度差 难以区别 偶然性—规律 难以发现差别-Ⅱ型错误 例如: 研究代乳粉能否代替牛奶 只用实验组与对照组各4头动物作研究, 体重增长均数差别没有统计学意义,因此认为可以用这种代乳粉代替牛奶 例如,某文报道 1975年,同一工厂作AFP普查,发现2例阳性,男36和39岁,1例即手术,左半肝切除,随访26月仍良好;另一例,当时拒绝手术,6个月后出现症状再手术,右半肝切除,18个月后死亡。这2例足以说明早期进行手术切除将有助于延长生存期。 为什么要估计样本含量? 1. 控制统计量的抽样误差 在抽样研究中算得的统计量, 都有抽样误差, 应该要求统计量的抽样误差在一定限度内 例如: 调查60岁以上妇女血清雌二醇(E2,pg/ml)平均数,要求所得样本均数的误差(标准误)不大于2. 从4个方面 控制统计量的抽样误差 1. 所有个体的同质性 2. 测量工具、方法、标准统一 3. 选择合适的抽样和分组方法 4. 控制样本含量 标准误的计算 n 都在分母中 标准误的计算 n 都在分母中 为什么要估计样本含量? 2. 提高估计的精度 标准误小 可信区间窄 统计量对参数的离散度小 用统计量估计参数精度高 提高估计的精度 可信区间宽,表示估计的精度差 可信区间窄,表示估计的精度好 妇女血清雌二醇 可信区间 1. 11.2~13.4 估计精度好 2. 9.1~15.3 估计精度差 可信区间 表示 范围 ~ 包含 的可能性为95% 与 之差 的可能性为95% 越小,就是可信区间越小,也是估计的精度越高 提高估计的精度 把统计量与参数之差控制起来 提高估计的精度 样本含量越大, 越小 越能把 控制在较小范围内 为什么要估计样本含量? 3. 减小Ⅱ型错误概率 假设检验中的Ⅱ型错误 备选假设对, 接受无效假设 有差别判断为无差别 假阴性错误 影响Ⅱ型错误概率大小的因素 观察指标的变异度大小 H0与H1差别大小 大小 样本含量大小 一些说法的质疑: 想说明吸烟无害 我一直吸烟,也没有得肺癌 某人不吸烟,也得了肺癌 为什么要估计样本含量? 4. 对误差估计更好 也都有抽样误差 估计样本含量中的 一些基本概念 1. 无效假设和备选假设 传统: H0: 相等 H1: 不相等 血压相差1毫米汞柱 不具体 相等? 不相等? 为什么统计检验中有 无 因为备选假设都是A≠B,这是一个模糊的概念。要计算 必须把备选假设改为具体的 A-B=K 无效假设和备选假设 新概念 H0: 相等 H1: 不相等 相等和不相等的含义? 2. 最不利 概念 在 中, 由于含有符号 ,不是一个确切的值, 实际上还是不能直接估计样本含量. 最不利 对于 H0: , 其中 时, 最大. 所以 就是控制 的最不利情况 例如 H0: H1: 什么是控制
显示全部
相似文档