第五章比率估计与回归估计报告.ppt
文本预览下载声明
第五章 比率估计与回归估计 本章要点 本章讨论了简单随机抽样和分层随机抽样下比率估计量和回归估计量的构造及性质。要求: ①掌握总体比率、比率估计量及回归估计量的概念。 ②了解比率估计量、回归估计量的偏倚、方差及方差的估计量。 ③掌握应用比率估计量及回归估计量的条件。 第一节 问题的提出 在许多实际问题中常常涉及两个调查变量(指标)Y 和X 。对于包含个抽样单元的总体除了对总体信息进行估计外,常常要估计总体比率R。总体比率在形式上总是表现为两个变量总值或均值之比。 在涉及两个变量的抽样调查中,有两种情况需要应用比率估计量。一种情况是利用双变量样本对总体比率进行估计需应用比率估计量,此时两个变量均为调查变量。另一种情况是一个变量为调查变量,另一个变量表现为与调查变量有密切关系的辅助变量,在对调查变量总体总值、总体均值等目标量进行估计时,利用已知的辅助变量信息构造比率估计量可以改进估计的精度。 基于这种考虑利用已知的辅助变量信息构造比率估计量就可使估计精度加以改进。 第二节 比率估计 一、比率估计量 设对有两个调查变量Y 和X 的总体进行简单随机抽样 ,分别以y,x表示样本总值 ,以 表示样本均值,以 为样本比率 ,用 作为总体比率R的估计称为的比率估计 。 比率估计量除了使用调查变量样本信息外,还要使用辅助变量总体信息与样本信息,而且是非线性估计量。这类估计量称为复杂估计量。由于比率估计量使用的信息比简单估计量多,因而有可能比简单估计量有更高的精度。同时由于比率估计量是非线性估计量,因而对其性质的研究比对简单估计量要复杂得多。 二、比率估计量的偏倚与均方误差 比率估计量是有偏估计量,但当样本量增大时其偏倚将趋于零 。 理论上可以证明, 分别为 的近似无偏估计量,而且对于比率估计量,其方差主要取决于 与 之间的差异,当 时,估计量方差将很小。换言之,比率估计量将有很高的精度。这告诉我们,只有当两个变量大致成正比例关系时,应用比率 估计量才能使估计精度有较大改进。 三、 比率估计量方差的估计与置信区间 对于一般的n,比率估计量呈右偏分布,只有当n>30, <0.1, <0.1这些条件同时满足时才能直接用正态分布构造置信区间。R的置信区间为 [ ] 其中 是标准正态分布的上α/2分位点,0<α<1。类似可得 、Y的置信区间。 案例一 解 答过程 案例二 解答过程 四、 比率估计量优于简单估计量的条件 定量分析计算表明,并非任何情况下比率估计量都优于简单估计量,只有当调查变量与辅助变量有较高的正相关性时比率估计量才能使估计精度有较大提高。若 ≈ ,则只需当ρ> 0.5 时比率估计量就比简单估计量精度高。 五、多元比率估计 对于调查变量Y ,若有p个具有正相关性的辅助变量 则可构造多元比率估计。 设 是 的基于第k个辅助变量的比率估计,则 的多元比率估计量为: 其中 是相应变量的样本总值, 是辅助变量总体均值, 是适当选取的权,满足 。 利用拉格朗日乘数法可计算得 此时最小方差为 案例三 解答过程 六、乘积估计 当辅助变量X 与调查变量Y 呈负相关关系时,不能应用比率估计而应改用乘积估计 乘积估计优于简单估计的条件是 < 此时
显示全部