chapter 4 统计分析软件应用﹝1﹞.ppt
文本预览下载声明
计算机在药学中的应用;4 统计分析软件应用(1) ;Exce1 2002 的统计分析工具包一共包括19个工具,按照其工作原理和应用范围的不同,大致可以分成5大类:;数据分析工具的调用;数据分析工具对话框;4.1 实验数据的简单统计 ;以上从总体中抽取样本的过程就称为抽样。样本具有代表性和独立性的抽样称为简单随机抽样。用数学语言表达就是:简单随机抽样的样本Xi与X同分布且样本容量与总体中个体数量相比很小。
基于样本而构造的、不含任何未知参数的、用于推断总体特征的参数称为统计量。统计量本身是一个随机变量,它的值可以通过对样本值的计算而得到。统计量的分布称为抽样分布。经常用到的统计量有样本均值、样本方差和样本标准差。 ;2.常用统计量 ;(2)样本方差S2
定义样本k阶中心矩:
?
则,修正样本二阶中心矩为样本方差,记作:
;(3)样本标准差S
样本方差的平方根为样本标准差。
在统计学中,一般惯例是用希腊字母μ、σ2表示整体参数,而用罗马字母X、S2表示样本统计量,应用中要注意区别。 ;(1) 标准正态分布:当μ、σ2均己知时,统计量
?
?
(2) x2分布(读做卡方分布):当μ=0,σ2 =1时,统计量
;t分布:设X~N(0,1),Y~x2(n),X、Y相互独立,则统计量
F分布:设X~x2(n1),Y~x2(n2),X、Y相互独立,则统计量
;4.抽样分布基本定理 ;(3)X与S2相互独立。由以上各定理可以得出: ;对于总体X~N(μ1,σ12)、Y~N(μ2,σ22),{Xi}、〔Yj〕为分别取自其中的样本,且两组样本相互独立,则
;当σ12=σ22,记 ;4.1.2统计估值 ;2.点估计及其评价
期望和方差是总体X最重要的数字特征,因此,很自然地利用样本{X}的均值X和样本方差S2分别作为总体期望μ与方差σ2的估计。
3.常用区间估计公式 .
根据抽样分布定理,对于给定的置信度+ a,可以推导出如下的区间估计公式:
(1)单正态总体期望的区间估计
对于期望的估计,根据σ2是否已知,分别使用Z统计量和T统计量。 ;(2)单正态总体方差的区间估计
对于方差的估计,使用x2统计量。
;(3)二正态总体均值差的区间估计 ;
其中:
;(4)二正态总体方差比的区间估计
;4.2 基础分析 ;4.2.1 描述统计 (例4-1);选项解释
输入区域:在此输入待分析数据区域的单元格引用。该引用必须由两个或两个以上按列或行排列的相邻数据区域组成。本例中选择眼压和人数两列:Bl∶C17。
分组方式:单击“逐行”或“逐列”指明输入区域中的数据是按行还是按列排列。由于本例中数据按列排列,所以选“逐列”。
标志位于第一行/标志位子第一列:如果输入区域的第一行(或第一列)中包含标志项,选中“标志位于第一行”(或“标志位于第一列”)复选框。如果输入区域没有标志项,清除该复选框,Excel 2002将在输出表中生成适宜的数据标志。本例中数据列的上方第一行有“眼压”、“人数”的标志,所以应选中此项。 ;平均数置信度:如果需要在输出表中包含平均值的置信度,请选中此复选框。在右侧的框中,输入所要使用的置信度数值。由于在统计中一般常用95%的置信度,所以本例中也取此值。
第k大值: 如果需要在输出表中包含每个数据区域中的第k个最大值,请选中此复选框。在右侧的框中,输入k的数字。如果输入1,则该行将包含数据集中的最大值。由于“描述统计”工具会自动返回最大和最小值,所以本例中此项取2,要求返回第2大值。
第k小值: 如果需要在输出表中包含每个数据区域中的第k个最小值,请选中此复选框。在右侧的框中,输入k的数宇。如果输入1,则该行将包含数据集中的最小值。同上,这里输入2。
;输出区域:在此输入对输出表左上角单元格的引用。此工具将为每个数据集产生两列信息。左边一列包含统计标志,右边一列包含统计值。根据所选择的“分组方式”选项,Excel将为输入区域中的每一行或每一列生成一个两列的统计表。本例中选择紧靠数据列的区域D1∶G18。
新工作表组:选中此选项可在当前工作簿中插入新工作表,并从新工作表的Al单元格开始粘贴计算结果。若要为新工作表命名,请在右侧的框中键入名称。本例中按区域输出,故此项不选。
新工作簿:选中此选项可创建一新工作簿,并在新工作簿的新工作表中粘贴计算结果。本例中按区域输出,故此项不选。 ;汇总统计:如果需要Exce1在输出表中为下列每个统计结果生成一个字段,请选中此复选框。这些统计结果有:平均值、标准误差(相对于平均值)、中值、众数、标准偏差、方差、峰值、偏度、极差(全距)、最小值、最大值、总和、总个数、最大值(#)、最小值(
显示全部