文档详情

资料的描述性统计分析.ppt

发布:2025-04-14约9.13千字共77页下载文档
文本预览下载声明

三.中位数(Median)如求数列7,10,12,14,18,20的中位数。n=6,为偶数,取中间两个数的平均数,则M=(12+14)/2=13(天)如求数列7,10,12,14,15,18,20的中位数。n=7,为奇数,取中间那个数为中位数。则M=14(天)第30页,共77页,星期日,2025年,2月5日三.中位数(Median)适用于表示任何分布资料的平均水平。但常用于非正态分布资料。由于中位数不受个别特大,特小数值的影响,因此它比均数稳健,常用于资料分布不明,或明显偏态,或分布的一端无确定值的情况。第31页,共77页,星期日,2025年,2月5日

四.众数(Mode)

频数最大的变量值称为众数。列成频数表的资料,频数最大的组段的组中值为众数。?第32页,共77页,星期日,2025年,2月5日集中趋势的测度第33页,共77页,星期日,2025年,2月5日

五.百分位数(Percentile)

第X百分位数以Px表示,它将总体或样本的全部观察值分成二个部分,其中有x%个观察值小于Px,(100-x)%个观察值大于Px。用途:1.描述一组资料在各个百分位置上的水平,用一组百分位数如P5,P25,P50,P75,P95,可以描述总体或样本的分布特征,如集中位置、变异度等。第34页,共77页,星期日,2025年,2月5日百分位数70%下侧30%上侧第70个百分位数值四分之一分位数=25%四分之二分位数=50%第35页,共77页,星期日,2025年,2月5日五.百分位数(Percentile)2.确定医学正常值范围。P25称为第1四分位数;记为Q1。P50称为第2四分位数;记为Q2,就是中位数MP75称为第3四分位数;记为Q3。计算百分位数时,特别是靠近两端的百分位数时,要求例数足够大,大于100例。第36页,共77页,星期日,2025年,2月5日五.百分位数(Percentile)例:用直接法计算例3.2资料共120例的第5百分位数,用频数表法计算第95百分位数,解:将原始观察值由小到大排列,得3.980,4.065,4.070,4.070,4.2150,4.250,4.260,4.290,……5.850,5.875先确定第x百分位数在第几位。用公式:(n+1)×x%第37页,共77页,星期日,2025年,2月5日五.百分位数(Percentile)本例(120+1)×5%=6.05,第5百分位数在第6.05位,即第6到第7位之间。简单的算法是取第6和第7位数的平均值,P5=(4.250+4.260)/2=4.255(1012/L)。第38页,共77页,星期日,2025年,2月5日五.百分位数(Percentile)第39页,共77页,星期日,2025年,2月5日五.百分位数(Percentile)计算P951.列出频数分布表,计算累计频数。2.计算nx%,120×95%=1143.对照累计频数栏与nx%确定PX应落在哪一个组段中。114将在组限为5.5~的组中,该组段下限为L,组距为i,频数为f,上一组累积频数为Σfl。PX=L+i(nx%-Σfl)/f,P95=5.5+0.2×(114-108)/9=5.633(1012/L)第40页,共77页,星期日,2025年,2月5日第三节离散程度的指标1.全距(Range)是最大与最小观察值之差。全距计算方便,但仅利用最大与最小二个数据来代表全部数据的离散程度,信息利用差。全距受特大与特小值影响大,不稳定。?2.四分位数间距(InterquartileRange)?第41页,共77页,星期日,2025年,2月5日第三节离散程度的指标四分位数间距是第3四分位数与第1四分位数之差,即P75-P25。四分位数间距受特大值或特小值影响小,较稳定。中位数和四分位数间距相结合常用于表示非正态分布资料的平均水平和离散程度。第42页,共77页,星期日,2025年,2月5日第三节离散程度的指标3.标准差与方差(StandardDeviationandVariance)总体的标准差,方差符号为σ,σ2,样本的标准差,方差符号为S,S2。第43页,共77页,星期日,2

显示全部
相似文档