文档详情

多元统计分析及SPSS应用.ppt

发布:2017-08-23约字共44页下载文档
文本预览下载声明
二、分布的形状 用于描述数据分布形状即分布关于其中心的波动程度的代表值有:极差、内距、方差和标准等,它们描述了分布的离散程度和差异程度。 (一)极差(range) 极差也称为全距,是最大值与最小值之间的距离,它是数据离散或差异程度的最简单测度值,即 例如,在前面的数据中,极差为128-84=44(件)。显然,数据的离散程度大,极差就越大。极差虽然很容易计算,但它只告诉我们数据分布范围,至于分布的中间部分是如何变化的则不得而知。而且它受极端值的影响可能是很大的。 (二)内距(Inter-Quartile Range, IQR) 内距又称为四分位差,是两个四分位数之差,IQR=高四分位数—低四分位数。 若内距比较小,则说明数据比较集中在中位数附近;反之则比较分散。内距常和中位数一起用来描述一个定距特别是定序测量数据的分布。 (三)方差(variance)和标准差(standard deviation) 方差是离差平方的平均数,即 或 三、偏度与峰度 (一)偏度(skewness) 所谓偏度是指反映频数分布偏态方向和程度的测度。 在频数分布中,最大集中点以上(频数曲线图横轴上众数的右边)的频数占总频数的一半多,称为右偏或正偏。 最大集中点以下(频数曲线图横轴上众数的左边)的频数占总频数的一半多,称为左偏或负偏。 偏度的计算公式为: (二)峰度(kurtosis) 所谓峰度,是指频数分布曲线高峰的形态,即反映分布曲线 的尖峭程度的测度。 峰度的计算公式为 当β=0 时,表示分布的峰度是正态分布的峰度;当β0 时,表示分布曲线的高峰是尖顶高峰;当β0 时,表示分布曲线的高峰是平顶高峰。 四、SPSS 操作 在SPSS 中计算上例各种指标的步骤为: (一)定义加工零件数的变量名为X,并输入原始数据。 (二)选择[Analyze]=[Descriptive Statistics]=[ Descriptives...],打开[Descriptives]主对话框。 打开[Descriptives]主对话框。在主对话框左边列表中选定变量X,单击按钮使之进入[Variables(s)] 列表框。 (三)单击[Options...]按钮,打开[Descriptives:Options]子对话框。选择均值(Mean)、总和(Sum)、标准差(Std.Deviation)、方差(Variance)、极差(Range)、最小值(Minimum)、最大值(Maximum)、偏度(Skewness)和峰度(Kurtosis),选好后单击[Continue]按钮返回[Descriptives]主对话框,再单击[OK]按钮即可得到各种统计量的计算结果。 输出结果: 以上结果没有给出中位数、众数等统计量,可以在频数(率)分析时增加选项计算相应的统计量,具体操作步骤如下: (一)定义工人编号和加工零件数的变量名分别为NO 和X,然后输入变量NO 和X 的原始数据。 (二)选择[Analyze]=[Descriptive Statistics]=[Frequencies...], 弹出[Frequencies]主对话框。现欲X 进行频数分析,在对话框左侧的变量列表中选X,单击按钮使之进入[Variable(s)]列表框,并选择[Display Frequency Tables]显示频数分布表。 (三)单击[Statistics...]按钮,弹出[Frequencies:Statistics]子对话框,并单击相应项目。本例中选择均值(Mean)、中位数(Median)、众数(Mode)、总和(Sum)、标准差(Std.Deviation)、方差(Variance)、极差(Range)、最小值(Minimum)、最大值(Maximum)、偏度(Skewness)和峰度(Kurtosis),选好后单击[Continue]按钮返回[Frequencies]主对话框,再单击[OK]按钮即可得到各种统计量的计算结果。 输出结果: The End! Enjoy! * * 多元统计分析及SPSS应用 rzhao@orsc.edu.cn session 3 聚类分析 应用多元统计分析及SPSS应用 Session 3 统计数据的收
显示全部
相似文档