(研究方法与论文写作课件)第三章 数据处理.ppt
文本预览下载声明
位置特征参数 实验数据的位置特征参数,是用以描述实验数据的平均位置与特定位置的。 常用的有算术均值、均方根均值、计权均值、几何均值等。在实际计算中,最常用的是算术均值。 位置特征参数的计算 算术平均值 均方根均值 加权平均值 几何均值 算术平均值 算术平均值是全部数据的代数和除以样本量N,一般用x 表示。这种方法最简单,也是实际计算中最常用的实验数据的位置特征参数。其数学表达式为 均方根均值 均方根均值简称均方根值,在统计学中广泛使用。其定义式如下 例如,在对某测量仪器进行校验时,实测其测量误差分别为0.022, 0.015, -0.021, -0.008, 0.003, 则其测量误差的均方根均值为 加权平均值 ?所谓加权平均值,就是在计算平均值的时候对数值给以不同的比重系数(wi),所得到的平均值称为加权平均值或称作计权平均值。即 例如,某高校对校内各系进行教学能力评估,评估内容主要有:师资力量、实验条件、授课质量、学生考试成绩,上述4项内容的权重系数依次为:4, 3, 2, 1。生物工程系4项内容得分依次为90, 72, 88,96,则生物工程系的得分加权平均值为 几何均值 几何平均值是将n个观测数据联乘后并开n次方所得到的数值。即 离散特征参数 样本的离散特征参数就是用来描述数据的分散程度的; 常用的离散特征参数有极差、标准差、标准均差及变异系数等。 极差 极差是一个最简单的离散特征参数,它是样本中数据的最大值与最小值之差,可表示为: L=xmax - xmin ????????????????????xmax——样本中数据的最大值, xmin——样本中数据的最小值。 极差的优点是计算简单,便于表示。 但极差是由个别数据所决定的,这就导致它不能反映全部数据提供的信息; 其结果有一定的偶然性,代表性也较差。 方差与标准差 方差就是样本数据中所有数据与样本数据平均值之差的平方的平均值。表示 : 标准差(方差的开平方)则表示为 在分析样本的数据时,常以 代替 方差、标准差、标准均差和变异系数都是以平均值为中心的离散特征参数。在实际工作中,方差应用比较普遍,而标准均差和变异系数应用较少。 标准均差: 变异系数 : ?????? 遗失数据的弥补 在一些情况下,每个实验点都是经过精心设计选择的,此时每个实验数据都是十分重要的。 但是,如果不慎遗失了某些实验数据,或某些实验操作失误缺少了某些实验数据,该如何处理呢? 最好的办法:补做这些实验。 遗失数据的弥补 实验无法补做怎么办? 用数学的方法来弥补遗失的实验数据。 遗失数据的弥补 1. 用未遗失的数据的平均值代替遗失的数据; 使用条件:实验数据有重复,并且每一批实验至少有一个数据没有遗失时,可以用。 表4-5 有重复实验数据的弥补 =(1.5+2.4+3.5+3.3+2.2+2.1)/6=2.5 =(1.2+1.4+1.2+1.3+1.6+1.5)/6=1.37 表4-5所示为一组实验数据,其中a和b为遗失的数据,如何弥补? * 所谓有效数字:具体地说,是指在分析工作中实际能够测量到的数字。所谓能够测量到的是包括最后一位估计的,不确定的数字。 我们把通过直读获得的准确数字叫做可靠数字;把通过估读得到的那部分数字叫做存疑数字.把测量结果中能够反映被测量大小的带有一位存疑数字的全部数字叫有效数字. * ?这些数据虽然有波动,但并不是杂乱无章,而是表现出一定的规律性。 表4-3是这些数据的频率和频数分布,图4-4是其直方图。可以看出,数据是在0.64~0.95之间波动,而在0.77~0.835范围里集中了较多的数据,越往两边数据越少。 数据处理 数据处理分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据也称观测值,是实验、测量、观察、调查等的结果,常以数量的形式给出。 目的: 数据处理分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析是组织有目的地收集数据、分析数据,使之成为有用信息的过程。 数据处理的方法 数据处理的方法很多:参数估计、假设检验、方差分析和回归分析等。参数估计对某些数据进行点估计和区间估计;假设检验是判断各种数据处理结果的可靠程度;方差分析是分析各影响因素对考察指标的影响的显著性程度;回归分析是如何获
显示全部