实验数据处理与分析.docx
实验数据处理与分析
食品学院
食品学院肖俊松
课程主要内容
u实验设计方法(正交,均匀设计,配方实验设计)
u数据分析方法(均值比较,方差分析,回归分析,多
元统计初步)
u数据的表图表示法(科技绘图)
u相关软件使用(实验设计软件,统计软件,绘图软件)
第一章基础回顾
I.变量及其分类
II.变量的描述
III.变量取值与误差IV.变量分布规律
V.描述性统计与推断性统计
I变量及其分类
u测定对象
u变量:数值可以变化的量u分类
离散型,连续型
自变量,因变量
定类变量、定序变量、定距变量和定比变量
?定类变量:又称为名义(nominal)变量,如性别,职业,国籍等。
?定序变量:又称为有序(ordinal)变量、顺序变量,如学历。
?定距变量:又称为间隔(interval)变量,如温度,智商,定距尺度中没有绝对零点(0不表示没有)
?定比变量:又称为比率(ratio)变量,如绝对温度。定比尺度有绝对零点(定比尺度中的“0”表示没有,或者是理论上的极限)
II变量的描述
u总体和样本
所要考察对象的全体叫做总体,其中的每一个考察对象叫做个体,从总体中所抽取的一部分个体叫做总体的一个样本。
u一般来说:
总体的个体容量≥样本个体容量
(有限总体和无限总体)
?有限总体:一个统计总体所包括的单位数如果是有限的,称为有限总体。
?无限总体:一个统计总体所包括的单位数如果是无限的,称为无限总体。
II变量的描述
u由总体计算的数称为参数(parameter)
u由样本计算的数称为统计量(statistics),统计量是参数的估计值。
III变量取值与误差
1真值与试验值
u真值:truevalue,某一时刻和某一状态下,变量的客观值或实际值。真值一般是未知的,但从相对的意义上来说,真值又是已知的。
2平均值
u算数平均数:是所有数据的总和除以总频数所得的商(Excel:AVERAGE)
u加权平均值
u对数平均值
u几何平均值
u调和平均值
III变量取值与误差
2误差
u绝对误差:absoluteerror,试验值与真值之差。真值一般未知,绝对误差无法准确计算,但可估算最大绝对误差|?x|max
u相对误差:relativeerror,绝对误差与真值之比。可计算最大相对误差。
u算术平均误差:averagediscrepancy,?=Excel:AVEDEA
u标准误差:standarderror,mean-root-squareerror,standarddiscrepancy,
standarddeviation。N无穷大时,有总体标准差σ(Excel:STDEV);n有限时,有样品标准差s(Execl:STDEVP)
标准偏差
相对标准偏差:RSD=s/*100%
III变量取值与误差
3误差来源
u随机误差:偶然因素引起的差异
u系统误差:试验条件引入的差异
u过失误差:失误
u测量值=真值+系统误差(!)+随机误差(↓)+错误(0)
III变量取值与误差
4实验数据的精准度
u精密度:precision,反映随机误差大小程度极差
标准差σ
方差σ2
u正确度:trueness,反映系统误差大小
u准确度:accuracy,反映随机误差和系统误差的综合
III变量取值与误差
5实验数据误差的统计检验
5.1随机误差的检验
u卡方检验:χ2test。判断各试验方法或实验结果随机误差之间的关系。
u一组实验数据x1,x2…xn服从正态分布,则统计量χ2=
服从自由度为n-1的χ2分布。对给定的显著性水平a,由卡方表差的临界值χ2a,将计算得到的χ2与临界值χ2a比较,判断是否有显著性差异。(双侧检验,左侧检验,右侧检验)
uF检验
用于2组具有正态分布的试验数之间精密度的比较。
5.2系统误差检验
(1)平均值与给定值的检验
u对实验数据的平均值进行检验,实际上是对系统误差的检验
u有一组数据服从整体分布,统计量服从自由度n-1的t分布。要检验其算术平均值与真实值之间是否有显著性差异,则根据给定的显著性水平a,将计算的t值与临界值比较,得出检验结论。
(2)两个平均值的检验(t检验)
u两组数据方差无显著差异的比较
u两组数据方差有显著差异的比较
(3)成对数据的比较(t检验)
(4)秩和检验(不对数据是否符合正态分布做严格规定)
5.3异常值检验Outlier,exceptionaldata
u处理原则:
实验过程中发现异常值应停止试验,分析