《统计学基础知识》课件.ppt
文本预览下载声明
第一章 统计分析基础知识;统计学研究对象:收集数据;分析数据 ;展示数据;统计学应用领域:; 1981年,首届国际《红楼梦》研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为《从词汇上的统计论〈红楼梦〉作者的问题》的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对《红楼梦》后40回系高鹗所作这一流行看法提出异议,认为120回均系曹雪芹所作。(语言统计学) ; 统计学家调侃数学家:你们不是说若X=Y且Y=Z,则X=Z吗!那么想必你若喜欢一个女孩,那么这个女孩喜欢的男生你也喜欢吧?;统计学的内容 ;第一节:统计学基本概念;样本;三、数据和变量;四、误差和错误;四、准确性和精确性;第二节 统计特征数的计算;加权平均数;算术平均数的性质:;(二)中数:将资料内所有观察值从大到小排序,居中间位置的观察值称为中数( median ),计作Md。如观察值个数为偶数,则以中间二个观察值的算术平均数为中数。;(四)几何平均数 如有n个观察值,其相乘积开n次方,即为几何平均数( geometric mean ),用G代表。;例:土壤水分在毛细管中的上升速率,从土壤表面下30cm量起,第一个10cm、第二个10cm、第三个10cm土壤毛管水的上升速率分别为:8cm/min、6cm/min、4cm/min,求毛管水的平均上升速率。;二、变异性的度量;(一)极差( range ):又称全距,记作R,是资料中最大观察值与最小观察值的差数。;(二)方差:平均离均差平方和。;自由度(df):是指样本内独立而能自由变动的 观测值个数。;sample1;sample2;(三)标准差;(四)变异系数;例:比较甲乙两个生产单位的小麦产量的均衡性。;Microsoft Excel 对统计特征数的计算;第三节 次数分布;每穗小穗数在15—20的范围内变动,把所有观察值按每穗小穗数多少加以归类,共分为6组,组与组间相差为1小穗,称为组距。 ;200个稻穗每穗粒数的次数分布表
;二、连续性变量的次数分布;1. 数据排序(sort) 首先对数据按从小到大排列(升序)或从大到小排列(降序) ; 140行水稻产量为例,样本内观察值的个数为140,查表可分为8—16组,假定分为12组,则组距为179/12=14.9g,为分组方便起见,可以15g作为组距。;第一组:??小观测值是75,可以把它当做第一组的组中值。;确定组中值;5、统计观测值落入每个区间的次数,制作次数分布表;6、制作次数分布图;第四节 无偏估计;样本平均数 的平均数;第五节 概率和概率分布;事件的运算;(二)频率;(三)概率; 某一随机试验,其基本事件空间是U={u1,u2, ‥‥un},共有n个有限的基本事件,而且每一个事件都是等可能事件,而时间A在其中包含m个基本事件,那么时间A发生的概率:;(五)概率的运算法则;二、大数定律;(二)辛钦大数定理;第六节 概率分布;概率累积函数;x;(二)离散型随机变量的数学期望和方差; 离散型随机变量X的概率分布函数,x是X的任何一个取值,那么 定义为离散型随机变量X的数学期望(均值),计作E(X)。;方差;方差的性质:;二项式分布;从n枚硬币中抽出x枚的组合方式:;二项式分布的形状和参数;例:某批玉米种子的发芽率为90%,同时播下5粒种子,计算种子发芽的概率分布。;例:某小麦品种在田间出现自然变异植株的概率为0.0045,试计算(1)调查100株,获得两株或两株以上植株的概率?(2)期望有99%的概率获得1株或1株以上变异植株,至少要调查多少株?;(二)泊松分布; 法国数学家poisson研究发现,在二项总体中,当n很大,p或q很小时,二项式分布趋近于另外一种分布——poission分布。;对立事件A;前例:;期望有99%的概率获得1株或1株以上的变异植株,至少要调查多少株。;泊松分布的两个参数;二、连续性随机变量的概率分布——正态分布;正态分布曲线的特性 ;正态分布概率计算 ;标准正态分布:;标准正态分布的概率密度函数;正态分布的概率计算向标准正态分布概率计算的转化;例:某土壤有机质含量x~N(1.08,0.132),计算土壤有机质含量落入[1.08,1.21]及[0.95,1.21]之间的概率。;几个特殊区间的概率;95%;第七节 抽样分布;;3、样本平均数概率分布;4、当原总体σ2方差未知,需用S2去估计σ2时;(二)抽样误差的分布;3、抽样误差概率分布;是统计学上允许的第一个合理误差范围;是统计学上允许的第二个合理误差范围;在抽样观察中可以根据统计学上允许的合理误差范围,推断总计平均数存在范围。由样本推断总体时,在一定的可靠程度保证下总体平均数的合理
显示全部