第三章概率与概率分布2.ppt
文本预览下载声明
第三章 概率与概率分布 主要内容: 概率论基础 常用概率分布 本章重点掌握 常用概率分布的特点 附录:常用概率分布数学用表的使用 第一节 概率论基础 一、概率论相关概念 1、随机现象 指在一定条件下可能发生也可能不发生的现象。 *** 问卷中的项目(标志)、样本统计量 ( 、S、P)的取值是否属于随机现象? 2、随机试验 指对随机现象取值规律进行观察的过程。 ***统计调查过程属于随机试验吗? 它观察的是什么的取值规律? 是对问卷中的项目(标志)、样本统计量( 、 S、P)的取值规律进行观察吗? 3、随机事件 指随机试验的每一个可能出现的结果。 ***调查问卷中品质型变量所设计的选择项(如性别:(1)男;(2)女)、数值型变量调查时每份问卷所填写的值属于随机事件吗? 4、样本空间 指随机试验所有可能结果的集合。 ***性别={男,女} (一)事件的概率 事件A的概率是对事件A在试验中出现的可能性大小的一种度量,即表示事件A出现可能性大小的数值 事件A的概率表示为P(A) 概率的定义有:先验概率和后验概率 (二)概率的后验定义 ? 在相同条件下进行n次随机试验,事件A出现 m 次,则比值 m/n 称为事件A发生的频率。随着n的增大(当n?∞时),该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,趋向于稳定,这个频率的稳定值即为事件A的概率,记为 例: 在家庭人口数频数分布表中,m为频数,n为样本量 、p为频率,A表示家庭人口数(事件), 则 在1000人中家庭人口数为2人的频数为100,频率 P=100/1000=10% 当样本量为无限大时,概率 P(A=2)≈10% (三)概率的先验定义 ? 如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数 m 与样本空间中所包含的基本事件个数 n 的比值,记为 (四)概率的性质 非负性 对任意事件A,有 0 ? P ? 1 规范性 必然事件的概率为1;不可能事件的概率为0。 (一)概率分布的定义 三、概率分布定义及类型 概率分布: 指随机变量所有取值的概率所形成的分布数列或分布图。 例:500户家庭人口分布 (二)概率分布的表示形式 1、表格式: 等同于离散型或连续型频数分布表; 2、函数式: P(X=xi) xi 为每一事件的代表值。 **例:家庭人口数为2,表示为P( x=2) 3、累积分布函数式: F(X)=P(X≤x)=ΣP(xi) 等同于频数分布表中的频率的向下累积值。 **例:家庭人口数在4人以下的总概率,表示为 P( x≦4) 离散型概率分布 连续型概率分布 第二节 常用概率分布 (一)二项试验 一、二项分布 (二)二项分布 定义:设X为n次二项试验中成功事件发生的次数,则有: 记为X~b(n,p) **例:人口调查结果表明,男性比率为50%,求在100份问卷中,男性问卷出现10人的概率? 二、正态分布 记为 X~N(μ, ?? ) f(x) = 随机变量 x 的频数 ?? = 总体方差 ? =3.14159; e = 2.71828 x = 随机变量的取值 (-? x ?) ? = 总体均值 (二)正态分布函数的主要性质 1 、曲线以X=μ为对称轴左右对称,且在X=μ处达到峰值 2、正态分布是一个分布族,每一特定正态分布通过均值? 的标准差?来区分。 ? 决定曲线的高度,? 决定曲线的平缓程度,即宽度 3、正态曲线下的总面积等于1 ? 和? 对正态曲线的影响 (三)标准正态分布 (四)标准正态分布的特点及大小概率事件 (1)标准正态分布曲线的均值为0,标准差为1; (2)界于2个标准差内的总概率为95.45%,约等于95%,称为大概率区间,用1-α表示,则小概率 α =5%; (3)界于3个标准差内的总概率为99.73%,约等于99%,称为极大概率区间,极小概率区为1%。 (4)在标准正态分布中,大、小概率的分界值Z称为临界值,用Zα 或Zα/2表示; (5)如果某测量标准分数Z界于- Zα/2 Z +Zα/2,则称其为大概率事件;若Z≤ - Zα/2,或Z≥ +Zα/2,为小概率事件。 (五)标准正态分布表及使用 附表1(P434):标准正态分布表 列:
显示全部