心理统计学复习资料.doc
文本预览下载声明
中心极限定理:设从均值为μ、标准差为,有限的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、标准误为 的正态分布。
统计
Z-score.(1)数据性质不变;(2)线性改变;(3)转换后=0,s=1;(4)不改变形态;(5)转换后不同类的数据可以比较。
公式:
正负1个标准差大约是0.68或68%;
正负2个标准差大约是0.95或95%;
正负3个标准差大约是0.997或99.7%。
推断性统计
描述性统计
图表。如,折线图、散点图、直方图等。
量表。(1)称名量表(如,性别);
顺序量表(如,由高到低排序,5、4、3、2、1);
等距量表(如,540、520、500)[数据不能相除,没有绝对零点。];
等比量表(如,10是5的2倍)[有绝对零点,可做加减乘除]。
二项分布。(1)统计变量中只有性质不同的两项群体的概率分布;(2)两个观测值是对立的。
二项实验。(1)重复一定次数;(2)只有两个结果;(3)成功与失败的概率和为1;(4)x是成功次数。
公式:
二项系数:
np、nq都大于等于5是正态分布;
pq是负偏态;pq是正偏态,p=q=0.5对称。
当符合正态分布时,
变量分为质变和量变,量变分为离散和连续。
离散变量与连续变量的区别:
离散变量只用自然数或整数单位计算,如企业个数、职工人数;
连续变量在一定区间内可以任意取值,如身高、尺寸。
统计量。如中位数、众数、均值、方差、标准差等。
众数=中位数=均值
中位数:奇数个:=x
偶数个:在此基础上
标准差:
样本标准差代替总体标准差N-1,样本容量很大时影响不大。
频数分布和抽样分布的区别:
数据来源。频数分布是真实的数据分布,而抽样分布是统计量的分布;
频数分布是经验的,实际存在的;抽样分布是理论的,存在于逻辑中的。
点统计。如,比例、方差、均值等。
区间统计。如,置信区间。
分布分为频数分布(如抽样分布)和概率分布(如二项分布和正态分布)。
抽样分布即样本统计量的分布,受样本容量影响,所以抽样样本容量要固定。
抽样误差:样本容量越大越接近总体,抽样误差越小。
np、nq大于等于5趋于正态分布。
比例的抽样分布:
(p是成功的概率)
样本容量大于等于30为大样本,大样本一般趋于正态分布。
均值的抽样分布:
置信区间是指由样本统计量所构造的总体参数的估计区间
P小于等于5%为小概率事件。
为拒绝零假设。
a为弃真错误,b为留假错误。
a错误没法减少,因为设置了临界线。
减少b错误:
尽可能设置单项检验;
增加样本容量;
使用离差程度小的总体。
a即(1-b)即效度。b错误概率大于a。
T检验运用于两组数据的对比检验,且没有总体标准差时。
单样本t检验:
双样本t检验:
自由度是指当以样本的统计量来估计总体的参数时, 样本中独立或能自由变化的自变量的个数。
单样本df=n-1;
双样本df=
效度:(区分度)
离差越大,效度越高;
样本容量越大,效度越高;
标准差越小,效度越高;
a水平越大,效度越高。
方差齐性(超过两组时,F检验):
当时,df=n-1
当时,
F分布是正偏态分布,样本足够大时趋于正态分布。
方差分析(1);
MST(分组均方);
MSE(误差均方);
P(组数、水平); (代表组数)
N(总样本容量)。
(2) ;
(omega的平方用于
描述关系强度)
APA style:F(,),MSE= ,pa
事后多重比较常用HSD检验,严谨则用scheffe检验。
皮尔逊相关系数:(应用于两个等距或等比数据,不能应用于排名)
;
极轻度:-0.2r0.2;轻度:±0.2~0.5;中度:±0.5~0.8;高度:r0.8
使用是因为排除了=0和1的情况,代表了影响因素的相关程度。
【截断的全距会影响相关系数】
斯
显示全部