社会研究方法:统计分析1.ppt
文本预览下载声明
第十讲 统计分析的基本概念与方法(1) 一、描述性统计分析 二、样本分布 三、推断性统计的基本概念 四、假设检验 五、相关分析 六、回归分析 一、描述性统计(Descriptive Statistics) (一)百分比、相对比与图表 一、描述性统计(Descriptive Statistics) 2. 相对比(Ratio) f1 R= f2 例:某村共1370名男性,930名女性 男女性别比: 1370/ 930=1.47 一、描述性统计(Descriptive Statistics) ◆百分比、相对比与图表仅仅给出了变量分布的直观信息,若想对变量分布的特征有更进一步的把握,还需对其分布的结构做进一步处理。 一、描述性统计(Descriptive Statistics) (二)变量的集中/中心趋势(Central tendency)的测量 1.众数(mode) 2.中位数(median) 3.平均数(mean) 一、描述性统计(Descriptive Statistics) 1.众数 在一个变量分布中出现频率最高的变量值 例1:前面“婚姻状况”例子中,单身人数最多,众数是单身者。 例2:变量值分布为 2、3、3、3、3、4、4、6、7 众数是3 ▲众数可以有两个: 2、3、3、3、3、4、4、5、5、5、5、6、7 一、描述性统计(Descriptive Statistics) 2.中位数 指一个变量分布的中间点 例1:变量值分布为 2、3、3、3、4、6、7 例2:变量值分布为 2、4、4、4、6、7、8、9 中位数为: (4+6)/ 2=5 一、描述性统计(Descriptive Statistics) 3.平均数 ▲平均数的特点:它对数值极大或极小的个案特别敏感 一、描述性统计(Descriptive Statistics) ◆众数:对定名变量是最合适的选择 ◆中位数:对定序变量是最合适的选择 ◆平均数;对定距和定比变量是最合适的选择 一、描述性统计(Descriptive Statistics) ▲虽然变量的集中趋势提供了变量分布的描述,但仅知其集中趋势是不够的. 例1:清华附近2家送快餐公司的送餐速度: A:平均送到家的时间为12分钟,但最快3分钟到,最慢30分钟到; B:平均送到家的时间为13分钟,但最快10分钟到,最慢15分钟到. Q:你愿意选哪家? = 还需对变量的离散趋势(Dispersion)进行测量 一、描述性统计(Descriptive Statistics) (三)变量的离散趋势(Dispersion)的测量 1.极差/全距(Range) 极差=变量最高值 – 最低值 例1: RA=30 – 3 =27 RB=15 – 10 =5 ▲但极差仅反映了变量最高值和最低值的差异,对变量分布中的其他值未加以考虑(浪费了许多信息) = 变量的平均离散值/平均偏差(Average Deviation) 一、描述性统计(Descriptive Statistics) 2. 变量的平均离散值/平均偏差(Average Deviation) 平均离散值:变量中的每一个值与平均数的距离之和. 一、描述性统计(Descriptive Statistics) 3.方差(Variance)和标准差(Standard Deviation) 方差:即把每个离散值先平方,计算总和,再除以样本总数. 一、描述性统计(Descriptive Statistics) 标准差: 即以平均数来估计变量中每一个值所犯的错误平均是S.该值越大,变量的分布面就越大.它显示变量分布的离散程度. 一、描述性统计(Descriptive Statistics) 按S计算例1的结果: A公司的平均值:12分钟 B公司的平均值:13分钟 SA=8.74 SB =1.56 故B公司比A公司的送餐速度稳定的多(即你估计B公司送餐到你家的时间的误差比A公司小的多) 一、描述性统计(Descriptive Statistics) ◆平均数和标准差把复杂的变量分布概括为两个数字,我们对变量的中心趋势和离散趋势有了一个直观的了解。 一、描述性统计(Descriptive Statistics)
显示全部