统计学基础任务1:认识统计研究.ppt
文本预览下载声明
1.设计:任何一个工作在开始工作之前首先都要进行一些筹划、计划。进行一个全局的安排。确定研究的主题,研究的目的。意义。预测会得到什么样的结论。数据收集的方式,样本的大小,用什么样的方式去分析数据,用什么样的统计软件,建立什么养的模型,用什么样的指标。 2.收集:自然科学:实地测量,实地考察。社会科学:网上下载。注意:要能保证你数据的完整性和准确性。收集上来数据的质量的好坏也会直接影响最后的研究结果。 3.数据整理:收集:查缺补漏。极大值、极小值。 4.分析:什么统计软件,建立什么样的模型,使用什么指标。 注意:4个步骤按先后顺序。 看目录,每一章看一下 * * 根据数据类型来选择数据的处理方式。关于数据的类型我们来介绍以下这三种对于数据的分类方式:1/2/3 某同学的身高:1.60米 空间:体重、某一个城市污染指数的。 * 1.分类数据。比如:我们说男女,我们将男生设为1,将女生设为0;比如说血型,我们将o型血设为0,A型血设为1,B型血设为2,AB型血设为3;注意:不可以进行大小的比较,也不能进行运算。 2.顺序数据。比如:考试成绩,最典型的优,良,中,及格,不及格。学历:小学,中学,大学,研究生。与分类数据的区别:顺序数据可以进行比较。 * 用一个具体的数值来表示的数据就是数值型数据。不但可以进行比较,也可以进行加减运算,也就是比较大小多少。第一个人身高162,第二个人身高172,第三个人身高182.每两个人之间相差都是10厘米。 * * 观测数据,比如说身高,体重,我们可以通过观测或者实地的测量来获得这个数值。实验数据:掷硬币正反面的概率,我们只能通过实验来获得,100次,这样只能通过实验来获得的数据我们称之为实验数据。 * 截面:全班同学的身高。 时间序列:其中某一个人从1岁到20岁每一年的身高。 二者一横一纵。 面板数据:时间序列数据和截面数据结合在一起,把这样一横一宗拼在一起所形成的这样一个表格或者一个截面中所包含的数据就是面板数据。 * * 第九页,综合应用题第一题 * * 信息:大四毕业成绩单,综合的成绩 咨询:咨询公司。新兴的行业 监督:天气预报。高温红色预警,暴雨黄色预警,风速,云层的厚度,气压的指数 关系:书,画上 * 例子:体现了统计什么样的职能。信息 * 信息 * 信息 * 预警 * 预警 1.青年人社会负担加大 2.社会对于医疗保险的支出会增加,医疗压力增大,医疗保障问题突出。3.人口老龄化将影响社会的生机和活力。 * 1.提高社会保障程度,医疗服务,医疗水平跟不上引起一系列的社会问题。 2.退休改革。 * 举例:我们现在已知某一个班级同学的身高,我们通过观察这一组数据的分布情况,对这一组数据进行分组,求它的均值、方差,对这一组数据的整体情况进行描述就是描述性统计。如果我们现在已知一个班级同学的身高,那我们将这个班级同学的身高作为一个样本,去推测整个沈阳职业技术学院全体同学的身高,这就是推断性统计。以前的时候,传统的统计学都是以描述性统计为主,比如说我们描述一下整个国家的人口分布、地理分布、财务分布,现代统计学则是以推断性统计为主,喜欢用一组数据去推断总体情况。一般我们在做一个完整的统计分析的时候,是即要包括描述性统计又要包括推断性统计。一个完整的统计分析是要同时包括这两个部分的。 * 现在统计学的研究方法,我们可以将他划分为两大类,一类是描述性统计一类是推断性统计。举例: * 这几个概念非常的重要,所以希望大家这里能认真的听一下,如果考试的话这里也会是考试的重点内容。 * 1.总体:我们想要了解的一个对象。比如:我们现在想了解期货一班全班同学的身高,统计总体。。。如果我们想了解沈阳职业技术学院所有同学的身高,这个总体马上就扩展了,变成沈阳职业技术学院全体同学的身高。你所要研究的对象全部个体的组合,就是整体。 2.个体。组成总体的每一个单位就叫做个体。比如说具体到我们班某一个同学的身高。张三的身高,李四的身高这就是个体。 那我们通过PPT中右侧的这个图,我们可以了解一下总体与个体的关系。这个大圈中包含的所有的人就是总体,其中的每一个小人就是个体。一个总体是由N多个,无限多个个体组成的。N多个个体组合在一起就构成了一个总体。 * 样本:比如我们要研究整个沈阳职业技术学院同学的身高,我们就可以抽取。。身高作为一个样本。我们从整体中抽取一小部分,通过这一小部分数据去推断整个总体的数据特征这就是样本的作用。需要注意的一点就是总。比如我们同样是研究沈阳。。总体是唯一的确定的,但样本却不是唯一的,对于一个总体我们可以选择不同的样本,比如我们同样是研究沈阳。。。同学的身高,我们即可以选择。。的同学身高作为样本,也可以选择。。班同学的身高作为样本。样本的选取一定要能代表总体的某一些重要的特征。样本选取的好坏也
显示全部