1数据分析与软件应用第1讲数据分析概述.ppt
文本预览下载声明
数据分析与处理;*;*;*;*;*;*;*;*;*;*;;社会研究的四个阶段;;获取数据的原则:;获取数据的步骤;获取数据的手段;;资料量化工作流程图;一、分类;一、分类;1.编码原则
第一,不重。
第二,不漏。
第三,对于无回答和不适用也应给予编码。
2.具体方法:填空题、单选题和多选题 ;5. 您的文化程度是:
(1) 小学及以下
(2) 初中
(3) 高中或中专
(4) 大专
(5) 本科及以上
6. 您的年龄:____周岁 ; 6. 您个人拥有下列哪些物品(可选多项)?
(1) 个人电脑
(2) 手机
(3)呼机?
(4) 相机
(5)收录机(500元以上)
(6)首饰珠宝(500元以上)
(7)名牌服装鞋帽(500元以上)
(8)名牌自行车(500元以上);7. 您业余时间主要从事哪些活动:(依经常程度选择三项)
(1)看书籍报刊 □
(2)看电视 □
(3)再学习 □
(4)做家务
(5)逛街、购物
(6)聊天
(7)休闲健身
(8)其他______;3.制作编码手册 ;三、录入;No.
;例 编码表
;三、录入;四、数据清理;四、数据清理;;;噪声数据是指数据中存在着错误、或异常(偏离期望值)的数据;
不完整数据是指感兴趣的属性没有值;
不一致数据则是指数据内涵出现不一致情况(如:作为关键字的同一部门编码出现不同值)。
数据清洗是指消除数据中所存在的噪声以及纠正其不一致的错误;
数据集成是指将来自多个数据源的数据合并到一起构成一个完整的数据集;
数据转换是指将一种格式的数据转换为另一种格式的数据;
数据消减是指通过删除冗余特征或聚类消除多余数据。;数据清洗;统计分析;QA
显示全部