第4讲数据操作和数据管理1讲解.doc
文本预览下载声明
第四讲 数据操作和数据管理(一)
参考书:Also see)
①Mitchell, M. N. 2010. Data Management Using Stata: A Practical Handbook. College Station, TX: Stata Press.
②Long, J. S. 2009. The Workflow of Data Analysis Using Stata. College Station, TX: Stata Press.
③Hamilton, L. C. 2013. Statistics with Stata: Updated for Version 12. 8th ed. Boston: Brooks/Cole. (中文版见⑤)
④Baum, C. F. 2009. An Introduction to Stata Programming. College Station, TX: Stata Press
⑤《应用STATA做统计分析》(劳伦斯·汉密尔顿著,郭志刚等译,重庆大学出版社,2011)。
⑥《社会统计分析与数据处理技术:STATA软件的应用》(杨菊华,中国人民大学出版社,2008)
数据分析的第一步首先要求将原始数据改造为Stata可用的格式。我们可以将一个新数据通过以下几种方式载入Stata:①键盘输入;②读取原始数据的ASCII格式文件;③将电子表格数据粘贴到数据编辑窗口(Editor)中;④应用第三方数据转换程序将其他电子表格、数据库或统计程序创建的系统数据集直接转换过来。一旦Stata有了内存数据,我们就可以在Stata中将其存为Stata格式,以利将来方便地取用和更新。
数据操作和管理包括如下功能:
⑴基本数据命令
⑵创建和删除变量
⑶函数和表达式
⑷日期和时间
⑸加载,保存,导入和导出数据
⑹合并数据
⑺重塑数据集
⑻标签,显示格式和注释
⑼变量的更改和重命名
⑽检查数据
⑾文件操作
⑿混合数据命令
当数据管理任务很复杂或需要重复进行时,Stata用户可以编写自己的程序来自动完成这些工作。尽管Stata是因其分析功能而著名,其实它同时也具有广泛的数据管理功能。本讲将介绍其中一些基本功能。
一、基本数据命令
1.[D] use . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Load Stata dataset
use Load Stata dataset (打开Stata数据集)
例1:(打开指定变量,可应用条件语句:if in)
use ln_wage grade age tenure race using nlswork
describe
2.[D] save . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Save Stata dataset
save Save Stata dataset (保存Stata数据集)
ave filename (首次保存文件)
save, replace (保存且替换已有文件)
3.[D] describe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Describe data in memory or in file
describe Describe data in memory or in file(描述内存或文件中的数据,生成内存数据或文件数据的概要)
注意:第一,变量名保证没有歧义的情况下可以使用缩写,或使用缩写通配符(~)代替省略部分,例如displ~ ;第二,可以指定一系列的变量,如变量1-变量n
例1:
use states,clear
describe, numbers (变量按顺序编号,变量名前面加上数字序号)
describe, fullnames(完整变量名)
describe state region median marriage divorce(变量列表,注意此处用到了缩写)
例2:
use census,clear
describe pop* (通配符*)
describe state region pop18p(stat或po都是错误的)
例3:
describe usin
显示全部