STATA常用命令大全.pdf
文本预览下载声明
STATA 常用命令大全
调整变量格式:
format x1 %10.3f ——将x1 的列宽固定为10,小数点后取三位
format x1 %10.3g ——将x1 的列宽固定为10,有效数字取三位
format x1 %10.3e ——将x1 的列宽固定为10,采用科学计数法
format x1 %10.3fc ——将x1 的列宽固定为10,小数点后取三位,加入千分位分隔符
format x1 %10.3gc ——将x1 的列宽固定为10,有效数字取三位,加入千分位分隔符
format x1 %-10.3gc ——将x1 的列宽固定为10,有效数字取三位,加入千分位分隔符,加入“-”表示左对齐
合并数据:
use C:\Documents and Settings\xks\桌面\2006.dta, clear
merge using C:\Documents and Settings\xks\桌面\1999.dta
——将1999 和2006 的数据按照样本(observation )排列的自然顺序合并起来
use C:\Documents and Settings\xks\桌面\2006.dta, clear
merge id using C:\Documents and Settings\xks\桌面\1999.dta ,unique sort
——将1999 和2006 的数据按照唯一的(unique)变量id来合并,在合并时对id进行排序(sort )
建议采用第一种方法。
对样本进行随机筛选:
sample 50
在观测案例中随机选取50%的样本,其余删除
sample 50,count
在观测案例中随机选取50 个样本,其余删除
查看与编辑数据:
browse x1 x2 if x33 (按所列变量与条件打开数据查看器)
edit x1 x2 if x33 (按所列变量与条件打开数据编辑器)
数据合并(merge)与扩展(append )
merge表示样本量不变,但增加了一些新变量;append表示样本总量增加了,但变量数目不变。
one-to-one merge:
数据源自stata tutorial中的exampw1 和exampw2
第一步:将exampw1 按v001~v003 这三个编码排序,并建立临时数据库tempw1
clear
use t:\statatut\exampw1.dta
su ——summarize的简写
sort v001 v002 v003
save tempw1
第二步:对exampw2 做同样的处理
clear
use t:\statatut\exampw2.dta
su
sort v001 v002 v003
save tempw2
第三步:使用tempw1 数据库,将其与tempw2 合并:
clear
use tempw1
merge v001 v002 v003 using tempw2
第四步:查看合并后的数据状况:
ta _merge ——tabulate _merge 的简写
su
第五步:清理临时数据库,并删除_merge ,以免日后合并新变量时出错
erase tempw1.dta
erase tempw2.dta
drop _merge
数据扩展append:
数据源自stata tutorial中的fac19 和newfac
clear
use t:\statatut\fac19.dta
ta region
append using t:\statatut\newfac
ta region
合并后样本量增加,但变量数不变
茎叶图:
stem x1,line(2) (做x1 的茎叶图,每一个十分位的树茎都被拆分成两段来显示,前半段为0~4 ,后半段
为5~9 )
stem x1,width(2) (做x1 的茎叶图,每一个十分位的树茎都被拆分成五段来显示,每个小树茎的组距为2 )
stem x1,round(100) (将x1 除以100 后再做x1 的茎叶图)
直方图
采用auto数据库
histogram mpg, discrete frequency normal xlabel(1(1)5)
(discrete表示变量不连续,frequency表示显示频数,normal加入正太分布曲线,xlabel设定x轴,1 和 5
为极端值,(1)为单位)
histogram price, fraction norm
(fraction表示y轴显示小
显示全部