文档详情

Ch6 SAS基本统计过程(二) freq-课件.ppt

发布:2016-05-22约8.44千字共24页下载文档
文本预览下载声明
Slide * 彭斌 关于计数资料的统计推断,最为常用的是 FREQ过程。 FREQ过程可以用于两个目的:一是描述分析,产生频数表和列联表,可简洁地描述数据;二是统计推断,产生各种统计量,可分析变量间的关系。 该过程主要由下列语句控制: PROC FREQ option(s) TABLES request(s) / option(s); WEIGHT variable; 该过程PROC FREQ语句是必需的,其它语句都是可选的。 第五章 计数资料的统计描述与推断 PROC FREQ option(s); 这里的options常用的有 Data=SAS-data-set,指定输入数据集名,若省略,则用最近建立的数据集。 2. TABLES request(s) / option(s); TABLES语句是该过程中非常重要的一条语句。在一个PROC FREQ过程中,可以有任意多个tables语句; 如果没有tables语句,FREQ对数据集中的每个变量都生成一个单向频数表; 如果tables语句没有任何说明选项(options),FREQ对tables语句中规定的变量的每个水平将计算频数、累计频数、占总频数的百分数及累计百分数。 在TABLES语句中,用request(s)指定制表要求。这里,可以是用*连接起来的一个变量或多个变量。在一个TABLES语句中可以给出任意多个制表要求。 例如: 。Tables a; 对指定变量a产生一个单向频数表; 。Tables a*b; 产生以b为列、a为行的二维列联表; 。Tables a*b*c; 产生以c列、b为行、a为分层的三维列联表。这里,按照a的不同取值形成b*c的不同列联表。 。Tables a*(b c);等价于tables a*b a*c; 。Tables (a b)*(c d);等价于tables a*c a*d b*c b*d; 。Tables (a b c)*d;等价于tables a*d b*d c*d; 2) 在TABLES语句的斜杠(/)后面可以使用如下选项: CHISQ:要求进行卡方检验(Chi-Square Test) Fisher:要求对大于2×2的表进行Fisher的精确检验; Agree:做配对卡方检验; ALPHA=p:确定置信区间的水平是100(1-p)%的置信区间,默认p=0.05; ALL:要求所有由CHISQ、MEASURES和CMH选项给出的检验和度量; NOCOL、NOROW、NOPERCENT、NOFREQ 最为常用的选项是CHISQ和FISHER。 3. WEIGHT variable; 通常每个观测对频数计数的贡献都是1,但当出现WEIGHT语句时,每个观测对频数计数的贡献为这个观测对应的权数变量的值。 。如果资料是最原始的形式,通常情况下不需要此语句; 。如果资料是以频数的形式出现,则需要该语句。 Data a; Input row col f; Cards; 1 1 74 1 2 51 2 1 56 2 2 19 ; Run; + - 甲组 74 51 乙组 56 19 四格表资料 建立SAS数据集,行变量row,列变量col,行列交叉对应的频数f row col Frequency| Percent | Row Pct | Col Pct | 1| 2| Total ---------+--------+--------+ 1 | 1 | 1 | 2 | 25.00 | 25.00 | 50.00 | 50.00 | 50.00 | | 50.00 | 50.00 | ---------+--------+--------+ 2 | 1 | 1 | 2 | 25.00 | 25.00 | 50.00 | 50.00 | 50.00 | | 50.00 | 50.00 | ---------+
显示全部
相似文档