第一章 SAS过程简介.pdf
文本预览下载声明
第 49 章 SAS 过程简介
用编程法运行 SAS,通常需要两步,第一步,叫 SAS 数据步,此步产生 SAS 数据集;第
二步,叫 SAS 过程步,此步调用 SAS软件包中真正的程序(称为 SAS 过程)处理提供的 SAS
数据集。本章将介绍以下主要内容:其一,SAS过程步的一般形式;其二,SAS/BASE 模块中
常用的一些过程及其主要功能;其三,SAS/STAT 模块中常用的一些过程及其主要功能。
49.1 SAS 过程步的一般形式
SAS 过程步的一般形式为:
PROC 过程名 DATA=输入数据集 选项;
过程语句 / 选项;
过程语句 / 选项;
……
RUN;
其中 PROC 是过程步开始的标志,在 PROC 后至少要留一个空格,紧随其后的是一个英文
单词(如 PRINT、SORT、…),该单词叫 SAS 过程名。SAS 软件中有很多模块(如 SAS/BASE、
SAS/STAT、SAS/GRAPH、…),每个模块中都有很多具体的 SAS 过程。在 PROC 后写上一个具
体的过程名,就是要求 SAS 系统调用该过程对给定的 SAS 数据集进行处理。
写在“PROC 过程名”之后的内容,都叫作 PROC语句的选择项,简称 PROC 语句的选项。
所谓“选项”,就是根据用户的需要,可选可不选,用来规定过程运行的一些设置。若某些
选项没选,SAS 系统就取隐含的或默认的或缺省的内容。例如,当“DATA=输入数据集”未
被选定时,SAS 系统就使用在此之前最后生成的数据集为分析之用的数据集。如果有多个选
项,彼此之间需用空格分开。
每个 SAS 语句都以分号结束,而每个过程步一般以 RUN 语句结束。还有一种所谓“交
互式过程”可以在遇到 RUN 语句时不结束过程运行,只有遇到 QUIT 语句或者下一个过程步、
数据步时才结束。在一个 SAS 过程步中,根据需要,可以写多个 SAS过程步语句。
49.2 SAS/BASE 模块中常用的一些过程及其主要功能
49.2.1 CHART 过程
CHART 过程可以产生垂直和水平直方图、块形图、饼图和星形图。这些图形显示变量的
值或与这些值相关的统计量。变量可以是数值的,也可以是字符的。
PROC CHART是一种有效的工具,它可以快速将数据视觉化,但如果需要生成包含颜色和
不同字体的高品质图形,建议使用SAS/GRAPH软件。SAS/GRAPH软件中的GCHART过程产生与
PROC CHART相同类型的图表。此外,PROC GCHART还可以生成环形图。
49.2.2 COMPARE过程
COMPARE过程比较两个SAS数据集的内容,它能比较不同数据集中的变量,也能比较同一
个数据集中的不同变量。
PROC COMPARE比较两个数据集:基础数据集和比较数据集。这个过程确定匹配变量和匹
配观测。匹配变量是具有相同名字的一些变量,或者使用VAR和WITH语句明显配对的一些变
量。匹配变量必须是相同的类型。匹配观测是对用户规定的所有ID变量具有相同值的一些观
测,若没有规定ID语句,则是出现在这些数据相同位置的观测。如果使用ID变量来匹配观测,
两个数据集必须按所有ID变量分类。
49.2.3 CORR过程
CORR过程用于计算变量间的相关系数,包括Pearson的乘积矩相关和加权乘积矩相关,
还能产生三个非参数的关联测度(Speaman的秩序相关,Kendall的tau-b,和Hoeffding的相
关性度量D)。另外,该过程也可以计算偏相关(Pearson的偏相关,Speaman的偏秩序相关
和Kendall的偏tau-b)和Cronbach系数α及一些单变量的描述性统计量。
49.2.4 EXPORT过程
PROC EXPORT过程步用于读取SAS数据集,并把它写到外部文件中去并保存。外部文件类
型包括:Excel、Access、DBF、文本文件(*.txt)等,同时此过程步还可以自定义存为外
部文件时的格式。
PROC EXPORT以下述方式之一来输出数据:
显示全部