文档详情

R软件教程.ppt

发布:2017-01-30约1.43千字共13页下载文档
文本预览下载声明
R 软件教程 第一讲 统计系 刘 伟 2010年秋 目录 数据目录的建立 数据的读入与读出 数据的描述性分析 1、数据目录的建立 工作目录 WorkingDir - D:/R/ 数据目录 DataDir - paste(WorkingDir,data/,sep=) 结果目录 ResultDir - paste(WorkingDir, result/,sep=) 2、数据的读入与读出 建立数据 向量: x- c(10.4,5.6,3.1,6.4,21.7),y-c(x,0) 向量的计算:+,-,*,/,^ z- x^2 与向量有关的函数: min(x),max(x), which.min(x),which.max(x), range(x), length(x), sort(x), order(x) /sort.list(x) sum(x),prod(x),median(x),var(x), (续前) 3、数据的描述性分析 位置度量 分散程度度量 分布形状度量 数据分布 数据图形 位置度量 均值: mean(x,trim=0,na.rm=FALSE) sum(x,na.rm=F) weighted.mean(x,w,na.rm=F) 顺序统计量: sort(x,decreasing=T) order() sort.list() rank() 中位数:median(x,na.rm=T) 百分位数:quantile(x,probs=c(), na.rm=T) 分散程度度量 方差 var(x) 标准差 sd(x) 变异系数 sd(x)/mean(x) 极差 quantile(x,0.75)-quantile(x,0.25) 标准误 sd(x)/sqrt(n) 数据图形 直方图,经验分布图,QQ图 茎叶图,箱线图,五数概括 * 产生有规律的数列: 等差数列:a:b, a:b-1, 2*a:b 等间隔数列:seq() seq(from=value1, to=value2, by=value3) seq(length=value1,from=value2,bu=value3) 重复函数:rep() rep(x,times=n) (续前) 数据框 产生 data.frame() 例:P86 将列表或矩阵转化为数据框 as.data.frame() (续前) 读入文件: read.table() df.set- read.table(paste(WorkingDir,FileName,sep=),sep=,,header=TRUE, as.is=TRUE) read.spss() read.csv() 读出文件: write.table() write.table(df.data,file=paste(DataDir,“FileName.csv,sep=),sep=,“, row.names=FALSE, col.names=T) write.csv() 分布形状度量 偏度 峰度 数据的分布 r—仿真,产生某指定分布的随机数 d—概率密度函数,返回各点处的密度函数值 p—分布函数,返回各点处的分布函数值 q—分布函数的反函数,给定概率p后,求 其下分位点。 *
显示全部
相似文档