R语言学习过程各种笔记.docx
文本预览下载声明
R语言学习过程各种笔记
R语言学习过程各种笔记
PAGE / NUMPAGES
R语言学习过程各种笔记
数据挖掘与数据分析的主要区别是什么?
数据分析就是为了处理原有计算方法、 统计方法,着重点就是数据、 算法、统计、数值。
数据挖掘是从庞大的数据库中分析出有目标数据群, 筛选出利于决策的有效信息
简单来说就是
数据分析是针对以往取得的成绩,比如说哪方面做得好,哪方面需要改进;
数据挖掘就是通过以前的成绩预测未来的发展的趋势,并且为决策者提供建议。
读 excel 时可以先复制再运行 data - (clipboard, header
= T, sep = \t)
在 R 语言中,使用“ =”和“ - ”到底有什么不同? 就是等
号和箭头号有什么区别,是完全一样还是局部不同?
R 里通常用符号 ”-”代替其它语言里的 ” =来”作赋值符号。 因为前者敲起来比等号要麻烦, 且
大部分情况下两者是等价的,所以通常就愉懒依旧用 ”=来”赋值。但要切记两者在某些时候
是有区别的。字面上的解释,可以认为 ”-”是赋值, ”=是”传值。在函数调用中, func(x=1)
与 func(x-1) 是有区别的, 前者调用完后变量 x 不会被保留,而后者会在工作区里保留变量
x=1 。再如
length(x=seq(1,10))
计算完成后
x 不会被保留, 而
length(x-seq(1,10))
计算完后
你会在工作区里发现
x 这个变量。
矩阵知识:
1_矩阵的生成
2_矩阵的四则运算
3_矩阵的矩阵运算
4_矩阵的分解
1_1 将向量定义成数组
向量只有定义了维数向量 (dim 属性 ) 后才能被看作是数组 . 比如 :
z=1:12;
dim(z)=c(3,4);
z;
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
注意:生成矩阵是按列排列的。
1_2 用 array ( ) 函数构造多维数组
用法为: array(data=NA,dim=length(data),dimnames=NULL)
参数描述: data :是一个向量数据。
dim :是数组各维的长度,缺省时为原向量的长度。
dimname :是数组维的名字,缺省时为空。
例子:
x=array(1:20,dim=c(4,5))
x
[,1] [,2] [,3] [,4] [,5]
[1,] 1 5 9 13 17
[2,] 2 6 10 14 18
[3,] 3 7 11 15 19
[4,] 4 8 12 16 20
1_3 用 matrix() 函数构造矩阵
函数 matrix) 是构造矩阵 ( 二维数组 ) 的函数,其构造形式为 matrix(data=NA ,nrow=1, ncol=1 ,byrow=FALSE,dimnames=NULL)
其中 data 是一个向量数据, nro 、是矩阵的行数, ncol 是矩阵的列数 . 当byrow=TRUE时,生成矩阵的数据按行放置, 缺省时相当于 byrow=FALSE,数据按列放置 .dimname。是数组维的名字,缺省时为空 .
如构造一个 3x5 阶的矩阵
A=matrix(1:15,nrow=3,byrow=TRUE)
A
[,1] [,2] [,3] [,4]
[,5]
[1,]
1
2
3
4
5
[2,]
6
7
8
9
10
[3,]
11
12
13
14
15
2_矩阵的四则运算
可以对数组之间进行四则运算 (+ 、一、* 、/) ,这时进行的是数组对应元素的四则运算。一般情况下参加运算的矩阵或者数组的维数是相同的, 但也可以计算不同维的,这是要将对应的元素补足。
3_1 转置运算
对于矩阵 A,函数 t(A) 表示矩阵 A 的转置,如:
A=matrix(1:6,nrow=2);
A;
[,1] [,2] [,3]
[1,] 1 3 5
[2,] 2 4 6
t(A); [,1] [,2]
[1,] 1 2
[2,] 3 4
[3,] 5 6
3_2 求方阵的行列式
函数 det() 是求矩阵行列式的值,如
det(matrix(1:4,ncol=2)); [1] -2
3_3 向量的内积
对于 n 维向量 x,可以看成 nxl 阶矩阵或 lxn 阶矩阵。若 x 与 y 是相同维数的向量,则 x%*%Y表示 x 与 y 作内积 . 例如,
x=1:5; Y=2*1:5
x%*%y
[ ,1]
[1 ,]110
函数 crossprod() 是内积运算函数 ( 表示交叉乘积 ) ,crossprod(x,y) 计算向量 x 与 y 的内积,即 t(x) %*% y 。crossprod
显示全部