R与统计:如何进行数据处理

删除缺失值

R中缺失值使用NA表示。NA是R中的三个逻辑值之一,另外两个是TRUE和FALSE。NULL表示无效对象。

#判断是否是缺失值
is.na(x)
#删除缺失值
x[!is.na(x)]
将字符串变为命令执行
#用parse()函数将字符串转化为表达式,再用eval()函数对表达式求解
a <- "print(1:10)"
eval(parse(text = a))
给一个变量添加元素
#使用append()函数
x <- 1:10
append(x, 0, after = 1)
比较两个dataframe是否相同
#any()函数可以判断两个数据框中是否至少有一个元素相等
any(a = b)
#如果需要返回两个数据框中相同的元素的位置
which(a = b, arr.ind = TRUE)
去掉数据中重复的行
#unique()函数可以去掉向量、数据框或数列中的重复元素
x <- c(1:10, 2:19, 3:8)
unique(x)
对数列进行维度变换
x <- array(1:24, 2:4)
xt <- aperm(x,c(2,1,3))
dim(xt)
对矩阵按行或按列计算
mat=matrix (vec, ncol =4)
cumsum(vec)
apply (mat, 2, cumsum)
根据共有的列合并数据框
merge(x, y, by.x=, by.y=)
将数据标准化
x <- c(1:30,10-20)
m <- scale(x, scale = F)
n <- scale(x, center = F)

推荐阅读更多精彩内容