加入收藏 | 设为首页 | 会员中心 | 我要投稿 辽源站长网 (https://www.0437zz.com/)- 云专线、云连接、智能数据、边缘计算、数据安全!
当前位置: 首页 > 大数据 > 正文

R语言数据处理方法~小结

发布时间:2021-01-21 09:17:41 所属栏目:大数据 来源:网络整理
导读:文章目录 1. R自带函数 2. reshape2数据重构 3. dplyr 4. tidyr 5. 字符串处理 1. R自带函数 1.1 转置 使用函数t()可对一个矩阵或数据框进行转置,对于数据框,行名将变成变量(列)名。 数列array进行维度转换 aperm 1.2 整合数据aggregate 在R中使用一个或

R语言数据处理方法~小结

2. reshape2包

首先将数据“融合”(melt),以使每一行都是一个唯一的标识符-变量组合。然后将数据“重铸”(cast),可以使用任何函数对数据进行整合成想要的任何形状。

注:reshape包的重铸函数为cast(),reshape2包的重铸函数为dcast()和acast()

R语言数据处理方法~小结

2.1融合-melt

数据集的融合是将它重构为这样一种格式:每个测量变量独占一行,行中带有要唯一确定这个测量所需的标识符变量。

R语言数据处理方法~小结

2.2重铸-dcast和acast

Use?acast?or?dcast?depending on whether you want vector/matrix/array output or data frame output. Data frames can have at most two dimensions.

1.dcast——返回的结果是一个数据框

2.acast——返回的结果可以是向量、矩阵或者数组

调用格式为:

R语言数据处理方法~小结

md为已融合的数据,formula描述想要的结果,是(可选的)数据整合函数。
接受的公式形如:

R语言数据处理方法~小结

在这个公式中,rowvar1 + rowvar2 + ...?定义了要划掉的变量集合,以确定各行的内容,而colvar1 + colvar2 + ...?则定义了要划掉的、确定各列内容的变量集合。


3. dplyr

3.1 基本操作

3.1.1 数据类型

将过长过大的数据集转换为显示更友好的 tbl_df 类型

R语言数据处理方法~小结

3.1.2 筛选filter

按给定的逻辑判断筛选出符合要求的子数据集,类似于 base::subset() 函数

R语言数据处理方法~小结

用R自带函数实现:

R语言数据处理方法~小结

除了代码简洁外,还支持对同一对象的任意个条件组合,如:

3.1.3 排列 arrange

(编辑:辽源站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读