首页 > 其他 > 详细

R基本数据管理(学习笔记)

时间:2015-07-09 17:51:55      阅读:208      评论:0      收藏:0      [点我收藏+]

对于数据的管理,有一些个人的理解,再次申明,这只是我个人的学习笔记,不喜勿喷.

1、变量的重编码:

solution one:

类似于python的列表表达式,其加强版为within(),在使用这种方法的时候,千万要注意语句的执行顺序,这个对最终的结果影响很大

example:

对于women这个dataframe,

data<-women

data<-within(data,
+ {
+ level<-"low"
+ level[height<60]<-"mid"
+ level[height<70]<-"normal"
+ level[height>=70]<-"high"
+ })

这种写法是不行的,原因是:后一个赋值会覆盖掉前面的赋值: level[height<70]<-"normal"会覆盖掉 level[height<60]<-"mid"(小于60的必然会小于70)

这样, level[height<60]<-"mid"就不会起作用。

solution two:

使用car包的recode()函数
solution three:
使用doBy的recodevar()函数
solution four:
使用自带的函数cut()

 

R基本数据管理(学习笔记)

原文:http://www.cnblogs.com/eifer/p/4633672.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!