R语言数据类型与数据结构

时间：2019-06-06 00:56:46 阅读：176 评论：0 收藏：0 [点我收藏+]

一.数据类型 5种

1.character 字符

2.numeric 数值

3.integer 整数一般数字的存储会默认为数值类型，如果要强调是整数，需要在变量值后面加上 L。 x <- 5L class(x)

4.complex 复数 1+2i

5.logical 逻辑 TRUE&FALSE

class()查看数据类型

R语言对大小写敏感

二。数据结构

属性：名称、维度、类型、向量结构

向量（vector）：只能包含同一类型的对象。

创建向量方法1：x1 <- vector("integer",length = 4)

方法2：x2 <- 1:4

方法3：x3 <- c(1,2,3,4)

向量的其他特点，如果往向量里传的数据类型不一样，向量会强制转成同一种类型。x <- c(TRUE,10,"a") 结果都会转换成字符型元素。

向量数据类型的转换：as.xxx()

向量还可以给参量命名：

names（向量名） <- c(跟参量数量一致的名字）

向量名

矩阵和数组|matrix&array

矩阵可以看做向量+维度属性（整数向量：nrow，ncol）

x<-matrix(1:4,nrow=2,ncol=2)

技术分享图片

矩阵的填充方式是按列填充。

矩阵的相关函数：dim(x) 查看矩阵行列信息。

attributes()可以查询矩阵属性。

其他创建矩阵的办法（矩阵其实就是向量+维度信息）

技术分享图片

矩阵的拼接：

按行拼接技术分享图片

按列拼接技术分享图片

数组 array

数组与矩阵非常相似，只是维度可以大于2

技术分享图片

列表（是r中非常重要的数据结构

）

跟前面数据结构最大不同是可以包涵不同类型对象；可以直接给列表里的元素命名。

技术分享图片

如何给矩阵的每行、每列命名？

用dimnames()

技术分享图片

因子

分类数据，可分成有序和无序（按能否比大小来区分）

技术分享图片

缺失值

NA&NaN

NA不属于NaN，NaN属于NA

NaN用来表示非法运算导致的缺失值，NA用来表示的范围更广。

相关函数，判断是否是na或nan is.na()

缺失值的处理，用平均数或者众数去补全。

数据框（data.frame()）

用来存储表格数据，跟列表、矩阵关系都很密切。

技术分享图片

日期与时间结构

时间分成两个类型，POSIXct/POSIXlt

表示距离1970-01-01过去了多少秒。前者存储的数据是整数，常寸在数据框中

POSIXlt是列表，包含年月日星期等

技术分享图片

一个数据矩阵的每一行数据叫作一次观测，每一列叫作一个变量。

R语言数据类型与数据结构

原文：https://www.cnblogs.com/Grayling/p/10967477.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)