首页 > 编程语言 > 详细

R语言现学现做

时间:2020-10-28 11:49:40      阅读:54      评论:0      收藏:0      [点我收藏+]
目标:对文件进行数据分析
 
 
1.环境配置

https://blog.csdn.net/weixin_42032429/article/details/83095899

 

2.连接文件

安装xlsx软件包

安装顺序

https://www.cnblogs.com/chenlu-vera/p/9334142.html

install.packages("rJava") 
install.packages("xlsxjars") 
install.packages("xlsx")

技术分享图片

验证是否安装成功

any(grepl("xlsx",installed.packages()))

技术分享图片

尝试调用xlsx包失败,先安装了xlsx,后rJava,导致loadNamespace()里算‘rJava‘时.onLoad失败了

技术分享图片

操作系统的版本是win10, 64bit,我系统安装的jdk1.8,是32bit的,而使用的R版本是64位的;R版本与jre版本不兼容导致;更改R版本位32位的即可!

RStudio中,Tools –> Global Options –General –> R version Change一下(如果安装R时没勾选32bit的,就重新安装一下)

然后执行

library("xlsx")

接下来使用read.xlsx()函数来读取excel数据

导入文件到RStudio中

file->import dataset->from excel

安装完依赖包就选取导入数据的目录

技术分享图片

导入后

技术分享图片

可以看到数据已经保存到ABPrices中了

查看数据

ABPrices

技术分享图片

 

 

3.基本操作

(1)查看表格维数

dim(ABPrices)

技术分享图片

(2)查看表格的数据结构

str(ABPrices)

技术分享图片

(3)获取描述性统计

summary(ABPrices)

技术分享图片

(4)缺失值统计

统计没有数据的表格数量

sum(is.na(ABPrices))

技术分享图片

(5)将数据表中的用户ID设置为索引

rownames(ABPrices)=ABPrices$id

(6)查看数据表

head(ABPrices)

(7)提取数据表前两行

ABPrices[1:2,]

技术分享图片

(8)提取特定用户ID信息

ABPrices[‘5441‘]

技术分享图片

(9)提取多个用户ID信息

ABPrices[c(‘5099‘,‘7322‘),]

技术分享图片

(10)提取多列信息

head(ABPrices[1:2])

技术分享图片

(11)提取指定列信息

head(ABPrices[‘host_name‘])

技术分享图片

(12)提取指定行列信息

ABPrices[1:2,5:6]

技术分享图片

(13)提取在指定用户的指定信息

ABPrices[‘7322‘,‘host_name‘]

(14)提取金额最大值的行信息

ABPrices[which.max(ABPrices$price),]

技术分享图片

(15)提取顾客数最小值的行信息

ABPrices[which.min(ABPrices$number_of_reviews),]

技术分享图片

(16)找到房租金额最大的那个值

ss=min(ABPrices$price)
print(ss)

技术分享图片

(17)找到房租金额平均值

print(mean(ABPrices$price))

技术分享图片

 

4.简单统计

(1)统计不同地区的房屋数量

#下载依赖包
install.packages("dplyr")
install.packages("ggplot2")

#加载依赖包
library(dplyr)
library(ggplot2)

#统计各区住房数量
freq <- data.frame(table(ABPrices$neighbourhood_group))

plot <- ggplot(data = freq, mapping = aes(x = reorder(Var1, -Freq),y = Freq)) + geom_bar(stat = ‘identity‘, fill = ‘lightcoral‘) + theme(axis.text.x  = element_text(angle = 45, vjust = 0.5)) + xlab(‘Areas‘) + ylab(‘Numbers‘)+ coord_flip()

plot

技术分享图片

 

 

R语言现学现做

原文:https://www.cnblogs.com/ak918xp/p/13889707.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!