获取数据、读取文件、写入文件

时间：2021-04-09 16:24:20 阅读：22 评论：0 收藏：0 [点我收藏+]

获取数据、读取文件、写入文件

获取数据

patientID <- c(1, 2, 3, 4)
admdate <- c("10/15/2009","11/01/2009","10/21/2009","10/28/2009")
age <- c(25, 34, 28, 52)
diabetes <- c("Type1", "Type2", "Type1", "Type1")
status <- c("Poor", "Improved", "Excellent", "Poor")
data <- data.frame(patientID, age, diabetes, status)
#使用dataframe将其变成一个数据框，向量内嵌套向量
data
data2 <- data.frame(patientID=character(0), age=numeric(0),
                    diabetes=character(), status=character())
#定义每一个变量的数据类型
data2 <- edit(data2)#使用edit来修改变量
fix(data2)#使用fix函数可以直接保存
#Reading file from Database
install.packages("RODBC")
#RODBC是用于读取数据库数据的包
#允许R和一个提供SQL链接的数据库之间通信，可读写数据库内容

读取文件（一）

setwd("D:\\backup\\Ln\\R语言实战\\RData")
x <- read.table ("input.txt")
x
head(x,n=12)
tail(x)
#文件过长时，head可选取文件前几行进行读取，tail选取末尾几行进行读取，默认为6行，
#添加n选项可决定读取的行数
x <- read.table ("input.csv")#默认空白分割
x <- read.table ("input.csv",sep=",")#这里使用,分割
#sep设置原文件中的分割方式，若为“，”，读取文件后自动将“，”删除
x <- read.table ("input.csv",sep=",",header = T)
#header决定是否将原文件第一行视为数据名称，header=T表示是数据名称，单独列出
x <- read.table ("input.csv",sep=",",header = T,skip = 5)
#skip可跳过文件前几行直接读取后面的数据，但文件中若前几行以#开头则识别为注释，自动跳过
x <- read.table ("input.csv",sep=",",header = T,nrows = 20)
x <- read.table ("input.csv",sep=",",header = T,skip = 5,nrows = 20)
x <- read.table ("input.csv",sep=",",header = T,skip = 5,nrows = 20,
                 na.strings = " ")
#skip控制从哪里开始读，nrow控制读取到哪里，na.strings用来告诉readtable
#哪部分属于缺失值
x <- read.table ("input.csv",sep=",",header = T,skip = 5,nrows = 20,
                 stringsAsFactors = F)
#AsFactors控制是否将字符转换为因子
?read.table
x <- read.csv ("input.csv",header = T)

读取文件（二）

x <- read.table("https://codeload.github.com/mperdeck/LINQtoCSV/zip/master",
           header = TRUE)
install.packages("XML")
require(XML)
readHTMLTable("https://en.wikipedia.org/wiki/World_population",which=3)
#XML包中的readHTMLTable包用于读取网页中的数据，只读取第三表格which=3

RSiteSearch("Matlab")
#RSiteSearch可在网页上搜索读取文件所需要的包，如搜索读取Matlab格式所需要的包
x <- read.table(gzfile("input.txt.gz"))
#R可直接读取压缩包中的数据，无需解压
x <- read.table("clipboard")
#clipboard可用于读取剪切板的信息
x <- readClipboard()
#函数readClipboard可直接读取剪切板的信息
x <- readLines("input.txt",n=100)
#基于每一行每一单元来读取文件
world.series <- scan ("http://lib.stat.cmu.edu/datasets/wseries",skip=35,
                     nlines = 23,what = list(year=integer(0),pattern=character(0)))
x <- scan("scan.txt",what=list (character(3),numeric(0),numeric(0)))
x <- scan("scan.txt",what=list (X1=character(3),X2=numeric(0),X3=numeric(0)))

写入文件



?write
#write是将数据写入文件，cat是将结果显示在屏幕上
?write.table
?write.csv
getwd()
write.table (x,file=newfile.txt)
write.table (x,file=newfile.csv,sep="\t")
write.table (x,file=newfile.csv,sep="\t",quote=FALSE,append=FALSE,na="NA")
write.table (x,file=gzfile (newfile.csv.gz),sep="\t",
             quote=FALSE,append=FALSE,na="NA")
#使用write函数时，会自动添加行号，row.names=F可避免添加
#write会为字符串自动添加双引号，若不需要，quote=F可避免
#append=T表示新添加的内容追加在原文件末尾，append=F则会清空原文件后写入新的内容
library(foreign)
#foreign是用于读取其他软件文件的包，如SPSS
write.arff()

获取数据、读取文件、写入文件

原文：https://www.cnblogs.com/kwq717/p/14636752.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)