patientID <- c(1, 2, 3, 4)
admdate <- c("10/15/2009","11/01/2009","10/21/2009","10/28/2009")
age <- c(25, 34, 28, 52)
diabetes <- c("Type1", "Type2", "Type1", "Type1")
status <- c("Poor", "Improved", "Excellent", "Poor")
data <- data.frame(patientID, age, diabetes, status)
#使用dataframe将其变成一个数据框,向量内嵌套向量
data
data2 <- data.frame(patientID=character(0), age=numeric(0),
diabetes=character(), status=character())
#定义每一个变量的数据类型
data2 <- edit(data2)#使用edit来修改变量
fix(data2)#使用fix函数可以直接保存
#Reading file from Database
install.packages("RODBC")
#RODBC是用于读取数据库数据的包
#允许R和一个提供SQL链接的数据库之间通信,可读写数据库内容
setwd("D:\\backup\\Ln\\R语言实战\\RData")
x <- read.table ("input.txt")
x
head(x,n=12)
tail(x)
#文件过长时,head可选取文件前几行进行读取,tail选取末尾几行进行读取,默认为6行,
#添加n选项可决定读取的行数
x <- read.table ("input.csv")#默认空白分割
x <- read.table ("input.csv",sep=",")#这里使用,分割
#sep设置原文件中的分割方式,若为“,”,读取文件后自动将“,”删除
x <- read.table ("input.csv",sep=",",header = T)
#header决定是否将原文件第一行视为数据名称,header=T表示是数据名称,单独列出
x <- read.table ("input.csv",sep=",",header = T,skip = 5)
#skip可跳过文件前几行直接读取后面的数据,但文件中若前几行以#开头则识别为注释,自动跳过
x <- read.table ("input.csv",sep=",",header = T,nrows = 20)
x <- read.table ("input.csv",sep=",",header = T,skip = 5,nrows = 20)
x <- read.table ("input.csv",sep=",",header = T,skip = 5,nrows = 20,
na.strings = " ")
#skip控制从哪里开始读,nrow控制读取到哪里,na.strings用来告诉readtable
#哪部分属于缺失值
x <- read.table ("input.csv",sep=",",header = T,skip = 5,nrows = 20,
stringsAsFactors = F)
#AsFactors控制是否将字符转换为因子
?read.table
x <- read.csv ("input.csv",header = T)
x <- read.table("https://codeload.github.com/mperdeck/LINQtoCSV/zip/master",
header = TRUE)
install.packages("XML")
require(XML)
readHTMLTable("https://en.wikipedia.org/wiki/World_population",which=3)
#XML包中的readHTMLTable包用于读取网页中的数据,只读取第三表格which=3
RSiteSearch("Matlab")
#RSiteSearch可在网页上搜索读取文件所需要的包,如搜索读取Matlab格式所需要的包
x <- read.table(gzfile("input.txt.gz"))
#R可直接读取压缩包中的数据,无需解压
x <- read.table("clipboard")
#clipboard可用于读取剪切板的信息
x <- readClipboard()
#函数readClipboard可直接读取剪切板的信息
x <- readLines("input.txt",n=100)
#基于每一行每一单元来读取文件
world.series <- scan ("http://lib.stat.cmu.edu/datasets/wseries",skip=35,
nlines = 23,what = list(year=integer(0),pattern=character(0)))
x <- scan("scan.txt",what=list (character(3),numeric(0),numeric(0)))
x <- scan("scan.txt",what=list (X1=character(3),X2=numeric(0),X3=numeric(0)))
?write
#write是将数据写入文件,cat是将结果显示在屏幕上
?write.table
?write.csv
getwd()
write.table (x,file=newfile.txt)
write.table (x,file=newfile.csv,sep="\t")
write.table (x,file=newfile.csv,sep="\t",quote=FALSE,append=FALSE,na="NA")
write.table (x,file=gzfile (newfile.csv.gz),sep="\t",
quote=FALSE,append=FALSE,na="NA")
#使用write函数时,会自动添加行号,row.names=F可避免添加
#write会为字符串自动添加双引号,若不需要,quote=F可避免
#append=T表示新添加的内容追加在原文件末尾,append=F则会清空原文件后写入新的内容
library(foreign)
#foreign是用于读取其他软件文件的包,如SPSS
write.arff()
原文:https://www.cnblogs.com/kwq717/p/14636752.html