首页 > 编程语言 > 详细

R语言LDA包数据预处理脚本

时间:2015-07-20 19:29:05      阅读:954      评论:0      收藏:0      [点我收藏+]

docs<-list()

setwd("E:/test/");
dirlist<-dir();

voc<-c()


for(file in dirlist)
{
  f<-paste(getwd(),‘/‘,file,sep=‘‘)
 
  data <- scan(f, what="")
  data <- gsub("[^\\w-]", "", data, perl=TRUE)
  voc<-c(voc,data)
  voc<-voc[!duplicated(voc)]
  print(data)
  df <- sort(table(tolower(data)))
  print("---")
  na<-names(df)
  v<-c()
  for(n in na)
  {
      v<-c(v,which(voc==n))
  }
  m<-rbind(v,df)
  lt<-list(m)
  print(m)
  print(df)
  docs <-append(docs,lt)
 
}
docs

版权声明:本文为博主原创文章,未经博主允许不得转载。

R语言LDA包数据预处理脚本

原文:http://blog.csdn.net/guoguo11191/article/details/46971797

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!