首页 > 其他 > 详细

数据集:用于数据挖掘、推荐系统等

时间:2015-12-22 15:58:28      阅读:456      评论:0      收藏:0      [点我收藏+]
下面是美国UCI机器学习中心提供的数据集:
 
感觉对自己比较有用的:
 
学生的基本信息,用于学生学业表现预测:http://archive.ics.uci.edu/ml/datasets/Student+Performance
 
有情感标注的语句数据集,可用于情感分析:http://archive.ics.uci.edu/ml/datasets/Sentiment+Labelled+Sentences
 
汽车评价和酒店评价的数据集,这个是文本评价,比较遗憾的是没有评价用户的信息:http://archive.ics.uci.edu/ml/datasets/OpinRank+Review+Dataset
 
饭店评价的数据集,有饭店信息、用户信息,评分信息。数据量比较小,可用于(上下文)推荐系统的研究:
 
38000位用户在一周之内访问网站 www.microsoft.com的信息。对每个用户,列出了其访问该网站的所有领域。用户用id标识,没有其他用户信息,数据较老(1998年)。可用于推荐系统研究:http://archive.ics.uci.edu/ml/datasets/Anonymous+Microsoft+Web+Data
 
sina微博的数据集,包括用户信息,微博信息,微博转发等信息:http://archive.ics.uci.edu/ml/datasets/microblogPCU
 

stanford dataset全集
有很多数据集,覆盖种类也较多

数据集:用于数据挖掘、推荐系统等

原文:http://www.cnblogs.com/colorss/p/5066783.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!