此次分享doc来自于互联网,分享会议是2014bdtc
首先看架构图:
?
数据来源图:
涉及点:
1.构建实体关系知识图谱
2.基于flume做数据传输
3.基于Elastic Search 提供检索服务
4.基于hadoop的mr做分析
5.利用了xpath做解析(其实csspath会更好)
6. 交叉验证
详情参见附件
"宜信大数据金融实践分享"汇总
原文:http://snv.iteye.com/blog/2218594