首页 > 其他 > 详细

Hadoop之HBase

时间:2018-05-26 23:41:05      阅读:279      评论:0      收藏:0      [点我收藏+]

从BigTable说起:

BigTable用于解决互联网的搜索问题

1.  建立互联网的索引

  爬虫持续不断的抓取新的网页,这些网页每一页一行的存储到BIgTable中

  MapReduce计算作业运行在整个表上,生成索引,为网络搜索应用做准备

2.  搜索互联网

  用户发起网络搜索请求

  搜索网络应用查询建立好的索引,从BigTable中得到网页

  提交用户

 

HBase:高可靠,高性能,面向列,可伸缩的分布式数据库。存储非结构化或者半结构数据的松散数据。  

与传统的关系型数据库之间的主要区别

1.  数据索引:关系型数据库都有一个主索引,或者有多个二级索引。HBase只有一个索引,行键。HBase中的所有的访问方法,或者通过行键访问,或者通过行键扫描,从而使得整个系统不会慢下来。

2.  数据维护:HBase在数据修改之后会保留旧的数据和新的数据

3.  可伸缩性:可以轻易的增加集群。

Hadoop之HBase

原文:https://www.cnblogs.com/da-peng/p/9094732.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!