培训网 数据库工程师培训机构 北京优就业培训中心
首页 找课程 找学校 教育新闻 培训问答

北京优就业培训中心

15830143330 预约试听 在线客服

您的位置: 资讯首页 > 数据库工程师培训资讯 > 大数据课程笔记: HBase总结

大数据课程笔记: HBase总结

来源:中华网考试编辑:青发布时间:2018-09-10

HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 

FUJITSU Cliq等商用大数据产品不同,HBaseGoogle Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用Chubby作为协同服务,HBase利用Zookeeper作为对应。


一、hbase的特性

1hbase数据的终持久化存储是基于hsfs文件系统,存储容量几乎无限,可以随时在线扩容

2hbase的数据增删改查功能模块是分布式系统

3nosql数据库,表结构

二、HBase的存储

HBase中的所有数据文件都存储在Hadoop HDFS文件系统上

1. HFileHBaseKeyValue数据的存储格式,HFileHadoop的二进制格式文件,实际上StoreFile就是对HFile做了轻量级包装,即StoreFile底层就是HFile

2. HLog FileHBaseWALWrite Ahead Log) 的存储格式,物理上是HadoopSequence File

三、HBase工作机制

1hbase工作机制示意图


2hbase工作机制详细解析

a.hbase的整体工作机制是接受客户端发来的请求命令,从hdfs中读取表文件信息返回给客户端;b. 每个hbase服务器负责表文件中对应region区域,hdfs上表文件的存储也是分为每个region单独存储,每个region中又分为多个列族存储;c. hbase集群中有两种角色,regionservermasterregionserver负责响应客户端请求,读取表文件;master负责监控regionserver的状态,以便及时处理掉线的regionserver,保证hbase集群正常运行;当一个region挂掉时,master会及时监控到,这里利用了zookeeper管理regionserver状态信息当一个master挂掉时,不会影响客户端查数据,但如果此时regionserver挂掉,master又不能及时监控到,便会影响数据查询;解决方法就是再设置一台master,一台active状态,一台standby状态用作备用,当activemaster挂掉,standbymaster将会变为active状态,监控regionserverd. masterzookeeper就组成了高可用。

学习永不止步,更多大数据技术分享,欢迎各位小伙伴持续关注!

我们是非常专业在线教育平台,为学员提供海量、优质的课程,专业的课程顾问课为您量身定制课程,课程结构严谨,用户可以根据自身的学习程度,自主安排学习进度。欢迎点击访问:北京数据库工程师培训课程汇总
推荐机构 相关机构 更多课程

申请试听名额

已有10254人申请免费试听

01电话咨询 | 15830143330

QQ:2872347183
加盟合作:0755-83654572