HBase 分布式数据库

  • 时间:
  • 浏览:14

HBase就是我基于BigTable思想,由开源社区发布的实现,除了CURD之外,还有什么都特点:

03年(作者上大二),谷歌发表了三篇论文:Google FS、MapReduce、BigTable。着实Google非要 签署这1个多 产品的源码,否则他发布了这1个多 产品的全部设计论文,奠定了风靡全球的大数据算法的基础!

hbase(main):011:0> delete 'scores', 'Tom', 'course:math'

0 row(s) in 0.0640 seconds

hbase(main):012:0> get 'scores', 'Tom', 'grade', 'course'

COLUMN CELL

grade: timestamp=1534492881763, value=6

1 row(s) in 0.0210 seconds

Table scores is ENABLED

scores

COLUMN FAMILIES DESCRIPTION

{NAME => 'course', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false',

KEEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER',

COMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '

65536', REPLICATION_SCOPE => '0'}

{NAME => 'grade', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false', K

EEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER', C

OMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '6

5536', REPLICATION_SCOPE => '0'}

COLUMN CELL

course:math timestamp=15344929360 43, value=97

grade: timestamp=1534492881763, value=5

着实,分布式存储非要替代集中存储。可能性你问1个多 老鸟,他会让我1个多 关键字--事务。传统的集中存储有很强大的事务支持能力,而分布式系统不支持事务。

什么都事先,HBase被当做HDFS系统的管理系统,将文件作为内容直接存储在HBase中,实现海量文件的索引、查找。

我从来没见过人们单位的主库系统,无论是小机可能性EMC。可能性哪年在值班时,收到通知主库挂了,我会着实是1个多 深藏在机房沉重铁门里的人们伙,冒了几缕青烟,紧接着监控上各种Web小图标就都红了....

作者接触HBase时间不长,无法估量在企业中流行程度,但已深感这俩 系统的强大。本文是作者有些感悟,和HBase的入门shell和Api,希望作为入门参考。

在5、6年前,人们就希望能用分布式存储和分布式数据库来替代集中存储,着实分布式廉价,否则高可靠。

菜鸟就会很懵逼,事务?增全部查是事务吗?

哪此是事务,我着实就是我清楚,但我着实分布式非要替换集中存储,主要可能性性能,在大量数据规模下集中存储提供更高的性能。60 0万条数据选泽Mysql,1亿左右选泽Oracle,10亿条数据用大数据。

至于高可靠,加各种HA吧。

随着版本迭代,安装步骤可能性变化,参照https://hbase.apache.org/book.html#getting_started。

和MySql一样,先用shell完成有些操作。

列:course:math====值:90

列:grade:====值:3

启动命令