您当前位置：首页 > 服务器 > 《HBase权威指南》读书笔记3

《HBase权威指南》读书笔记3

来源：程序员人生发布时间：2016-02-28 11:52:57 阅读次数：2592次

第3章客户端API：基础知识

所有修改都保证了行级别的原子性：要末读到最新的修改，要末等待系统允许写入转业修改
用户要尽可能使用批处理(batch)更新来减少单独操作同1行数据的次数
写操作中设计的列的数目其实不会影响该行数据的原子性，行原子性会同时保护到所有列
创建HTable实例（指的是在java中新建该类），每一个实例都要扫描.META. 表，以检查该表是不是存在，推荐用户只创建1次HTable实例，而且是每一个线程创建1个
如果用户需要多个HTable实例，建议使用HTablePool类（类似连接池）

CRUD

还可以通过 KeyValue 来添加Put: Put add(KeyValue kv)
getFamilyMap() 可以遍历Put实例中每个可用的KeyValue实例
用 has(family, qualifier) 来检查是不是存在特定的单元格，而不需要遍历全部集合
Put.getRow() 可以获得rowkey
Put.heapSize() 可以计算当前Put实例所需的堆大小，既包括其中的数据，也包括内部数据结构所需的空间

KeyValue

KeyValue提供了1些比较器（可能可以进行服务器端排序？），列出可能用到的几种：

KeyComparator 比较 getKey()
KVComparator
RowComparator 比较 getRow()

客户真个写缓冲区

客户端有1个写缓冲区(默许大小2M)，搜集1堆put，然后1次发给服务器
通过 table.setAutoFlush(false) 来激活缓冲区（只有在写非常频繁的情况下会用到）
hbase-site.xml 中的 hbase.client.write.buffer来调剂大小

以下情况会激起缓冲区的刷写

激活写缓冲区以后要手动调用 flushCommits()
缓冲区满了的时候也会自动调用flushCommits()方法
table.close()也会触发刷写

注意：如果只存储大单元格，缓冲区的作用就不大，由于大部份时间是传输时间而不是开关socket的时间

Put列表

可以传入1个列表的 Put

void Put(Listputs)

不过如果同时插入多个put，当其中某个出错的时候，前面几个会被正常插入，往后的put就都不会插入

而且客户端也不能保证服务器真个写入顺序

GET

get.exist(Get get) 方法，在需要检查1个比较大的列的时候能节省网络传输
Result getRowBefore 可以获得某个行之前的行

批量处理操作

put，get， delete 列表其实都是通过 batch() 方法实现的
直接使用batch(Listactions, Object[] results, ... ) 可以同时传入3种实例中的任意1种
batch其实不使用写缓冲区

注意：不可以把对同1行的put和delete放在1个批量处理里面，由于批量处理的顺序不可控

两种批量查询的区分

用batch(Listactions, Object[] results)批量查和 Object[] batch(Listactions) 的区分是

batch(Listactions, Object[] results)可以返回部份结果
Object[] batch(Listactions) 1旦出错，1条都没有

行锁

尽可能不要使用行锁，如果必须使用，请1定节俭占用锁的时间

扫描

通过 hbase-site.xml 中的 hbase.regionserver.lease.period 设定 ResultScanner 的租约
由于每次next()都要发1次要求，所以扫描器也有缓存，叫scanner caching ，默许是关闭的
通过 setBatch(5) 可以每次 next() 返回5列，注意是列！

各种特性

HRegionLocation getRegionLocation(row)

Map getRegionInfo()

这些方法可以获得某1行数据的具体位置，或所在的region信息

生活不易，码农辛苦
如果您觉得本网站对您的学习有所帮助,可以手机扫描二维码进行捐赠
程序员人生

------分隔线----------------------------

上一篇 A022-列表容器之ExpandableListView

下一篇 Crush The Crash--蓝屏

分享到:

------分隔线----------------------------

为码而活

积分：4237

15粉丝

7关注

栏目热点