博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hbase 中Column Family 的作用
阅读量:6407 次
发布时间:2019-06-23

本文共 515 字,大约阅读时间需要 1 分钟。

hot3.png

HBase本身的设计目标是支持稀疏表,而稀疏表通常会有很多列,但是每一行有值的列又比较少。

如果不使用Column Family的概念,那么有两种设计方案:
1.把所有列的数据放在一个文件中(也就是传统的按行存储)。那么当我们想要访问少数几个列的数据时,需要遍历每一行,读取整个表的数据,这样子是很低效的。
2.把每个列的数据单独分开存在一个文件中(按列存储)。那么当我们想要访问少数几个列的数据时,只需要读取对应的文件,不用读取整个表的数据,读取效率很高。然而,由于稀疏表通常会有很多列,这会导致文件数量特别多,这本身会影响文件系统的效率。
而Column Family的提出就是为了在上面两种方案中做一个折中。HBase中将一个Column Family中的列存在一起,而不同Column Family的数据则分开。
由于在HBase中Column Family的数量通常很小,同时HBase建议把经常一起访问的比较类似的列放在同一个Column Family中,这样就可以在访问少数几个列时,只读取尽量少的数据。

 

来自:

转载于:https://my.oschina.net/zjllovecode/blog/1797341

你可能感兴趣的文章
利用Ossim系统进行主机漏洞扫描
查看>>
面试总结小谈
查看>>
挑战JavaScript正则表达式每日两题(2)
查看>>
卢松松:12306网站订票详细攻略
查看>>
如何用活字格定制监狱管理系统
查看>>
你不知道的币圈江湖,ETH(以太坊)VS比特币,V神看不上中本聪
查看>>
ActiveReports 9实战教程(2): 准备数据源(设计时、运行时)
查看>>
我的运维之路(一)
查看>>
《从零开始学Swift》学习笔记(Day 47)——final关键字
查看>>
SIEM的隐忧
查看>>
Ruby中求50之内的素数方法
查看>>
rsync与FTP(vsftpd)在不同工作场景中的应用
查看>>
CentOS 6.4下Squid代理服务器的安装与配置
查看>>
唠唠 RDS 那些事 —— RDS on Windows Server 2016 第一篇
查看>>
《统一沟通-微软-实战》-8-部署-Microsoft Dynamics CRM 2011
查看>>
学习像树一样活着!
查看>>
IDC:中国安全市场发展潜力巨大
查看>>
多门冰箱市场增变,产品突破引领未来市场
查看>>
SystemCenter2012SP1实践(25)VMM下HyperV的高可用(上)
查看>>
关于飞信短信报警的问题
查看>>