新書推薦:
《
周易
》
售價:HK$
44.6
《
东南亚的传统与发展
》
售價:HK$
67.2
《
乾隆制造
》
售價:HK$
87.4
《
资治通鉴臣光曰辑存 资治通鉴目录(司马光全集)(全二册)
》
售價:HK$
304.4
《
明代社会变迁时期生活质量研究
》
售價:HK$
316.2
《
律令国家与隋唐文明
》
售價:HK$
76.7
《
紫云村(史杰鹏笔下大唐小吏的生死逃亡,新历史主义小说见微之作,附赠5张与小说内容高度契合的宣纸彩插)
》
售價:HK$
98.6
《
现代吴语的研究(中华现代学术名著3)
》
售價:HK$
65.0
|
編輯推薦: |
1.本书进行版本更新,以新的稳定版HBase 2.4.9为基础,将Hadoop升级到2.10.1版本,对客户端API做了重磅升级。2.本书专注于HBase在线实时系统的调优,使HBase集群响应延迟更低。 3.本书结合企业需要的“用户行为日志系统”,让读者能够快速上手的同时,做到从入门到实践。
|
內容簡介: |
本书以当前稳定版 HBase 2.4.9 为基础,将 Hadoop 升级到 2.10.1 版本,并对客户端 API 进行升级。本书以精练的语言介绍 HBase 的基础知识,让初学者能够快速上手使用 HBase;深入分析 HBase 的核心思想(如数据读取和数据备份等)和 HBase 架构(如 B+树、LSM 树和 WAL 等),专注于 HBase 在线实时系统的调优,使 HBase 集群响应延迟更低,让有经验的 HBase 开发人员能循序渐进地理解 HBase 源代码,更好地调试和解决各种实际问题;本书从企业常见的“用户行为日志管理系统”着手,结合 HBase 的实际应用场景,让读者快速上手,真正做到从入门到实践。本书非常适合作为有一定 Java 基础的开发人员的 HBase 入门教程,也适合作为HBase 运维人员部署和监控 HBase 的参考手册,还适合作为将 HBase 应用到在线生产环境中的开发人员进行 HBase 在线集群性能调优的技术指南。
|
關於作者: |
彭旭,2009年毕业于武汉大学软件工程专业,具有十多年的国内顶尖互联网企业工作经验,曾任阿里巴巴天猫技术部资深软件工程师和珠海市魅族科技有限公司架构师,精通Java生态系统相关技术,HBase实践经验丰富,对传统关系型数据库跟面向列式存储的HBase都有深刻的理解,擅长大数据存储、HBase在线系统的调优。
|
目錄:
|
目 录第 1 章 HBase 简介 11 1 背景 11 2 NoSQL 与传统 RDBMS 21 3 应用场景 31 3 1 Facebook 用户交互 31 3 2 淘宝 TLog 31 3 3 小米云服务 41 3 4 用户行为数据存储 4 第 2 章 HBase 安装 52 1 单机部署 52 1 1 前置条件 52 1 2 下载 HBase 62 1 3 配置 HBase 62 1 4 启动 HBase 72 1 5 HBase 初体验 72 2 分布式部署 82 2 1 环境准备 92 2 2 ZooKeeper 安装 112 2 3 Hadoop 安装 122 2 4 HBase 安装 232 2 5 启动集群 282 3 集群增删节点 292 3 1 增加节点 292 3 2 删除节点 30第 3 章 HBase 的数据模型 333 1 逻辑模型 333 2 物理模型 35第 4 章 HBase Shell 394 1 数据定义语言 394 1 1 创建表 394 1 2 查看所有表 404 1 3 查看已创建的表 404 1 4 修改表 414 2 数据操纵语言 414 2 1 put 命令 414 2 2 get 命令 424 2 3 scan 命令 434 2 4 delete 命令、deleteall 命令和 truncate 命令 454 3 其他常用的 Shell 命令 464 3 1 复制状态查看 464 3 2 分区拆分 474 3 3 分区大合并 474 3 4 负载均衡开关 474 3 5 分区手动迁移 474 3 6 HBase 运行 Ruby 脚本 48第 5 章 模式设计 495 1 行键设计 505 2 规避热点区间 525 3 高表与宽表 545 4 微信朋友圈设计 555 4 1 需求定义 555 4 2 问题建模 55第 6 章 客户端 API 616 1 Java 客户端使用 616 2 数据定义语言 646 2 1 表管理 646 2 2 分区管理 676 3 数据操纵语言 696 3 1 Put 操作 696 3 2 Get 操作 726 3 3 Scan 操作 746 3 4 Delete 操作 776 3 5 Increment 操作 796 4 过滤器 826 4 1 过滤器简介 826 4 2 过滤器使用 836 5 事务 1016 5 1 原子性 1026 5 2 隔离性 102第 7 章 架构实现 1097 1 存储 1097 1 1 B+树 1097 1 2 LSM 树 1107 1 3 预写入日志 1117 2 数据写入与读取 1147 2 1 定位分区服务器 1147 2 2 数据修改流程 1167 2 3 数据查询流程 1197 3 合并策略 1217 3 1 StripeCompaction 策略 1217 3 2 DateTieredCompaction 策略 1217 3 3 RatioBasedCompaction 策略 1217 3 4 ExploringCompaction 策略 1237 3 5 FIFOCompaction 策略 124第 8 章 协处理器 1258 1 观察者类型协处理器 1258 2 端点类型协处理器 1298 3 加载/卸载协处理器 1338 3 1 静态加载/卸载 1338 3 2 动态加载/卸载 134第 9 章 HBase 性能调优 1419 1 客户端调优 1419 1 1 设置客户端写入缓存 1419 1 2 设置合适的扫描缓存 1439 1 3 跳过 WAL 写入 1439 1 4 设置重试次数与间隔 1439 1 5 选用合适的过滤器 1449 2 服务器端调优 1449 2 1 创建表语句的优化 1459 2 2 禁止分区自动拆分与合并 1489 2 3 开启机柜感知 1509 2 4 开启短路本地读 1529 2 5 开启补偿重试读 1529 2 6 JVM 内存调优 153第 10 章 集群间数据复制 16110 1 复制 16210 1 1 集群拓扑 16310 1 2 配置集群复制 16310 1 3 验证复制数据 16610 1 4 复制详解 16810 2 快照 17310 2 1 配置快照 17310 2 2 管理快照 17310 3 导出和导入 17510 3 1 导出 17610 3 2 导入 17710 4 复制表 178第 11 章 监控 18111 1 Hadoop 监控 18111 1 1 Web 监控页面 18211 1 2 JMX 监控接口 18411 2 HBase 监控 18711 2 1 Web 监控页面 18711 2 2 JMX 监控接口 18911 2 3 客户端 API 监控 191附录 A 常见问题 193A 1 垃圾回收超时导致分区服务器宕机 193A 2 Scanner 租期过期 196A 3 分区迁移异常 197A 4 Windows 运行 HBase 程序缺少winutil exe 200A 5 误删表数据 201A 6 RIT 时间过长导致不同分区行键数据有重叠 203
|
|