《实战Hadoop大数据处理》 - 曾刚编著 - 清华大学出版社 - 香港大書城 - Meg Book Store

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

會員書架精選

2023年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書
七月出版：大陸書台灣書
六月出版：大陸書台灣書
五月出版：大陸書台灣書
四月出版：大陸書台灣書
三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書
12月出版：大陸書台灣書
11月出版：大陸書台灣書
十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書

『簡體書』实战Hadoop大数据处理

書城自編碼： 2696771
分類：簡體書→大陸圖書→計算機/網絡→數據庫
作者：曾刚编著
國際書號(ISBN)： 9787302411444
出版社：清华大学出版社
出版日期： 2015-08-01
版次： 1 印次： 1
頁數/字數： 266页
書度/開本： 16开釘裝：平装

售價：HK$ 72.2

我要買件

** 我創建的書架 **
未登入.

新書推薦：

深度学习详解

《深度学习详解》
售價：HK$ 114.8

李白传（20世纪文史学家李长之经典传记）

《李白传（20世纪文史学家李长之经典传记）》
售價：HK$ 45.8

津轻：日本无赖派文学代表太宰治自传性随笔集

《津轻：日本无赖派文学代表太宰治自传性随笔集》
售價：HK$ 66.7

河流之齿

《河流之齿》
售價：HK$ 59.8

新经济史革命：计量学派与新制度学派

《新经济史革命：计量学派与新制度学派》
售價：HK$ 89.7

盗墓笔记之秦岭神树4

《盗墓笔记之秦岭神树4 》
售價：HK$ 57.3

战胜人格障碍

《战胜人格障碍》
售價：HK$ 66.7

逃不开的科技创新战争

《逃不开的科技创新战争》
售價：HK$ 103.3

建議一齊購買：

+

HK$ 127.7
《Hadoop大数据分析与挖掘实战》

+

HK$ 146.2
《深入理解Hadoop（原书第2版）》

+

HK$ 83.3
《Hadoop大数据处理技术基础与实践》

+

HK$ 109.2
《写给程序员的数据挖掘实践指南》

+

HK$ 90.7
《Hadoop 2.0-YARN核心技术实践》

+

HK$ 109.2
《Hadoop YARN权威指南（Hadoop YARN的创建》

內容簡介：

曾刚编的《实战Hadoop大数据处理》以“大数据”为起点，较详细地介绍了Hadoop的相关知识。全书共分为9章，介绍了大数据的基本理论、Hadoop生态系统、Hadoop的安装、HDFS分布式文件系统、 MapReduce的原理及开发、HBase数据库、Hive数据仓库、Sqoop数据转换工具，*后结合实际介绍了大数据在智能交通和情报分析中的应用。本书力求用浅显的语言、生动的案例、详细的操作步骤向广大读者介绍Hadoop；力求深入浅出，把复杂的理论与实际案例相结合，用平实的语言把深奥的原理简单化；力求图文并茂，通过适当的图表把零乱的知识点有序地展现在读者面前；力求紧跟时代步伐，尽量结合较新版本的软件阐述大数据处理的相关知识。
本书适合作为Hadoop技术的初学者、工程技术人员、大专院校研究生或高年级本科生的学习用书或参考书。

目錄：

第1章大数据概述
1.1 大数据简介
1.1.1 大数据的概念与特点
1.1.2 大数据研究的背景
1.1.3 大数据的应用示例
1.1.4 大数据研究的意义
1.2 大数据处理技术简介
1.2.1 大数据的关键技术
1.2.2 大数据处理模式及其系统
1.3 大数据带来的挑战
1.4 大数据的研究与发展方向
第2章 Hadoop简介
2.1 Hadoop项目起源
2.2 Hadoop的由来
2.3 Hadoop核心组件及相关项目简介
2.4 Hadoop的版本衍化
2.5 Hadoop的发展趋势
第3章 Hadoop的安装
3.1 安装Ubuntu Server
3.1.1 VMware网络适配器的连接模式
3.1.2 “仅主机模式”网络的设置
3.1.3 安装Ubuntu Server
3.1.4 远程管理Ubuntu Server
3.1.5 安装JDK
3.1.6 克隆其他虚拟机
3.1.7 配置hosts文件
3.2 配置SSH公钥认证
3.2.1 为什么要公钥认证
3.2.2 公钥认证的工作原理
3.2.3 SSH客户端的安装
3.2.4 SSH配置
3.2.5 配置SecureCRT公钥登录Linux服务器
3.3 安装配置Hadoop
3.3.1 单机安装
3.3.2 伪分布模式的安装
3.3.3 分布式安装
3.3.4 Hadoop管理员常用命令
3.4 双NameNode分布式安装Hadoop 2.2.0
3.4.1 安装配置Zookeeper集群
3.4.2 安装Hadoop 2.2.0
第4章 HDFS文件系统
4.1 互联网时代对存储系统的新要求
4.2 HDFS系统的特点
4.3 HDFS文件系统
4.3.1 HDFS系统组成
4.3.2 HDFS文件数据的存储组织
4.3.3 元数据及其备份机制
4.3.4 数据块备份
4.3.5 数据的读取过程
4.3.6 数据的写入过程
4.4 HDFS Shell命令
4.5 API访问
4.5.1 编译Hadoop的Eclipse插件
4.5.2 在Eclipse中安装Hadoop插件
4.5.3 Hadoop URL读取数据
4.5.4 FileSystem类
4.5.5 取得HDFS的元信息
4.6 HDFS的高可用性
4.6.1 元数据的备份
4.6.2 使用SecondaryName进行备份
4.6.3 BackupNode备份
4.6.4 Hadoop 2.X中HDFS的高可用性实现原理
4.6.5 Federation机制
4.7 HDFS中小文件存储问题
4.7.1 文件归档技术
4.7.2 SequenceFile格式
4.7.3 CombineFileInputFormat
第5章 MapReduce原理及开发
5.1 初识MapReduce
5.1.1 试用WordCount
5.1.2 自己编写WordCount
5.1.3 WordCount处理过程
5.2 MapReduce工作原理
5.2.1 MapReduce数据处理过程
5.2.2 MapReduce框架组成
5.2.3 MapReduce运行原理
5.3 Shuffle和Sort
5.3.1 Map端的Shuffle
5.3.2 Reduce端Shuffle
5.3.3 Shuffle过程优化
5.4 任务的执行
5.4.1 推测执行
5.4.2 任务JVM重用
5.4.3 跳过坏的记录
5.4.4 任务执行的信息
5.5 故障处理
5.5.1 任务失败
5.5.2 TaskTracker失败
5.5.3 JobTracker失败
5.5.4 任务失败重试的处理方法
5.6 作业调度
5.6.1 先进先出（FIFO）调度器
5.6.2 能力调度器
5.6.3 公平调度器
5.7 MapReduce编程接口
5.7.1 InputFormat——输入格式类
5.7.2 FileInputFormat——文件输入格式类
5.7.3 InputSplit——数据分块类
5.7.4 RecordReader——记录读取类
5.7.5 Mapper类
5.7.6 Reducer类
5.7.7 OutputFormat——输出格式类
5.7.8 FileOutputFormat类——文件输出格式类
5.7.9 RecordWriter类——记录输出类
5.8 MapReduce应用开发
5.8.1 计数类应用
5.8.2 去重计数类应用
5.8.3 简单排序类应用
5.8.4 倒排索引类应用
5.8.5 二次排序类应用
第6章 HBase数据库
6.1 HBase介绍
6.1.1 互联网时代对数据库的要求
6.1.2 HBase的特点
6.2 HBase架构与原理
6.2.1 系统的架构及组成
6.2.2 HBase逻辑视图
6.2.3 HBase的物理模型
6.2.4 元数据表
6.3 安装HBase
6.3.1 单机模式安装
6.3.2 伪分布模式安装
6.3.3 分布式安装
6.4 HBase Shell操作
6.4.1 基本Shell命令
6.4.2 DDL操作
6.4.3 DML操作
6.4.4 HBase Shell脚本
6.5 基于API使用HBase
6.5.1 API简介
6.5.2 表操作示例
6.5.3 数据操作示例
6.5.4 Filter的应用与示例
6.6 MapReduce操作HBase数据
6.6.1 HBase MapReduce汇总到文件
6.6.2 HBase MapReduce汇总到HBase
6.7 HBase优化
6.7.1 JVM GC优化
6.7.2 HBase参数调优
6.7.3 表设计优化
6.7.4 读优化
6.7.5 写优化
第7章 Hive数据仓库
7.1 Hive简介
7.1.1 数据分析工具应具有的特征
7.1.2 Pig与Hive的比较
7.1.3 Hive架构
7.1.4 Hive的元数据存储
7.1.5 Hive文件存储格式
7.1.6 Hive支持的数据类型
7.2 Hive的安装
7.2.1 安装MySQL
7.2.2 安装Hive
7.2.3 Hive的用户接口
7.3 Hive QL讲解
7.3.1 DDL命令
7.3.2 DML操作
7.3.3 SELECT查询
7.4 Hive复杂类型
7.4.1 Array（数组）
7.4.2 Map类型
7.4.3 Struct类型
7.5 Hive函数
7.5.1 Hive内置函数
7.5.2 Hive用户自定义函数
第8章数据整合
8.1 大数据整合问题
8.2 Sqoop 1.4X整合工具
8.3 Sqoop2整合工具
第9章典型应用案例介绍
9.1 大数据在智能交通中的应用
9.1.1 交通运输业面临的挑战
9.1.2 智能交通大数据平台的架构
9.1.3 数据分析层的数据基础分析
9.2 大数据在情报分析中的应用
9.2.1 公安情报分析的现状
9.2.2 大数据情报分析系统架构
9.2.3 数据的整合
9.2.4 情报分析的方法
9.2.5 基于文本的串并案件聚类分析
参考文献

書城介紹　 |　合作申請　|　索要書目　 |　新手入門　|　聯絡方式　 |　幫助中心　|　找書說明　 |　送貨方式　|　付款方式 香港用户　 |　台灣用户　|　大陸用户　|　海外用户

megBook.com.hk

Copyright © 2013 - 2024 （香港）大書城有限公司　 All Rights Reserved.