新書推薦:
《
血色帝国:近代英国社会与美洲移民
》
售價:HK$
58.2
《
海外中国研究·王羲之:六朝贵族的世界(艺术系列)
》
售價:HK$
178.1
《
唐宋绘画史 全彩插图版
》
售價:HK$
98.6
《
海洋、岛屿和革命:当南方遭遇帝国(文明的另一种声音)
》
售價:HK$
106.4
《
铝合金先进成型技术
》
售價:HK$
266.6
《
英雄之旅:把人生活成一个好故事
》
售價:HK$
87.4
《
分析性一体的涌现:进入精神分析的核心
》
售價:HK$
122.1
《
火枪与账簿:早期经济全球化时代的中国与东亚世界
》
售價:HK$
77.3
|
內容簡介: |
本书以任务为载体,以实施过程为主线,将知识点穿插到任务实施过程中,知识体系的构建循序渐进、由易到难、由浅入深,符合普遍认知规律。本书以Hadoop 大数据平台为重点,主要内容包括预备知识、准备Hadoop 环境、搭建Hadoop 大数据平台、使用Java 语言编写MapReduce 程序、使用Python 语言编写MapReduce 程序、Hadoop 系统的常见故障及应对和Hadoop 系统运维。本书适合作为各类职业院校大数据技术与应用等相关专业的教材,也可以作为大数据爱好者的自学参考用书。为便于教学,本书配有电子资源,选择本书作为授课教材的教师可登录机械工业出版社教育服务网(www.cmpedu.com)免费注册后进行下载或联系编辑(010-88379194)咨询。本书还配有二维码,读者可直接扫描二维码观看微课视频,方便教学。
|
目錄:
|
项目1 预备知识................................................1任务1 VirtualBox虚拟机安装与配置........................................................2任务2 在VirtualBox中安装Ubuntu虚拟机...............................................7任务3 安装和配置远程连接工具Xshell...................................................15任务4 安装和配置远程连接工具Xftp......................................................21任务5 Linux基础知识............................................................................25项目2 准备Hadoop环境..................................31任务1 配置JDK....................................................................................32任务2 配置SSH免密码登录...................................................................35任务3 Hadoop文件和目录结构.............................................................39项目3 搭建Hadoop大数据平台.........................45任务1 配置单机模式Hadoop................................................................46任务2 配置伪分布模式Hadoop.............................................................50任务3 配置集群模式Hadoop.................................................................62任务4 安装ZooKeeper组件..................................................................75任务5 配置高可用模式Hadoop.............................................................82任务6 HDFS........................................................................................92任务7 Hadoop调优..............................................................................97任务8 安装Hive数据仓库....................................................................102任务9 搭建Spark计算平台..................................................................109项目4 使用Java语言编写MapReduce程序.........123任务1 安装与配置Maven本地仓库......................................................124任务2 配置IDEA编程环境...................................................................130任务3 编写个Java应用程序.........................................................137任务4 编写Hadoop经典程序WordCount............................................146任务5 分析通信基站数据.....................................................................154项目5 使用Python语言编写MapReduce程序....159任务1 WordCount案例......................................................................160任务2 母婴产品销售数据分析..............................................................169任务3 通信基站数据分析.....................................................................176项目6 Hadoop系统的常见故障及应对...............185任务1 Hadoop系统日志结构及分析....................................................186任务2 NameNode单节点故障的风险预防...........................................189任务3 硬件故障及应对........................................................................197任务4 Hadoop系统的隐私安全...........................................................198任务5 Hadoop系统的未来..................................................................199项目7 Hadoop系统运维................................201任务1 用Ambari搭建Hadoop及生态组件............................................202任务2 动态增加和删除Hadoop节点....................................................221任务3 从SecondaryNameNode恢复NameNode..............................226任务4 Zabbix安装与配置....................................................................231任务5 Ansible基础.............................................................................241任务6 使用Ansible部署Hadoop集群..................................................249任务7 Docker安装与应用...................................................................252任务8 使用Docker部署Hadoop集群...................................................257参考文献......................................................263
|
內容試閱:
|
随着移动互联网、物联网、云计算技术的发展,数据呈现爆炸式增长的态势。我国也在“十三五”规划中提出实施国家大数据战略,旨在全面推进国内大数据技术的发展和应用,加快建设数据强国,推动数据资源开放共享,促进经济转型升级。本书以Hadoop大数据平台为重点,采用项目式编写模式,全书共7个 项目,包括预备知识、准备Hadoop环境、搭建Hadoop大数据平台、使用Java语言编写MapReduce程序、使用Python语言编写MapReduce程序、Hadoop系统的常见故障及应对和Hadoop系统运维。内容涉及Hadoop伪分布模式、集群模式、高可用模式的搭建;使用Python、Java编写MapReduce应用程序;使用ZooKeeper、Hive、Spark等组件搭建大数据平台;使用Ambari、Zabbix、Ansible工具对大数据平台进行高效运维。本书为校企合作“双元”编写。刘庆生、陈位妮担任主编,刘潇潇、魏萌、刘洪海、刘丹担任副主编,参加编写的还有范唐鹤、李江岱、季丹、王钰、王晶晶。其中,刘庆生编写了项目2和项目3,陈位妮编写了项目4、项目5、项目7的任务3~任务8,刘潇潇编写了项目1、项目6的任务3~任务5,魏萌编写了项目7的任务1,刘洪海、刘丹编写了项目7的任务2,范唐鹤、李江岱、季丹编写了项目6的任务1,王钰、王晶晶编写了项目6的任务2。北京西普阳光教育股份有限公司在本书的编写过程中提供了大量的技术支持和真实案例。由于编者水平有限,书中难免出现
|
|