新書推薦:
《
画楼:《北洋画报》忆旧(年轮丛书)
》
售價:HK$
337.5
《
大国脊梁:漫画版
》
售價:HK$
80.2
《
跟着渤海小吏读历史:大唐气象(全三册)
》
售價:HK$
189.0
《
心智的构建:大脑如何创造我们的精神世界
》
售價:HK$
81.4
《
美国小史(揭秘“美国何以成为美国”,理解美国的经典入门读物)
》
售價:HK$
81.4
《
中国古代北方民族史丛书——东胡史
》
售價:HK$
87.8
《
巨人传(插图珍藏本)
》
售價:HK$
705.6
《
地下(村上春树沙林毒气事件的长篇纪实)
》
售價:HK$
76.7
|
編輯推薦: |
本书在强调大数据、数据可视化的基础性原理同时,融入真实案例分析,具有实用性,读者可以举一反三,真正学会大数据可视化和数据挖掘的工具软件;对数据分析的每一步操作都有详尽的说明,且选用都是相关工具软件,无须编程基础即可完成整个分析过程,使读者能够脱离枯燥的代码环境,专注于数据本身,为数据分析带来全新的思路和视角运用大数据思维,特别适用于初次接触数据分析的读者。
|
內容簡介: |
本书以循序渐进的方式,由浅入深地讲解了数据分析的整个过程。全书共分8 章,主要内容包括:数据分析概述、数据可视化初步、数据图表制作、数据公式与函数、数据可视化案例、数据挖掘基础、数据分析报告和数据分析案例。每章内附有实用性范例供读者练习,巩固所学知识。本书在讲解数据可视化基础性原理的同时,融入真实案例分析,具有较强的实用性,帮助读者举一反三,真正掌握大数据可视化和数据挖掘的工具软件,并能运用大数据思维解决学习和工作中的实际问题。本书适合作为高等学校非计算机相关专业大数据可视化、数字媒体设计等课程的教材,也可作为对数据分析感兴趣读者的参考用书。
|
目錄:
|
第1 章 数据分析概述 1
1.1 大数据简介 1
1.2 数据可视化 2
1.2.1 数据可视化概述 2
1.2.2 在线可视化工具 2
1.2.3 桌面版可视化软件 6
1.3 数据挖掘 7
1.3.1 数据挖掘概述 7
1.3.2 常用数据挖掘工具 7
1.4 数据分析 9
1.4.1 数据分析概述 9
1.4.2 数据分析的目的与分类 9
1.4.3 数据分析的作用 9
1.5 数据分析的步骤 10
1.6 数据分析方法论 11
1.7 常见数据分析法则 12
第2章 数据可视化初步 14
2.1 Oracle 数据分析软件产品简介 14
2.2 软件安装 16
2.2.1 硬件要求 16
2.2.2 安装Oracle AD 16
2.2.3 安装DVML 16
2.3 Oracle AD 功能介绍 17
2.3.1 认识主页 17
2.3.2 连接到文件 19
2.3.3 连接到数据库 20
2.3.4 创建项目和添加数据集 21
2.3.5 项目的导入导出 26
2.3.6 工作界面简介 28
2.4 Oracle AD 支持的数据类型 29
2.4.1 定性数据与定量数据 29
2.4.2 度量和属性 35
2.4.3 连续和离散 35
2.5 数据准备 36
2.5.1 转换数据类型 36
2.5.2 连接 38
2.5.3 提取 39
2.5.4 拆分 42
2.5.5 创建 44
2.5.6 分组 46
2.5.7 收集器 47
2.6 创作一个画布 49
2.6.1 画布新建与设置 49
2.6.2 将数据添加到可视化画布 50
2.6.3 添加多个可视化图表 51
2.6.4 更改可视化类型 52
2.6.5 调整可视化属性 54
2.6.6 颜色设置 56
2.6.7 大小(宽度)设置 58
2.6.8 排序和筛选 59
2.6.9 数据的钻探 61
2.6.10 用作筛选器 61
2.6.11 导出画布 62
第3 章 数据图表制作 65
3.1 条形图 66
3.2 水平条形图 75
3.3 线形图 77
3.4 面积图 82
3.5 饼图 84
3.6 旭日图 88
3.7 树状图 91
3.8 雷达线 92
3.9 网格热图 95
3.10 标记云 98
3.11 散点图 100
3.12 组合图表 106
3.13 瀑布图 110
3.14 箱线图 113
3.15 地图 116
3.16 叙述 118
第4 章 数据公式与函数 121
4.1 常量与运算符 121
4.2 公式与函数操作 123
4.2.1 公式的使用 123
4.2.2 函数的输入 126
4.3 常用函数 126
4.3.1 聚合函数 126
4.3.2 字符串函数 135
4.3.3 数学函数 139
4.3.4 转换函数 141
4.3.5 日历 日期函数 142
4.3.6 表达式函数 147
第5 章 数据可视化案例 152
5.1 图解中国能源 152
5.1.1 数据整理 152
5.1.2 能源概况 154
5.1.3 四类能源生产与消耗比例 156
5.1.4 叙述 158
5.2 图解新冠肺炎疫情发展 159
5.2.1 数据整理 159
5.2.2 疫情概况 160
5.2.3 部分省份 城市排名 161
5.2.4 每日新增情况 166
5.2.5 叙述 168
第6 章 数据挖掘基础 169
6.1 数据挖掘概述 169
6.1.1 数据挖掘的分类 169
6.1.2 数据挖掘的步骤 170
6.1.3 数据挖掘的应用 171
6.1.4 数据挖掘的案例 172
6.2 IBM SPSS Modeler 18 简介 173
6.2.1 软件下载与安装 174
6.2.2 软件界面介绍 174
6.2.3 数据流构建 176
6.2.4 模型简介 178
6.3 数据整理 180
6.3.1 数据的属性 181
6.3.2 数据的角色 181
6.3.3 数据的导入 181
6.3.4 数据的集成 186
6.3.5 数据的导出 188
6.4 数据建模决策树 189
6.4.1 决策树案例 189
6.4.2 用户画像案例 193
6.5 数据建模关联分析 195
6.5.1 关联参数 195
6.5.2 关联分析案例 196
第7 章 数据分析报告 199
7.1 数据分析报告概述 199
7.2 数据分析报告的写作原则 199
7.3 数据分析报告的结构 200
7.4 数据分析报告排版 201
第8 章 数据分析案例 207
8.1 广告投入分析 207
8.1.1 数据整理 207
8.1.2 广告投入概况分析 209
8.1.3 项目广告投放分析 211
8.1.4 留学英语公开课在百度投放渠道分析 212
8.1.5 注册人数预测 215
8.1.6 封面 220
8.1.7 结论 220
8.1.8 叙述 221
8.2 成绩分析 221
8.2.1 数据整理 221
8.2.2 人数分析 224
8.2.3 生源地分析 227
8.2.4 成绩分析 229
8.2.5 封面 235
8.2.6 结论 236
8.2.7 叙述 237
附录A 数据分析报告评分表 238
附录B 数据分析报告示例 239
附录C Access 基本操作 254
参考文献 260
|
內容試閱:
|
大数据技术经历了多年的发展,已经在金融、电信、教育、医药等领域得到了较多也较为成功的应用,这使人们看到了该技术所带来的社会变革,而IT 技术的高速发展使得该技术趋于大众化,使得越来越多的人能够参与其中,分享该技术带来的乐趣。
本书系统地介绍了数据分析、数据可视化与数据挖掘的概念和方法,在内容编排上侧重于应用,用案例将知识点进行串联,本次修订将数据可视化进阶细化为可视化进阶数据图表制作、数据公式与函数、数据可视化案例,对其操作方案与步骤进行详解,以期达到提高读者的学习兴趣、增强实践动手能力的目的。
本书对于初次接触数据分析的读者会有很大帮助,书中对数据分析的每一步操作都有详尽的说明,且选用的软件都是相关工具软件,无须编程基础即可完成整个分析过程,使读者能够脱离枯燥的代码环境,专注于数据本身,为数据分析带来全新的思路和视角。书中涉及的数据均来自于网络,仅供学习研究使用。
本书由张丹珏任主编,郑俊任副主编,施庆、赵任颖、程五生、盛家骏、翁少逸和蒋雨蔚参与编写。全书由顾顺德主审。具体分工如下:第1 章由施庆编写;第2 章的2.1~2.4由程五生编写;第2 章的2.5 由赵任颖编写;第2 章的2.6 和第3 章由郑俊编写;第4 章由施庆编写;第5~8 章和附录A 由张丹珏编写;附录B 由盛家骏、翁少逸和蒋雨蔚编写,张丹珏整理;附录C 由赵任颖编写。
在本书的编写过程中,得到了许多老师的大力支持和热情帮助,中国铁道出版社有限公司对本书的出版给予了大力支持,在此表示衷心的感谢!
由于时间仓促,编者水平有限,书中难免存在疏漏或不足之处,恳请读者批评指正,以便及时修改和完善。
编 者
2020 年6 月
|
|