新書推薦:
《
大宋理财:青苗法与王安石的金融帝国(全彩插图本)
》
售價:HK$
109.8
《
安全感是内心长出的盔甲
》
售價:HK$
67.0
《
快人一步:系统性能提高之道
》
售價:HK$
110.9
《
我们为什么会做梦:让梦不再神秘的新科学
》
售價:HK$
77.3
《
算法图解(第2版)
》
售價:HK$
78.2
《
科学的奇幻之旅
》
售價:HK$
77.3
《
画艺循谱:晚明的画谱与消闲
》
售價:HK$
143.4
《
新民说·现实政治史:从马基雅维利到基辛格
》
售價:HK$
99.7
內容簡介:
与本书第1版相比,ggplot2发生了诸多改造和升级,与之相应地,Hadley Wickham对本书也进行了更新换代。ggplot2是R的一个数据可视化包,它能帮助用户轻松地绘制各类图像,包括多图层复合图像。ggplot2可以帮助你:
l 使用不同数据源叠加多个图层(点、线、地图、瓦片图、箱线图等),且图层间具有自动调节的统一尺度。
l 添加指定平滑器,通过R卓越的建模性能,拟合线性模型、稳健回归、局部加权模型、广义可加模型等。
l 存储各类ggplot2图像(或其中一部分),以便进一步调整处理。
l 创建自定义图像主题,满足各类机构或期刊对图片的要求,以轻松地应用到多个图像中。
l 从视觉角度处理图像,有助于探索如何更好地展现数据的各个部分。
与本书第1版相比,ggplot2发生了诸多改造和升级,与之相应地,HadleyWickham对本书也进行了更新换代。ggplot2是R的一个数据可视化包,它能帮助用户轻松地绘制各类图像,包括多图层复合图像。ggplot2可以帮助你:
l使用不同数据源叠加多个图层(点、线、地图、瓦片图、箱线图等),且图层间具有自动调节的统一尺度。
l添加指定平滑器,通过R卓越的建模性能,拟合线性模型、稳健回归、局部加权模型、广义可加模型等。
l存储各类ggplot2图像(或其中一部分),以便进一步调整处理。
l创建自定义图像主题,满足各类机构或期刊对图片的要求,以轻松地应用到多个图像中。
l从视觉角度处理图像,有助于探索如何更好地展现数据的各个部分。
对于每一个纠结于如何有效生动地展示数据的人,这本书是一盏指路明灯。当然,为了学习本书,R的基本知识仍是必要的(比如如何将数据导入R)。ggplot2是一种专门用于制作图像的迷你语言,本书介绍了有关它的一切。通过阅读本书,你将能够轻而易举地绘制各类图像解决问题,也能更好地把原本停留在你脑海中的图像投射到屏幕或页面上。
本书相对旧版的改动:
l更新本书以适应*的ggplot2 2.1.0,包括主题系统的主要更新。
l介绍新添加的标度、统计变换和几何图像。
l添加更多实战演练。
l修订全书简介,更多关注ggplot函数而非qplot函数。
l更新数据建模章节,主要使用的R包有tidyr、dplyr和broom。
內容試閱 :
第2版中译本序
ggplot2 的发展
近五年来,数据科学变得举足轻重,其中数据可视化的流程不可或缺。数据可视化为人类提供了对数据的直观理解与感受。各类软件中,R 由于它和统计学的渊源、开源、易用性而受到数据科学家的青睐,ggplot2 包更是数据可视化中必不可少的神兵利器。
在软件更新换代极快的时代,ggplot2 用它长久的生命力、庞大的使用量证实了其设计之优良。现在,ggplot2 在RStudio CRAN 镜像的每月下载量达到了惊人的45 万!下图展示了下载量的变化;当然,是用ggplot2 绘制的。
本书的变化
本书英文第1 版出版于2009 年,第2 版面世于2016 年。因为英文第2 版相对于第1 版有了重大变化,所以中文版也需要大量的相应修订。例如,工具箱和标度两章有大幅更新内容,数据分析则拆分成全新的3 章。读者查阅这些章节的时候,实际上同步享受着这几年内软件工具的变动和数据分析思维的进步。
此外,翻译第1 版的时候,由于0.9.* 的版本API 变动频繁,译者作了大量修正。而现在ggplot2 已经到了稳定的2.2.* 版,API 经过千锤百炼,已经趋于稳定。因此,读者阅读本书的时候,基本不必担心代码的兼容问题。而且,最新版的ggplot2 包含了扩展机制,开发者可以按需自行定义自己的主题、风格、内容。无论你想绘制什么二维静态统计图形,ggplot2 都值得一试。
还有,现在的英文版和中文版书籍源码均大量采用了knitr 包的技术,大量图形都是根据所标记的代码直接绘制出来。这种方式大量减少了图形排版错误、代码不兼容等情况,给作者、译者带来了很大的便利;可以想象,对读者阅读、学习书中代码也大有裨益。
最后,中文版里,为了优化排版效果,对部分代码块的换行和空行作了微调(其余内容不变);正文的图片也改为黑白,必须用彩色的绘图则放到正文后的彩图附录中。
致谢
首先要感谢Hadley Wickham 的卓越创新,ggplot2 软件包和本书英文原版均主要出于他手。
我们感谢第2 版的译者:黄俊文(第1、7、8、11、12 章)、王小宁(第4、5、6 章)、于嘉傲(第2、3 章)、冯璟烁(第9、10 章)。黄俊文和王小宁负责R markdown 和LATEX 排版,王小宁负责和出版社的对接。此外,魏太云提供了不少意见。我们因为统计之都社区(https:cosx.org)而走在了一起。
感谢西安交通大学出版社,他们为中文R 社区作出了重要的贡献。
正所谓站在巨人的肩膀上,第2 版的翻译绝对离不开第1 版所有译者和审校者所打下的基础。我们感谢第1 版的译者:邱怡轩、主伟呈、肖楠、高涛、潘岚锋、魏太云,他们均来自于统计之都社区;以及担任第1 版审校的殷腾飞;还有所有为第1 版翻译提供了不可或缺的帮助的老师与朋友:孟生旺、张政、肖凯、余光创、陈妍、李晓矛、谢漫锜、李皞、韩帅、陈丽云、李舰、刘思喆、邓一硕、陈堰平、谢益辉等。
黄俊文
2018 年10 月
前言
欢迎来到第2 版《ggplot2:数据分析与图形艺术》。我很高兴这本书能得以改版,从而展示ggplot2 包中最新、最棒的特点,以及近5 年来在R 社区和ggplot2 社区发生的巨大变化。ggplot2 社区是一个充满活力的社区,其邮件列表中有着超过7000 名成员,并且还拥有一个十分活跃的Stack Overflow 社区,每天被打上ggplot2 标签的问题就有近万个。鉴于目前我已经基本不再对ggplot2进行更改,现在来学习使用这个包是再合适不过了。
ggplot2 是成功的,它是R 中下载量最大的包之一(仅去年一年就被下载了超过一百万次!),并且影响了其他语言中绘图包的设计。我也由衷感激它的成功,ggplot2 包给了我很多周游世界的机会,让我遇到很多有趣的人。我喜欢听人们谈论他们如何利用R 和ggplot2 来理解他们所关心的数据。
十分感谢Carson Sievert 先生对改版工作的支持,他帮助我修正了大量代码,包括将源码转换为R Markdown 文档的工作。另外,他还更新了书中的诸多例子并审校了全文。
主要变化
为了保证此次改版是对本书第1 版的充分升级,我做了许多工作,除随处可
见的代码更新(以保证与最新版本的ggplot2 兼容)之外,还包括:
在书中增加了大量代码,使本书更易于作为参考书使用。全书对knitr 更加友好:减少了独立图表并增加了内联代码。这样的布局可能确实不如原书靓丽,但可以让相关的内容更加紧凑。
本书完整的源代码发布在https:github.comhadleyggplot2-book。
简介中,把qplot 改成ggplot 入门。先前有反馈意见指出,qplot 像是根拐杖:它虽然使得作简单的图变得容易了一些,但却不能帮助用户掌握语法。
增加了练习的部分,读者可以在学习新的技巧后立刻进行实践。
为那些围绕ggplot2 包建立的大量的包增加了指引,这些包构成了一个丰富的生态系统。你将在书中看到大量的其他包被高亮标出并且有对应的指引。这些包在我看来都十分有用。
第3 章工具箱一章,包含所有新的几何对象。增加了全新的3.3 文本标签一节,标签十分重要,但在上一版中并没有详细的介绍。3.7 节绘制地图一节中,扩展了地图数据的类型,并给出了获取这些数据的方式。
重写了第6 章标度一章,使之更专注于最重要的任务。这章还讨论了一些新的功能,它们能对图例外观进行更精确的控制,并在6.6 节展示了ggplot2 中新增的标度细节。
原书中数据分析一章被分为三个部分:数据整理(基于tidyr 包),数据操作(基于dplyr包),和模型可视化(基于broom 包)。我将介绍我自己开发的最新版的数据操作工具,和David Robinson 开发的非常棒的broom 包。