新書推薦:
《
“口袋中的世界史”第一辑·冷战中的危机事件
》
售價:HK$
291.2
《
绝美的奥伦堡蕾丝披肩编织
》
售價:HK$
177.0
《
狂飙年代:18世纪俄国的新文化和旧文化(第二卷)
》
售價:HK$
177.0
《
万有引力书系 纳粹亿万富翁 德国财富家族的黑暗历史
》
售價:HK$
109.8
《
中国常见植物野外识别手册:青海册
》
售價:HK$
76.2
《
三星堆对话古遗址(从三星堆出发,横跨黄河流域,长江流域,对话11处古遗址,探源多元一体的中华文明)
》
售價:HK$
87.4
《
迷人的化学(迷人的科学丛书)
》
售價:HK$
143.4
《
宋代冠服图志(详尽展示宋代各类冠服 精美插图 考据严谨 细节丰富)
》
售價:HK$
87.4
|
編輯推薦: |
本书以流行病学研究设计为主线展开,在R语言基本介绍的基础上详细描述了常用的流行病学研究设计以及相应统计方法的R语言代码实现过程,为读者利用R语言研究医学问题提供参考。
|
內容簡介: |
《基于流行病学研究设计的R语言实践》一书分为十四章,以流行病学研究设计为主线展开,在R语言基本介绍的基础上,详细描述了横断面研究、病例对照研究、病例交叉研究、队列研究、随机对照试验研究、时间序列分析、Meta分析、倍差法、孟德尔随机化研究等常用的流行病学研究设计,同时描述了其中涉及的统计方法R语言代码实现过程,并介绍了R语言作图和空间制图,可为预防医学相关专业本科生、研究生学习以及流行病学、社会学等相关领域科研人员利用R语言研究医学问题提供参考。
|
關於作者: |
林华亮,教授、博士生导师,中山大学公共卫生学院院长助理、流行病学系主任。先后获得中山大学“百人计划”中青年杰出人才、广东省杰出青年医学人才等称号,入选“全球顶尖前10万科学家排名榜”。长期从事大气污染及其与基因易感性交互作用在慢性病发生发展中的作用研究,并提出了大气污染控制浓度阈值的新方法。
|
目錄:
|
第一章 R 语言概述 / 1
一、 R 软件及RStudio 软件的获取和安装 / 1
二、 RStudio 软件界面和功能介绍 / 3
三、 R 语言的使用规则简介 / 5
第二章 数据结构与数据管理/ 9
第一节 常见的数据类型 / 9
第二节 数据的基本结构 / 10
一、 向量 / 10
二、 矩阵 / 10
三、 数组 / 11
四、 数据框 / 12
五、 因子 / 15
六、 列表 / 15
第三节 数据的导入与保存 / 17
一、 数据导入 / 17
二、 数据保存 / 21
第四节 数据的初步操作 / 22
一、 数据的整合、重塑与合并 / 22
二、 定义数据分组 / 28
三、 从数据中抽取子集 / 28
第五节 数据的管理和基础应用 / 30
一、 获取数据集中变量的名称 / 30
二、 创建新的变量 / 31
三、 变量的重命名 / 32
四、 缺失值的发现与处理 / 33
五、 数据排序 / 34
六、 数据类型的转换 / 34
七、 数据描述 / 35
第六节 大数据分析 / 36
一、 创建data/table / 36
二、 设置主键 / 36
三、 查看数据 / 37
四、 提取数据集 / 38
五、 数据整理 / 38
第七节 R 语言自带的数据集 / 40
第三章 基本统计分析/ 43
第一节 t 检验 / 43
一、 单样本t 检验 / 43
二、 配对t 检验 / 44
三、 两独立样本均数比较的t 检验 / 45
四、 小结 / 47
第二节 方差分析 / 47
一、 完全随机设计的方差分析 / 47
二、 随机区组设计的方差分析 / 49
三、 小结 / 50
第三节 χ2 检验 / 50
一、 2×2 交叉表数据的χ2 检验 / 50
二、 R×C 交叉表数据的χ2 检验 / 51
三、 配对设计数据的χ2 检验 / 52
四、 χ2 检验的校正 / 52
五、 小结 / 53
第四节 秩和检验 / 53
一、 配对设计资料的符号秩和检验 / 54
二、 两组独立样本比较的Mann-Whitney 检验/ 55
三、 多组独立样本比较的Kurskal-Wallis 检验 / 56
四、 小结 / 57
第五节 相关分析 / 57
一、 简单相关分析 / 57
二、 偏相关 / 59
三、 相关关系的可视化 / 60
四、 小结 / 62
第六节 回归分析 / 62
一、 简单线性回归 / 62
二、 多项式回归 / 65
三、 多重线性回归 / 67
四、 Logistic 回归 / 70
五、 泊松回归 / 75
六、 小结 / 77
第四章 横断面研究/ 78
第一节 横断面研究资料的描述 / 78
一、 案例分析 / 79
二、 小结 / 82
第二节 多重线性回归 / 82
一、 多重线性回归分析 / 83
二、 小结 / 86
第三节 二分类变量的Logistic 回归 / 86
一、 二分类Logistic 回归分析 / 87
二、 小结 / 90
第四节 无序多分类变量的Logistic 回归 / 90
一、 无序多分类Logistic 回归分析 / 90
二、 小结 / 91
第五节 有序多分类变量的Logistic 回归 / 92
一、 有序多分类变量的Logistic 回归分析 / 92
二、 小结 / 94
第六节 交互作用分析 / 95
一、 多重线性回归模型中的交互作用分析 / 95
二、 广义线性回归模型中的交互作用分析 / 97
三、 小结 / 99
第五章 病例对照研究/ 101
第一节 概述 / 101
一、 基本概念 / 101
二、 基本特点 / 101
三、 研究类型 / 101
四、 病例对照研究的衍生设计 / 102
五、 用途 / 103
第二节 资料分析方法与案例分析 / 103
一、 资料分析方法 / 103
二、 案例分析 / 105
第六章 病例交叉设计/ 124
第一节 概述 / 124
第二节 时间分层病例交叉设计 / 125
一、 案例分析 / 125
二、 小结 / 131
第三节 时间分层病例交叉设计结合分布滞后非线性模型 / 132
一、 案例分析 / 132
二、 小结 / 134
第四节 基于个体的时间分层病例交叉设计 / 134
一、 案例分析 / 135
二、 小结 / 137
第七章 队列研究/ 139
第一节 队列研究中的生存分析 / 139
一、 基本概念 / 139
二、 生存数据案例 / 140
三、 使用R 软件进行生存分析 / 141
第二节 中介效应分析 / 157
一、 中介效应分析的基本原理和步骤 / 157
二、 中介效应分析在R 语言中的实现 / 158
第八章 随机对照试验研究/ 160
第一节 概述 / 160
一、 定义和基本原理 / 160
二、 试验设计关键点和常见设计方案 / 160
第二节 资料整理与分析 / 162
一、 资料的整理 / 162
二、 资料的分析 / 162
三、 结果输出 / 163
第三节 案例分析 / 163
一、 数据描述与预处理 / 163
二、 预分析与生存曲线 / 166
三、 Cox 比例风险回归 / 168
四、 亚组分析及比较 / 172
第九章 时间序列分析/ 178
第一节 时间序列的基本概念和特点 / 178
一、 案例分析 / 178
二、 小结 / 190
第二节 缺失数据的填补 / 191
一、 案例分析 / 191
二、 小结 / 196
第三节 广义相加模型及其应用 / 196
一、 案例分析 / 196
二、 小结 / 204
第四节 分布滞后非线性模型及应用 / 204
一、 案例分析 / 205
二、 小结 / 208
第十章 Meta 分析 / 209
第一节 单因素Meta 分析 / 209
一、 单因素Meta 分析概述 / 209
二、 案例分析 / 210
三、 小结 / 218
第二节 多因素Meta 分析 / 218
一、 多因素Meta 分析概述 / 218
二、 案例分析 / 219
三、 小结 / 224
第三节 Meta 回归分析/ 224
一、 Meta 回归分析概述/ 224
二、 案例分析 / 225
三、 小结 / 230
第十一章 R 语言作图 / 231
第一节 plot 基本作图/ 231
一、 展开空白画布 / 232
二、 描绘平面直角坐标系 / 232
三、 绘制点图 / 233
四、 绘制线图 / 234
五、 改变图形元素 / 234
六、 添加文本信息 / 237
七、 页面布局与图形组合 / 240
第二节 ggplot2 基本作图/ 242
一、 散点图 / 242
二、 直方图 / 244
三、 箱线图 / 245
第三节 ggplot2 进阶/ 247
一、 坐标轴 / 247
二、 图例 / 248
三、 分面 / 251
四、 主题 / 252
五、 图案拼接 / 255
六、 储存与导出 / 262
第十二章 R 语言中的空间数据 / 263
第一节 空间数据基本概念 / 263
一、 矢量数据 / 263
二、 栅格数据 / 265
三、 空间坐标参考系 / 267
四、 空间数据处理常用包 / 268
五、 小结 / 269
第二节 空间数据操作 / 269
一、 空间数据的读写 / 269
二、 矢量数据操作 / 271
三、 栅格数据操作 / 273
四、 小结 / 286
第十三章 倍差法在R 语言中的应用 / 287
第一节 倍差法概述 / 287
第二节 案例分析 / 288
第十四章 孟德尔随机化/ 294
第一节 概述 / 294
一、 孟德尔随机化的概念 / 294
二、 孟德尔随机化的统计学方法 / 294
三、 孟德尔随机化的设计类型 / 295
四、 孟德尔随机化存在的问题 / 295
第二节 孟德尔随机化分析软件及分析过程 / 296
一、 单样本孟德尔随机化 / 296
二、 两样本孟德尔随机化 / 299
参考文献/ 306
|
內容試閱:
|
R 语言作为一门统计学语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R 语言变成了一把炙手可热的数据分析利器。随着越来越多有工程背景的人员的加入,R 语言的社区在迅速扩大成长。R 语言不仅仅在数理统计领域受到青睐,在临床医学、公共卫生、教育、金融、互联网等多个行业也应用广泛。
R 语言之所以受欢迎,有以下几方面原因:第一,R 软件可以在官网免费下载。相比于其他的统计软件,如SAS、SPSS、STATA 等,R 软件不需要任何费用,用户可以自由地使用、复制、发布、修改源码、补充漏洞以及按具体需求定制功能,这无疑是其最吸引人的地方。第二,R 语言拥有庞大的软件包生态系统,很多前沿的技术、先进的模型等都会迅速地在R 软件中以程序包的形式出现,供大家学习使用。如果某项统计技术已经存在,那么几乎必然存在着一款R 软件包与之对应。第三,R 语言的界面比较友好,相对简单易学,为创建可重复及高质量的分析提供了有利条件。此外,R 软件保留了运算的代码,修改后可重复使用,大大降低了撰写语言代码的时间成本。第四,R 语言在绘图及数据可视化方面具有强大的功能。R 语言有一个非常强大的数据可视化宝库,可以做出许多精美的图形。在大数据时代的今天,R 语言将会发挥越来越重要的作用,特别是在医疗、公共卫生领域。
近年来,公共卫生和健康医疗大数据迅猛发展,相关人才的需求也日趋紧迫,全国高校中,相关专业建设不断升温。这些大数据技术应用的背后均存在着一个学科的框架指导,那就是流行病学。总体而言,任何健康医疗大数据的构建、数据分析的理论和模型的建立及应用,其起点应是提出要解决什么科学问题,而医疗卫生科学问题的提出是流行病学的范畴。流行病学研究设计之于健康医疗大数据,就好比建筑设计图纸与建筑材料的关系。
近年来,笔者在与医疗卫生领域相关专业技术人员交流中发现,目前在公共卫生监测、健康医疗大数据、流行病学数据统计整理和分析中存在很多短板,而这些短板归结起来就是流行病学设计和统计分析的脱节,例如数据采集缺乏宏观流行病学思维的指导,数据分析中统计分析、模型应用不规范等。如何破局?通过与诸多业内同行的多次交流,结合自己团队的经验,我们认为R 语言结合流行病学设计是一个可以很好解决两者脱节问题的出路,这也是筹划撰写本书的初衷。
因此,本书以流行病学研究设计为主线展开,在R 语言基本介绍的基础上,详细描述了包含横断面研究、病例对照研究、队列研究、随机对照试验研究、Meta 分析等常用的流行病学研究设计思路和分析方法,同时涉及双重差分法、孟德尔随机化等流行病学因果推断方法,并描述了其中涉及的统计方法的R 代码实现过程,既不晦涩,也非浅白,向读者打开了一扇利用R 语言研究医学问题的窗。
书中难免有不当之处,敬请各位专家和读者指正。
林华亮
2024 年5 月
|
|