新書推薦:
《
那本书是(吉竹伸介与又吉直树 天才联动!)
》
售價:HK$
102.4
《
传播的跃迁:人工智能如何革新人类的交流
》
售價:HK$
113.9
《
纯粹·古代中国的历史与制度
》
售價:HK$
64.4
《
生活来来往往 别等来日方长 新版(伍佰:“讲好了这一辈子,再度重相逢。”别等,别遗憾!珍惜当下才是最好的解药)
》
售價:HK$
59.8
《
一个英国军事顾问眼中的二战
》
售價:HK$
285.2
《
就业、利息和货币通论(徐毓枬译本)(经济学名著译丛)
》
售價:HK$
69.0
《
瘦肝
》
售價:HK$
102.4
《
股票大作手回忆录
》
售價:HK$
57.3
|
編輯推薦: |
(1) 体现工程教育专业认证的理念,通过对机器学习理论和案例的讲解和分析,提升读者解决复杂工程问题的能力和自我学习能力。
(2) 将机器学习与模型推理相关的知识进行模块化整理,使读者能够快速了解本书的内容架构和知识脉络,从而进行针对性学习。
(3) 剖析机器学习与模型推理的内涵和联系,让本书能够适用于自动化领域和计算机领域的教学和科研。
(4) 每章都配备了习题,附录提供了基础知识,便于读者自主学习。
|
內容簡介: |
在人工智能与控制科学产生深度交叉融合的背景下,本书对机器学习和模型推理的经典算法和前沿理论知识进行深度剖析和全面梳理,形成具有理论深度和知识广度的参考资料,旨在支撑“智能科学与技术”和“控制科学与工程”两个一级学科的建设和发展。
本书的主要内容分成两篇。第一篇主要介绍机器学习的主要理论和方法,包括统计决策方法、监督学习方法、无监督学习方法、深度学习方法和近似推理方法。除了总结经典算法之外,第一篇还介绍了最新的集成学习方法(如迁移学习、终身学习和元学习)和深度学习方法(如图神经网络、深度信念网络和深度生成网络),使学生能够掌握机器学习专业方向的前沿理论知识。第二篇主要介绍模型推理的主要理论与方法,包括静态统计模型、概率图模型、马尔可夫模型以及马尔可夫决策过程。在模型知识的驱动下,第二篇聚焦控制领域的状态估计、系统辨识和马尔可夫决策,形成更具理论深度的高层次学习内容。为了帮助读者掌握核心内容和知识点,每章都配备了习题和主要参考文献,附录提供了本书学习的基础知识。
本书前半部分的知识点相对容易,适合本科教学;后半部分的知识点对矩阵分析和随机过程等数学知识要求较高,适合研究生教学。本书也是机器学习、模式识别和系统辨识等专业研究生科研的重要参考资料。
|
關於作者: |
俞成浦,北京理工大学教授、博士生导师。长期从事系统建模和控制方面的教学与研究,讲授“机器学习基础”“模式识别”等课程。发表一作SCI论文20余篇,其中ESI热点论文2篇。主持国家基金委重大项目课题、国家重点研发计划课题和基金委面上基金。完成国家高层次海外人才青年项目和十三五装备预研项目。获自然科学一等奖和中国自动化学会自然科学一等奖。出版专著2部。
陈文颉,北京理工大学副教授、硕士生导师。长期从事深度学习、目标检测与识别方面的教学和研究工作,讲授“模式识别”“电磁兼容技术”等课程。发表论文50余篇,授权专利20余项。承担装备型号项目、国防研究项目和自然科学基金。获国家科技进步奖2项。出版教材1部。
邓方,北京理工大学教授、博士生导师。长期从事自主智能群系统、可穿戴泛在系统等方面教学与研究,讲授“控制系统的故障诊断与容错控制”“智能计算与信息处理”等课程。发表学术论文140余篇,授权发明专利108项。承担国家自科基金重点项目、科技创新2030重大项目等项目多项。获中国青年科技奖、北京市科技奖杰出青年中关村奖、国家科技进步奖二等奖、日内瓦国际发明展金奖、国家教学成果二等奖、北京市教学成果一、二等奖、IEEE TSMCS最佳副主编奖等。出版专著、教材各1部。
|
目錄:
|
第1章 绪论 1
1.1 人工智能发展 2
1.2 机器学习 4
1.2.1 机器学习概念 4
1.2.2 机器学习方法 4
1.2.3 机器学习分类 5
1.3 模型推理 6
1.3.1 模型分类 6
1.3.2 模型推理概念 7
1.3.3 模型推理方法 8
1.4 应用例子 9
1.5 内容安排 12
习题 13
第一篇 机 器 学 习
第2章 统计决策方法 17
2.1 贝叶斯决策 19
2.1.1 最小错误率贝叶斯决策 19
2.1.2 最小风险贝叶斯决策 21
2.1.3 Neyman-Pearson决策 23
2.1.4 贝叶斯决策规则比较 26
2.1.5 正态分布统计决策 26
2.2 概率密度函数估计 28
2.2.1 参数估计------极大似然法 29
2.2.2 参数估计------最大后验法 31
2.2.3 参数估计------贝叶斯方法 32
2.2.4 概率密度函数估计------贝叶斯学习 35
2.2.5 非参数概率密度函数估计------k近邻法 36
2.2.6 非参数概率密度函数估计------Parzen窗法 37
习题 39
第3章 监督学习方法 42
3.1 最小二乘法 43
3.1.1 线性回归 43
3.1.2 逻辑回归 45
3.1.3 均方误差估计 46
3.2 支持向量机 48
3.2.1 标准支持向量机 48
3.2.2 软间隔与正则化 52
3.2.3 支持向量回归 54
3.3 核方法与正则化 56
3.3.1 广义线性模型 56
3.3.2 核支持向量机 61
3.3.3 正则化理论 61
3.4 神经网络 64
3.4.1 感知器 64
3.4.2 神经网络结构 68
3.4.3 反向传播算法 70
3.5 复合学习方法 73
3.5.1 集成学习 73
3.5.2 多任务学习 79
3.5.3 迁移学习 80
3.5.4 终身学习 81
3.5.5 元学习 82
习题 83
第4章 无监督学习方法 86
4.1 近邻测度和聚类准则 88
4.2 聚类方法 92
4.2.1 层次聚类算法 92
4.2.2 最优化方法聚类算法 94
4.2.3 图谱聚类算法 99
4.3 特征降维 101
4.3.1 特征选择 102
4.3.2 特征提取 106
4.4 无监督概率模型估计 116
4.4.1 期望最大化算法 117
4.4.2 混合高斯分布估计方法 120
4.4.3 因子分析方法 122
4.4.4 概率矩阵分解方法 124
习题 126
第5章 深度学习方法 128
5.1 深度网络概述 129
5.1.1 深度网络定义和种类 129
5.1.2 深度网络特点 132
5.2 深度卷积神经网络 132
5.2.1 卷积神经网络 134
5.2.2 参数学习 135
5.2.3 常见卷积神经网络 136
5.3 循环神经网络 137
5.3.1 循环网络 137
5.3.2 记忆网络和注意力机制 142
5.4 图神经网络 146
5.4.1 图神经网络基本框架 146
5.4.2 图滤波器 147
5.4.3 图池化 150
5.4.4 图神经网络学习 151
5.5 深度信念网络 153
5.5.1 玻耳兹曼机 153
5.5.2 受限玻耳兹曼机 156
5.5.3 深度信念网络 158
5.6 深度生成网络 159
5.6.1 变分自编码器 159
5.6.2 生成对抗网络 163
习题 167
第6章 近似推理方法 170
6.1 确定性近似推理 171
6.1.1 拉普拉斯近似 171
6.1.2 KL变分近似 172
6.2 采样近似推理 176
6.2.1 采样推理 176
6.2.2 马尔可夫链蒙特卡罗法 177
6.2.3 重要性采样 181
习题 183
第二篇 模 型 推 理
第7章 静态统计模型 189
7.1 线性回归模型 190
7.1.1 最优线性无偏估计 192
7.1.2 参数估计的概率分布 192
7.1.3 参数估计的置信区间 193
7.1.4 回归变量的选择------F检验法 194
7.1.5 回归变量的选择------AIC检验法 195
7.1.6 回归变量的选择------BIC检验法 196
7.2 贝叶斯线性模型 198
7.2.1 贝叶斯拟合 198
7.2.2 贝叶斯分类 201
7.2.3 贝叶斯正则化 203
7.3 隐线性模型 204
7.3.1 因子分析模型 204
7.3.2 概率主成分分析 205
7.3.3 典型相关分析 206
7.4 潜在语义模型 207
7.4.1 确定性潜在语义模型 207
7.4.2 概率潜在语义模型 209
习题 211
第8章 概率图模型 213
8.1 图模型 214
8.1.1 有向图模型 215
8.1.2 无向图模型 217
8.1.3 有向图和无向图之间的转换 219
8.2 图模型学习 220
8.2.1 不含隐变量的参数估计 220
8.2.2 含隐变量的参数估计 221
8.2.3 贝叶斯网络学习 222
8.3 图模型推理 222
8.3.1 精确推理 223
8.3.2 联合树算法 230
8.3.3 网格模型 237
习题 239
第9章 马尔可夫模型 241
9.1 离散状态马尔可夫模型 242
9.1.1 马尔可夫模型 242
9.1.2 隐马尔可夫模型 243
9.1.3 观测序列概率计算 244
9.1.4 状态序列估计 246
9.1.5 模型参数估计 250
9.2 连续状态马尔可夫模型 251
9.2.1 自回归模型 251
9.2.2 状态空间模型 252
9.2.3 线性高斯状态空间模型 254
9.2.4 非线性高斯状态空间模型 257
9.2.5 动态系统参数辨识 261
习题 264
第10章 马尔可夫决策过程 267
10.1 马尔可夫决策 269
10.1.1 策略迭代学习 271
10.1.2 值迭代学习 271
10.2 强化学习 272
10.2.1 无模型的值函数学习方法 272
10.2.2 无模型的策略函数学习方法 276
10.3 逆强化学习 280
10.3.1 基于最大边际的逆强化学习 280
10.3.2 基于最大熵的逆强化学习 282
习题 283
附录A 概率理论 286
A.1 随机变量与概率分布 287
A.2 随机向量与概率分布 287
A.3 共轭先验分布 288
A.3.1 二项分布与Beta分布 288
A.3.2 多项分布与Dirichlet分布 289
A.3.3 高斯分布与Gamma分布 290
A.4 多维高斯分布 291
A.5 信息和熵 292
附录B 矩阵理论 295
B.1 常用矩阵函数 296
B.2 特征值和特征向量 296
B.3 向量和矩阵范数 297
B.4 矩阵微积分 298
B.5 矩阵奇异值分解 299
附录C 优化理论 300
C.1 无约束优化 301
C.2 等式约束优化 301
C.3 不等式约束优化 302
C.4 优化算法 303
C.4.1 牛顿法 303
C.4.2 梯度下降法 305
C.4.3 加速梯度下降法 306
C.4.4 非光滑优化问题求解 308
C.4.5 带约束优化 309
参考文献 312
|
內容試閱:
|
近年来,随着人工智能和大数据技术的快速发展,学科之间的交叉融合呈现出井喷之势。作为人工智能的核心,机器学习理论和方法已被广泛应用于解决工程应用和科学领域的复杂问题。机器学习是一门多学科交叉专业,涵盖概率论、统计学、最优化理论和近似理论等专业知识,主要研究如何从巨量数据中获取隐藏的、有效的、可理解的模型和知识,并以此来优化和提升计算机模拟或实现人类智能的能力。
在人工智能领域的机器学习与控制领域的系统辨识产生深度交叉融合的背景下,本书对数据驱动的学习和模型驱动的推理进行了梳理,使得控制领域的学生和工程师能够深刻理解前沿机器学习和传统控制理论之间的异同及优劣,为进一步科研深造和工程实践提供有力支撑。本书作者长期从事动态系统辨识研究,并开设了本科生“机器学习基础”和研究生“模式识别”等课程。通过科研与教学的互融互补,作者对机器学习和模型推理的内涵理解也逐渐加深,因此编写此书,希望能够对机器学习、模式识别和系统辨识相关专业的教学和科研带来新的启发。
机器学习强调如何实现数据驱动的学习和建模,其对应的模型通常由神经网络或者核函数来近似描述。由于该模型结构不具备明确的物理含义,因此神经网络学习通常被认为是黑箱模型学习。反之,控制领域的动态模型往往具有明确物理意义的结构特征,比如多智能体协同中的拓扑结构具有明确的空间关联特性,因此动态模型学习与推理通常被认为是灰箱学习。根据上述理解,全书内容分为通用机器学习部分(着重强调数据驱动的学习方法)和模型推理部分(着重强调特殊结构模型的学习和推理)。面向不同专业背景或者不同层次的本科生/研究生教学,授课教师可以对教学内容有针对性地进行选择。
在本书的第一篇(机器学习部分),除了讲解经典的统计决策方法、监督学习方法和无监督学习方法,还介绍了最新的集成学习方法(如迁移学习、终身学习和元学习)和深度学习方法(如图神经网络、深度信念网络和深度生成网络),使学生能够掌握机器学习专业方向的前沿理论知识。第二篇(模型推理部分)聚焦自动控制领域中的状态估计、系统辨识和马尔可夫决策等内容,形成更高层次的机器推理内容,适合自动化专业的研究生和工程人员参考学习。
机器学习与推理经历了跨越式发展,研究内容广而深,理论和算法日新月异,本书很难涵盖所有相关内容。作者尽力将机器学习与推理相关的知识进行模块化整理,使读者能够快速了解本门课程的内容架构和知识脉络。由于作者学识有限,书中疏漏和不当之处在所难免。针对机器学习与推理内容的分块化整理,不同专业背景或视角会形成不同的见解,不当之处敬请读者批评指正,不胜感激。
作者
2024年2月
|
|