新書推薦:
《
从康德到黑格尔的发展:兼论宗教哲学(英国观念论名著译丛)
》
售價:HK$
60.5
《
突破不可能:用特工思维提升领导力
》
售價:HK$
77.3
《
王阳明大传:知行合一的心学智慧(精装典藏版)
》
售價:HK$
221.8
《
失衡与重塑——百年变局下的中国与世界经济
》
售價:HK$
132.2
《
不被定义的年龄:积极年龄观让我们更快乐、健康、长寿
》
售價:HK$
77.3
《
南方谈话:邓小平在1992
》
售價:HK$
80.6
《
纷纭万端 : 近代中国的思想与社会
》
售價:HK$
109.8
《
中国古代文体形态研究(第四版)(中华当代学术著作辑要)
》
售價:HK$
168.0
|
內容簡介: |
机器学习应用遍及人工智能的各个领域,是众多数学科学家需要学习的内容。本书第壹部分提供了一个相当复杂的机器学习系统,以帮助读者提高其效率。第二部分重点介绍了三个不同的基于现实世界的数据的案例研究,并提供相应解决方案。全书通过知识介绍,使读者了解收集数据、准备使用数据、训练模型、评估模型的性能,以及改进模型的性能的方法;通过对实际问题解决的讲解,帮助读者获得处理机器学习问题的经验。
|
目錄:
|
目录?Contents
译者序
前言
第1章 机器学习引言1
1.1 什么是机器学习1
1.2 分类方法概述2
1.3 聚类方法概述2
1.4 监督学习概述3
1.5 无监督学习概述4
1.6 增强学习概述4
1.7 结构化预测概述5
1.8 神经网络概述5
1.9 深度学习概述6
第2章 分类7
2.1 引言7
2.2 判别函数分析:地下卤水地质化学测量8
2.3 多元逻辑回归:理解学生的课程计划选择15
2.4 Tobit回归:评估学生的学术能力20
2.5 泊松回归:理解加拉帕戈斯群岛现存物种27
第3章 聚类38
3.1 引言38
3.2 层次聚类:世界银行样本数据集39
3.3 层次聚类:1999~2010年
亚马逊雨林的烧毁情况44
3.4 层次聚类:基因聚类55
3.5 二进制聚类:数学测验68
3.6 k均值聚类:欧洲各国蛋白质消耗量75
3.7 k均值聚类:食品80
第4章 模型选择和正则化86
4.1 引言86
4.2 压缩方法:每天消耗的卡路里87
4.3 降维方法:Delta航空公司航空队100
4.4 主成分分析:理解世界菜肴109
第5章 非线性114
5.1 广义加性模型:衡量新西兰的家庭收入114
5.2 平滑样条:理解汽车和速度119
5.3 局部回归:理解干旱警告和影响129
第6章 监督学习136
6.1 引言136
6.2 决策树学习:对胸痛患者的预先医疗护理指示137
6.3 决策树学习:基于收入的房地产价值分布145
6.4 决策树学习:预测股票走势方向154
6.5 朴素贝叶斯:预测股票走势方向170
6.6 随机森林:货币交易策略184
6.7 支持向量机:货币交易策略193
6.8 随机梯度下降:成人收入201
第7章 无监督学习208
7.1 引言208
7.2 自组织映射:可视化热图209
7.3 矢量量化:图像聚类212
第8章 增强学习217
8.1 引言217
8.2 马尔可夫链:股票区制转移模型218
8.3 马尔可夫链:多渠道归因模型229
8.4 马尔可夫链:汽车租赁代理服务239
8.5 连续马尔可夫链:加油站的车辆服务243
8.6 蒙特卡罗模拟:校准Hull-White短期利率247
第9章 结构化预测257
9.1 引言257
9.2 隐马尔可夫模型:欧元和美元257
9.3 隐马尔可夫模型:区制检测263
第10章 神经网络270
10.1 引言270
10.2 为S&P 500建模270
10.3 衡量失业率278
第11章 深度学习292
11.1 引言292
11.2 循环神经网络:预测周期信号292
第12章 案例研究:探索世界银行数据299
12.1 引言299
12.2 探索世界银行数据299
第13章 案例研究:再保险合同定价316
13.1 引言316
13.2 再保险合同定价316
第14章 案例研究:用电量预测329
14.1 引言329
14.2 用电量测量329
|
內容試閱:
|
Preface?前言当今世界,数据已经成为新的“价值金矿”并以指数级的速度增长着。这种增长既包括现存数据的增长,也包括新数据的增长,这些新的数据以结构化和非结构化的形式展现,并来源于社交媒体、互联网、文档文献以及物联网等多种多样的数据源。数据流必须实时地收集、处理、分析,并最终展现出来以确保数据的使用者能够在如今快速变化的环境中做出理性且明智的决定。机器学习技术将待解决问题的上下文信息应用于这些数据上,用统计学技术确保不断快速到达的复杂数据能够以科学的方式加以分析。并利用机器学习算法从数据中进行迭代学习,发现数据中的隐藏模式和规律。机器学习的这种迭代学习的模式是非常重要的,正因如此,当机器学习模型被暴露在新的数据中时,它们才能从新的数据集中独立地适应和学习以产出可靠的结论。
我们将首先介绍本书中包含的多种不同的机器学习主题,随后,基于现实世界的问题在不同的章节中对各个主题进行一一探讨,例如分类、聚类、模型选择和正则化、非线性问题、监督学习、无监督学习、增强学习、结构化预测、神经网络、深度学习,还有最后的案例研究。本书的机器学习算法以R语言作为编程语言。本书适用于R语言的初学者,但是熟悉R语言对理解和使用本书的代码肯定是会有所帮助的。
你将学习如何合理地决定使用哪类算法以及如何应用这些算法得到最佳的效果。如果你想要对图像、文字、语音或者其他形式的数据都建立有意义的多功能的应用,本书绝对会成为你的得力助手。
本书的主要内容第1章涵盖了机器学习的各种概念。本章使读者初步了解本书涵盖的各个主题。
第2章包括以下算法:判别函数分析、多元逻辑回归、Tobit回归、泊松回归。
第3章包括以下主题和算法:层次聚类、二进制聚类、k均值聚类。
第4章包括以下主题和算法:压缩方法、降维方法和主成分分析。
第5章包括以下主题和算法:广义加性模型、平滑样条、局部回归。
第6章包括以下主题和算法:决策树学习、朴素贝叶斯、随机森林、支持向量机、随机梯度下降。
第7章包括以下主题和算法:自组织映射和矢量量化。
第8章包括以下主题和算法:马尔可夫链、蒙特卡洛模拟。
第9章包括以下主题和算法:隐马尔可夫模型。
第10章包括以下主题和算法:神经网络。
第11章包括以下主题和算法:递归神经网络。
第12章包括世界银行数据分析。
第13章包括再保险合同定价。
第14章包括用电量预测。
本书的重点本书的重点是用R语言构建基于机器学习的应用。我们已经使用R语言构建过各种解决方案。我们的重点是利用R语言库和函数以最佳方式来克服现实世界的挑战。我们尽量保持所有代码的友好性和可读性。我们认为这将使读者能够很容易地理解代码,并在不同的场景中随时使用它。
本书的目标读者本书是为想构建实用的基于机器学习的应用的专业人士,以及统计、数据分析、机器学习、计算机科学或其他专业的学生和专业人士准备的。本书适用于R语言的初学者,但是熟悉R语言对理解和使用本书的代码肯定是会有所帮助的。对于那些希望在现有技术栈中探索机器学习技术的有经验的R语言程序员来说,本书也将是非常有用的。
特殊章节在本书中,你将频繁看到如下小节:准备工作和具体实施步骤。
为了更加清晰地说明怎样完成一个机器学习方法,我们使用了如下特殊章节。
准备工作该节告诉你机器学习方法需要哪些准备,并描述了如何设置该机器学习方法所要求的软件或其他先决条件。
具体实施步骤该节包含了机器学习方法的各个具体步骤。
下载示例代码本书的代码位于GitHub上,读者可从https:github.comPacktPublishingPractical-Machine-Learning-Cookbook下载。
下载本书的彩图本书还为你提供了一个PDF文件,其中包含了本书的彩图。这些彩图将帮助你更好地理解输出的变化。你能够从地址https:www.packtpub.comsitesdefaultfilesdownloadsPracticalMachineLearningCookbook_ColorImages.pdf下载该文件。
|
|