新書推薦:
《
英国商业500年(见证大国崛起与企业兴衰,启迪未来商业智慧。)
》
售價:HK$
80.6
《
万千心理·儿童心理治疗中的心智化:临床实践指导
》
售價:HK$
87.4
《
自我囚禁的人:完美主义的心理成因与自我松绑(破除你对完美主义的迷思,尝试打破自我评价过低与焦虑的恶性循环)
》
售價:HK$
66.1
《
周易
》
售價:HK$
44.6
《
东南亚的传统与发展
》
售價:HK$
67.2
《
乾隆制造
》
售價:HK$
87.4
《
资治通鉴臣光曰辑存 资治通鉴目录(司马光全集)(全二册)
》
售價:HK$
304.4
《
明代社会变迁时期生活质量研究
》
售價:HK$
316.2
|
編輯推薦: |
精心选取十个大数据与机器学习的实战案例,采用迭代递进模式,边理论边实践,深入浅出,让读者在工程实践中熏陶成长,在复杂系统设计中淬炼过硬本领。十个案例全部采用国际著名机构发布的真实数据,研究领域涉及生物信息、图像处理、商业零售、银行金融、自然语言处理等。每个案例采用的数据集规模相对较大,鲜明体现了机器学习在大规模数据挖掘处理方面独领风骚。
|
內容簡介: |
精心选取十个大数据与机器学习的实战案例,采用迭代递进模式,边理论边实践,深入浅出,让读者在工程实践中熏陶成长,在复杂系统设计中淬炼过硬本领。十个案例全部采用国际著名机构发布的真实数据,研究领域涉及生物信息、图像处理、商业零售、银行金融、自然语言处理等。每个案例采用的数据集规模相对较大,鲜明体现了机器学习在大规模数据挖掘处理方面独领风骚。
|
關於作者: |
董相志,理学硕士,鲁东大学信息与电气工程学院副教授,主讲《网络编程》、《Android程序设计》、《机器学习》、《深度学习》、《人工智能》、《大数据与人工智能》、《Python程序设计》、《Web前端设计》、《Web后端设计》等课程。近年来第一作者出版教材三部,参加省部级课题二项,获山东省软科学一等奖一项,获山东省教学成果二等奖一项。主要教学研究方向为大数据与人工智能、网络编程等。
|
目錄:
|
第1章房价预测与回归问题
1.1数据集
1.2训练集观察
1.3列变量观察
1.4相关矩阵
1.5缺失数据
1.6离群值
1.7正态分布
1.8同方差与异方差
1.9线性回归假设
1.10参数估计
1.11决定系数
1.12特征工程
1.13数据集划分与标准化
1.14线性回归模型
1.15岭回归模型
1.16Lasso回归模型
1.17ElasticNet回归模型
1.18XGBoost回归模型
1.19Voting回归模型
1.20Stacking回归模型
1.21模型比较
小结
习题
第2章人体蛋白图谱与卷积神经网络
2.1数据集
2.2训练集观察
2.3标签向量化
2.4均衡性检查
2.5构建新训练集
2.6卷积运算
2.7边缘扩充
2.8卷积步长
2.9三维卷积
2.10定义卷积层
2.11简单卷积神经网络
2.12定义池化层
2.13经典结构LeNet5
2.14卷积网络结构剖析
2.15为什么使用卷积
2.16数据集划分
2.17图像的特征表示
2.18蛋白图像的特征矩阵
2.19数据标准化
2.20模型定义
2.21模型训练
2.22模型评估
2.23模型预测
小结
习题
第3章细胞图像与深度卷积
3.1数据集
3.2数据采集
3.3数据集观察
3.4数据分布
3.5筛选数据集
3.6神经网络
3.7符号化表示
3.8激励函数
3.9损失函数
3.10梯度下降
3.11正向传播
3.12反向传播
3.13偏差与方差
3.14正则化
3.15MiniBatch梯度下降
3.16优化算法
3.17参数与超参数
3.18Softmax回归
3.19VGG16卷积网络
3.20ResNet卷积网络
3.2111卷积
3.22Inception卷积网络
3.23合成细胞彩色图像
3.24数据集划分
3.25制作HDF5数据集
3.26迁移学习与特征提取
3.27基于VGG16的迁移学习
3.28训练ResNet50模型
3.29ResNet50模型预测
小结
习题
第4章自动驾驶与YOLO算法
4.1认识自动驾驶
4.2数据集
4.3数据集观察
4.4变量观察
4.5场景观察
4.6场景动画
4.7目标检测
4.8特征点检测
4.9滑动窗口实现目标检测
4.10卷积方法实现滑动窗口
4.11初识YOLO算法
4.12交并比
4.13非极大值抑制
4.14Anchor Boxes
4.15YOLO技术演进
4.16用OpenCV显示图像
4.17用OpenCV播放视频
4.18用GoogLeNet对图像分类
4.19用GoogLeNet对视频逐帧分类
4.20YOLO v3预训练模型
4.21YOLO v3对图像做目标检测
4.22YOLO v3对视频做目标检测
4.23YOLO v3对驾驶场景做目标检测
小结
习题
第5章AlphaFold与蛋白质结构预测
5.1什么是AlphaFold
5.2肽键、多肽与肽链
5.3蛋白质的四级结构
5.4数据集
5.5筛选蛋白质序列
5.6计算残基之间的距离
5.7二面角与拉氏构象图
5.8计算二面角Phi()和Psi()
5.9裁剪残基序列的OneHot矩阵
5.10裁剪评分矩阵和二面角标签
5.11定义二面角预测模型
5.12二面角模型参数设定与训练
5.13二面角模型预测与评价
5.14定义距离预测模型
5.15构建残基序列3D特征矩阵
5.16构建3D评分矩阵
5.17定义距离标签的3D矩阵
5.18距离模型参数设定与训练
5.19距离模型预测与评价
小结
习题
第6章机器问答与BERT模型
6.1Google开放域数据集
6.2序列模型与RNN
6.3词向量
6.4注意力机制
6.5Transformer模型
6.6BERT模型
6.7数据集分析
6.8F1分数
6.9定义BERT模型和RoBERTa模型
6.10训练BERT微调模型
6.11用BERT微调模型预测
小结
习题
第7章苹果树病虫害识别与模型集成
7.1数据集
7.2叶片观察
7.3RGB通道观察
7.4叶片图像分类观察
7.5叶片类别分布统计
7.6Canny边缘检测
7.7数据增强
7.8划分数据集
7.9DenseNet模型定义
7.10DenseNet模型训练
7.11DenseNet模型预测与评估
7.12EfficientNet模型定义
7.13EfficientNet模型训练
7.14EfficientNet模型预测与评估
7.15EfficientNet Noisy Student模型
7.16EfficientDet模型
7.17模型集成
小结
习题
参考文献
|
內容試閱:
|
教育部新工科培养方案明确指出本科生应具备复杂系统设计能力。本书与此目标完美契合,同时具备高阶性、创新性与挑战性三种特质。本书是四位作者通力合作的成果,具有以下四个特色。
第一,所见即所得。所有编码和图表分析,均出自本书案例的实践过程,与案例100%同步,100%测试,100%可靠。
第二,一例一世界。七个案例,各有侧重。案例全部采用国际著名机构发布的真实数据,研究领域涉及房产零售、生物信息、图像处理、自动驾驶、蛋白质折叠、机器问答、植物病理等。案例从数据分析和预处理开始,到特征工程,再到机器学习建模,最后完成模型评估,系统推演,丝毫毕现。
第三,把脉问前沿。案例聚焦问题前沿与技术前沿,同时兼顾方法的普适性、代表性与先进性。例如,对于历史经典模型(LeNet5)、结构优美的模型(VGG16)、自身应用广泛并对后来算法影响深远的模型(ResNet、Inception)、性能卓著的后起之秀模型(YOLO v1~v4、DenseNet、EfficientNet、EfficientDet、BERT)等,予以重点关注。
第四,视频求深解。所有章节同步配有作者高清视频讲解,扫描书中二维码即可在线观看。视频不是书本内容的简单重复,而是再次升华和有益补充。视频讲解弥补了文字在逻辑推演细节上的跳跃,口头表达带来了更为丰富的立体感知,视频讲解在聚焦前沿方面亦多有拓展。
本书以应用为导向,理论教学贯穿其中,理论与实践相得益彰。
回归问题讨论了线性回归、岭回归、Lasso回归、ElasticNet回归、XGBoost回归、Voting回归和Stacking回归七种方法在同一问题上的表现。
神经网络基本理论的内容则循序渐进,包括神经网络结构、激励函数、损失函数、梯度下降、正向传播、反向传播、偏差与方差、正则化、MiniBatch梯度下降、参数与超参数、优化算法等。
卷积神经网络的内容囊括卷积核、卷积运算、边缘扩充、卷积步长、最大池化与平均池化、卷积层、经典结构、11卷积等基础模块,也包括对经典网络的剖析与运用,包括LeNet5网络、VGG16网络、ResNet网络、Inception网络、DenseNet网络、EfficientNet网络、EfficientDet网络等。
自动驾驶与YOLO算法碰撞,从目标检测、OpenCV、滑动窗口、卷积滑动窗口、Bounding Box、交并比、非极大值抑制、Anchor Box等算法基础模块,到最后的YOLO算法v1、v2、v3、v4等一气呵成。
循环神经网络和自然语言处理领域,从词汇表征、词嵌入向量、注意力机制、Transformer到以BERT模型为核心的机器问答。
本书将理论知识作为独立教学模块,与案例推演前后呼应,浑然一体。这种边理论边实践的教学模式,既可在工程实践中熏陶理论见识,又可在复杂系统设计中淬炼过硬本领。
总之,本书坚持理论与实践相融合的教学理念,使得案例在易读、易学、易用、易模仿、易创新等方面形成了自己的特色。作者坚持一流教学标准引领教材各个环节的创作,既有内容美,又有形式美。教材文案设计和视频讲解以读者为中心,课后习题均有解答,让读者学得轻松,学得快乐,学有所成。
本书彩色图表较多,为了节约印刷成本,彩色图表以黑白颜色呈现,但是文字表达仍然沿用彩色图表的描述逻辑,一方面是为了保留彩色图表的丰富内涵; 另一方面,彩色图表本身就是实践的结果。如果读到描述彩色图表的文字,可以参照视频讲解、程序文档或随书课件,完整复原彩色图表的庐山真面目。
本书的出版得到了清华大学出版社的大力支持,在此致以衷心感谢!
本书案例编码借鉴了众多Kaggle作者、GitHub作者和不知名网络作者的方案,书中行文或者案例文档已有注明,部分图表引用了论文作者的原创,相关论文已列在书末参考文献中。在此向众多的网络作者、原创学者表达谢意!本书部分内容参照了吴恩达老师的深度学习公开课,在此表达崇高敬意!
好作品离不开读者的反馈,欢迎读者批评指正。
最后,是写给读者的几句话:
致读者
数据滔滔,浮光跃金。
机器碌碌,静影沉璧。
平凡数据,不凡潜力。
生生不息,碌碌不止。
案例领航,风雷万里。
鸿蒙壮心,寻根问底。
明明如月,何时可掇?
行到水穷,坐看云起。
编著者2020年5月
|
|