新書推薦:
《
德国天才4:断裂与承续
》
售價:HK$
112.7
《
妈妈的情绪,决定孩子的未来
》
售價:HK$
43.7
《
推拿纲目
》
售價:HK$
414.0
《
精致考古--山东大学实验室考古项目论文集(一)
》
售價:HK$
250.7
《
从天下到世界——国际法与晚清中国的主权意识
》
售價:HK$
78.2
《
血色帝国:近代英国社会与美洲移民
》
售價:HK$
59.8
《
海外中国研究·王羲之:六朝贵族的世界(艺术系列)
》
售價:HK$
182.9
《
唐宋绘画史 全彩插图版
》
售價:HK$
101.2
|
編輯推薦: |
智能交通与智能驾驶系列 引用大量的交通案例,展示各类算法模型应用到交通实践 借助回归分析、聚类分析、神经网络与深度学习,从数据预处理、数据统计、数据模型、数据结果分析、数据可视化展示等方面,更加清晰地介绍了综合交通数据的具体处理和分析方法,赋能智能交通大数据应用。 综合交通数据科学关键板块: 1.地理信息系统 2.交通模拟 3.智能交通系统 4.大数据分析 5.交通政策和规划 6.交通数据共享和可视化 综合交通数据科学技术作用: 1,帮助预测和缓解交通拥堵,通过实时监测交通状况,交通管理者可以及时采取措施来改善道路流通,如调整信号灯、引导交通、提供实时交通信息等,从而降低交通拥堵; 2,有助于提高道路交通的安全性,减少交通事故和交通伤亡,识别交通安全问题的热点; 3. 有利于环境可持续性,城市交通规划可持续性,提高资源利用效率。
|
內容簡介: |
本书结合作者多年的科研和教学经验,深入浅出地介绍了数据科学中常用的热门的回归分析、聚类分析、神经网络与深度学习的原理、模型;在介绍理论知识的同时,引用了大量的交通案例,以便展示如何将各类算法模型应用到交通实践中。本书分别以杭州地铁、北京地铁客流数据和共享单车骑行数据为例,从数据预处理、数据统计、数据模型、数据结果分析、数据可视化展示等方面,更加清晰地介绍了综合交通数据的具体处理和分析方法,展示了如何运用这些技术来分析杭州和北京地铁客流数据,以及如何利用共享单车数据进行集成学习和客流预测,从而增强综合交通数据科学理论知识的可解释性,以便读者进一步增强综合交通数据科学技术实战能力,理解所介绍的知识与方法。
|
關於作者: |
周慧娟,博士,北方工业大学教授;毕业于北京交通大学系统分析与集成专业,曾就职于铁道科学研究院电子计算技术研究所;具有丰富的交通行业从业经历,承担过铁路地理信息系统平台(RGIS)的建设及铁路、城市轨道交通、城市道路交通行业信息化建设和信息系统研发;讲授“数据库技术”“交通大数据技术”“交通地理信息系统”等课程,对数据科学相关理论、方法、技术及其在交通行业的应用有较深的理解和积累。
|
目錄:
|
前言 第1 章 绪论 1 1.1 数据科学的发展历程与应用现状 1 1.2 综合交通领域研究方向及应用需求 2 1.3 综合交通数据科学技术 3 1.3.1 概述 3 1.3.2 内容 3 1.3.3 应用 4 1.4 本书简介 4 第2 章 回归分析的原理、模型与实现 6 2.1 回归分析简介 6 2.2 简单线性回归 7 2.2.1 案例引入 7 2.2.2 基本概念 7 2.2.3 模型描述 8 2.2.4 参数估计 9 2.2.5 欠拟合与过拟合 13 2.2.6 多元线性回归 16 2.3 逻辑回归 20 2.3.1 案例引入 20 2.3.2 基本概念 21 2.3.3 模型描述 21 2.3.4 参数估计 23 2.4 非线性回归 27 2.4.1 多项式回归 27 2.4.2 幂函数回归 29 2.4.3 常见非线性回归模型 30 2.5 正则化回归方法 31 2.5.1 L2 正则化:岭回归 32 2.5.2 L1 正则化:LASSO 回归 32 2.6 本章小结 34 第3 章 聚类分析的原理、模型与实现 35 3.1 聚类概述 35 3.1.1 什么是聚类 35 3.1.2 聚类的要求 35 3.1.3 聚类的计算方法 36 3.1.4 聚类的应用 38 3.1.5 聚类效果评价指标 38 3.2 k-means 聚类 40 3.2.1 k-means 聚类原理 41 3.2.2 k-means 聚类优缺点 42 3.2.3 k-means 聚类调优和改进算法 43 3.3 层次聚类 44 3.3.1 层次聚类原理 45 3.3.2 层次聚类优缺点 46 3.3.3 凝聚的层次聚类方法 47 3.4 DBSCAN 52 3.4.1 DBSCAN 原理 53 3.4.2 DBSCAN 关键参数 54 3.4.3 DBSCAN 优缺点 56 3.5 其他聚类方法 57 3.5.1 GMM 聚类 57 3.5.2 谱聚类 57 3.5.3 GMM 聚类和谱聚类示例 58 3.6 算法对比 59 3.6.1 分类和聚类的区别 59 3.6.2 k-means 聚类、DBSCAN、层次聚类对比 59 3.6.3 scikit-learn 库中的聚类算法的比较 64 第4 章 神经网络与深度学习 66 4.1 神经网络 66 4.1.1 人工神经网络 66 4.1.2 神经元 67 4.1.3 激活函数 67 4.1.4 神经网络的基本结构 71 4.1.5 前向传播与反向传播 72 4.2 深度强化学习 74 4.2.1 卷积运算 74 4.2.2 卷积神经网络 77 4.2.3 循环神经网络 83 4.3 案例分析 83 第5 章 杭州地铁客流数据分析实践 90 5.1 数据统计 90 5.1.1 10 分钟客流集计 90 5.1.2 站点5 分钟粒度进站客流量 92 5.1.3 各个站点5 分钟粒度下进站乘客平均乘车时间 94 5.1.4 早高峰进站人数 96 5.1.5 线路B 早高峰进站客流可视化 98 5.1.6 乘客编号路径追踪 99 5.2 数据聚类 102 5.3 回归分析 110 第6 章 北京地铁客流数据分析与客流预测 118 6.1 数据分析 118 6.1.1 数据介绍 118 6.1.2 数据处理 119 6.1.3 单线路1 分钟时间粒度进出站客流量 121 6.1.4 单站一天内1 分钟时间粒度下进站客流量 122 6.2 客流量预测 125 6.2.1 LSTM 模型 125 6.2.2 CNN 模型 128 6.2.3 结果分析 132 第7 章 多模型共享单车骑行需求预测 134 7.1 数据说明及具体目标 134 7.2 实施流程 135 7.3 数据预处理 136 7.3.1 导入相关包 136 7.3.2 读取数据 137 7.3.3 日期数据处理及特征类别转换 138 7.3.4 异常值处理 138 7.3.5 可视化分析 139 7.4 模型建立与求解 150 7.4.1 准备数据 150 7.4.2 基本模型 150 7.4.3 模型融合 Stacking 160 7.5 结果分析 160 7.5.1 各模型残差分析 160 7.5.2 预测结果分析 167 参考文献 169
|
內容試閱:
|
2019年12月,为贯彻落实习近平总书记关于网络强国的重要论述和国家大数据战略部署,推进交通运输治理体系和治理能力现代化,提升综合交通运输服务水平,加快建设交通强国,交通运输部印发了《推进综合交通运输大数据发展行动纲要(2020—2025年)》。该纲要明确指出要推进综合交通运输大数据发展,推动大数据与综合交通运输深度融合,构建综合交通大数据中心体系和综合性大数据分析技术模型,有效支撑综合交通运输决策管理与服务。大数据技术作为一种全面、连续观察交通现象的手段,结合人工智能算法,能够为交通分析技术体系带来变革。 为了顺应“互联网+”与交通运输学科融合发展的趋势,应对新工科背景下智能交通大数据分析人才的缺口,解决交通大数据相关课程重理论轻实践以及学生数据分析能力薄弱的问题,作者团队结合多年的科研和教学经验,采用案例化教学方式,以行业实际数据和案例为支撑,深入浅出地介绍了数据科学中常用的热门的回归分析、聚类分析、神经网络与深度学习的原理、模型。为进一步增强学生综合交通数据科学技术的实战能力,本书分别以杭州地铁、北京地铁客流数据和共享单车骑行数据为例,从数据预处理、数据统计、数据模型、数据结果分析、数据可视化展示等方面,更加清晰地介绍了综合交通数据的具体处理和分析方法,展示了如何运用这些技术来分析杭州和北京地铁客流数据,以及如何利用共享单车数据进行集成学习和客流预测,从而增强综合交通数据科学理论知识的可解释性。 全书共7章,第1章由周慧娟、张尊栋编写,第2章由周慧娟、吴文祥编写,第3章由张尊栋、周慧娟编写、第4章由张尊栋、刘小明编写,第5章由周慧娟、刘小明编写,第6章由张尊栋、吴文祥编写,第7章由张尊栋、陈智编写。研究生王瑞、乔曜芩、王若愚、张巍、冯丽、刘雨珂、刘璐菲等参加了本书的资料整理、代码实现与测试等工作。全书由周慧娟统稿。 由于数据科学理论与技术在国内外仍处于持续发展阶段,在交通运输领域的应用时间也不长,又限于作者水平,本书难免存在对已有技术讨论覆盖不全、模型算法更新不及时等问题和不当之处,恳请广大读者不吝批评指正。 本书的出版得到了北方工业大学2023 年教材出版专项资助。
|
|