登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書

『簡體書』数据挖掘:原理与应用

書城自編碼: 3704487
分類:簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 丁兆云,周鋆,杜振国
國際書號(ISBN): 9787111696308
出版社: 机械工业出版社
出版日期: 2021-12-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 90.9

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
精致考古--山东大学实验室考古项目论文集(一)
《 精致考古--山东大学实验室考古项目论文集(一) 》

售價:HK$ 244.2
从天下到世界——国际法与晚清中国的主权意识
《 从天下到世界——国际法与晚清中国的主权意识 》

售價:HK$ 76.2
血色帝国:近代英国社会与美洲移民
《 血色帝国:近代英国社会与美洲移民 》

售價:HK$ 58.2
海外中国研究·王羲之:六朝贵族的世界(艺术系列)
《 海外中国研究·王羲之:六朝贵族的世界(艺术系列) 》

售價:HK$ 178.1
唐宋绘画史  全彩插图版
《 唐宋绘画史 全彩插图版 》

售價:HK$ 98.6
海洋、岛屿和革命:当南方遭遇帝国(文明的另一种声音)
《 海洋、岛屿和革命:当南方遭遇帝国(文明的另一种声音) 》

售價:HK$ 106.4
铝合金先进成型技术
《 铝合金先进成型技术 》

售價:HK$ 266.6
英雄之旅:把人生活成一个好故事
《 英雄之旅:把人生活成一个好故事 》

售價:HK$ 87.4

 

內容簡介:
目前,数据挖掘类课程已成为我国新工科教育的数据科学思维提升课程,成为信息、电子等各类工科专业本科生与研究生的必修课。本书深入浅出地介绍了数据挖掘和数据分析的知识、常用的各类算法;系统梳理与比较各类算法的优缺点与适用场景。本书内容结合作者多年的科研和教学经验,大量案例来自作者的项目和科研成果,不仅适合作为大数据特色类专业的本科生和研究生教材,同时也适合机械、航空等其他工科专业的入门与自学教材,还可作为各专业本科生与研究生考试复习的参考资料。
目錄
前言第1章 绪论11.1 数据挖掘的出现11.2 为什么要学习数据挖掘11.2.1 数据爆炸但知识贫乏11.2.2 从商业数据到商业智能的进化21.2.3 科学发展范式21.3 什么是数据挖掘31.3.1 数据挖掘的出现31.3.2 数据挖掘的定义31.3.3 数据的含义41.3.4 信息的含义41.3.5 知识的含义51.3.6 数据、信息、知识的关系51.3.7 数据挖掘过程51.3.8 数据挖掘的关联课程61.4 数据挖掘的内容71.4.1 关联规则挖掘71.4.2 分类71.4.3 聚类91.4.4 回归101.5 本章小结10第2章 认识数据112.1 数据的基本概念112.1.1 数据对象112.1.2 数据属性122.1.3 属性的类型132.1.4 属性类型的对比142.1.5 离散属性与连续属性142.2 数据的基本统计方法152.2.1 中心化趋势统计量:均值、中位数和众数152.2.2 离散度度量162.2.3 分布形状度量172.3 数据的基本可视化方法182.3.1 箱线图可视化182.3.2 直方图可视化192.3.3 散点图可视化192.4 数据相似性的计算方法202.4.1 数据相似性和相异性度量的基本概念202.4.2 标称属性的邻近性度量212.4.3 二值属性的邻近性度量222.4.4 序数属性的邻近性度量232.4.5 数值属性的邻近性度量232.4.6 混合类型属性的邻近性度量252.4.7 余弦相似性252.5 本章小结26第3章 数据预处理273.1 数据质量273.2 数据预处理的主要任务273.2.1 数据清理273.2.2 数据集成283.2.3 数据规约323.2.4 数据规范化和数据离散化373.3 特征构造383.3.1 为什么需要特征构造383.3.2 基本特征构造法383.3.3 时间类型数据特征构造法393.3.4 时间序列数据特征构造法413.3.5 离散数据特征哑编码423.4 本章小结43第4章 分类的基本概念与朴素贝叶斯分类器444.1 分类的基本概念444.2 朴素贝叶斯分类的基础理论454.2.1 贝叶斯示例454.2.2 贝叶斯定理464.2.3 极大后验假设464.2.4 多维属性的联合概率474.2.5 独立性假设474.2.6 训练集介绍474.3 贝叶斯分类的案例484.3.1 案例一:购买电脑预测484.3.2 案例二:垃圾邮件分类494.4 连续类型数据分类504.5 本章小结50第5章 决策树分类515.1 决策树515.2 决策树构建的两个问题525.2.1 如何构建决策树525.2.2 构造什么样的决策树是合适的535.3 决策树算法545.3.1 Hunt算法545.3.2 构建决策树的关键问题565.3.3 信息增益算法575.3.4 C4.5算法595.3.5 CART算法615.4 本章小结64第6章 规则和近邻分类器666.1 基于规则的分类666.1.1 基于规则的分类示例666.1.2 规则的质量686.1.3 规则分类器的特征686.1.4 基于规则的分类器的建立696.1.5 规则分类的特点766.2 急切学习与惰性学习766.3 近邻分类器776.3.1 近邻算法的定义776.3.2 K近邻分类算法786.4 本章小结79第7章 回归算法807.1 线性回归的案例:房价预测807.2 线性回归算法817.2.1 线性回归的提出817.2.2 线性回归建模817.2.3 小二乘法827.3 优化求解方法837.3.1 梯度下降837.3.2 梯度下降法求解837.3.3 学习率分析847.3.4 梯度下降法收敛857.3.5 梯度下降法的变体867.4 逻辑回归877.4.1 逻辑回归函数877.4.2 逻辑回归的特点877.4.3 优势比887.4.4 逻辑回归参数估计897.4.5 逻辑回归正则化907.4.6 逻辑回归数值优化917.4.7 逻辑回归训练方法的优化937.5 决策树回归947.5.1 决策树回归的基本概念947.5.2 决策树分类划分点的选择947.5.3 决策树回归算法967.6 本章小结96第8章 模型的评价978.1 分类模型的评价指标978.1.1 混淆矩阵978.1.2 准确率978.1.3 精确率与召回率988.1.4 ROC曲线998.2 不平衡分类1028.2.1 基于抽样的方法1038.2.2 两阶段学习1048.2.3 代价敏感学习1048.3 过拟合与欠拟合1058.3.1 训练误差和泛化误差1058.3.2 噪声导致的过拟合1078.3.3 缺乏代表性样本导致的过拟合1078.3.4 解决过拟合的方法一:减少泛化误差1098.3.5 解决过拟合的方法二:使用确认集估计泛化误差1108.4 其他模型评价指标1138.4.1 回归模型1138.4.2 聚类模型1148.4.3 关联规则模型1158.5 本章小结117第9章 支持向量机分类器1189.1 支持向量机的提出1189.1.1 支持向量机简介1189.1.2 传统分类方法的不足1189.1.3 支持向量机的总体思想1199.1.4 从Logistic回归到SVM分析1199.1.5 支持向量机的应用1209.2 深入支持向量机1219.2.1 支持向量机算法的原理1219.2.2 支持向量机建模1229.2.3 支持向量机求解1239.3 非线性支持向量机1269.3.1 基于软间隔的C-SVM1269.3.2 非线性SVM与核变换1299.3.3 支持向量机二分类推广1319.4 本章小结131第10章 神经网络分类器13210.1 人工神经网络出现的背景 13210.1.1 发展历程13210.1.2 端到端的学习133
內容試閱
随着大数据、人工智能的快速发展,各高校越来越重视大数据相关专业与课程的建设,很多高校开设了大数据学院或数据科学/大数据专业。随着数据科学的普及,数据挖掘逐渐成为一种通用技术,广泛应用于人们社会生活的各个领域,因此掌握数据挖掘的基本概念和技术十分重要。笔者近年来一直从事数据挖掘领域的研究以及课程的建设,通过将复杂的数据挖掘知识点与实际案例结合,形成了一套以案例为牵引的数据挖掘知识体系,使不同学科背景的本科生、研究生更容易理解和掌握数据挖掘技术。本书以深入浅出、简要易懂的方式荟萃了数据挖掘的各类算法知识点;系统地梳理和比较了各类算法的优缺点与适用场景;以案例为驱动说明了数据挖掘算法的运用。本书知识点难度适中,适合理工科相关专业的本科生与研究生作为教材使用,也可作为相关领域的科研与工程技术人员的参考书。另外,本书选取了笔者所在高校各类数据挖掘课程的试题,这些试题不仅涵盖数据挖掘经典的知识点,而且涉及互联网公司在招聘数据挖掘、机器学习、人工智能等方向的工程师时的笔试知识点。这些试题覆盖面广、新颖性强,适合本科生与研究生进行考前复习以及应聘笔试和面试时参考。本书的组织结构如下:第1章阐述为什么要学习数据挖掘、什么是数据挖掘、数据挖掘的主要技术,使读者从整体上把握本书的内容。第2章从数据的基本概念、基本统计特性、可视化以及相似性计算等方面综合认识数据,让读者知道在真实数据场景中,应该从哪几个方面初步认识数据。第3章主要包括数据质量的衡量因素、数据预处理的方法以及特征工程的常见方法等内容,让读者知道针对真实的质量不高的数据,如何通过数据预处理与特征工程提高数据质量。第4章至第11章主要介绍数据分类,将从决策树分类、规则和近邻分类、回归、支持向量机、神经网络、集成学习以及模型的评价等方面来详细阐述数据分类算法,让读者能够针对实际数据挖掘问题,深入理解数据分类算法,并且灵活运用到实践中。第12章主要从划分方法、层次方法、密度方法等方面详细阐述数据聚类的算法,让读者能够深入理解聚类算法的原理,掌握算法的应用场景。第13章主要从Apriori算法、FP-Growth算法、关联分析评估等方面详细阐述关联规则挖掘算法,让读者能够深入理解频繁项挖掘与规则挖掘的原理,熟练运用算法解决大项事物数据库关联规则挖掘的问题。第14章详细阐述了图数据中的节点影响力评估模型,让读者能够针对实际大型图数据的场景,利用影响力计算模型挖掘图中的关键节点。第15章主要针对现实中大量的个性化推荐需求,详细阐述基于内容的信息推荐、基于协同的信息推荐以及混合推荐等内容,让读者能够熟练运用推荐算法解决现实中的推荐问题。第16章主要针对近年来人工智能中热门的自然语言处理问题,详细阐述分布式词向量、循环神经网络、卷积神经网络、BERT模型等内容,使读者能够深入理解神经网络在自然语言处理中的模型。附录汇编了数据挖掘的各类试题,读者可以通过试题的解答进一步理解知识点,试题答案可从华章网站下载。本书在提炼数据挖掘知识点的基础上,在中国大学MOOC上开设了“数据挖掘”MOOC课程(https://www.icourse163.org/course/NUDT-1461782176),并在头歌平台上开设了“数据挖掘”实验课程(http://www.educoder.net/path/4153),读者可通过在线视频课程的学习、作业训练与编程实践加深对数据挖掘知识点的理解,提高运用能力。数据挖掘是一个快速发展的领域,加之编写时间、作者水平所限,书中难免有疏漏之处,请各位读者、同行不吝指正。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.