登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書

『簡體書』数据分析与挖掘技术

書城自編碼: 3980386
分類:簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 彭进香、张莉、刘鑫
國際書號(ISBN): 9787302651949
出版社: 清华大学出版社
出版日期: 2024-03-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 55.2

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
当代学术·乡族与国家:多元视野中的闽台传统社会(修订本)
《 当代学术·乡族与国家:多元视野中的闽台传统社会(修订本) 》

售價:HK$ 101.2
了不起的中国冠军:讲给孩子的奥运故事
《 了不起的中国冠军:讲给孩子的奥运故事 》

售價:HK$ 78.2
海外中国研究·北京的六分仪:中国历史中的全球潮流
《 海外中国研究·北京的六分仪:中国历史中的全球潮流 》

售價:HK$ 78.2
霍比特人(插图典藏版,150余幅精美全彩插图,原作地图首度汉化为简体中文,2024年全新译本)
《 霍比特人(插图典藏版,150余幅精美全彩插图,原作地图首度汉化为简体中文,2024年全新译本) 》

售價:HK$ 124.2
权力的文化与文化的权力:旧制度下的欧洲(1660—1789)
《 权力的文化与文化的权力:旧制度下的欧洲(1660—1789) 》

售價:HK$ 158.7
穿透估值:读懂估值中的共识与博弈
《 穿透估值:读懂估值中的共识与博弈 》

售價:HK$ 90.9
人设、流量与成交
《 人设、流量与成交 》

售價:HK$ 68.8
复利:全球顶尖投资者的31节认知与决策思维课
《 复利:全球顶尖投资者的31节认知与决策思维课 》

售價:HK$ 103.4

 

建議一齊購買:

+

HK$ 55.2
《中华文化原典选读(第2版)》
+

HK$ 70.8
《体育礼仪教程》
+

HK$ 98.8
《方剂学·全国中医药行业高等教育“十四五”规划教材》
+

HK$ 51.8
《美术——造型拓展与应用》
+

HK$ 123.8
《中医内科学·全国中医药行业高等教育“十四五”规划教材》
+

HK$ 156.2
《诊断学(第9版/本科临床/配增值)》
編輯推薦:
《数据分析与挖掘技术》系统地介绍数据分析与挖掘相关的概念、算法和应用,并结合一些典型的应用实例呈现数据挖掘有关算法的实践思路与过程,对教学而言具有较高的价值。
《数据分析与挖掘技术》通过对数据挖掘的理论、数据分析与挖掘的相关算法、SPSS数据分析与挖掘等内容的讲解,旨在让读者可以真正理解数据分析与挖掘理论,掌握数据挖掘的实用技能。
內容簡介:
《数据分析与挖掘技术》主要介绍数据分析与挖掘的相关理论和技术方法,重点介绍数据挖掘的相关技术,书中采取理论知识与具体实现任务相结合的方法,系统讲解了数据分析与挖掘的实用技术。全书共分为9章,主要内容包括数据分析与数据挖掘概论、数据仓库与联机分析处理、数据预处理、关联规则挖掘、聚类分析、回归分析、决策树分析、SPSS数据挖掘基础、SPSS数据挖掘统计分析方法。为了使学习者能轻松掌握数据分析与挖掘相关的概念、算法和应用,《数据分析与挖掘技术》通过典型的应用实例以任务驱动的方式让学习者理解数据挖掘有关算法的实践思路并体验实现过程。
《数据分析与挖掘技术》可作为计算机、大数据、智能科学等专业的课程的教材使用,也可以作为从事大数据分析与数据挖掘等相关工作技术人员的参考书。
關於作者:
彭进香,湖南应用技术学院信息工程学院院长,教授,市级优秀教师,“十三五”校级首批重点建设学科——计算机应用技术学科建设负责人。近年来主持和参与省、市级教研、科研项目20多项,指导省大学生研究性学习和创新性实验计划项目2项,发表研究论文20多篇,主编和参编教材6部,专利1项,软件著作权2项。对互联网企业从事数据挖掘有较深的研究,在大数据挖掘、分析及实战场景应用方面具有丰富经验。
目錄
第1章 数据分析与数据挖掘概论 1
1.1 数据分析 2
1.1.1 数据分析的定义 2
1.1.2 数据分析的工具 2
1.1.3 数据分析的方法与案例 7
1.2 数据挖掘 9
1.2.1 数据挖掘的定义 9
1.2.2 数据挖掘的目的 9
1.2.3 数据挖掘的工具 10
1.2.4 数据挖掘的方法和经典算法 11
小结 15
思考题 15
第2章 数据仓库与联机分析处理 17
2.1 数据仓库 18
2.1.1 数据仓库的定义和特点 18
2.1.2 数据仓库与数据库的区别 19
2.1.3 数据仓库的系统结构 20
2.1.4 数据仓库的数据模型 22
2.2 数据仓库的设计步骤 23
2.2.1 概念模型设计 24
2.2.2 逻辑模型设计 27
2.2.3 物理模型设计 28
2.2.4 数据仓库的生成 31
2.2.5 数据仓库的运行与维护 33
2.3 联机分析处理 34
2.3.1 联机分析处理的定义 34
2.3.2 联机分析处理的多维数据
存储 35
2.3.3 联机分析处理的分类 36
小结 39
思考题 39
第3章 数据预处理 41
3.1 数据预处理概述 42
3.1.1 数据预处理的目的 42
3.1.2 数据预处理的方法 42
3.2 数据清洗 44
3.2.1 数据清洗的方法和步骤 44
3.2.2 缺失值的识别与处理技巧 47
3.2.3 异常值的判断、检验与处理 49
3.3 数据集成 52
3.3.1 数据集成常见方法 53
3.3.2 数据冲突的检测和解决 55
3.3.3 处理数据集成中的冗余数据 56
3.3.4 相关分析 59
3.4 数据变换 62
3.4.1 数据变换过程中的离散化 62
3.4.2 数据变换的规范化方法 64
3.5 数据规约 65
3.5.1 数据规约的定义与目的 65
3.5.2 常用的数据规约策略 66
小结 70
思考题 70
第4章 关联规则挖掘 71
4.1 关联规则挖掘概述 72
4.1.1 关联规则的分类及应用 72
4.1.2 关联规则挖掘示例 74
4.2 Apriori算法 75
4.2.1 Apriori算法的定义与特点 76
4.2.2 Apriori算法的应用 79
4.2.3 Apriori算法分析与改进 82
4.3 FP-Growth算法 85
4.3.1 FP-Growth算法的基本思想 86
4.3.2 FP-Growth算法的特点及
改进 87
小结 92
思考题 92
第5章 聚类分析 93
5.1 聚类分析概述 94
5.1.1 什么是聚类分析 94
5.1.2 聚类中的相异度计算 96
5.2 基于划分的聚类 98
5.2.1 K-means算法 99
5.2.2 K-medoids算法 103
5.2.3 K-medoids算法中的PAM
算法示例 104
5.3 基于层次的聚类 106
5.3.1 层次聚类的基本思想 106
5.3.2 AGNES算法 107
5.3.3 DIANA算法 109
5.3.4 Birch层次聚类算法 111
5.4 基于密度的聚类 114
5.4.1 DBSCAN算法的流程 114
5.4.2 DBSCAN算法的性能分析 115
5.4.3 OPTICS密度聚类算法 116
5.5 基于模型的聚类算法 119
5.5.1 高斯混合模型的原理 119
5.5.2 EM算法的应用 119
小结 123
思考题 124
第6章 回归分析 125
6.1 回归分析概述 126
6.2 简单线性回归分析 127
6.2.1 简单线性回归分析的定义 127
6.2.2 简单线性回归分析的应用 129
6.3 多元回归分析 130
6.3.1 多元回归分析的定义 130
6.3.2 多元回归分析的步骤 131
6.3.3 多元回归分析的应用 132
6.4 岭回归分析 133
6.4.1 岭回归分析的原理 133
6.4.2 岭回归分析在数据挖掘领域的
应用 134
6.5 逻辑回归分析 135
6.5.1 逻辑回归分析的原理 135
6.5.2 逻辑回归模型的建立与参数
估计 136
6.5.3 逻辑回归分析的优化和
改进 137
6.5.4 逻辑回归分析在数据挖掘
领域的发展趋势 138
小结 139
思考题 139
第7章 决策树分析 141
7.1 决策树分析的有关概念 142
7.1.1 信息论的基本原理 142
7.1.2 决策树分析流程 144
7.1.3 决策树分类算法 145
7.2 ID3算法 147
7.2.1 ID3算法介绍 147
7.2.2 ID3算法的实例分析 149
7.2.3 ID3算法的特点及应用 152
7.3 C4.5算法 153
7.3.1 C4.5算法介绍 153
7.3.2 C4.5算法的特点及应用 155
7.4 CART算法 156
7.4.1 CART算法的原理与特点 156
7.4.2 CART算法的应用 158
小结 160
思考题 161
第8章 SPSS数据挖掘基础 163
8.1 SPSS的发展 164
8.2 SPSS应用入门 164
8.3 SPSS界面介绍 165
8.3.1 SPSS的窗口 165
8.3.2 SPSS的菜单 166
8.4 建立SPSS文件 167
8.4.1 SPSS文件类型 167
8.4.2 数据录入 167
8.4.3 文件的保存与导出 168
8.5 SPSS数据的变量属性定义 168
8.5.1 变量名称和类型 169
8.5.2 变量宽度和小数 170
8.5.3 标签和值 170
8.5.4 变量缺失值 170
8.5.5 变量显示列、对齐方式 171
8.5.6 变量测量方式和变量角色 171
8.6 SPSS数据管理 172
8.6.1 插入或删除个案 172
8.6.2 插入或删除变量 172
8.6.3 数据排序 173
8.6.4 数据的行列转置 174
8.6.5 选取个案 175
8.6.6 数据合并 175
8.6.7 拆分数据文件 177
8.7 SPSS数据转换 178
8.7.1 计算产生变量 178
8.7.2 对个案内的值计数 179
8.7.3 重新编码 180
小结 182
思考题 182
第9章 SPSS数据挖掘统计分析
方法 183
9.1 基本描述统计 184
9.1.1 频数分析 184
9.1.2 描述分析 187
9.1.3 探索分析 188
9.1.4 交叉表分析 192
9.2 T检验 197
9.2.1 单样本T检验 197
9.2.2 独立样本T检验 199
9.2.3 配对样本T检验 201
9.3 方差分析 202
9.3.1 单因素方差分析 203
9.3.2 多因素方差分析 207
9.3.3 重复测量方差分析 213
9.4 在SPSS中应用多元回归分析 217
9.4.1 多元线性回归分析的应用 217
9.4.2 Logistic回归的应用 223
9.5 在SPSS中应用聚类分析 228
9.5.1 两步聚类分析 228
9.5.2 K-平均值聚类分析 232
9.5.3 系统聚类分析 235
9.6 在SPSS中应用相关分析 240
9.6.1 线性相关分析 240
9.6.2 偏相关分析 242
9.7 因子分析 244
小结 249
思考题 250
参考文献 251
內容試閱
数据分析与挖掘技术是当今信息时代至关重要的领域之一。随着科技的飞速发展,我们生活和工作中产生的数据不断增加,数据已经成为一种宝贵的资源。然而,这些海量的数据并不总是直接可用或易于理解。数据分析与挖掘的目标就是从这些大数据中提取有价值的信息和知识,帮助人们发现隐藏的模式和关联,做出明智的决策,预测未来的趋势,从而增强企业的竞争力和创新能力。
  数据分析与挖掘技术的应用范围非常广泛,涉及很多领域,包括商业、金融、医疗、社交网络、物流等。在商业领域,数据分析与挖掘技术可以帮助企业了解消费者的需求和行为,制定更加精准的营销策略,提高销售额和客户满意度;在金融领域,数据分析与挖掘技术可以帮助金融机构识别风险、预测市场趋势、优化投资组合、提高投资回报率;在互联网行业,企业通过大数据挖掘分析可以为人们提供更为方便的人机交互体验。因此,如何利用大数据创造出更多的价值是目前的研究重点。
  本书通过对数据挖掘的理论、数据分析与挖掘的相关算法、SPSS数据分析与挖掘等内容的讲解,旨在让读者可以真正理解数据分析与挖掘理论,掌握数据挖掘的实用技能。
  本书具体内容包括以下方面。
  第1章介绍数据分析与数据挖掘概论,包括数据分析的定义、工具、方法与案例,数据挖掘的定义、目的、工具和方法等。
  第2章介绍数据仓库与联机分析处理,包括数据仓库的定义与特点、数据仓库的系统结构、数据仓库的数据模型、数据仓库的设计步骤和联机分析处理等。
  第3章介绍数据预处理,包括数据预处理的目的和方法、数据清洗的方法和步骤、数据集成的方法、数据冲突的检测和解决、数据变换过程中的离散化、数据规约的定义与目的、常用的数据规约策略等。
  第4章介绍关联规则挖掘,包括关联规则的分类及应用、Apriori算法的定义与特点、Apriori算法的应用、FP-Growth算法的基本思想、FP-Growth算法的特点及改进等。
  第5章介绍聚类分析,包括聚类分析的有关概念、聚类中的相异度计算、K-means算法、K-medoids算法、层次聚类的基本思想、AGNES算法、DIANA算法、Birch层次聚类算法、DBSCAN算法、基于模型的聚类算法等。
  第6章介绍回归分析,包括回归分析的有关概念、简单线性回归分析的定义与应用、多元回归分析的定义与应用、岭回归分析的原理与应用、逻辑回归分析的原理等。
  第7章介绍决策树分析,包括决策树分析的有关概念、ID3算法介绍、ID3算法的实例分析、C4.5算法介绍、C4.5算法的特点及应用、CART算法的原理与特点、CART算法的应用等。
  第8章介绍SPSS数据挖掘基础,包括SPSS应用入门、界面介绍、建立SPSS文件、SPSS数据的变量属性定义、SPSS数据管理、SPSS数据转换等。
  第9章介绍SPSS数据挖掘统计分析方法,包括基本描述统计、T检验、方差分析,以及在SPSS中应用多元回归分析、聚类分析和相关分析等。
  本书由彭进香、张莉、刘鑫撰写,并由其他学科团队成员协助完成。作者团队拥有丰富的相关领域教学与研究经验,本书在融入作者自身研究内容成果的基础上,也参考了相关的一些文献著作,在此对相关文献著作的作者表示衷心感谢。
  由于作者水平和相关技术快速发展的现实,书中可能存在不足之处,欢迎广大读者提出宝贵意见和建议。
  
  
  作 者

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.