新書推薦:
《
药食同源中药鉴别图典
》
售價:HK$
68.8
《
设计中的比例密码:建筑与室内设计
》
售價:HK$
89.7
《
冯友兰和青年谈心系列:看似平淡的坚持
》
售價:HK$
55.8
《
汉字理论与汉字阐释概要 《说解汉字一百五十讲》作者李守奎新作
》
售價:HK$
78.2
《
汗青堂丛书144·决战地中海
》
售價:HK$
172.5
《
逝去的武林(十周年纪念版 武学宗师 口述亲历 李仲轩亲历一九三零年代武人言行录)
》
售價:HK$
56.4
《
唐代冠服图志(百余幅手绘插画 图解唐代各类冠服 涵盖帝后 群臣 女官 士庶 军卫等 展现唐代社会风貌)
》
售價:HK$
87.4
《
知宋·宋代之科举
》
售價:HK$
102.4
|
內容簡介: |
随着移动通信和行动装置普及、物联网和网络发展,以及云端技术的不断进步,现今数据产生、搜集和储存方式比以往更为方便。数据挖掘与大数据分析可以从海量数据中,找到值得参考的样型或规则,转换成有价值的信息、洞察或知识,创造更多新价值。
《大数据分析与数据挖掘》主要介绍数据挖掘与大数据分析的理论方法与实践应用,并加入丰富的实务案例介绍,具体说明如何应用数据挖掘与大数据分析技术以解决真实问题,深入浅出地剖析从数据中掏金的秘诀。
《大数据分析与数据挖掘》共分为13章,内容涵盖数据挖掘基本概念与数据准备、数据挖掘的方法与实证、数据挖掘的进阶运用;书中也提供R语言与编程实例辅以说明,使读者更能融会贯通地应用数据挖掘方法,进而提升大数据分析和数字决策能力。
|
關於作者: |
简祯富(Chen-Fu Chien,Ph.D.),现职:
台湾新竹清华大学清华讲座教授:工业工程与工程管理学系EMBAMBA
台湾科技部IC产业同盟计划主持人
学历与训练:
哈佛大学商学院PCMPCL结业
威斯康星大学麦迪逊分校决策科学与作业研究博士
新竹清华大学工业工程系暨电机工程系双学位(斐陶斐荣誉会员)
经历与荣誉:简祯富(Chen-Fu Chien,Ph.D.),现职:
台湾新竹清华大学清华讲座教授:工业工程与工程管理学系EMBAMBA
台湾科技部IC产业同盟计划主持人
学历与训练:
哈佛大学商学院PCMPCL结业
威斯康星大学麦迪逊分校决策科学与作业研究博士
新竹清华大学工业工程系暨电机工程系双学位(斐陶斐荣誉会员)
经历与荣誉:
新竹清华大学主任秘书、台湾科技计划审议委员、台湾质量奖审查委员、国科会固本精进计划推动办公室总主持人、竹科2.0规划计划主持人、新竹清华大学副研发长兼首任产学合作执行长、台积电工业工程处副处长(台积电首位借调的国内学者)、加州大学伯克利分校傅尔布莱特学者、剑桥大学访问教授、日本早稻田大学青年访问学者等。发表超过145篇学术论文,取得12项半导体制造国际发明专利,著有《半导体制造技术与管理》及《决策分析与管理》等书;主编《创业清华》《固本科园台湾精进》《产业工程与管理个案》及《清华百人会》等书及《竹科30》有声书。并撰写台积电、联发科、创意电子等哈佛管理个案。荣获行政院国家质量奖国科会杰出研究奖、优秀年轻学者研究计划、经济部大学产业经济贡献奖、教育部产学合作研究奖、科技管理学会院士、吕凤章奖章、新竹清华大学首届杰出产学合作奖、杰出工程教授、工程论文奖、工业工程奖章、工业工程论文奖及2011 IEEETASE Best Paper Award等学术殊荣,也是国科会学以致用的九个标杆之一,等。
研究领域:
决策分析、大数据分析、半导体制造、制造策略
许嘉裕(Chia-Yu Hsu,Ph.D.),现职:
元智大学信息管理学系副教授
台湾科技部IC产业同盟计划共同主持人
学历:
新竹清华大学工业工程与工程管理学系博士、硕士
成功大学统计学系学士
经历与研究领域:
曾任元智大学信息管理学系助理教授,剑桥大学制造研究所访问学者,新竹清华大学工业工程与工程管理学系博士后研究员,台积电制造技术中心工程师。研究领域包含数据挖掘、大数据分析、智能制造、统计决策、样型识别,并针对产业实际问题发展实证模型,包含半导体制造智能与良率提升事故诊断与故障侦测分析晶圆图样型辨识与比对先进制程控制与先进设备控制等。执行的研究计划包含台积电、旺宏、创意电子等高科技厂商委托产学合作研究计划及科技部新竹科学园区管理局委托计划等。在数据挖掘与智能制造领域的国际期刊上发表16篇论文,取得3项半导体制造发明专利。荣获温世仁服务科学新苗奖、元智大学青年学者研究奖等学术荣誉。
|
目錄:
|
第1篇 大数据分析与数据挖掘导论
第1章 大数据分析与数据挖掘概论
1.1 前言
1.2 大数据分析的应用
1.3 数据挖掘与数字决策
1.4 数据挖掘和大数据分析架构与步骤
1.4.1 问题定义与架构
1.4.2 数据准备
1.4.3 建立挖掘模式
1.4.4 结果解释与评估
1.5 数据挖掘的问题类型
1.5.1 分类
1.5.2 预测
1.5.3 聚类
1.5.4 关联规则
1.6 数据挖掘模式
1.7 结论
1.8 本书架构
问题与讨论
第2章 数据与数据准备
2.1 数据取得
2.2 大数据分析的基础:Hadoop
2.2.1 Hadoop架构
2.2.2 Hadoop分布式文件系统
2.2.3 MapReduce
2.3 数据类型
2.4 数据尺度
2.5 数据检查
2.6 数据探索与可视化
2.7 数据整合与清理
2.8 数据转换
2.8.1 数据数值转换
2.8.2 数据属性转换
2.9 数据归约
2.9.1 数据维度归约
2.9.2 数据数值归约
2.10 数据分割
2.11 应用实例半导体厂制造技术员人力资源管理质量提升
2.11.1 案例背景
2.11.2 数据准备
2.12 结论
问题与讨论
第2篇 数据挖掘方法与实证
第3篇 数据挖掘进阶运用
|
|