新書推薦:
《
打好你手里的牌(斯多葛主义+现代认知疗法,提升当代人的心理韧性!)
》
售價:HK$
66.1
《
新时代硬道理 广东寻路高质量发展
》
售價:HK$
77.3
《
6S精益管理实战(精装版)
》
售價:HK$
100.6
《
异域回声——晚近海外汉学之文史互动研究
》
售價:HK$
109.8
《
世界文明中的作物迁徙:聚焦亚洲、中东和南美洲被忽视的本土农业文明
》
售價:HK$
99.7
《
无端欢喜
》
售價:HK$
76.2
《
股票大作手操盘术
》
售價:HK$
53.8
《
何以中国·何谓唐代:东欧亚帝国的兴亡与转型
》
售價:HK$
87.4
|
內容簡介: |
主要研究论坛贴文、博客文章、微博文章等媒体互动讨论的舆情数据的抓取,以及舆情数据的综合处理和分析,并实现基于大数据的舆情预警研究。实现对舆情数据的可视化展示,用图表呈现舆情的时间走势、地域分布、主题分布、文章排行、热度聚集、热词发现等舆情分析结果,辅助决策。实现对相关热点话题的自动识别、智能聚类以及对传播路径的追溯、对议题漂移的捕捉和核心观点的摘要。 在大数据环境下,面对在线消费提供的海量数据信息,传统的技术方法已逐渐无法满足企业创造和维持品牌忠诚的竞争需求。本书构建了一个在线消费大数据时代下的人工智能模型机器学习模型,通过机器学习方法,对在线消费者的品牌商品购买行为进行聚类,实现具有相似忠诚度的用户的聚类,同时实现在线品牌忠诚度的度量。其中,重点研究机器学习路径、机器学习算法、模型构建方法,以及模型的检验与优化方法。本书适合经济管理专业的研究生和教师阅读。
|
關於作者: |
赵玮,1981年生,经济学博士,北京联合大学应用科技学院经济管理系电子商务专业教师,具备双师素质资格,*精品课程及*资源共享课程Web技术应用基础核心成员。主要研究领域包括:数据挖掘与数据分析、机器学习、职业技术教育。发表核心论文、EI期刊论文4篇,主持全国教育科学规划课题一项,并参与完成多个省部级、校级教研和科研项目。曾获得第九届全国多媒体课件大赛高职组优秀奖、北京联合大学暑期社会实践优秀指导教师、北京联合大学应用科技学院院级 师德 先进个人等奖项,并指导学生获得第九届畅享杯全国职业院校创业技能大赛企业经营管理沙盘竞赛全国总决赛团体三等奖,第三届大学生文科计算机设计大赛三等奖。
|
目錄:
|
目 录
1 绪论 1
1.1 研究背景 1
1.2 研究目的及研究意义 2
1.2.1 研究目的 2
1.2.2 研究意义 3
1.3 国内外研究现状 3
1.3.1 国外研究现状 3
1.3.2 国内研究现状 12
1.3.3 研究现状评述 15
1.4 研究思路与研究内容 16
1.4.1 研究思路 16
1.4.2 研究内容 17
2 在线品牌忠诚度大数据与机器学习方法 20
2.1 在线品牌忠诚度大数据 20
2.1.1 在线品牌忠诚度大数据的基本特性 20
2.1.2 在线品牌忠诚度大数据的特征 22
2.1.3 在线品牌忠诚度大数据分析评述 23
2.2 在线品牌忠诚度度量的机器学习 24
2.2.1 机器学习研究概述 25
2.2.2 在线品牌忠诚度度量的机器学习要素 28
2.2.3 在线品牌忠诚度度量的机器学习聚类方法 30
2.2.4 在线品牌忠诚度度量的机器学习框架 31
2.2.5 在线品牌忠诚度度量的机器学习环境 32
2.2.6 在线品牌忠诚度度量的机器学习路径 33
2.3 本章小结 34
3 在线品牌忠诚度度量的在线数据采集 36
3.1 在线品牌忠诚度度量的在线数据采集关键技术 36
3.1.1 信息源 36
3.1.2 采集方法 37
3.1.3 数据处理 38
3.2 在线品牌忠诚度度量的在线数据采集模型分析 39
3.2.1 在线数据采集模型 39
3.2.2 在线数据采集模型抓取策略 40
3.2.3 在线数据采集模型结构原理 41
3.3 在线品牌忠诚度度量的在线数据采集模型设计 41
3.3.1 在线数据采集模型的策略设计 41
3.3.2 在线数据采集模型的架构设计 43
3.3.3 在线数据采集模型的详细设计 44
3.4 在线品牌忠诚度度量的在线数据采集模型实现 46
3.4.1 根据主题抓取 URL 列表 46
3.4.2 URL 判重 47
3.4.3 网页解析存储 47
3.5 本章小结 50
4 在线品牌忠诚度度量的在线数据清洗 51
4.1 在线品牌忠诚度度量的在线数据清洗概述 51
4.1.1 在线品牌忠诚度度量的在线数据清洗流程 51
4.1.2 在线品牌忠诚度度量的在线数据清洗准备 52
4.1.3 在线品牌忠诚度度量的在线数据清洗对象 60
4.2 在线品牌忠诚度度量的在线数据检测算法的设计与实现 61
4.2.1 在线品牌忠诚度度量的在线重复数据检测算法 61
4.2.2 在线品牌忠诚度度量的在线错误数据检测算法 63
4.2.3 在线品牌忠诚度度量的在线缺失数据检测算法 67
4.3 在线品牌忠诚度度量的在线数据清洗算法的设计与实现 68
4.3.1 在线品牌忠诚度度量的在线重复数据清洗算法 68
4.3.2 在线品牌忠诚度度量的在线数据转换类型算法的
设计与实现 70
4.3.3 在线品牌忠诚度度量的在线错误数据清洗算法的
设计与实现 74
4.3.4 在线品牌忠诚度度量的在线缺失数据清洗算法 76
4.3.5 在线品牌忠诚度度量的在线数据合并和过滤算法 81
4.4 本章小结 82
5 在线品牌忠诚度度量的机器学习方法模型构建 83
5.1 机器学习聚类算法理论 83
5.1.1 聚类的概念 83
5.1.2 划分聚类算法 84
5.2 在线品牌忠诚度度量模型特征概述 86
5.2.1 在线品牌忠诚度度量模型特征选择依据 86
5.2.2 在线品牌忠诚度度量模型特征指标定义 87
5.3 在线品牌忠诚度度量模型特征构建 91
5.3.1 在线品牌忠诚度度量模型行为特征集构建算法 91
5.3.2 在线品牌忠诚度度量模型态度特征集构建算法 96
5.3.3 在线品牌忠诚度度量模型时间特征集构建算法 99
5.3.4 在线品牌忠诚度度量模型用户特征集构建算法 102
5.3.5 在线品牌忠诚度度量模型初始特征集构建算法 105
5.4 在线品牌忠诚度度量模型构建 107
5.4.1 在线品牌忠诚度度量模型的要素定义 107
5.4.2 在线品牌忠诚度度量模型的要素实例 108
5.4.3 在线品牌忠诚度度量模型的方法定义 110
5.4.4 在线品牌忠诚度度量模型的构建实现 111
5.5 本章小结 119
6 在线品牌忠诚度度量模型检验 120
6.1 在线品牌忠诚度度量模型检验概述 120
6.1.1 聚类模型有效性 120
6.1.2 聚类模型有效性的检验方法 121
6.2 在线品牌忠诚度度量模型检验指标设计 122
6.2.1 在线品牌忠诚度度量模型内部有效性指标 122
6.2.2 在线品牌忠诚度度量模型外部有效性指标 124
6.3 在线品牌忠诚度度量模型内部有效性指标检验实现 126
6.3.1 在线品牌忠诚度度量模型 SSE 指标检验算法 126
6.3.2 在线品牌忠诚度度量模型 SSB 指标检验算法 128
6.3.3 在线品牌忠诚度度量模型 Intra DPS 指标检验算法 129
6.3.4 在线品牌忠诚度度量模型 Inter DPS 指标检验算法 131
6.3.5 在线品牌忠诚度度量模型交叉检验算法 132
6.4 在线品牌忠诚度度量模型外部有效性指标检验实现 149
6.4.1 Allan L. Baldinger 和 Joel Rubinson 的理论检验 149
6.4.2 Palto 理论的检验 152
6.5 本章小结 154
7 在线品牌忠诚度度量的模型优化 155
7.1 在线品牌忠诚度度量的模型数据处理优化方法 155
7.1.1 增加数据量 155
7.1.2 处理缺失值和异常值 156
7.2 在线品牌忠诚度度量的模型数据处理优化实现 156
7.2.1 算法设计 157
7.2.2 算法实现 158
7.3 在线品牌忠诚度度量的模型特征工程优化方法 159
7.3.1 特征工程优化概述 160
7.3.2 RFE 特征选择方法 163
7.3.3 Boruta 特征选择方法 164
7.4 在线品牌忠诚度度量的模型特征工程优化实现 165
7.4.1 特征转换和选择预处理方法的实现 165
7.4.2 RFE 特征选择方法的实现 171
7.4.3 基于 RFE 特征选择方法的模型优化 173
7.4.4 Boruta 特征选择方法的实现 183
7.4.5 基于 Boruta 特征选择方法的模型优化 188
7.4.6 基于 RFE 和 Boruta 特征选择方法的模型优化比较 192
7.5 在线品牌忠诚度度量的模型算法调整优化方法及实现 193
7.5.1 基于聚类数 k 选择的模型优化 193
7.5.2 基于迭代次数选择的模型优化 196
7.5.3 基于初始质心生成次数选择的模型优化 196
7.6 在线品牌忠诚度度量最优模型效果 197
7.6.1 实现在线品牌忠诚度相似用户的聚类 198
7.6.2 实现在线品牌忠诚度的界定 198
7.7 本章小结 202
8 总结与展望 204
参考文献 207
|
內容試閱:
|
十三五规划明确提出了坚持扩大内需战略,充分挖掘我国内需的巨大潜力,拓展新型消费业态的要求。尤其是在以互联网经济为代表的新经济背景下,在线消费作为新型消费业态的代表正逐渐改变着人们的消费观念和方式,研究在线品牌忠诚度,对于刺激消费和实现企业精准营销、风险管控、决策支持、效率提升和产品设计,以及提升企业在在线领域的竞争力具有极其重要的意义。应用科学有效的机器学习方法对在线品牌忠诚度进行系统分析和研究具有迫切性和必要性。
在大数据环境下,面对在线消费提供的海量数据信息,传统的技术方法已逐渐无法满足企业创造和维持品牌忠诚的竞争需求。突出表现在传统随机采样方法很难定位具有高品牌忠诚度的消费群体;同时,传统的数据处理技术也无法处理具有海量、混杂和非结构化数据特性的在线消费行为。在面对庞大量级的在线数据,以及如何实时利用在线数据锁定品牌消费群体的需求时,传统的方法具有局限性。本研究的目的就是构建一个在线消费大数据时代下的人工智能模型机器学习模型,通过机器学习方法,对在线消费者的品牌商品购买行为进行聚类,构建在线品牌忠诚度度量模型,实现具有相似忠诚度的用户的聚类,同时实现在线品牌忠诚度的度量。其中,重点研究机器学习路径、机器学习算法、模型构建方法,以及模型的检验与优化方法。
本研究围绕理论研究模型设计模型优化的思路,主要完成以下研究工作。
(1)在对品牌忠诚度理论进行国内外研究现状综述的基础上,对在线品牌忠诚度大数据特性和在线品牌忠诚度度量的机器学习方法进行论述。
(2)构建在线品牌忠诚度度量模型是本研究的主体,研究过程遵循在线品牌忠诚度度量的机器学习路径展开。
① 在线品牌忠诚度度量的在线数据采集,即通过设计在线数据采集模型和爬虫算法对在线品牌忠诚度度量相关的在线数据进行采集。
② 在线品牌忠诚度度量的在线数据清洗,即通过设计在线数据检测算法对在线品牌忠诚度度量的在线数据进行检测;通过设计在线数据清洗算法对在线品牌忠诚度度量的在线数据进行清洗。
③ 在线品牌忠诚度度量的机器学习方法建模,即根据特征选择依据和特征指标定义,通过设计算法完成模型所需要的特征构建;在对在线品牌忠诚度度量模型和模型聚类进行数学定义的基础上,通过设计聚类算法实现模型构建。
④ 在线品牌忠诚度度量模型检验,即根据内部有效性指标和外部有效性指标定义,通过设计内部有效性检验算法实现模型内部有效性检验;通过设计外部有效性检验算法实现模型外部有效性检验。
(3)对在线品牌忠诚度度量模型进行优化是本研究的重点。主要研究工作包括通过数据处理优化、特征工程优化和算法调整优化得到最优模型,并从实现在线品牌忠诚度相似用户聚类和实现在线品牌忠诚程度界定两个方面对最优模型进行评价。
本研究的创新点如下。
(1) 针对以大数据处理、大数据价值挖掘和以互联网经济为代表的新经济下的在线品牌忠诚度大数据的特性,以及由此带来的在线品牌忠诚度大数据分析方式、分析思维、分析技术的颠覆性变革,本研究对于在线品牌忠诚度数据分析的模型和算法高复杂性等方面,首次进行了系统深入的挖掘和剖析,为以互联网经济为代表的新经济下的在线品牌消
费行为及在线品牌忠诚度的进一步研究奠定了基础。
(2) 提出机器学习方法用于在线品牌忠诚度度量的思路,并实现了应用机器学习方法对在线品牌忠诚度模型进行构建,进一步拓展了机器学习方法的应用领域。
(3) 通过全数据分析模式,即样本等于总体的大数据分析模式,实现在线品牌忠诚度相似用户的聚类和在线品牌忠诚度的界定,突破了传统随机采样方法在定位具有高品牌忠诚度消费群体方面的局限性。
(4) 在线品牌忠诚度度量模型优化是本研究的重点,其中特征工程优化是模型优化的核心。而对于聚类方法,存在特征工程适用性问题,本研究在借鉴相关方法思路的基础上对具体的特征选择方法进行调整和改进,使其更好地适用于模型优化,具有创新性。
感谢陆红老师和李宇红老师为研究框架、研究逻辑和各章节结构给予的系统严谨的指导,感谢李慧凤老师为研究论述给予的凝练和提升,感谢王廷梅老师为数据采集给予的技术支持,感谢王秦老师为国内外研究现状梳理给予的辛苦付出,感谢杨洁老师和张苏雁老师为文献整理给予的帮助,感谢所有为本书出版提供支持和帮助的同事、同学和朋友
|
|