数据已经渗透到各行各业的各种业务过程中,这些数据不断积累,形成了传统数据管理系统无法有效管理和使用的大数据。同时,企业和机构运营环境越来越复杂,竞争也越来越激烈,商业机会稍纵即逝,管理者需要全面掌握业务各方面的运营状况,及时做出反应,进行快速、科学的决策。商务智能系统具有数据集成、数据管理以及数据分析的功能,能从大量数据中发现隐含的模式,辅助管理者发现业务运营的规律和异常,降低运营成本和风险,增加收入,提高客户满意度。商务智能系统已经被越来越多的企业所采纳,成为提高企业竞争力的重要方法,在许多重要的商业应用中发挥着重要的作用。
全球管理咨询公司麦肯锡全球研究院(McKinsey Global Institution,MGI)2011年发布了一个题目为《大数据: 创新、竞争和生产力的下一个前沿领域》(Big data: the next frontier for innovation, competition, and productivity)的研究报告。报告中指出,大数据可以为世界经济创造重要价值,提高企业和公共部门的生产力和竞争力,并为消费者创造大量的经济剩余。2016年12月,MGI又发表了题为《分析的时代: 在大数据的世界竞争》(The age of analytics: competing in a datadriven world)的研究报告。报告指出,大数据分析正在改变竞争的基础,对商业模式产生颠覆性影响。同时,报告还指出分析和技术人才持续匮乏,是数据潜在价值发现和有效利用的障碍。为此,近几年来,国内外高校纷纷设立与数据分析有关的专业,如数据科学与大数据技术专业和商务数据科学专业。
本书作者自20世纪90年代末就开始在清华大学为研究生开设商务智能课程,20年来一直从事商务智能领域的教学和科研工作。本书内容是作者20年来教学和科研内容的总结,旨在为数据科学专业、信息系统专业、计算机专业以及其他相关专业介绍商务智能的基本概念、功能和分析方法。全书分为五个部分,共16章内容。第一部分(包括第1章和第2章)是商务智能概念和过程,主要介绍商务智能的基本概念、系统构成、发展历史以及系统开发过程。第二部分(包括第3~7章)是商务智能方法,详细介绍机器学习和数据挖掘的各种模型和技术方法,包括关联分析、分类、数值预测、聚类以及神经网络与深度学习的各种方法。第三部分(包括第8~12章)是商务智能基础技术,介绍为了实现数据分析需要的基础支撑技术,包括数据预处理、文本数据处理、数据仓库、联机分析处理和商务智能可视化。第四部分(包括第13章和第14章)是商务智能应用系统,介绍商务智能的应用领域,并以推荐系统和意见挖掘为例,介绍了典型的应用方法。另外,还介绍了常用的商务智能系统,包括商品化的商务智能系统和开源的商务智能软件。为了便于理解前面介绍的数据分析方法,此部分还介绍了开源数据挖掘软件Weka和RapidMiner的详细使用方法。第五部分(包括第15章和第16章)是商务智能深度应用与发展,进一步介绍了针对复杂数据的分析方法,包括序列模式挖掘、社会网络分析、数据流数据挖掘以及多关系数据挖掘等; 最后对商务智能的进一步发展以及对社会的影响进行了分析和展望。
本书在编写过程中,得到了教育部高等学校管理科学与工程类学科教学指导委员会主任、国家信息化专家咨询委员会成员、清华大学陈国青教授的帮助和指导,得到了国家自然科学基金(项目编号: 71771131)的资助,在此表示感谢。
由于作者水平有限,书中难免有疏漏之处,望广大读者批评指正。
刘红岩
2020年于清华园