华东师范大学终身教授,博士生导师,华东师大计算机应用研究所所长。1982年底起任教于华东师范大学,现任华东师范大学计算机应用研究所所长, 华东师范大学多媒体技术研究室(Lab.of Multimedia Information Technology,MMIT)主任。至今发表主要学术论文200余篇,出版学术专著6本。曾获国家教委科技进步二等奖,中国科学院科技进步二等奖各一项,上海市科技进步三等奖3项。上海市信息化专家委员会委员。上海市信息家电行业协会数字家庭应用专业委员会主任。上海计算机学会CSCW专业委员会副主任。
序分布式数据库系统及其技术的研究始于20世纪70年代。回顾历史,1978年笔者考上华东师范大学计算机应用专业的研究生,随后也通过了国家出国留学考试。1980年我负笈西行,赴(前)联邦德国斯图加特大学学习分布式数据库技术,参加国际上*早设计的分布式数据库系统之一——POREL系统的研制。40多年过去了,虽然经历了各种风云变化,但分布式数据库技术依然魅力不减。尤其是在目前的云计算与大数据时代,对分布式数据库系统和相关技术的关注和应用越来越多。有意思的是,区块链技术的基础也是分布式数据库技术。1986年,国际数据库界的先驱者Prof. Dr. Erich Neuhold应邀来华东师范大学讲授分布式数据库技术,并赠送我们一本由Stefano Ceri等撰写的著作《Distributed Databases:Principles and Systems》(McGrawHill Book Company,1984),该书成了笔者给研究生授课的基础。在我们(中国科学院数学研究所、华东师范大学和原上海科学技术大学)联合承担的国家“七五”攻关项目“分布式关系型数据库管理系统CPOREL”研制的基础上,周龙骧教授撰写了《分布式数据库管理系统实现技术》(科学出版社,1998)一书,其中笔者也撰写了相关章节。随即笔者见到了由M. Tamer ?zsu,Patrick Valduriez撰写的《Principles of Distributed Database Systems》(Springer)一书。可以说这三本书,尤其是《Distributed Databases:Principles and Systems》和《Principles of Distributed Database Systems》这两本经典书是本书的核心参考资料,本书的一些思想、样例和记法引自这三书书。笔者在此衷心感谢这三本书的作者。本书讨论了分布式数据库技术及其应用,其中结合了笔者参加德国的POREL、中国的CPOREL和德国的VODAK等分布式数据库管理系统研制的经验。自20世纪80年代起,笔者在大学里讲授分布式数据库技术,历时30多年,直接体会着分布式数据库技术的发展和变化,也试图将自己的点滴体会融合在本书中。本书主要针对的是对数据管理、数据库系统和分布式信息系统有兴趣的读者,尤其是计算机科学技术专业与数据科学专业的学生和研究人员。其他有兴趣的读者也许会发现其中有自己渴望了解的内容。本书可以分成三部分。具体结构如下,第*部分介绍了经典分布式数据库系统与技术的关键技术,第二部分讨论了新一代的分布式数据库系统及其相关技术,第三部分介绍了分布式数据库技术的典型应用。其中第*部分从《Distributed Databases:Principles and Systems》和《Principles of Distributed Database Systems》两本经典书籍中汲取了很多思想和营养。第*部分主要关注分布式数据库技术的一些经典问题,包括引言、分布式数据库系统体系结构、分布式数据库设计、分布式数据语义控制、分布查询优化、分布事务管理、并发控制和可靠性机制等内容。第1章回顾了数据库技术的发展历史,分析了分布式数据库系统的基础——数据库系统、计算机网络和分布式技术。第2章则讨论了分布式数据库系统的体系结构,着重分析和阐述了分布的透明性及其对数据库应用的影响。第3章讨论了分布式数据库的设计问题,主要聚焦于分布式数据库的分片设计和分配设计。第4章讨论了分布式目录管理、视图及其管理,以及分布式数据库系统的安全性与访问控制。第5章讨论了分布式数据集成,数据库集成、互操作与数据集成,以及本体在数据集成中的作用。第6章和第7章讨论了分布式数据库系统查询优化。查询优化是数据库系统的关键技术,分布式查询优化有其独有的特点和挑战。在这两章里,查询优化基础技术和方法、分层化查询处理、查询本地化和优化,以及分布查询优化将深入讨论。第8章、第9章和第10章讨论了事务管理。第8章是分布式事务管理技术的概述。第9章阐述了并发控制技术,讨论了可串行化理论、分布并发控制和多版本并发控制等核心问题。第10章讨论了分布式数据库系统的健壮性和故障恢复问题,尤其对两阶段提交协议(2PC)进行了深入讨论。第二部分讨论数据库复制、多数据库系统、分布式数据库系统安全性、并行数据库系统、分布式面向对象数据库系统、P2P系统、Web数据库与云数据库系统、分布计算与大数据分析和分布式簿记与区块链技术等分布式数据库系统及其技术的新发展和新挑战。第11章讨论了数据复制问题,对可线性化概念和多版本数据的一致性问题进行了深入讨论。第12章讨论松耦合的多数据库系统及其相关技术。第13章讨论分布式数据库系统的安全性问题。第14章关注一种特殊的分布式数据库系统——并行数据库系统。第15章讨论分布式面向对象数据库系统,对这类系统的特点与特殊问题进行了深入讨论。第16章则讲述了P2P系统及P2P数据库系统。第17章讨论了互联网情况下的数据库技术、Web数据库与云数据库系统。第18章关注分布计算与大数据分析,讨论分布式文件系统、NoSQL数据库系统和SQL与大数据等问题。第19章讨论分布式簿记与区块链技术,包括区块链结构、默克尔树结构和区块链分层结构等。第三部分讨论典型应用,如物联网的分布式数据库系统支持、电子政务中的分布式数据库系统、智慧健康中的分布式数据库技术支持、教育信息化中的分布式数据库技术支持和工业互联网中的分布式数据库支持等。第20章讨论物联网的分布式数据库系统支持,以及物联网、泛在计算、情景感知计算和相应的分布式数据库技术支持。第21章关注电子政务以及其中的分布数据库系统。第22章探讨了健康信息系统和智慧健康中的分布式数据库技术支持。第23章讨论了教育信息化及其中的分布式数据库技术需求和应用。第24章则讨论了工业互联网中的分布式数据库和数据仓库支持问题。我们期望本书能给读者展示关于分布式数据库系统、技术及其应用的一个较为完整的图像,让读者对相关技术有所了解,以便读者继续研究和应用。本书的跨度和难度很大。尽管笔者有过一定的分布式数据库管理系统的开发经验,曾参加过德国分布式关系型数据库管理系统POREL、中国的CPOREL,和德国分布式面向对象数据库管理系统VODAK的研制,20世纪90年代中期也曾带领由国内著名高校计算机科学技术的毕业生组成的精英团队研制开发过Teradata大型并行数据库管理系统的分布式版本,但是在撰写本书时,笔者三人始终兢兢业业、如履薄冰。我们尽力而为,力求做到更好。随时欢迎读者指出书中的不足,望不吝指教。笔者的电子邮箱为:顾君忠 jzgu@cs.ecnu.edu.cn贺樑 lhe@cs.ecnu.edu.cn应振宇 zyying@cs.ecnu.edu.cn