再版序
本书不仅是国际上比较全面的关于独立成分分析 Independent Component Analysis, ICA 的专著,也是国内正式翻译出版的关于ICA和盲源信号分离等技术的一本标准教材。中译本由电子工业出版社出版发行后反响很好,在同类教材中属于比较畅销的,某些时段还供不应求,以至于有读者来信联系译者索书,这些读者不仅有从事数学和信号处理研究的学者,还有更多来自无线通信、医学图像处理,特别是脑科学与认知研究等领域的工程师、研究生和专家教授。本书出版后,从国际和国内的引用、评价和应用案例的分析和统计来看,ICA这项20世纪90年代才发展起来的应用数学方法正在由一项创新逐步变成为一部经典,而在这个过程中本书起到了重要的推广作用。
一般认为,ICA的基本数学框架是1986年建立的,1995年后随着其快速算法的出现而开始快速发展。目前国际上采用最多的称为FastICA的快速独立成分分析算法是由Aapo Hyvrinen 和Erkki Oja两位学者提出的,而这两位学者就是本书的主要作者。可以说,本书不仅仅是一般的关于ICA和盲源信号分离的标准教材,同时也是一本关于ICA理论框架、ICA算法和ICA在不同领域应用方法等学术研究的专著,并具有大量探讨性和启发性的内容,这是其他同类教材所不能比拟的。因此,虽然目前关于独立成分分析的文献、教材和在线教程等资源已经非常丰富,但本书的地位仍然是不可替代的。
本书的中译版于2007年由电子工业出版社推出,对独立成分分析技术在国内的普及应用已经起到了重要的推动作用。目前国内通信、电子等工科研究生教育和许多科学研究领域 (特别是脑科学研究领域)对于独立成分分析方法的需求仍然在不断增长,需要比较全面系统且具有启发性的教材。考虑到本书特点和权威性,出版社决定将本书再次出版以满足读者的需求。本书现有的中译本是由国内较早从事独立成分分析和脑科学与认知科学的几位学者翻译的,他们对原书中专业性较强内容的理解和把握是到位的,翻译质量也得到了大部分读者的认同。故再版中译本仍沿用原先的翻译文字,主要是根据现代读者的阅读习惯和教材重点突出的风格要求,对原书内容进行了重新排版和修订。
原作者序
非常感谢胡德文教授为把我们的《独立成分分析》一书翻译成中文原书由John Wiley & Son于2001年出版所做出的重要努力。
我们于1999年开始撰写本书,当时独立成分分析(ICA)还是一种相当新颖的方法,它的前景在一定程度上尚未可定:它是否能够成为实际应用中的一种重要技术、其理论是否已得到充分的发展,这些都还是不清楚的。
应该说,在应用和理论两个方面,我们都是相当幸运的。一方面,许多实际应用领域的相关工作已经证实ICA是非常有用的,而在这些领域中,神经信息学和生物信息学尤其值得特别提及;另一方面,本书中所阐述的理论也经受住了时间的考验,现在已经被广泛接受。
中国的科学家已经对ICA的研究做出了重要的贡献,我们希望本书能够吸引和激励更多的参与者。同样也希望对ICA应用感兴趣的中国学者和专家能够在本书中找到有用的原则性导引,并在理论上有所帮助。
Aapo Hyvrinen, Juha Karhunen, Erkki Oja
英文原文:
We are very grateful to Prof. Dewen Hu for his great efforts in translating our book “Independent component analysis”originally published by John Wiley and Sons in 2001 into Chinese.
When we started writing the book in 1999, ICA was still a rather new method, and its future was somewhat uncertain. It was not clear whether it would become an important technique for practical applications, and whether the theory was sufficiently developed.
We have been quite fortunate in both respects. On the one hand, ICA has proven very useful in a large number of application fields, of which neuroinformatics and bioinformatics deserve special mention. On the other hand, the theory that we expounded in the book has stood the test of time, and is now well-established.
Chinese scientists have made important contributions to research on ICA, and we hope this book will inspire many more. We equally hope that Chinese researchers and professionals interested in applications of ICA will find useful guidelines and theoretical understanding in this book.
Aapo Hyvrinen, Juha Karhunen, and Erkki Oja
序言
独立成分分析ICA是一种统计和计算技术,用于揭示随机变量、测量数据或信号中的隐藏成分。对于通常以大量样本数据库形式给出的多元观测数据,ICA定义了一个生成模型。此模型假设观测数据变量是某些未知内在变量的线性或非线性混合,而且不仅内在变量是未知的,实现混合的系统也是未知的。我们还假定那些内在变量是非高斯且相互独立的,并称它们为观测数据的独立成分。这些独立成分也可称为源或因子可以通过ICA方法找到。
ICA可以看成是主成分分析和因子分析的延展。但是,ICA是一项更强有力的技术,当经典方法完全失效时,它仍然能够找出支撑观测数据的内在因子或源。
ICA所分析的数据可能来源于许多不同的应用领域,包括数字图像、文档数据库,以及经济指标和心理学测量。在许多实例中,测量结果是以一组并行Parallel信号或时间序列的形式给出的,盲源分离Blind source separation这一术语可以用于刻画该类问题。盲源分离的典型例子有:多个麦克风拾取同时发出语音的混合信号、多个传感器记录的脑电波、手机中的射频干扰信号或从某些工业过程中得到的并行时间序列。
ICA技术也是一项相对较新的发明。它是20世纪80年代初期首先在神经网络建模领域中引入的。到20世纪90年代中期,几个研究小组引入了一些极为成功的新算法,类似鸡尾酒会效应问题的演示,也给人们留下了深刻的印象:ICA可以从混合信号中找出每个人的语音波形。因此,无论是在神经网络领域特别是无监督学习,还是在更为一般的高级统计学和信号处理领域中,ICA都成了激动人心的新话题之一。ICA在生物信号处理、语音信号分离、无线通信、故障诊断、特征提取、金融时间序列分析和数据挖掘等现实领域中的应用报道也正在不断涌现。
在过去的20年内,ICA的文章大量发表在信号处理、人工神经网络、统计学、信息论及各种应用领域的期刊和会议论文集中。最近还举办了几场关于ICA的专题会议和学术研讨[70,348],出版了一些关于ICA、盲源分离以及其他相关主题的论文合集[315,173,150]和专著[105,267,149]。这些现有的文献对于其预期读者来说是非常有用的,但它们大都只集中于论述ICA方法的某些特定主题;而简短的专业论文和书籍章节中通常不包含数学和统计学的预备知识。因此,对更广泛的读者群来说,完全理解ICA这个技术性相当强的主题变得非常困难。
直到目前为止还没有一本内容广泛、细节丰富的教材:既能覆盖数学背景知识、基本原理和求解算法,又能兼顾ICA实际应用的现状。本书的出版目的就是希望填补这个空缺,并充当ICA的入门导引。
本书的预期读者可能来自多个学科:诸如统计学、信号处理、神经网络、应用数学、神经和认知科学、信息论、人工智能和工程领域。不论是研究人员、学生还是工程实践领域的工作者都可以使用本书。我们还做了各种努力使本书能够自足selfcontrained,以便那些仅有大学微积分、矩阵代数、概率论和统计学基本背景知识的读者阅读。本书也适合作为ICA方面的研究生教材,许多章节后都有习题和计算机练习作业。
本书的范围和内容
本书提供了把ICA作为统计与计算技术的全面导引,重点是数学原理和基本算法。大部分素材基于作者自己的研究小组中开展的原创性研究工作,这从不同主题所占比重的角度可以自然地反映出来。本书覆盖面较宽,特别涵盖了那些能同时适用于大规模问题求解的算法:即算法在观测变量数目和数据点个数都非常巨大时仍然有效。当ICA大量地用于真正的现实应用问题 而不是直到最近仍占主流的玩偶型问题或小规模探讨性研究时,这些算法就能在不久的将来得到越来越多的应用。卷积型混合、时滞及其他一些不同于ICA的盲源分离技术中涉及到的更为专门的信号处理方法,本书相应地强调得略少一些。
由于ICA是一个进展迅速的研究领域,不可能在一本教材中囊括每项已报道过的研究进展。我们已尽力在适当的地方涵盖了其他研究者的核心贡献,并给出了一个庞大的文献目录,以便进一步参考。对于可能被遗漏的那些重要贡献,我们深表歉意。
为便于阅读,本书分成了四个部分。
● 第一部分给出了数学预备知识,引入了书中后面部分会用到的基本数学概念。该部分从第2章的概率论速成教程开始。假设读者已熟悉本章中的大部分内容,不过本章还引入了特为ICA预备的一些概念,如高阶累积量和多变量概率理论。在第3章中,接着讨论最优化理论和梯度法,它们在构造ICA算法时将会用到。第4章回顾和综述了估计理论。信息论是ICA的一个补充性理论框架,它包含在第5章中。第6章是第一部分的总结,其中讨论了与ICA相关的主成分分析、因子分析和去相关方法。更为自信的读者可以按照其意愿跳过第一部分中部分或全部导论性的章节,而直接从第二部分中ICA的原理开始学习。
● 第二部分涵盖并解决了ICA基本模型:即ICA中经典的线性瞬态无噪声混合模型,它构成了ICA理论的核心。第7章引入了该基本模型,并讨论了混合矩阵的可辨识性问题。后面各章讨论对该模型进行估计的不同方法。一个核心的原则是非高斯性,它与ICA的关系在第8章中首次进行了讨论。接下来我们回顾了极大似然原理第9章和极小互信息原理第10章,并展示了这些基本原理之间的联系。第11章讨论了使用高阶累积张量的代数方法,第12章回顾了基于非线性去相关的早期ICA工作以及非线性主成分方法,这两章中的内容可能不太适合于本书导论教程的性质。在这些章节中,我们还讨论了与每一种基本原理相对应的计算独立成分和混合矩阵的实用算法。在第13章中,接着讨论了主要与数据预处理和数据降维相关的一些实际问题与具体考虑,其中包括引导使用者如何把ICA真正确实地应用于自己的具体问题。第14章综述和比较了各种ICA方法,并对第二部分进行了总结。
● 第三部分中给出了ICA基本模型的各种扩展。相比第二部分而言,这部分内容具有更多的探索性质而不够成熟,因为大多数扩展是最近才引入的,尚存在许多未解决的问题。如果要开设一门ICA的导论课程,可能只需在该部分挑选出几章即可。我们首先在第15章中讨论了在ICA模型中引入显式观测噪声的问题,然后在第16章中探讨独立成分个数多于混合观测量个数的情况。第17章进一步将模型进行推广:混合过程可以是非常一般的非线性形式。第18章讨论了估计另外一种线性混合模型的方法,该混合模型与ICA模型类似,但是假设的前提条件差别较大:即成分不是非高斯的,但具有某种时间依赖性。第19章讨论了混合系统中包含卷积的情况。ICA更进一步的扩展,特别是不要求成分严格独立的模型,将在第20章中给出。
● 第四部分探讨ICA方法的一些应用:特征提取第21章与图像处理和视觉研究都有关系;脑成像的应用第22章集中讨论人脑的电磁活动测量。第23章讨论ICA在无线通信中的应用。ICA在计量经济学和音频信号处理中的应用,以及ICA对其他应用领域的启示在第24章中探讨。书中那些非常复杂和入门课程中可以跳过的章节,我们都已用星号标出。本书中给出的一些算法,其对应软件是公开的,可以通过互联网在我们的网页或其他ICA研究者提供的网页中获得。包含真实数据的数据库也同时提供下载,以便测试算法。我们还为本书专门制作了网页,其中包含了一些适当的提示,地址是:
www.cis.hut.fiprojectsicabook
建议读者通过访问这些网页以获得更多的信息。
本书由三位作者合作完成,Aapo Hyvrinen负责第5章、第7章、第8章、第9章、第10章、第11章、第13章、第14章、第15章、第16章、第18章、第20章、第21章和第22章;Juha Karhunen负责第2章、第4章、第17章、第19章和第23章;Erkki Oja负责第3章、第6章和第12章。第1章和第24章则由三位作者联合撰写。
致谢
感谢许多ICA研究者,他们的原创性贡献形成了ICA的基础,并使得本书的问世成为可能。我们特别对丛书主编Simon Haykin致以谢意,多年以来,他在信号处理和神经网络方面的文章和著作一直鼓舞着我们。
本书的某些部分,是建立在与赫尔辛基技术大学Helsinki University of Technology中我们研究小组的其他成员紧密合作基础上的。第21章主要基于我们与Patrik Hoyer的合作研究,该章所有实验也都是他完成的。第22章基于Ricardo Vigrio的实验和素材。13.2.2节基于我们与Jaakko Srel及Ricardo Vigrio的联合工作。16.2.3节由Razvan Cristescu提供。20.3节基于我们和Ella Bingham的联合工作,14.4节基于我们和Xavier Giannakopoulos的联合工作,20.2.3节则基于我们和Patrik Hoyer及Mika Inki的联合工作。第19章部分基于Kari Torkkola提供的素材。第17章中的许多内容基于我们和Harri Valpola及Petteri Pajunen的联合工作,24.1节是我们和Kimmo Kiviluoto及Simona Malaroiu联合完成的。
在本书写作的不同阶段,有几个人友善地同意阅读并评述了该书的部分或全部内容。为此,我们诚挚地感谢Ella Bingham、JeanFranois Cardoso、Adrian Flanagan、Mark Girolami、Antti Honkela、Jarmo Hurri、Petteri Pajunen、Tapani Ristaniemi和Kari Torkkola。Leila Koivisto在编辑上给予了我们帮助,Antti Honkela、Mika Ilmoniemi、Merja Oja和Tapani Raiko在某些插图上提供了帮助。
我们在ICA方面的研究工作,以及本书写作是在芬兰赫尔辛基技术大学的神经网络研究中心Neural Networks Research Centre进行的。研究工作的部分资助来自于“BLISS”项目欧盟和“信息处理新原理”项目芬兰科学院,在此深表谢意。另外,A.H.即A. Hyvrinen,原书只用了姓名的缩写 要表达对赫尔辛基大学心理学系G.te Nyman和Jukka H. kkinen的谢意,他们提供的友好服务,使得本书的部分内容能够完成。