新書推薦:
《
美国小史(揭秘“美国何以成为美国”,理解美国的经典入门读物)
》
售價:HK$
81.4
《
中国古代北方民族史丛书——东胡史
》
售價:HK$
87.8
《
巨人传(插图珍藏本)
》
售價:HK$
705.6
《
地下(村上春树沙林毒气事件的长篇纪实)
》
售價:HK$
76.7
《
偿还:债务与财富的阴暗面
》
售價:HK$
80.2
《
清华大学藏战国竹简校释(壹):《命训》诸篇
》
售價:HK$
94.4
《
封建社会农民战争问题导论(光启文库)
》
售價:HK$
68.4
《
虚弱的反攻:开禧北伐
》
售價:HK$
92.0
|
目錄:
|
1.pan style="font-family:宋体"应用背景介绍pan
1.2混合模型介绍4
1.3本书的主要研究内容9
2带有辅助信息且等方差的混合模型1pan
2.pan style="font-family:宋体"模型的建立1pan
2.2参数的估计及其相合性13
2.3似然比检验20
2.4数值研究26
2.5小结35
3带有辅助信息且异方差的混合模型37
3.pan style="font-family:宋体"模型的建立37
3.2参数的估计及其相合性39
3.3似然比检验46
3.4数值研究53
3.5小结60
4带有辅助信息的混合模型中的EM-检验6pan
4.1EM-检验介绍6pan
4.2带有辅助信息且等方差模型的EM-检验67
4.3带有辅助信息且异方差模型的EM-检验74
4.4数值研究8pan
4.5小结86
5基于核心家庭数据的混合模型88
5.pan style="font-family:宋体"等方差情形88
5.2异方差情形99
5.3小结108
6研究结论及展望110
6.pan style="font-family:宋体"研究结论110
6.2创新与不足112
6.3未来展望113
主要参考文献114
索引12pan
|
內容試閱:
|
混合模型是用来描述一个大群体中若干个子群体的统计模型。有限混合模型不仅在理论研究上是统计学家们研究的问题,而且在实际中也有广泛的应用,许多复杂现象都可以用混合模型来描述。
在理论上,由于有限混合模型不满足经典统计学中的正则性,给研究者带来了巨大的困难,许多经典的统计结论将不再适用。是当混合模型退化到单一成分模型时,参数不可识别,似然比检验LRT统计量的极限分布也不是经典的卡方分布。针对有限混合模型非正则的性质,学者们不断提出新的方法来解决.其中主括对参行限制,对参数做惩罚以及基于EM算法来构造新的检验统计量等方法。本书将以一个新的思路来研究混合模型.即带有辅助信息的混合模型。
在实际中,混合模型在生物遗传学中的应用尤为重要。基因组印记是一个重要的表观遗传现象,与许多复杂疾病有着密切的关系。识别印记基因对研究复杂疾病的病因有很大的帮助。根据印记基因的特点,来自父母双方的等位基因有着不同的表达特性。在群体数据中,对杂合子样本,不能确定哪个等位基因来自父亲,哪个来自母亲,因此杂合了样本的表达值将符合一个两成分的混合模型。而纯合子样本的丽个等位基因相同,相应的表达值将符合单成分模型。印记基因识别的统计问题是要识别来自父母双方等位基因的表达值是甭有差异。而纯合子样本对杂合子混合模型的推断能够提常有用的信息。
本书是基于作者的博士学位论行修改完善后完成的。书中将以印记基因的识别作为基本问题,根据印记基因的特点建立了相应的混合模型,基于所提出的模型研究了各种辅助信息下模型的理论性质及其应用。具体的结构安排如下:
第pan章是绪论,分别介绍了有关印记基因的相关背景知识,以及有关混合模型的相关理论和应用,是对有限混合模型介绍了其发展历程以及在理论上非正则的特点。结合印记基因和有限混合模型的了本书将要研究的印记基因识别问题。
在第2章中研究了群体数据下的印记基因检验问题。根据印记基因的特点建立了等方差的混合正态模型。在纯合子样本的辅助信息下,证明了模型中参数极大似然估计MLE的相合性,并推导出LRT统计量的极限分布为。另外,运用本章的方法分析了精神分裂症数据中GABRB2基因的印记情况,得到了较可靠的结果。
在第3章中对群体数据的印记基因识别问题,考虑了异方差假定下带有辅助信息的混合模型。其中辅助信息依然由纯合子样本来提供。在异方差的假定下,为了解决似然函数无界的问题,本章中采取对方差加惩罚的方法。为了使原假设下的参数可识别,对混合比例也加了相应的惩罚。基于惩罚似然函数,证明了参数的估计有相合性,且LRT统计量有简单的极限分布X?,根据此结一步分析了精神分裂症数据。
在第4章中研究了带有辅助信息混合模型中的EM一检验方法。首先对EM检验的方法以及EM一检验统计量的构造做了详细介绍,并分析了EM检验统计量的特点。然后结合辅助信息以及EM检验分别对第2、3章中提出的模型构造了新的EM一检验统计量,并推导了两种模型下检验统计量的极限分布。最后通过模拟研究和对精神分裂症数据的分析与似然比检验方法做了比较。
在第5章中考虑了核心家庭数据中的混合模型。每个核心家庭括孩子及其父母三位成员。利用父母基因型的信启、分别提出了等方差以及异方差的混合模型。由于有父母的信息,辅助信息将更充足,使得复合混合模型的样本相对变少。只有当家庭中孩子和父母双方都为杂台子时,才不确定孩子的等位基因来源,样本的表达值才会符合两成分的混合模型。研究表明,充足的辅助信息足以使参数的MLE有相合性.并且似然比检验统计量有与经典统计学中一致的卡方极限分布。
第6章是研究结论与展望,总结了本书的主要研究内容及结论,分析了本书中的主要创新以及不足之处,并对基于辅助信息研究混合模型的未行了展望。
本书中的研究在统计理论和实际应用方面都有所突破。在统计理论方面为混合模型的研究提供了新的思路。利用辅助信息能够使得有限混合模型中的参数可识别,且参数估计也有相合性。参数估计的收敛速度会有所提高,同时似然比检验统计量也会有简单而且容易使用的极限分布,假设检效也提高。在应用方面,较好地解决了对群体数据印记基因的识别问题。
本书能够顺利完成,在此感谢东北财经大学双建设项目高学术专著出版的资助以及国家自然科学基金项日带有辅助信息的混合模型的统计推断和应用项目号:11701071的资助,感谢郭建华教授、陈家骅教授对我的悉心指导,感谢东北师范大学数学与统计学院、东北财经大学统计学院为我提供的各种资源,以及老师们和同学们对我的帮助。在本书的出版过程中,东北财经大学出版社的编辑给予了很多帮助,在此向他们致谢。
由于作者有限,书中难免有疏漏和不当之处,欢迎专家和学者给予批评指正。
李少亭
2020年10月
|
|