登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書

『簡體書』语音情感识别

書城自編碼: 3703912
分類:簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 张雪英
國際書號(ISBN): 9787030676832
出版社: 科学出版社
出版日期: 2021-11-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 207.5

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
永通万国:货币与历代兴衰
《 永通万国:货币与历代兴衰 》

售價:HK$ 118.6
进阶吧!投资者5
《 进阶吧!投资者5 》

售價:HK$ 131.9
“器,用,道”的变革史——中国近现代美术的材料、制度及精神研究
《 “器,用,道”的变革史——中国近现代美术的材料、制度及精神研究 》

售價:HK$ 142.8
莫卧儿王朝商业史
《 莫卧儿王朝商业史 》

售價:HK$ 118.6
富马利中国见闻录
《 富马利中国见闻录 》

售價:HK$ 118.6
一张餐巾纸,搞定所有难题
《 一张餐巾纸,搞定所有难题 》

售價:HK$ 94.4
汇率下跌之后:日元贬值的宏观经济启示
《 汇率下跌之后:日元贬值的宏观经济启示 》

售價:HK$ 71.4
百酿成金 全球15家经典酒庄的品牌故事(精装)
《 百酿成金 全球15家经典酒庄的品牌故事(精装) 》

售價:HK$ 154.9

 

內容簡介:
本书系统地阐述了语音情感识别的理论、方法和研究成果,主要由两部分构成:部分包括第1章到第9章,这九章的内容涵盖语音情感识别的基础知识、基本流程、特征提取以及识别网络,是对语音情感识别深入研究中不可或缺的知识;第二部分包括第10章和第11章,这两章的内容是在语音情感识别研究基础上的进一步深入,将脑电信号引入到情感识别研究中,以情感脑电辅助语音情感识别,是脑认知过程与传统信号处理手段的有效结合,为今后情感识别研究提供了新思路和新方法。
本书可作为人工智能、计算机、电子信息等专业的教师、研究生和技术开发人员学习语音情感识别知识的参考书。
目錄
第1章 语音情感识别基本知识 1
1.1 语音情感识别的研究背景和意义 1
1.2 语音情感识别关键技术 1
1.2.1 情感语音数据库 1
1.2.2 语音情感特征 2
1.2.3 语音情感识别模型 3
1.3 基于脑认知的语音情感识别研究 5
小结 5
参考文献 5
第2章 情感的划分 7
2.1 离散情感划分 7
2.2 情感维度空间模型 8
2.3 基于离散情感的维度空间模型 11
2.4 其他情感模型 12
小结 13
参考文献 13
第3章 情感语音数据库 15
3.1 情感语音数据库建立的基本原则 15
3.2 TYUT1.0情感语音数据库的建立 17
3.2.1 语音的采集 17
3.2.2 语句的有效性分析 18
3.3 TYUT2.0情感语音数据库的建立 20
3.3.1 截取情感语音素材 20
3.3.2 语句的有效性评价 20
3.4 基于PAD情绪模型的情感语音数据库优化及标注 24
3.4.1 TYUT2.0 情感语音数据库的优化实验 24
3.4.2 三维PAD情感模型量化标注实验 26
3.5 常用情感语音数据库 33
3.5.1 柏林情感语音数据库 33
3.5.2 VAM数据库 34
3.5.3 SEMAINE数据库 34
3.5.4 IEMOCAP数据库 34
3.5.5 AVEC 2012数据库 35
3.5.6 MERC数据库 35
小结 35
参考文献 36
第4章 语音情感特征分析与研究 37
4.1 传统语音情感特征 37
4.1.1 韵律特征 37
4.1.2 音质特征 39
4.1.3 MFCC特征 39
4.1.4 LPCC特征 40
4.2 基于人耳听觉模型的谱能量特征 40
4.2.1 基本的谱能量特征介绍 40
4.2.2 人耳听觉特性 42
4.2.3 基于Bark尺度频带划分的谱能量特征 44
4.2.4 基于ERB尺度频带划分的谱能量特征 47
4.3 基于人耳听觉特性的谱能量特征的优化改进 49
4.3.1 声道响应对谱能量特征的补偿算法 49
4.3.2 基于TEO的谱能量特征 51
4.3.3 多种特征的情感识别率对比 52
4.4 基于HHT情感语音特征提取 57
4.4.1 HHT基本理论 57
4.4.2 集合经验模态分解方法EEMD 61
4.4.3 基于EEMD的IMFE特征提取 65
4.4.4 EEMD-Teager能量谱特征提取 68
4.4.5 HHT边际谱特征提取 69
小结 72
参考文献 72
第5章 基于人耳听觉的情感特征及在语音情感识别中的应用 74
5.1 ZCPA特征 74
5.2 帧优化算法对ZCPA特征的改进 77
5.2.1 帧优化算法基本理论 77
5.2.2 实验步骤 79
5.2.3 实验结果及分析 79
5.3 基于人耳听觉特性的过零峰值Teager能量算子(ZCMT)特征 80
5.3.1 ZCMT特征原理及提取步骤 80
5.3.2 实验结果及分析 81
5.4 声门补偿的ZCMT特征 83
5.4.1 语音产生的非线性模型 83
5.4.2 典型的声门特征及基音周期的提取 84
5.4.3 声门特征对于人耳听觉模型特征的影响 86
5.4.4 人耳听觉补偿算法 87
5.4.5 声门特征补偿的人耳听觉模型特征在语音情感识别中的应用 88
5.4.6 实验结果及分析 89
小结 90
参考文献 90
第6章 情感语音非线性特征分析研究 92
6.1 语音的非线性特性 92
6.2 情感语音信号的非线性特性 93
6.2.1 功率谱分析 93
6.2.2 主分量分析 94
6.2.3 相空间重构 95
6.3 非线性属性特征分析研究 99
6.3.1 关联维数 99
6.3.2 Kolmogorov熵 100
6.3.3 Lyapunov指数 101
6.3.4 Hurst指数 102
6.3.5 基于非线性属性特征的语音情感识别实验 103
6.4 基于相空间重构的非线性几何特征 108
6.4.1 非线性几何特征参数提取 108
6.4.2 基于五种描述符轮廓的语音情感识别实验 110
6.4.3 基于非线性几何特征的语音情感识别实验 113
6.5 基于特征级融合的情感语音特征参数优化 115
6.5.1 特征级融合在语音情感识别中的应用 115
6.5.2 基于特征级融合的语音情感识别实验 116
6.6 基于特征选择的情感语音特征参数优化 118
6.6.1 特征选择在语音情感识别中的应用 118
6.6.2 基于特征选择的语音情感识别实验 119
6.7 基于特征优化的情感语音特征参数优化 120
6.7.1 特征分析 120
6.7.2 特征优化算法 122
6.7.3 基于非线性全局特征的特征优化预实验 123
6.7.4 基于特征全集的特征优化语音情感识别实验 123
小结 124
参考文献 124
第7章 语音情感识别建模 126
7.1 基于CHMM语音情感识别系统的建立与实现 126
7.1.1 HMM建模的语音情感识别系统 126
7.1.2 CHMM语音情感识别系统的设计与实现 127
7.1.3 实验结果与分析 131
7.2 基于极限学习机的情感识别模型 133
7.2.1 核函数ELM基本理论 133
7.2.2 基于核函数ELM的情感识别 137
7.2.3 Im-ABC优化KELM识别网络 140
7.2.4 选择性集成极限学习机的研究 147
7.3 基于FCM的语音情感识别 152
7.3.1 FCM基本理论概述 152
7.3.2 FCM语音情感识别网络的架构 153
7.3.3 e-FCM语音情感识别网络的实现 155
7.3.4 实验及结果分析 157
小结 166
参考文献 167
第8章 融合算法应用于语音情感识别的研究 168
8.1 数据融合 168
8.1.1 数据融合的概念 168
8.1.2 特征级融合 169
8.1.3 决策级融合 170
8.2 决策融合e-FCM算法介绍 170
8.2.1 概率矩阵 170
8.2.2 决策方法制定 171
8.3 实验结果与分析 173
8.3.1 语音特征的选择 173
8.3.2 决策融合e-FCM实验 173
小结 177
参考文献 177
第9章 连续维度语音情感识别研究 178
9.1 情感语音特征与PAD三维相关性分析 178
9.1.1 原理介绍 178
9.1.2 Pearson相关介绍 179
9.1.3 结果分析 179
9.2 犹豫模糊集决策融合预测PAD值 180
9.2.1 犹豫模糊信息 180
9.2.2 加权融合预测PAD值 182
9.3 仿真实验及结果分析 183
9.3.1 PAD数据的概率特性验证 183
9.3.2 情感PAD数据空间分布 184
9.4 基于特征选择改进模型的PAD情感维度预测 185
9.4.1 基于GRA-PCA特征选择的PAD维度预测 186
9.4.2 基于聚类PSO-LSSVM模型的PAD维度预测 196
9.4.3 PAD维度预测的综合模型研究 203
小结 208
参考文献 208
第10章 情感语音诱发的脑电信号分析研究 211
10.1 脑电信号 211
10.1.1 脑电信号的概念 211
10.1.2 脑电信号的电极导联 212
10.1.3 事件相关电位 214
10.1.4 情感语音诱发的事件相关电位 215
10.1.5 基于诱发脑电信号的认知心理学分析方法 216
10.2 情感语音诱发的脑电信号采集与处理 219
10.2.1 实验设计 220
10.2.2 实验准备 221
10.2.3 实验材料的筛选与预处理 222
10.2.4 实验任务和实验程序 224
10.2.5 ERP的记录与预处理 225
10.2.6 数据分析 226
10.3 基于情感语音持续时长影响的ERP研究 226
10.3.1 实验方法 227
10.3.2 实验结果及分析 229
10.3.3 实验结论 234
10.4 基于情感语音基频影响的ERP研究 235
10.4.1 实验方法 235
10.4.2 实验结果及分析 237
10.4.3 实验结论 241
10.5 言语的可理解性及非言语情感诱发的ERP研究 242
10.5.1 实验方法 242
10.5.2 实验结果及分析 244
10.5.3 实验结论 249
小结 249
参考文献 250
第11章 脑电辅助语音信号的情感识别研究 254
11.1 脑电信号与语音信号的常用信号处理方法 254
11.2 结合非线性全局特征和谱特征的情感脑电信号分析 256
11.2.1 情感语音脑电信号非线性全局特征提取 256
11.2.2 结合非线性全局特征和谱特征的情感脑电识别实验 258
11.3 基于压缩感知的情感识别模型 261
11.3.1 压缩感知基本理论 261
11.3.2 CS识别模型的构建 263
11.3.3 CS中不同重构算法性能对比实验 267
11.3.4 CS情感识别的过程 268
11.4 基于CS的脑电辅助语音信号的情感识别 269
11.4.1 语音信号的情感识别 270
11.4.2 脑电信号的情感识别 274
11.4.3 基于特征的CCA融合 277
小结 282
参考文献 282
內容試閱
人工智能技术的发展,正在改变着人机交互的方式。语言是人类直接、方便的交流信息和情感的方式,让机器像人一样具有说话、思维和情感能力,实现人与机器的自然交流,是人工智能领域一直追求的目标。语音情感识别的研究,将推动这一目标的逐步实现,其成果可广泛应用于人机交互、远程医疗、电子教育、刑事侦查和情绪疏导等领域,因此,开展语音情感识别研究具有重要意义和实用价值。 情感是受到外部刺激影响,如听到一些话、看到一些图片等,引发人的生理及心理变化,从而反映出来的一种感知状态。当人受到外部刺激并产生心理反应时,面部表情可以人为控制,掩饰其真实情感,但电生理信号(脑电、心电、肌电等)却能真实反映其情感状态。在多种生理信号中,脑电(electroencephalography,EEG)信号由于时间分辨率高,可以较好地表征情感脑认知过程,同时具有测试相对简单、成本较低的优点。因此,结合EEG信号及语音情感信号,建立对应数据库,研究人脑对语音情感的认知过程,成为提高语音情感识别性能的重要方法。 语音情感识别系统一般包括三个主要部分:情感数据库,特征提取,特征融合及识别。本书围绕这三个部分,在建立和优化情感语音数据库的基础上,一方面,研究了的语音情感特征提取技术和语音情感识别网络,给出了每种算法的详尽步骤,并对实验结果进行了详细讨论。另一方面,利用情感语音数据库中的情感语句来诱发脑电信号,构成情感脑电数据库,采用认知心理学方法,分析情感语音不同声学参数在情感认知过程中存在的差异性问题;采用信号处理方法,研究脑电信号特征提取并进行情感识别;将人的认知过程和传统的信号处理手段有机结合到一起,终形成了脑电辅助语音情感识别系统的新思路,并通过实验证明了这种新思路的可行性和有效性。 本书共分11章,第1章介绍了语音情感识别的基本知识,让读者对语音情感识别的基本框架和基本方法有个了解;第2章是人类情感的划分,介绍和讨论了常见的情感分类模型的研究现状、存在的问题及今后发展的方向;第3章是情感语音数据库,介绍了一般情感数据库的基本构建原则及一些常见的情感语音数据库,较为详细地说明了我们自己建立TYUT1.0和TYUT2.0数据库的步骤、筛选方法;第4章是关于语音情感特征的内容,介绍了几种常见的语音情感特征提取方法及在情感识别实验中的结果;第5章是基于人耳听觉的情感特征及在语音情感识别中的应用,介绍了一种将人耳听觉特性和人的发音特性相结合的语音情感新特征;第6章是情感语音非线性特征分析研究,通过研究分析验证了语音信号在产生和传播过程中存在非线性特性,从情感语音中提取非线性特征并应用于语音情感识别;第7章是语音情感识别建模,基于隐马尔可夫模型(hidden Markov models,HMM)、核函数极限学习机(extreme learning machine with kernel,KELM)和模糊认知图(fuzzy cognitive maps,FCM)将语音信号处理方法和认知心理学知识相结合,用于语音情感识别,得到了较好的结果;第8章是融合算法应用于语音情感识别的研究,将特征级融合和决策级融合用于语音情感识别的研究;第9章是连续维度语音情感识别研究,将离散模型和连续维度两种方法相结合,提出了基于声学特征和基本情感PAD(pleasure-arousal-dominance)值来预测语音库中语音情感的PAD值的方法;第10章是情感语音诱发的脑电信号分析研究,用认知心理学方法研究情感语音的认知过程,主要采用事件相关电位(event-related potentials,ERP)技术研究情感语音不同声学参数对认知差异的影响问题,以及言语可理解与非言语的认知差异问题,其实验结果可为情感语音的脑认知研究提供一定的理论和实验参考;第11章是脑电辅助语言信号的情感识别研究,首先阐述了提取脑电信号非线性特征及将其用于情感脑电信号识别的原理和方法,给出了有效的实验结果;其次采用压缩感知分类方法,对情感脑电及语音信号进行了情感识别研究,证明了情感脑电辅助语音情感识别的可行性和有效性。 本书内容来源于课题组多年的研究成果,是作者基于国家自然科学基金项目和省部项目的研究内容,融合了课题组近些年在国内外期刊和会议上发表过的论文编撰的。近几年,深度学习算法应用在语音情感识别中的研究也成为一种趋势,这方面的研究方兴未艾,可以专门著书,所以本书中暂不涉及该方面内容。 本书全部内容是在太原理工大学张雪英教授组织和指导下撰写的,具体分工为:第1章、第2章、第4章及第7章的7.2节由张雪英教授执笔;第3章、第5章、第6章及第11章的11.1和11.2节由孙颖副教授执笔;第7章(除7.2节)、第8章、第9章由张卫博士执笔;第10章、第11章的11.3和11.4节由畅江博士执笔。同时,课题组一些硕士生、博士生参与了其中部分实验仿真研究工作,在此向他们表示衷心感谢;衷心感谢国家自然科学基金和山西省自然科学基金对相关研究工作的资助;衷心感谢科学出版社的大力支持。 鉴于语音情感识别技术是一项正在快速发展的技术,许多方法还在不断更新和研究中,加之作者水平有限,书中许多内容有待进一步研究和完善,恳请读者批评指正。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.