新書推薦:
《
读书是一辈子的事(2024年新版)
》
售價:HK$
77.3
《
乐道文库·什么是秦汉史
》
售價:HK$
80.6
《
汉娜·阿伦特与以赛亚·伯林 : 自由、政治与人性
》
售價:HK$
109.8
《
女性与疯狂(女性主义里程碑式著作,全球售出300万册)
》
售價:HK$
109.8
《
药食同源中药鉴别图典
》
售價:HK$
67.0
《
设计中的比例密码:建筑与室内设计
》
售價:HK$
87.4
《
冯友兰和青年谈心系列:看似平淡的坚持
》
售價:HK$
55.8
《
汉字理论与汉字阐释概要 《说解汉字一百五十讲》作者李守奎新作
》
售價:HK$
76.2
|
編輯推薦: |
本书适合作为高等院校计算机、广播电视工程专业高年级本科生、研究生的教材,便于读者理解和掌握多媒体数据库的理论、设计需求和技术进展以及当前有影响的、有代表性的多媒体内容检索系统和商业多媒体数据库系统。
|
內容簡介: |
本书在全面介绍多媒体数据库的多媒体数据类型、多媒体数据压缩标准、多媒体数据库等基本知识的基础上,着重介绍多媒体数据压缩技术,音频、静态图像、视频编码标准和方法,各类基于多媒体数据内容的检索方法。 全书共分为11章: 第1~6章介绍多媒体数据,着重介绍各类多媒体数据的编码算法,音频信号压缩编码原理和标准,静态图片压缩编码原理和标准,以及视频压缩编码技术和标准; 第7~11章介绍多媒体数据库,着重讨论多媒体数据库的基础知识,包括体系结构、数据模型等,文本处理与信息检索,基于内容的音频检索,基于内容的图像检索,以及视频索引和检索。 本书适合作为高等院校计算机、广播电视工程专业高年级本科生、研究生的教材,便于读者理解和掌握多媒体数据库的理论、设计需求和**技术进展, 以及当前有影响的、有代表性的多媒体内容检索系统和商业多媒体数据库系统。
|
關於作者: |
江潇潇,上海工程技术大学,讲师,女,35岁,专业:通信与信息系统,研究领域:多源信息融合,研究成果:在国内外重要学术刊物上发表论文十余篇,申请发明专利五项。
|
目錄:
|
第1章概论
1.1多媒体基本概念
1.1.1多媒体概述
1.1.2信息与媒体
1.1.3超文本与超媒体
1.1.4虚拟现实
1.2多媒体的主要特征
1.2.1信息载体的多样性
1.2.2集成性
1.3多媒体数据与数据管理
1.3.1多媒体数据特点
1.3.2多媒体数据的管理技术
1.4关系数据库管理系统
1.5面向对象数据库
1.5.1面向对象数据库概要
1.5.2面向对象的数据库设计技术
1.6多媒体数据库
1.6.1多媒体数据库简介
1.6.2多媒体数据库的体系结构
1.6.3多媒体数据库基于内容的检索
小结
习题
第2章多媒体信息处理概述
2.1数字音频的基本概念
2.1.1语音的特性
2.1.2音频的数字化
2.1.3数字音频信号的存储格式
2.1.4MIDI系统
2.2数字图像的基本概念
2.2.1数字图像的分类
2.2.2常见数字图像文件格式
2.3视频的基本概念
2.3.1视频的属性
2.3.2视频的采样格式
2.3.3常用的视频文件格式
2.3.4视频质量评估方法
小结
习题
第3章多媒体数据压缩技术
3.1数据压缩工作原理
3.1.1数据压缩概述
3.1.2数据压缩的基本原理
3.2统计编码
3.2.1统计编码的基础
3.2.2游程编码
3.2.3算术编码
3.2.4香农编码
3.2.5哈夫曼编码
3.3预测编码
3.3.1预测编码的基本原理
3.3.2帧内预测技术
3.3.3帧间预测技术
3.4变换编码
3.4.1变换编码工作原理
3.4.2的正交变换——KL变换
3.4.3离散余弦变换DCT
3.4.4小波变换
3.5其他编码方法
3.5.1矢量量化编码
3.5.2子带编码
3.5.3神经网络编码
3.5.4模型编码
小结
习题
第4章音频压缩技术标准
4.1音频信号压缩编码原理
4.1.1音频压缩编码基本原理
4.1.2音频信号压缩编码分类
4.2音频信号压缩编码技术
4.2.1波形编码
4.2.2参数编码
4.2.3混合编码
4.2.4感知声音编码
4.3音频信号压缩编码标准
4.3.1G.711
4.3.2G.721
4.3.3G.722
4.3.4G.728
4.3.5G.729
4.3.6MPEG中的音频编码
小结
习题
第5章静态图像压缩技术标准
5.1静态图像压缩编码
5.1.1静态图像压缩编码原理
5.1.2静态图像压缩编码分类
5.2基于小波变换的图像压缩技术
5.2.1数字图像的小波变换
5.2.2EZW算法
5.2.3SPIHT算法
5.3静态图像压缩标准
5.3.1二值图像压缩编码标准
5.3.2JPEG压缩编码标准
5.3.3JPEG 2000压缩编码标准
小结
习题
第6章视频压缩技术标准
6.1视频压缩编码技术简介
6.1.1视频压缩技术的基础
6.1.2视频压缩技术的分类
6.2基于块的混合视频编码技术
6.2.1基于块的混合视频编码原理
6.2.2预处理与后处理
6.2.3码率控制
6.3可伸缩视频编码技术
6.3.1可伸缩性编码原理
6.3.2基于块的混合视频的可伸缩视频编码方案
6.3.3小波视频编码
6.4视频压缩编码标准
6.4.1MPEG视频标准系列
6.4.2MHEG超越媒体
6.4.3ITU视频标准系列
小结
习题
第7章多媒体数据库
7.1引言
7.2多媒体数据库技术的发展历程
7.2.1阶段
7.2.2第二阶段
7.2.3第三阶段
7.3MMDBMS的体系结构
7.4多媒体系统数据模型
7.4.1数据模型
7.4.2数据模型的要求
7.4.3通用的多媒体数据模型
7.5多媒体数据库的设计
7.5.1体系结构设计
7.5.2界面设计
7.6其他问题
小结
习题
第8章文本处理与信息检索
8.1引言
8.2IR系统与DBMS的区别
8.3信息检索模型
8.3.1信息检索模型分类
8.3.2布尔检索模型
8.3.3向量空间模型
8.3.4概率模型
8.3.5扩展经典检索模型
8.4文本处理
8.4.1文本预处理
8.4.2文本聚类
8.5文本索引
8.5.1倒排文件表
8.5.2后缀树和后缀数组
8.5.3签名文件
8.6用户相关反馈和查询扩展
8.7信息检索与Web搜索
8.7.1信息检索
8.7.2网络信息资源检索
8.7.3搜索引擎应用
8.7.4图像搜索引擎
8.7.5移动搜索
8.7.6搜索引擎选择
小结
习题
第9章基于内容的音频检索
9.1引言
9.2音频的主要特征
9.2.1时域特征
9.2.2频域特征
9.2.3频谱图
9.2.4主观特征
9.3基于内容的音频检索过程
9.4音频分段与分类
9.4.1不同类型声音的主要特征
9.4.2音频的分类方法
9.5语音识别与检索
9.5.1语音识别
9.5.2语音识别系统
9.5.3语音识别算法
9.5.4语音识别性能
9.5.5说话人识别
9.6音乐的索引和检索
9.6.1音乐的存储类型
9.6.2结构化音乐和声音效果的索引和检索
9.6.3基于样本音乐的检索
9.7利用音频和其他媒体之间的关系进行索引和检索
小结
习题
第10章基于内容的图像检索
10.1引言
10.2基于内容的图像检索过程
10.3基于颜色特征的图像检索
10.3.1颜色空间模型
10.3.2颜色直方图
10.3.3颜色矩
10.3.4颜色聚合向量
10.3.5颜色相关图
10.4基于纹理特征的图像检索
10.4.1Tamura纹理特征
10.4.2灰度直方图的矩
10.4.3基于共生矩阵的纹理特征
10.4.4自回归纹理模型
10.4.5基于小波变换的纹理特征
10.4.6基于Gabor变换的纹理特征
10.5基于形状特征的图像检索
10.5.1基于轮廓的形状特征
10.5.2基于区域的形状特征
10.6基于空间关系的图像检索
10.6.1基于图像分割的方法
10.6.2基于图像分块的方法
10.6.3拓扑关系
10.6.4方位关系
10.6.5距离关系
10.6.6属性关系图
10.6.7基于空间关系特征检索的步骤
10.7不同特征的比较与综合特征检索
10.7.1不同图像特征的特点总结
10.7.2不同特征的比较
10.7.3综合特征检索
10.8图像检索过程中的相关反馈技术
10.9基于内容的图像检索系统
小结
习题
第11章视频索引和检索
11.1引言
11.2视频特征分析
11.2.1视频基本知识
11.2.2视频特征
11.3基于镜头的视频索引和检索
11.3.1视频结构化
11.3.2基于镜头的视频索引和检索
11.4视频镜头检测和分割
11.4.1镜头切换和运动
11.4.2突变镜头检测
11.4.3渐变镜头检测
11.4.4其他镜头检测技术
11.5视频索引和检索
11.5.1关键帧提取
11.5.2运动特征提取与索引
11.5.3基于对象的索引和检索
11.5.4基于注释的索引和检索
11.5.5视频索引和检索的综合方法
11.6视频表现和抽象
11.6.1视频摘要
11.6.2基于图像的视频摘要
11.6.3基于内容的视频摘要
11.6.4基于结构的视频摘要
11.7视频检索技术的发展趋势
小结
习题
参考文献
|
內容試閱:
|
多媒体技术是当今信息技术领域发展快、活跃的技术,是信息时代的典型代表产物之一,它极大地改变了人们获取信息的传统方法,迎合人们读取信息方式的需求。多媒体技术的迅速发展,使其作为一种信息社会的通用工具,进入了人类社会的各个领域,成为信息交流的关键方式。随着计算机技术与网络的迅速发展,传统的多媒体技术研究方向也在随之改变。从多媒体通信和多媒体制作与表现工具方面,转到了高效存储管理和多媒体信息检索领域,并逐渐向智能多媒体技术方向发展,涉及文字识别、语音识别、自然语言理解、机器翻译、图像识别理解、计算机视觉等方面,其发展潜力不可估量。
海量多媒体数据比传统数据复杂得多,多媒体的信息特征与结构化信息的特征和需求不同,传统的数据库管理系统无法有效处理复杂的多媒体数据,这就要求我们必须使用和研究新的多媒体数据管理和信息检索技术。多媒体数据库是随着多媒体技术发展产生的一种新型数据库,其数据库中的信息不仅包括字符、数字等结构化数据的表达形式,而且包括许多多媒体的非结构化数据,因此数据库管理涉及各种复杂数据对象的处理。多媒体数据库技术的综合性非常强,涉及多媒体数据的数据模型、数据存储与编码、数据索引与过滤、数据检索与查询等方面,随着人工智能技术与应用的蓬勃发展,进一步推动了多媒体数据内容管理和检索技术的发展,对多媒体数据库管理也提出了新的挑战。
目前,多媒体方面的教材和著作大多主要针对多媒体技术本身或面向某种媒体类型,而关于多媒体内容管理和检索的教材很少,且主要集中于文献资料的形式,大多针对某种特定的问题展开基于内容的检索研究。另外,关于多媒体数据库更是缺乏较为完整和系统的介绍。总体来说,关于多媒体数据库技术的研究大都只能依靠查阅相关文献来完成,很难找到合适的教材来全面了解和学习该领域的相关内容。因此,本教材旨在对多媒体数据库技术进行较为全面、综合性的叙述和覆盖,在对多媒体数据库的多媒体数据类型、多媒体数据压缩标准、多媒体数据库等基本知识的介绍基础上,重点讲述多媒体数据压缩技术、音频、静态图像和视频编码标准和方法,以及各类基于多媒体数据内容的检索方法。全书共分为11章: 前6章为多媒体数据内容介绍,着重介绍各类多媒体数据的编码算法,音频信号压缩编码原理和标准,静态图片压缩编码原理和标准,以及视频压缩编码技术和标准; 后5章为多媒体数据库内容介绍,着重讨论多媒体数据库的基础知识,包括体系结构、数据模型等,文本处理与信息检索,基于内容的音频检索,基于内容的图像检索,以及视频索引和检索。
本书适合作为高等院校计算机、广播电视工程专业高年级本科生、研究生的教材,读者通过学习本书可理解和掌握多媒体数据库的理论、设计需求和技术进展以及当前有影响的、有代表性的多媒体内容检索系统和商业多媒体数据库系统。此外,本书还适合用于任何想了解多媒体数据管理技术的读者。
在本书的编写过程中,作者得到了许多人的帮助,在此深表谢意。另外,感谢王珂、杨佳峰、高华金同学参与了书稿的编写与校订。
由于作者水平有限,书中难免存在疏漏和不当之处,敬请读者批评指正。
编者2021年3月
|
|