新書推薦:
《
绝美的奥伦堡蕾丝披肩编织
》
售價:HK$
177.0
《
狂飙年代:18世纪俄国的新文化和旧文化(第二卷)
》
售價:HK$
177.0
《
万有引力书系 纳粹亿万富翁 德国财富家族的黑暗历史
》
售價:HK$
109.8
《
中国常见植物野外识别手册:青海册
》
售價:HK$
76.2
《
三星堆对话古遗址(从三星堆出发,横跨黄河流域,长江流域,对话11处古遗址,探源多元一体的中华文明)
》
售價:HK$
87.4
《
迷人的化学(迷人的科学丛书)
》
售價:HK$
143.4
《
宋代冠服图志(详尽展示宋代各类冠服 精美插图 考据严谨 细节丰富)
》
售價:HK$
87.4
《
形似神异:什么是中日传统政治文化的结构性差异
》
售價:HK$
55.8
|
編輯推薦: |
适读人群 :研究生、科研人员、从业者等◆中国计算机领域具有重要突破或重要创新的博士研究生科研成果◆2021年度CCF优秀博士学位论文奖◆首次从属性层面评测、分析现有方法◆当前规模领先、完整度领先的视频显著性物体评测结果◆显著性和伪装目标检测两大领域的黄金指标
|
內容簡介: |
《认知规律启发的显著性物体检测方法与评测》的作者范登平博士在苏黎世联邦理工学院全职从事研究工作。本书的研究内容紧密结合了人类视觉认知机制和显著性计算技术,所提出的核心技术为计算机视觉的诸多任务提供了重要的技术基础。由范博士设计的两项指标已经成为SOD领域评测模型的黄金标准,为该领域的学术共同体提供了更加全面、客观的结果。《认知规律启发的显著性物体检测方法与评测》共七章:第1章 绪论,介绍本书的研究背景并简述研究目标和主要贡献。第2章 相关工作,介绍相关工作,包括图像显著性物体检测、视频显著性物体检测、非二进制显著性物体检测评价指标和二进制显著性物体检测评价指标。第3章 富上下文环境下的显著性物体检测数据集与评测,详细介绍富上下文环境下的显著性物体检测数据集与评测,包括显著性物体检测数据集的构建和基于属性的评测。第4章 基于注意力转移机制的视频显著性物体检测,详细介绍本书提出的基于注意力转移机制的视频显著性物体检测技术、新的视频显著物体检测数据集以及模型的评测。第5章 基于结构相似性的显著性检测评价指标,详细讨论本书提出的基于结构相似性的显著性检测评价指标,并利用该评价指标对多种基于深度学习的模型进行评测。第6章 基于局部和全局匹配的显著性物体检测评价指标,讨论了本书提出的基于局部和全局匹配的显著性物体检测评价指标,该指标主要针对物体分割之后的二值显著图的评价,通过一系列元度量实验,证明了该指标*符合人眼的感知。第7章 总结与展望,总结全书并讨论未来的研究方向。
|
關於作者: |
范登平,苏黎世联邦理工学院博士后研究员,曾任阿联酋起源人工智能研究院(IIAI)研究员、阿里巴巴达摩院高级算法工程师。长期从事计算机视觉领域中基础理论和应用的研究,在认知规律启发的视觉场景理解和评价准则方面取得了重要突破。在国内外权威期刊和会议上发表CCF A类论文近40篇(含6篇IEEE TPAMI论文),连续两年入选CVPR Best Paper Finalists,荣获首届计图开发者大会杰出论文奖和*具影响力(应用)论文奖,连续两次入选由美国斯坦福大学公布的全球前2%科学家榜单(2021年、 2022年)。“伪装目标检测”任务被英国权威杂志New Scientist撰文报道,获中国专利6项、美国专利3项。担任中国计算机学会计算机视觉专业委员会委员、IEEE高级会员、CVPR 2023领域主席、第七届MICCAI眼科医学影像分析研讨会领域主席,担任国际期刊Computer Vision and Machine Learning的编委,长期担任IEEE TPAMI、IEEE TIP、IEEE TMI等20余种知名刊物的评审员。
|
目錄:
|
第1章 绪论1.1 本书背景 1 1.1.1 研究背景 1 1.1.2 国内外研究现状 2 1.1.3 开放性评测数据集及智能检测模型 5 1.1.4 综合评价体系 81.2 研究目标与主要贡献 91.3 本书的组织结构 13第2章 相关工作2.1 图像显著性物体检测 15 2.1.1 图像显著性物体检测数据集 15 2.1.2 基于深度学习的图像显著性物体检测模型 172.2 视频显著性物体检测 21 2.2.1 视频显著性物体检测数据集 21 2.2.2 视频显著性物体检测模型 232.3 非二进制显著性物体检测评价指标 27 2.3.1 二值显著图的评估 27 2.3.2 非二值显著图的评估 28 2.3.3 当前指标的局限性 292.4 二进制显著性物体检测评价指标 31第3章 富上下文环境下的显著性物体检测数据集与评测3.1 引言 34 3.1.1 背景知识 34 3.1.2 研究动机 36 3.1.3 解决方案概要 373.2 SOC数据集 38 3.2.1 存在非显著物体 39 3.2.2 图像的数量和类别 40 3.2.3 显著物体的全局/局部颜色对比 42 3.2.4 显著物体的位置 44 3.2.5 显著物体的大小 44 3.2.6 高质量的显著对象标签 44 3.2.7 具有属性的显著对象 453.3 基于深度学习的显著性检测模型评测结果 47 3.3.1 评估指标 49 3.3.2 指标统计 50 3.3.3 基于属性的评估 513.4 讨论和结论 56第4章 基于注意力转移机制的视频显著性物体检测4.1 引言 58 4.1.1 背景知识 584.1.2 研究动机 594.1.3 解决方案概要 604.2 DAVSOD数据集 654.2.1 视频采集 654.2.2 数据标注 654.2.3 数据集的特点与统计 704.2.4 数据集划分 714.3 SSAV模型 724.3.1 基于显著性转移的视频显著性物体检测模型 724.3.2 实现细节 764.4 视频显著性物体检测模型评测结果 774.4.1 实验设置 774.4.2 性能比较和数据集分析 774.4.3 分离实验 834.5 讨论和结论 93第5章 基于结构相似性的显著性检测评价指标5.1 引言 945.1.1 背景知识 945.1.2 研究动机 955.1.3 解决方案概要 985.2 S-measure指标 995.2.1 面向区域的结构相似性度量 1005.2.2 面向物体的结构相似性度量 1015.2.3 结构相似性指标 1035.3 实验验证 1045.3.1 元度量1:应用排序 1045.3.2 元度量2:新水平vs.通用映射图 1055.3.3 元度量3:标准显著图替换 1075.3.4 元度量4:标注错误 1095.3.5 进一步比较 1135.3.6 元度量5:人的判别 1155.3.7 显著性模型比较 1185.4 讨论和结论 120第6章 基于局部和全局匹配的显著性物体检测评价指标6.1 引言 1216.1.1 背景知识 1216.1.2 研究动机 1226.1.3 解决方案概要 1226.2 E-measure指标 1256.2.1 局部项 1266.2.2 局部全局匹配项 1286.2.3 局部全局匹配指标 1286.3 实验验证 1296.3.1 元度量 1296.3.2 数据集和模型 1306.3.3 元度量1:应用排序 1316.3.4 元度量2:先进vs.通用映射图 1346.3.5 元度量3:先进vs.随机噪声 1356.3.6 元度量4:人为排序 1356.3.7 元度量5:手工标注图替换 1376.4 讨论和结论 138第7章 总结与展望7.1 工作总结 1407.2 展望 144
|
內容試閱:
|
显著性物体检测技术起源于认知学中人类的视觉注意行为,即人类视觉系统能够快速地将注意力转移到视觉场景中Z具信息量的区域而有选择性地忽略其他区域。该技术在现实生活中有着广泛的应用基础,如自动驾驶、人机交互、视频分割、视频字幕和视频压缩等。由于图像和视频数据(遮挡、模糊和运动模式等)自身存在的挑战以及人类在动态场景中注意行为(选择性注意分配和注意转移)固有的复杂性,显著性物体检测技术面临着巨大挑战。受制于采集设备,早期构建的显著性物体检测数据集表达真实场景的能力非常有限。同时,这一领域的评价指标是基于像素级误差的,完全忽略了人类认知规律的特性。上述问题严重制约了显著性物体检测技术的发展。本书围绕图像、视频显著性物体检测,研究了基于人类认知规律的数据集构建、模型构建、评价指标三个方面的问题。
|
|