《视觉语言交互中的视觉推理研究》 - 牛玉磊著 - 机械工业出版社 - 香港大書城 - Meg Book Store

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

會員書架精選

2023年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書
七月出版：大陸書台灣書
六月出版：大陸書台灣書
五月出版：大陸書台灣書
四月出版：大陸書台灣書
三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書
12月出版：大陸書台灣書
11月出版：大陸書台灣書
十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書

『簡體書』视觉语言交互中的视觉推理研究

書城自編碼： 3849527
分類：簡體書→大陸圖書→計算機/網絡→人工智能
作者：牛玉磊著
國際書號(ISBN)： 9787111723035
出版社：机械工业出版社
出版日期： 2023-03-01

頁數/字數： /
書度/開本： 32开釘裝：平装

售價：HK$ 59.8

我要買件

** 我創建的書架 **
未登入.

新書推薦：

阿勒泰的春天

《阿勒泰的春天》
售價：HK$ 50.4

如见你

《如见你》
售價：HK$ 51.3

人格阴影全新修订版，更正旧版多处问题。国际分析心理学协会（IAAP）主席力作

《人格阴影全新修订版，更正旧版多处问题。国际分析心理学协会（IAAP）主席力作》
售價：HK$ 67.0

560种野菜野果鉴别与食用手册

《 560种野菜野果鉴别与食用手册》
售價：HK$ 67.1

中国官僚政治研究（一部洞悉中国政治制度演变的经典之作）

《中国官僚政治研究（一部洞悉中国政治制度演变的经典之作）》
售價：HK$ 62.7

锂电储能产品设计及案例详解

《锂电储能产品设计及案例详解》
售價：HK$ 110.9

首辅养成手册（全三册）（张晚意、任敏主演古装剧《锦绣安宁》原著小说）

《首辅养成手册（全三册）（张晚意、任敏主演古装剧《锦绣安宁》原著小说）》
售價：HK$ 121.0

《清洁》
售價：HK$ 65.0

建議一齊購買：

+

HK$ 242.8
《Scikit-Learn、Keras和TensorFlow的》

+

HK$ 74.8
《Excel机器学习》

+

HK$ 160.0
《机器学习中的交替方向乘子法》

+

HK$ 77.9
《硬件产品经理手册：手把手构建智能硬件产品》

+

HK$ 91.1
《人工智能算法卷2 受大自然启发的算法》

+

HK$ 150.0
《先进控制技术》

編輯推薦：

适读人群：研究生、科研人员、从业者等◆中国计算机领域具有重要突破或重要创新的博士研究生科研成果◆2021年度CCF优秀博士学位论文奖◆知识建模和知识推断两个方面◆单轮交互和多轮交互两个场景◆去除直接因果效应，克服模型对语言偏差的依赖

內容簡介：

《视觉语言交互中的视觉推理研究》的作者牛玉磊博士于2020年在中国人民大学取得博士学会，后前往美国哥伦比亚大学开展博士后研究工作。本书从知识建模和知识推断两方面入手，深入研究了视觉语言交互任务中的视觉推理问题。《视觉语言交互中的视觉推理研究》共五章：第1章主要介绍了计算机视觉与自然语言处理交叉领域中交互类问题的研究背景，并分别从单轮交互、多轮交互、知识偏差三个角度选取了指称语理解、视觉对话、视觉问答三个经典任务展开讨论。第2章主要介绍了单轮交互情形的代表性视觉推理任务，即指称语理解问题，提出了变分背景框架，根据视觉图像和指称语文本的联系及视觉物体之间的关系提取语义背景信息，并根据背景信息对指称语进行定位。第3章介绍了多轮交互情形的代表性视觉推理任务，即视觉对话问题，提出了递归注意力机制，通过视觉指代消解的思想对图像、对话和问题之间的联系进行建模，优化视觉表示。第4章介绍了知识偏差情形的代表性视觉推理任务，即视觉问答问题，基于因果推理提出了反事实视觉问答框架，在训练环境和测试环境的答案分布不一致情况下，通过因果效应的视角提取并去除语言偏差。第5章对本书进行了总结，并对未来研究方向进行了展望。

關於作者：

牛玉磊，美国哥伦比亚大学博士后，2015年和2020年于中国人民大学分别获得学士与博士学位。研究方向包括计算机视觉、机器学习、因果推理、多模态学习等，在国际著名学术会议和期刊上发表论文20余篇。担任BMVC 2022领域主席，AAAI 2023、IJCAI 2021高级程序委员会委员等学术职务。获2021年度CCF优秀博士学位论文奖、CVPR 2019视觉对话挑战赛冠军，被评为NeurIPS 2022、ICLR 2021、ICCV 2021的杰出审稿人。

目錄：

第1章引言 1.1 研究背景 1 1.2 研究现状 5 1.2.1 指称语理解 6 1.2.2 视觉对话 8 1.2.3 视觉问答 11 1.3 研究内容与贡献 14 1.4 组织结构 17第2章单轮交互情形下的指称语理解 2.1 研究概述 20 2.2 相关工作 23 2.3 变分背景框架 26 2.3.1 问题表述 26 2.3.2 指称语理解 29 2.3.3 指称语生成 31 2.3.4 模型实现 32 2.4 实验结果 40 2.4.1 实验设置 40 2.4.2 指称语理解实验结果 44 2.4.3 指称语生成实验结果 552.5 小结 57第3章多轮交互情形下的视觉对话 3.1 研究概述 60 3.2 相关工作 64 3.3 预备知识 66 3.4 递归视觉注意力模型 66 3.4.1 判别模块 68 3.4.2 匹配模块 69 3.4.3 注意力模块 72 3.5 其他模块 73 3.5.1 语言特征表示 73 3.5.2 视觉特征表示 75 3.5.3 特征优化与融合 76 3.5.4 非线性映射 78 3.5.5 Gumbel离散采样 79 3.6 实验结果 80 3.6.1 实验设置 80 3.6.2 实现细节 82 3.6.3 对比方法 82 3.6.4 实验结果分析 85 3.7 小结 93第4章知识偏差情形下的视觉问答 4.1 研究概述 96 4.2 相关工作 101 4.3 预备知识 104 4.3.1 因果图 105 4.3.2 反事实表示 105 4.3.3 因果效应 106 4.4 基于简化因果图的反事实视觉问答 107 4.4.1 反事实视觉问答框架 108 4.4.2 技术实现 110 4.5 基于完全因果图的反事实视觉问答 115 4.5.1 反事实视觉问答框架 115 4.5.2 技术实现 116 4.6 实现细节 119 4.7 实验结果 120 4.7.1 实验设置 120 4.7.2 简化因果图实验结果 122 4.7.3 完全因果图实验结果 134 4.8 小结 137第5章总结与展望 5.1 创新总结 139 5.2 未来工作展望 141 5.2.1 视觉推理任务 142 5.2.2 知识建模 142 5.2.3 知识偏差 143

內容試閱：

视觉语言是计算机视觉与自然语言处理的交叉领域，对机器的感知和认知能力均有较高的要求。随着深度学习的发展和计算能力的提高，机器的感知能力得到了显著提升，于是研究者们开始探索机器的认知能力，尤其是推理能力。本书从知识建模和知识推断两方面入手，对视觉语言交互任务中的视觉推理问题进行研究。其中，知识建模指通过模型的构建，从视觉媒介和自然语言中提取视觉与语言知识，并进行特征表示；知识推断指机器对视觉和语言两个模态的知识进行综合考虑，并进行无偏的推断与估计。

書城介紹　 |　合作申請　|　索要書目　 |　新手入門　|　聯絡方式　 |　幫助中心　|　找書說明　 |　送貨方式　|　付款方式 香港用户　 |　台灣用户　|　大陸用户　|　海外用户

megBook.com.hk

Copyright © 2013 - 2024 （香港）大書城有限公司　 All Rights Reserved.