新書推薦:
《
就业、利息和货币通论(徐毓枬译本)(经济学名著译丛)
》
售價:HK$
67.2
《
瘦肝
》
售價:HK$
99.7
《
股票大作手回忆录
》
售價:HK$
55.8
《
秩序四千年:人类如何运用法律缔造文明(世界重归混乱,文明岌岌可危,法律与秩序是我们仅有的武器。穿越时间,鸟瞰全球,一部波澜壮阔的人类文明史)
》
售價:HK$
154.6
《
民法典1000问
》
售價:HK$
99.7
《
国术健身 易筋经
》
售價:HK$
33.4
《
古罗马800年
》
售價:HK$
188.2
《
写出心灵深处的故事:踏上疗愈之旅(修订版)(创意写作书系)
》
售價:HK$
66.1
|
內容簡介: |
本书是人工智能技术应用核心课程系列教材之一,通过对人工智能数据标注的概念、方法、工具与案例的系统介绍,结合对图像、视频、语音、文本和3D点云等类别数据的具体标注案例的分析与操作,使初学者可以快速掌握数据标注的基础知识和常用方法,使从业者在提升数据标注技术水平的同时,掌握工程化数据标注的项目组织、管理和质量控制的技术与方法。本书适合作为高校人工智能相关专业的教材,也可供人工智能、机器学习与深度学习爱好者阅读,还可作为人工智能改造升级项目的规划与实施者、人工智能数据服务从业者以及数据标注技术工程管理人员阅读和参考。
|
關於作者: |
聂明,男,1964年生人,中共党员,博士,三级教授, 现任南京信息职业技术学院人工智能学院(筹)院长,是全国工信和信息化职业教育教学指导委员会计算机专指委委员、江苏省"333工程中青年学术带头人、江苏省"六大人才高峰高层次人才培养对象。编著出版过《移动增值应用开发导论》、《Java Web应用开发项目教程》、《VC 程序设计技能教程与实训》和《计算机应用技术导论》等多本专著和教材。
|
目錄:
|
第1章 人工智能概述 1
1.1 人工智能发展概况 1
1.1.1 人工智能的发展历程 1
1.1.2 人工智能的影响力 3
1.1.3 人工智能的国际竞争 5
1.2 人工智能的典型技术 7
1.2.1 人工智能技术的分类 7
1.2.2 语音合成 10
1.2.3 语音识别 11
1.2.4 自然语言处理 12
1.2.5 图像识别 13
1.2.6 3D点云 13
1.2.7 多模态数据处理 14
1.3 人工智能是新一代信息技术的核心 15
1.3.1 5G与人工智能的关系 16
1.3.2 云计算与人工智能的关系 16
1.3.3 大数据与人工智能的关系 17
1.3.4 物联网与人工智能的关系 18
1.4 本章小结 18
1.5 作业与练习 19
第2章 数据标注的概念、工具与方法 20
2.1 数据标注的概念及其对人工智能发展的意义 20
2.1.1 全球数据的快速增长催生大数据产业 20
2.1.2 数据产业推动人工智能应用技术的发展 21
2.1.3 数据标注对于人工智能应用的意义 21
2.2 数据标注对象 22
2.2.1 数据集 22
2.2.2 语音数据集 24
2.2.3 图像数据集 25
2.2.4 文本数据集 26
2.2.5 视频数据集 27
2.3 数据标注工具与平台 28
2.3.1 语音数据标注工具 28
2.3.2 图像数据标注工具 30
2.3.3 视频数据标注工具 31
2.3.4 文本数据标注工具 33
2.3.5 3D点云标注工具 34
2.4 典型数据标注技术 35
2.4.1 语音转写技术 35
2.4.2 人脸检测和关键点检测 36
2.4.3 图像分割 36
2.4.4 视频类标注 37
2.5 数据标注工程 37
2.5.1 数据采集 37
2.5.2 数据处理 40
2.5.3 数据标注 42
2.5.4 数据质检 46
2.5.5 数据交付 46
2.5.6 数据验收 47
2.6 本章小结 47
2.7 作业与练习 48
第3章 图像数据标注 49
3.1 图像数据标注简介 49
3.1.1 图像数据标注的目的与发展 49
3.1.2 图像数据标注规范 50
3.1.3 场景分类型图像数据标注 52
3.1.4 图像数据标注形式分类 52
3.1.5 图像任务和数据标注的关系 55
3.1.6 图像数据标注的术语 56
3.2 关键点标注方法 56
3.2.1 关键点标注项目的应用及发展前景 56
3.2.2 关键点的标注内容 57
3.2.3 标注数据结果格式 58
3.2.4 关键点标注工具简介 59
3.2.5 关键点标注案例分析 61
3.2.6 关键点标注难点及分析 63
3.3 标注框标注方法 63
3.3.1 框标注适合的场景 63
3.3.2 框标注工具简介 65
3.3.3 标注方案及案例分析 67
3.3.4 标注框标注难点及分析 69
3.4 图像区域标注方法 69
3.4.1 图像区域标注适合的场景 69
3.4.2 图像区域标注工具简介 70
3.4.3 标注方案及案例分析 72
3.4.4 图像区域标注难点及分析 74
3.5 本章小结 74
3.6 作业与练习 74
第4章 视频数据标注 76
4.1 视频数据标注简介 76
4.1.1 视频数据标注的意义 76
4.1.2 视频数据标注任务 77
4.1.3 视频源数据管理 77
4.2 视频数据标注工具 78
4.2.1 视频数据标注工具简介 78
4.2.2 视频数据标注流程 80
4.2.3 典型视频数据标注方法 83
4.3 视频数据标注案例解析 85
4.3.1 矩形框标注案例—人体追踪属性标注 85
4.3.2 矩形框标注案例—车辆标注 86
4.3.3 矩形框标注案例—商场监控视频数据标注 88
4.4.4 视频帧标注案例—足球视频数据标注 92
4.5 本章小结 94
4.6 作业与练习 95
第5章 语音数据标注 96
5.1 语音数据标注简介 96
5.1.1 语音数据标注相关背景 96
5.1.2 语音信号基础知识 97
5.2 语音数据标注概述 99
5.2.1 标注任务分类 99
5.2.2 常见语音数据异常 100
5.2.3 基本标注规范 102
5.3 典型开源语音数据标注工具 104
5.3.1 Praat语音学软件 104
5.3.2 语音数据标注平台 105
5.4 语音数据标注整体流程 110
5.4.1 项目背景与意义 110
5.4.2 语音项目整体规程 110
5.4.3 语音数据标注过程详情 111
5.5 多样化语音数据标注项目 115
5.5.1 智能家居儿童语音数据标注 115
5.5.2 智能音箱语音数据标注 117
5.5.3 智能客服语音拼音标注 119
5.5.4 演讲语音数据标注 120
5.6 本章小结 122
5.7 作业与练习 122
第6章 文本数据标注 123
6.1 文本数据标注简介 123
6.1.1 文本数据标注的发展与研究现状 123
6.1.2 基本概念 124
6.1.3 流程介绍 127
6.1.4 交付格式 127
6.1.5 应用场景 127
6.2 文本数据标注工具 129
6.2.1 开源文本数据标注工具 129
6.2.2 专业文本数据标注工具及其标注场景 132
6.2.3 优秀的标注工具应具备的条件 142
6.3 序列标注方法举例 142
6.3.1 外卖成分识别标注案例 142
6.3.2 单品推广文案标注案例 144
6.3.3 多音字关键词提取标注案例 145
6.4 关系标注方法举例—中文阅读理解分析案例 147
6.5 属性标注方法案例 148
6.5.1 语音文本判别标注案例 148
6.5.2 文本情感分析判别标注案例 150
6.6 本章小结 152
6.7 作业与练习 152
第7章 3D点云标注 153
7.1 3D点云标注简介 153
7.1.1 点云的获取方法 154
7.1.2 3D点云应用 156
7.1.3 3D点云的存储方式及数据类型 158
7.1.4 3D点云典型数据集 159
7.2 3D点云标注工具 160
7.2.1 3D点云标注工具的主要功能 161
7.2.2 界面布局和操作 161
7.2.3 标注输出格式 164
7.3 3D点云标注项目 164
7.3.1 项目背景 164
7.3.2 自动驾驶3D点云标注规范 164
7.3.3 3D点云标注流程 166
7.4 本章小结 169
7.5 作业与练习 169
第8章 工程化数据标注的组织管理 171
8.1 数据标注项目实施流程 171
8.1.1 数据标注项目 171
8.1.2 一般项目实施流程 173
8.1.3 数据标注项目实施流程 174
8.2 数据标注团队组织架构 176
8.2.1 数据标注团队组织类型 176
8.2.2 数据标注团队组织架构 177
8.3 数据标注团队角色分工 179
8.3.1 数据标注团队角色分工之一 179
8.3.2 数据标注团队角色分工之二 181
8.3.3 数据标注团队角色分工总览 182
8.4 数据标注团队沟通和建设 184
8.4.1 项目相关方管理 184
8.4.2 数据标注团队沟通 186
8.4.3 数据标注团队建设 188
8.4.4 数据标注员培训 189
8.5 国外数据产品生产组织方式案例 191
8.5.1 亚马逊机械特克平台 191
8.5.2 澳鹏平台 192
8.6 本章小结 193
8.7 作业与练习 193
第9章 工程化数据标注的质量控制 194
9.1 质量控制 194
9.1.1 质量控制流程 194
9.1.2 控制流程细则 196
9.1.3 质量监控 198
9.1.4 质量检验方法 199
9.2 质量标准 200
9.2.1 语音数据标注 200
9.2.2 图像数据标注 202
9.2.3 文本数据标注 203
9.3 质检与验收 204
9.3.1 质检流程 204
9.3.2 验收原则 205
9.3.3 验收报告 205
9.4 质量总结 209
9.5 数据质检与验收案例 210
9.5.1 人脸68点标注质检案例 210
9.5.2 客服语音数据标注质检案例 214
9.5.3 3~5岁中国儿童朗读文本数据标注质检案例 215
9.6 本章小结 216
9.7 作业与练习 216
第10章 工程化数据标注的进度管理 217
10.1 项目进度管理的定义和实践 217
10.1.1 物理架构 217
10.1.2 项目进度管理的实践 218
10.2 项目活动分解排序和估算时间 221
10.2.1 定义活动 221
10.2.2 排列活动顺序 222
10.2.3 估算活动持续时间 224
10.3 制订项目进度计划 225
10.3.1 制订项目进度计划的常用技术 225
10.3.2 数据标注项目进度计划实例 228
10.4 监控进度计划实施 230
10.4.1 监控进度计划实施的流程 230
10.4.2 监控进度计划实施的时机和方法 231
10.4.3 数据标注项目进度监控实例 233
10.5 本章小结 236
10.6 作业与练习 236
第11章 工程化数据标注的系统平台 238
11.1 数据标注系统概述 238
11.1.1 典型数据标注平台系统架构 239
11.1.2 典型标注工具 240
11.2 数据标注平台实例介绍 246
11.2.1 数加加Pro标注平台的适用范围 246
11.2.2 数加加Pro标注平台的产品特性 246
11.2.3 数加加Pro标注平台的产品架构 247
11.2.4 数加加Pro标注平台的产品优势 248
11.3 本章小结 250
11.4 作业与练习 250
第12章 数据标注的发展趋势 251
12.1 人工智能总体发展趋势 251
12.1.1 主要国家和地区高度重视AI发展 251
12.1.2 有监督学习仍是人工智能的主流 252
12.2 人工智能数据发展趋势 254
12.2.1 人工智能数据需求 254
12.2.2 人工智能数据市场规模 258
12.2.3 人工智能数据需求特点 259
12.3 数据标注发展趋势 259
12.3.1 定制化精细化发展 259
12.3.2 高度自动化发展 260
12.3.3 智能化流程化发展 262
12.3.4 重视安全与隐私保护 263
12.4 本章小结 264
12.5 作业与练习 264
附录A 典型数据产品介绍 266
附录B 开源数据集介绍与获取 269
附录C 人工智能的网络学习资源 273
附录D 人工智能的产业生态与技术图谱 276
参考文献 280
|
內容試閱:
|
序
1947年,艾伦?图灵在其技术报告《智能计算机器》中首次提出了机器智能的基本框架;1950年,在他发表的《计算机器与智能》论文中,提出了著名的图灵测试—如果一台机器能够与人类展开对话,而不被辨别出其机器身份,那么就称这台机器具有智能。1956年,约翰?麦卡锡、马文?闵斯基、克劳德?香农、艾伦?纽厄尔、赫伯特?西蒙等科学家齐聚达特茅斯学院,讨论“用机器来模仿人类学习以及其他方面的智能”,宣告了“人工智能”的诞生。
达特茅斯会议之后,大批人工智能领域专家及研发成果相继涌现。
20世纪50—80年代,属于人工智能的“逻辑推理”时代:1962年,IBM的阿瑟?萨缪尔开发出西洋跳棋程序,战胜了一位盲人下棋高手;1966年,麻省理工学院的约瑟夫?魏泽堡打造出史上第一个聊天机器人“Eliza”,它能理解简单的自然语言,并产生类似人类的互动;之后陆续出现知识工程、专家系统……
20世纪80—90年代,是人工智能的“计算智能”时代:1982年,约翰?霍普菲尔德提出了连续和离散的Hopfield神经网络模型(HNN),能解决一大类模式识别问题,还能给出一类组合优化问题的近似解,还有多层神经网络及其BP算法,直到今天的深度网络、对抗网络、图网络……
进入21世纪,人工智能再一次迎来大繁荣,智能翻译、智能客服、人脸识别、智能音箱、互联网娱乐、无人机、智能机器人、自动驾驶……大量的创新成果层出不穷。人工智能繁荣背后的机理,既有分布式计算大幅度提升算力的原因,也有多层神经网络模型深度学习技术不断成熟的原因,还有大规模数据采集、存储、处理水平大幅提高的原因。可以说,算力、算法、数据、场景是人工智能得以兴起的四大核心要素,尤其是数据的价值和作用不容忽视。
长期以来,高性能智能芯片、高可靠智能算法及系统都是人工智能前台的闪耀明星,而高质量数据则是默默无闻的幕后英雄。社会对人工智能产业的数据环节关注太少,吸引优秀人才团队从业服务的更少,优秀人才团队编写的人工智能数据服务类高质量教材更是少之又少,本书恰恰是众多“少”中的典型代表。本书以一线企业的实际项目为基础,系统介绍人工智能图像、视频、语音、文本、3D点云等几大类别数据标注的不同方法和典型案例,深入分析工程化数据标注的组织管理、质量控制、进度管理、系统平台等具体实践,对于人工智能的爱好者、专业教师、学生和从业人员均具有一定的参考与指导作用。
这是一部业界迫切需要的、富含实践指导意义的专业教材。相信在有关教师的细致教学下,在各位同学、读者的认真学习下,人工智能数据服务行业将涌现一大批专业数据工程师;更相信在人工智能理论、算法、算力、数据、系统等各环节同志们的共同努力下,我们的人工智能产业会在助力社会发展上发挥越来越大的作用。
王飞跃
中国科学院自动化研究所研究员、博士生导师
复杂系统管理与控制国家重点实验室主任
前言
当前,以人工智能、量子信息、基因工程等技术为代表的第四次科技革命正在悄然地改变着世界。从全球范围看,人工智能既是推动世界发展的重要技术,也是国际竞争的主战场之一,甚至关系着国家发展的前途和命运。历史上的每一次科技革命都是通过技术突破激起创新热潮,进而推进生产力变革。面对这一历史机遇,世界主要国家和经济体都加强了对人工智能的战略部署:美国、英国注重人工智能的基础研究;日本、德国则偏向从应用方面促进人工智能的发展;我国提出人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题,通过一系列的规划与激励,快速推进人工智能、5G网络、数据中心等新型基础设施的建设进度。
人工智能经过六十多年的发展,随着2016年谷歌AlphaGo战胜人类围棋顶尖选手,以及深度学习在图像识别、自然语言处理、计算机视觉、智慧语音、智能商业、自动驾驶、智慧医疗等领域取得突破性成绩,人工智能多种专项技术的工程化、实用化的黄金时代到来了,人工智能产业迎来了蓬勃发展的朝阳时代。纵观人工智能技术的发展与当前应用系统的落地情况,算法、算力是其支撑,而数据已经成为其生命线,原因是数据规模越大、数据质量越好,算法模型越智能、应用系统越实用。早在20世纪80年代就已经出现神经网络算法,2006年又进一步出现了深度学习算法,但是整个发展和应用过程由于没有足够数据的支持而进展缓慢、艰难。近年来,由于有效支持人工智能算法模型训练的高质量、大规模的数据集及算力问题的有效解决,人工智能技术的应用率先在互联网场景爆发,催生了旷视、商汤、抖音、云知声、字节跳动等一大批细分行业的独角兽企业。近期,金融、保险、电力、汽车、交通、制造、医疗等许多传统行业也逐渐成为人工智能技术应用的主战场。艾瑞咨询的研究报告提出,到2025年我国人工智能核心产业规模将超过4000亿元,带动相关产业规模超过5万亿元。未来人工智能数据服务行业的市场需求和潜力巨大。
早期人工智能数据服务的领域仅限语音识别、人脸检测等简单场景,如今已经延伸到语音控制、人脸解锁、互联网“瘦脸/变音”、跨年龄段人脸识别、化妆前后人脸比对等复杂应用场景,并进一步延伸到智慧金融/保险、智能家居、智慧交通、智慧医疗、智慧城市、动物识别、智能制造等繁多复杂的行业应用场景。回顾人工智能数据服务的发展历程,2010年前后仅仅是“阳春白雪”的态势,如今已经是“热闹非凡”。有业内人士评估,我国全职的人工智能数据采集、标注从业人员已达到十万人以上,兼职人员的规模更是达到百万级别。回顾人工智能数据的生产方式,从早期的“人拉肩扛”的全手工模式,到如今已经逐步出现了专业化的采集平台、标注工具、柔性化的数据生产系统等工程化模式,产生了无监督冷启动标注技术、弱监督预标注技术和少监督精标注技术,实现了数据、项目、人员、绩效、质量等工程化管理,甚至有业内龙头企业已经具备了标注工具的柔性化配置生成技术,使得通用标柱工具的开发周期由5个工作日减少至30分钟,开发周期大为缩短。
2020年2月,人力资源和社会保障部办公厅牵头发布《智能制造工程技术人员等职业信息》,正式提出了“人工智能训练师”这一新职业信息,该职业包含了数据标注员、数据采集员等新职位。调查发现,经历过专业系统学习、培训实践、考核认证的数据采集标注人才十分缺乏,未来5~10年的缺口将高达百万人。为了填补上述人才缺口,已经有部分高职院校启动了人工智能数据标注相关的人才培养工作。例如,南京信息职业技术学院人工智能学院的教学团队已经建设了“工程化数据标注实训室”,开设了“工程化数据标注技术”新课程,启动了“人工智能数据工程”新专业的可行性研究与开发建设等工作。但是多方反馈,人工智能数据标注对学校及教师而言仍是一个较为新鲜的事物,既缺乏数据标注的项目实践、案例,也缺乏数据标注的实训平台、工程样板。同时,能够充分满足教学需求的数据标注相关教材也不多见。
基于上述原因,从2018年开始,多位具有丰富教学经验和工程经验的教师与工程师组成编写创作团队,立足人工智能数据标注的教学特点及产业需求,以国内人工智能数据服务领军企业一线的理论认识、技术方法、项目案例、管理经验等为基础,精心组织编写了这本教材。
全书共12章。第1章和第2章从基础概念入手,介绍人工智能、数据标注的基本概念、工具与方法;第3章~第7章系统阐述图像数据、视频数据、语音数据、文本数据、3D点云数据的不同标注方法和典型案例;第8章~第11章系统分析工程化数据标注的组织管理、质量控制、进度管理,以及系统平台的原理、方法、功能与实践案例;第12章探讨了人工智能数据标注的发展趋势;附录分享了典型的数据产品、开源数据集与相关学习资源。本书通过将数据标注的理论、方法、案例有机融合,使初学者可以快速掌握数据标注的基础知识、概念与方法,使从业者在提升数据标注技术水平的同时,学到工程化数据标注的项目组织、管理和质量控制的技术与方法。
本书由长期从事教学与行业实践一线工作的聂明教授和齐红威博士担任主编,刘青青、王大亮、何鸿凌、丰强泽、王伟旗、王辉、孙岩、霍广超、刘博、霍轩、郝晨光、郎倩华、赵文化、唐玉风、梁艳明、沈杰、徐德雄、栗全峰、高禹、姚会文、王丽媛、刘海香、姜大利、马晓倩、安博文、闫华、马鸣宇、宋伟伟等专业工程师协同参与了内容组织,对相关编者的用心思考、细心撰写、精心组织等工作表示由衷的感谢。另外,本书参考、借鉴了一些专著、教材、论文、报告和网络上的成果、素材、结论或图文,受篇幅限制没有在参考文献中一一列出,在此一并向原创作者表示衷心感谢。同时,感谢“人工智能技术应用核心课程系列教材”编委会各位专家、学者的指导!
期望本书的出版能够为计算机与人工智能类相关专业的教师、学生和相关工程技术人员了解人工智能数据服务行业、学习工程化数据标注技术起到参考和指导作用,也期望本书能够为全国高职院校开设“人工智能数据标注”新课程、进一步开发“人工智能数据工程”新专业起到引导和推动作用。
由于时间仓促,加之编者水平有限,书中考虑不全面、描写不准确之处在所难免,恳请广大读者、专家、老师和社会各界朋友批评指正!
编者联系邮箱:427723799@qq.com
编 者
2020年12月
|
|