登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書

『簡體書』自然语言处理应用与实战

書城自編碼: 3841944
分類:簡體書→大陸圖書→計算機/網絡计算机理论
作者: 韩少云等
國際書號(ISBN): 9787121450174
出版社: 电子工业出版社
出版日期: 2023-03-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 127.5

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
AIGC+机器人:以产业的视角读懂人工智能的未来
《 AIGC+机器人:以产业的视角读懂人工智能的未来 》

售價:HK$ 106.8
示人以真:健康组织这样开展业务
《 示人以真:健康组织这样开展业务 》

售價:HK$ 82.8
格林童话:1812/1815初版合集(权威全译本)
《 格林童话:1812/1815初版合集(权威全译本) 》

售價:HK$ 117.6
思想会·军力:现代战争的胜败解释
《 思想会·军力:现代战争的胜败解释 》

售價:HK$ 117.6
边界之外:海外社会研究(第一辑)
《 边界之外:海外社会研究(第一辑) 》

售價:HK$ 82.8
好销售,不违心:在你的舒适区内拿订单
《 好销售,不违心:在你的舒适区内拿订单 》

售價:HK$ 70.8
阿富汗史:骑驰在风暴中的国度
《 阿富汗史:骑驰在风暴中的国度 》

售價:HK$ 117.6
背影2
《 背影2 》

售價:HK$ 82.8

 

建議一齊購買:

+

HK$ 171.0
《 并行计算与高性能计算 》
+

HK$ 122.0
《 了不起的芯片 》
+

HK$ 111.3
《 一本书读懂Web3.0:区块链、NFT、元宇宙和DAO 》
+

HK$ 159.3
《 知识图谱:方法、实践与应用 》
+

HK$ 241.6
《 开放科学云技术与实践 》
+

HK$ 172.5
《 工业互联网赋能的企业数字化转型 》
編輯推薦:
市面上讲解人工智能的书比较多,但要么是偏重理论的讲解,要么是非常深涩的代码,对于计算机基础较差的学员来说,学习成本很高或者学了无益,付出了大量时间,但达不到岗位要求。“人工智能应用与实践系列”图书开创性地使用了新的教学方法,通过大量由浅入深、环环相扣的实践案例,能够帮助学员迅速理解人工智能的应用,快速掌握工作技能。此外本书还配有超值的300分钟以上的视频课程,帮助基础稍弱或者0基础的学员迅速提升。
內容簡介:
本书系统介绍了自然语言处理及深度学习,并结合实际应用场景和综合案例,深入浅出地讲解自然语言处理领域的相关知识。 全书共 15 章,分为 4 个部分。第 1 部分是自然语言处理基础,首先介绍自然语言处理的相关概念和基本技能,然后介绍词向量技术和实现方法,最后介绍关键词提取技术。第 2 部分是自然语言处理核心技术,分别介绍朴素贝叶斯算法、N-gram 语言模型、PyTorch 深度学习框架、FastText 模型文本分类和基于深度学习的文本分类。第 3 部分是序列标注,介绍序列标注的具体应用,如 HMM 词性标注和 HMM 命名实体识别等常见的自然语言处理应用场景。第 4 部分是预训练模型,它在很大程度上促进了自然语言处理的发展,这部分内容关注预训练模型的具体应用,如 ALBERT 的命名实体识别、Transformer 的文本分类、BERT的文本相似度计算、ERNIE 的情感分析等。 本书适合对人工智能、机器学习、深度学习和自然语言处理感兴趣的读者阅读,也可以作为应用型本科院校和高等职业院校人工智能相关专业的教材。
關於作者:
达内时代科技集团有限公司是国内知名的互联网-IT教育培训单位,是一站式互联网人才基地,专注IT职业教育人才服务多年,拥有300多家培训中心,帮助学员实现一地学习全国就业。
目錄
目 录
第 1 部分 自然语言处理基础
第 1 章 绪论 2
1.1 自然语言处理综述 3
1.1.1 自然语言处理的基本概念 3
1.1.2 自然语言处理的发展历程 4
1.1.3 自然语言处理的研究内容 5
1.1.4 自然语言处理的挑战与发展趋势 7
1.2 文本处理技能 9
1.2.1 字符串处理 9
1.2.2 中文分词及案例实现 11
1.3 文本数据处理 13
1.3.1 文本操作基础 13
1.3.2 案例实现——文本数据统计 15
1.3.3 案例实现——词云生成 17
本章总结 19
作业与练习 19
第 2 章 词向量技术 21
2.1 词向量概述 22
2.1.1 词向量基础 22
2.1.2 词向量表示的问题 22
2.2 词向量离散表示 23
2.2.1 独热编码 23
2.2.2 词袋模型 24
2.2.3 词频-逆文本频率 25
2.2.4 案例实现——文本离散表示 25
2.3 词向量分布表示 29
2.3.1 神经网络语言模型 29
2.3.2 Word2vec 模型 31
2.3.3 案例实现——中文词向量训练 33
本章总结 39
作业与练习 39
第 3 章 关键词提取 41
3.1 关键词提取概述 42
3.1.1 关键词提取基础 42
3.1.2 基于 TF-IDF 的关键词提取 42
3.1.3 基于 TextRank 的关键词提取 43
3.1.4 基于 Word2vec 词聚类的关键词提取 43
3.2 关键词提取的实现 44
3.2.1 案例介绍 44
3.2.2 案例实现——关键词提取综合案例 45
本章总结 57
作业与练习 57
第 2 部分 自然语言处理核心技术
第 4 章 朴素贝叶斯中文分类 60 4.1 朴素贝叶斯分类算法概述 60
4.1.1 概率基础 60
4.1.2 朴素贝叶斯分类器 62
4.2 机器学习库 sklearn 64
4.2.1 sklearn 获取数据 64
4.2.2 sklearn 数据预处理 64
4.2.3 sklearn 构建模型 65
4.3 案例实现——朴素贝叶斯中文分类 65
本章总结 71
作业与练习 72
第 5 章 N-gram 语言模型 73
5.1 N-gram 概述 73
5.1.1 N-gram 语言模型简介 73
5.1.2 N-gram 概率计算 74
5.1.3 案例——N-gram 的实现 75
5.2 案例实现——基于 N-gram 的新闻文本预测 77
本章总结 84
作业与练习 84
第 6 章 PyTorch 深度学习框架 85
6.1 PyTorch 基础 85
6.1.1 PyTorch 的介绍与安装 85
6.1.2 PyTorch 入门使用 87
6.1.3 梯度下降与反向传播 92
6.1.4 案例——使用 PyTorch 实现线性回归 95
6.2 PyTorch 数据加载 99
6.2.1 使用数据加载器的目的 99
6.2.2 DataSet 的使用方法 99
6.2.3 DataLoader 的使用方法 100
6.3 PyTorch 自带数据集加载 101
本章总结 102
作业与练习 102
第 7 章 FastText 模型文本分类 104
7.1 FastText 模型简介 104
7.1.1 FastText 模型原理 104
7.1.2 FastText 模型结构 105
7.1.3 FastText 模型优化 105
7.2 案例实现——FastText 模型文本分类 106
本章总结 118
作业与练习 118
第 8 章 基于深度学习的文本分类 119
8.1 基于 TextCNN 的文本分类 119
8.1.1 卷积神经网络 119
8.1.2 TextCNN 的原理 121
8.2 基于 TextRNN 的文本分类 122
8.2.1 LSTM 原理 122
8.2.2 LSTM 网络结构 123
8.3 基于 TextRCNN 的文本分类 124
8.3.1 TextRCNN 原理 124
8.3.2 TextRCNN 网络结构 125
8.4 案例实现——基于深度学习的文本分类 126
本章总结 146
作业与练习 146
第 3 部分 序列标注
第 9 章 HMM 的词性标注 148
9.1 词性标注简介 149
9.1.1 词性标注的基本概念 149
9.1.2 中文词性的分类及作用 149
9.1.3 词性标注体系 150
9.2 HMM 词性标注的原理和基本问题 151
9.2.1 HMM 词性标注的原理 151
9.2.2 HMM 的基本问题 151
9.3 案例实现——HMM 的中文词性标注 152
本章总结 158
作业与练习 158
第 10 章 HMM 的命名实体识别 159
10.1 命名实体识别 160
10.1.1 命名实体识别的概念 160
10.1.2 NER 的标注方法 160
10.2 NER 的 HMM 162
10.3 案例实现——HMM 的中文命名实体识别 162
本章总结 175
作业与练习 175
第 11 章 BiLSTM-CRF 的命名实体识别 176
11.1 CRF 简介 177
11.1.1 CRF 的基本概念 177
11.1.2 BiLSTM 的命名实体识别 177
11.1.3 CRF 的命名实体识别 178
11.2 BiLSTM-CRF 的原理 179
11.3 案例实现——BiLSTM-CRF 的中文命名实体识别 180
本章总结 189
作业与练习 189
第 4 部分 预训练模型
第 12 章 ALBERT 的命名实体识别 192
12.1 预训练模型简介 193
12.1.1 预训练模型的基本概念 193
12.1.2 经典的预训练模型 193
12.2 预训练模型 Hugging Face 195
12.2.1 Hugging Face 简介 195
12.2.2 案例实现——使用 Hugging Face完成情感分析 196
12.3 案例实现——ALBERT 的中文命名实体识别 198
本章总结 207
作业与练习 207
第 13 章 Transformer 的文本分类 209
13.1 Transformer 概述 210
13.1.1 Encoder-Decoder 模型 210
13.1.2 Transformer 简介 210
13.1.3 Transformer 总体结构 211
13.2 Self-Attention 机制 213
13.2.1 Self-Attention 机制的原理 213
13.2.2 Self-Attention 的计算过程 214
13.2.3 位置编码和 Layer Normalization 215
13.3 案例实现——Transformer 的文本分类 217
本章总结 234
作业与练习 234
第 14 章 BERT 的文本相似度计算 236
14.1 文本相似度简介 237
14.1.1 文本相似度的应用场景 237
14.1.2 文本相似度计算的方法 237
14.2 BERT 的文本相似度简介 238
14.3 案例实现——BERT 的文本相似度计算 239
本章总结 251
作业与练习 251
第 15 章 ERNIE 的情感分析 253
15.1 情感分析简介 254
15.1.1 情感分析的基本概念 254
15.1.2 情感分析的方法 254
15.2 ERNIE 简介 255
15.3 案例实现——ERNIE 的中文情感分析 257
本章总结 271
作业与练习 272
內容試閱
前 言
语言是同类生物之间由于沟通需要而形成的具有统一编码、解码标准的指令。语言的魅力和独特性在于不同的语境也会赋予语言不同的意义,需要匹配相应的逻辑思维去理解。自然语言是人们交流情感最基本、最直接、最方便的表达工具,人们日常使用的汉语、英语、法语等都是自然语言,它是随着人类社会发展演变而来的。概括来讲,自然语言是指人类社会约定俗成的,区别于人工语言(如程序设计语言等)的语言。时至今日,计算机作为服务人的工具,人们更希望能用和人交流的方式与计算机进行交流,让计算机理解人类的语言,懂得人类的意图和心声。于是,让机器理解自然语言受到了无数优秀的学者和科研人员的关注,最终发展为人工智能领域的一个重要分支——自然语言处理。
现如今,自然语言处理技术已经取得了长足的进步,而且自然语言处理技术不断与语音识别、语音合成等语音技术相互渗透结合形成新的研究分支。我们平时常用的搜索引擎、新闻推荐、智能音箱等产品,都是以自然语言处理技术为核心的人工智能产品。同时,随着计算机及相关技术的发展和算力的提升,以及互联网的爆炸式发展和图形处理器(GPU)算力的进一步提升,自然语言处理迈入了深度学习时代,越来越多的自然语言处理技术趋于成熟并显现出巨大的商业价值。
? 机器翻译:机器翻译指的是实现一种语言到另一种语言的自动翻译。目前,谷歌翻译、百度翻译、搜狗翻译等行业巨头推出的翻译平台占据了翻译行业的主导地位。
? 问答系统:问答系统是指计算机利用计算系统理解人提出的问题,并根据自动推理等手段,在已有的知识资源中进行检索、匹配,将获取的结果反馈给用户的系统。问答系统在智能客服和搜索引擎中得到了广泛的应用。
? 情感分析:情感分析可以定义为一个分类问题,即指定一个文本输入,计算机通过对文本进行分析、处理和归纳后自动判断文本的情感类别。情感分析在推荐系统中体现出了巨大的商业价值。
? 信息抽取:信息抽取是指从文本或海量文本中抽取用户感兴趣的信息的技术。
? 文本摘要:文本摘要是指将原文档的主要内容或某方面的信息自动提取出来,形成原文档的摘要和缩写的技术。
随着自然语言处理技术的不断发展,国内外自然语言处理应用型人才的缺口也逐年增大。
究其原因,一方面源于近几年各行业对自然语言处理领域人才的需求快速增加;另一方面自然语言处理是综合性学科,涉及高等数学、概率论、信息学、计算机科学等众多学科,因此其入门门槛较高,需要技术人员掌握人工智能相关的多种理论基础和模型算法。市面上大多数自然语言处理方面的书籍也都更注重理论基础的讲解,案例方面的书籍相对较少。无可厚非,理论知识是掌握自然语言处理必不可少的基础,但案例实战同样是应用型人才应该具备的素质,也是帮助学习者更好地理解理论知识的最佳方式。为此,达内时代科技集团将以往与自然语言处理相关的项目经验、产品应用和技术知识整理成册,通过本书来总结和分享自然语言处理领域的实践成果。我们衷心希望本书能为读者开启自然语言处理之门!
本书内容
本书围绕自然语言处理的基本概念、基础技术、核心技术和预训练模型等内容进行讲解,理论联系实际,采用大量丰富案例,力求深入浅出,帮助读者快速理解自然语言处理相关模型和算法的基本原理与关键技术。本书既适合本科院校和高职院校的学生学习使用,也适合不同行业的自然语言处理爱好者阅读。在内容编排上,本书的每章都具备一定的独立性,读者可以根据自身情况进行选择性阅读;同时各章之间循序渐进地形成有机整体,使全书内容不失系统性与完整性。本书包含以下章节。
? 第 1 部分(第 1~3 章):自然语言处理基础。该部分首先介绍自然语言处理的相关概念和基本技能,然后介绍词向量技术和实现方法,最后介绍关键词提取技术的具体实现。
? 第 2 部分(第 4~8 章):自然语言处理核心技术。该部分主要介绍使用机器学习和深度学习实现文本分类,如用机器学习中的朴素贝叶斯算法实现中文文本分类,基于 N-gram语言模型实现新闻文本预测;深度学习部分内容介绍了 PyTorch 框架的使用,FastText模型文本分类和基于深度学习算法的文本分类。
? 第 3 部分(第 9~11 章):序列标注。该部分介绍序列标注的具体应用,如 HMM 的词性标注和 HMM 的命名实体识别等常见的自然语言处理应用,首先使用 HMM 算法分别实现中文文本的词性标注和中文命名实体识别,最后介绍 BiLSTM-CRF 的命名实体识别。
? 第 4 部分(第 12~15 章):预训练模型。随着自然语言处理技术的发展,预训练模型在很大程度上促进了自然语言处理的发展,这部分内容介绍预训练模型的具体应用,如使用 ALBERT 实现命名实体识别、使用 Transformer 实现中文文本分类、使用 BERT 实现文本相似度计算、使用 ERNIE 实现情感分析等。
书中理论知识与实践的重点和难点部分均采用微视频的方式进行讲解,读者可以通过扫描每章中的二维码观看视频、查看作业与练习的答案。
另外,更多的视频等数字化教学资源及最新动态,读者可以关注微信公众号,或者添加小书童获取资料与答疑等服务。

高慧强学 AI 研究院微信公众号 高慧强学微信公众号 达内教育研究院 小书童
致谢
本书是达内时代科技集团人工智能研究院团队通力合作的成果。全书由韩少云、冯华、刁景涛策划、组织并统稿,参与本书编写工作的有达内集团及院校的各位老师,他们为相关章节材料的组织与选编做了大量细致的工作,在此对各位编者的辛勤付出表示由衷的感谢!
感谢电子工业出版社的老师们对本书的重视,他们一丝不苟的工作态度保证了本书的质量。
为读者呈现准确、翔实的内容是编者的初衷,但由于编者水平有限,书中难免存在不足之处,敬请读者批评指正。
编 者
2023 年 2 月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.