登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書

『簡體書』自然语言处理与计算语言学

書城自編碼: 3527186
分類:簡體書→大陸圖書→計算機/網絡程序設計
作者: [法] 格夫·斯里尼瓦萨-,德西坎[Bhargav,Srin
國際書號(ISBN): 9787115540249
出版社: 人民邮电出版社
出版日期: 2020-08-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 77.9

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
粤港澳大湾区蓝皮书:粤港澳大湾区建设报告(2023)
《 粤港澳大湾区蓝皮书:粤港澳大湾区建设报告(2023) 》

售價:HK$ 225.6
邂逅晚清——中美的对望与凝视(罕见国内作者所著全面反映晚清中美交往历史的通俗作品)
《 邂逅晚清——中美的对望与凝视(罕见国内作者所著全面反映晚清中美交往历史的通俗作品) 》

售價:HK$ 105.6
广东当代金融史:全三册
《 广东当代金融史:全三册 》

售價:HK$ 717.6
养育的觉醒:全面激发孩子自驱力,教你如何心平气和做妈妈
《 养育的觉醒:全面激发孩子自驱力,教你如何心平气和做妈妈 》

售價:HK$ 58.8
1368:历史岔道口的抉择与国运盛衰
《 1368:历史岔道口的抉择与国运盛衰 》

售價:HK$ 69.6
全球城市发展报告2023:基于全球城市网络的合作与竞争
《 全球城市发展报告2023:基于全球城市网络的合作与竞争 》

售價:HK$ 273.6
为什么只见树木不见森林:从简单现象到复杂系统
《 为什么只见树木不见森林:从简单现象到复杂系统 》

售價:HK$ 94.8
大英帝国的兴衰:全景式俯瞰英国千年历史沧桑剧变,回首日不落帝国的初升、辉煌与没落
《 大英帝国的兴衰:全景式俯瞰英国千年历史沧桑剧变,回首日不落帝国的初升、辉煌与没落 》

售價:HK$ 117.6

 

編輯推薦:
1.Python开源社区资深供稿人撰写,基于Python语言 2.计算语言学领域为数不多的作品之一 3.文本分析实用指南 4.技术实用性强,侧重于技术细节的实现 5.平衡了理论与实战案例之间的关系,可以在掌握理论知识的同时,运行自己的自然语言处理项目 6.提供源码下载 使用Python和开源工具可以非常方便地进行现代文本分析,因此,在这个文本数据时代有必要掌握现代文本分析的方法。 本书介绍了如何使用自然语言处理和计算语言学算法对所拥有的数据进行推理并获得洞察力。这些算法以统计机器学习和人工智能技术为基础。现在,使用了这些算法的工具唾手可得,并可在Python、Gensim和spaCy等工具中使用。 本书从数据清理开始介绍,然后介绍了计算语言学的相关概念。在掌握了这些内容之后,接下来就可以使用真实的语言和文本,并借助Python来探索统计NLP和深度学习的更复杂领域。你将学到如何使用合适的工具来标注、解析和建模文本,并掌握相应框架工具的使用知识,还将知道何时选为主题模型选择Gensim这样的工具,以及何时使用Keras进行深度学习。 本书很好地平衡了理论与实战案例之间的关系,因此你可以在
內容簡介:
自然语言处理是一门融语言学、计算机科学、数学于一体的科学,研究人与计算机之间用自然语言进行有效通信的各种理论和方法。计算语言学是指通过建立形式化的数学模型来分析、处理自然语言,并在计算机上用程序来实现分析和处理的过程,旨在以机器来模拟人的部分或全部语言能力的目的。 《自然语言处理与计算语言学》作为一本借助于Python编程语言以及各种开源工具(如Gensim、spaCy等)来执行文本分析、自然语言处理和计算语言学算法的图书,从应用层面介绍了相关的理论知识和所涉及的技术。《自然语言处理与计算语言学》共分为15章,其内容涵盖了文本分析的定义、使用Python进行文本分析的技巧、spaCy语言模型、Gensim工具、词性标注及其应用、NER标注及其应用、依存分析、主题模型、高级主题建模、文本聚类和文本分类、查询词相似度计算和文本摘要、词嵌入、使用深度学习处理文本、使用Keras和spaCy进行深度学习、情感分析与聊天机器人的原理介绍等。 《自然语言处理与计算语言学》适合对自然语言处理的实现细节感兴趣的Python程序开发人员阅读。如果读者具备统计学的基本知识,对学习本书内容会大有裨益。
關於作者:
Bhargav Srinivasa-Desikan 是就职于法国INRIA公司(位于里尔)的一名研究人员。作为MODAL(数据分析与机器建模)小组的一员,致力于度量学习、预测聚合和数据可视化等研究领域。同时,他也是Python开源社区的一名活跃贡献者,在2016年度Google的夏季编程赛上,他通过Gensim实现了动态主题模型。Bhargav是欧洲和亚洲PyCons和PyDatas的常客,并使用Python进行文本分析教学。他也是Python机器学习软件包pycobra的维护者,还在Machine Learning Research杂志上发表过相关文章。
目錄
第 1章 什么是文本分析 1
1.1 什么是文本分析 1
1.2 搜集数据 5
1.3 若输入错误数据,则输出亦为错误数据(garbage in,garbage out) 8
1.4 为什么你需要文本分析 9
1.5 总结 11
第 2章 Python文本分析技巧 12
2.1 为什么用Python来做文本分析 12
2.2 用Python进行文本操作 14
2.3 总结 18
第3章 spaCy语言模型 19
3.1 spaCy库 19
3.2 spaCy的安装步骤 21
3.3 故障排除 22
3.4 语言模型 22
3.5 安装语言模型 23
3.6 安装语言模型的方式及原因 25
3.7 语言模型的基本预处理操作 25
3.8 分词 26
3.9 词性标注 28
3.10 命名实体识别 29
3.11 规则匹配 30
3.12 预处理 31
3.13 总结 33
第4章 Gensim:文本向量化、向量变换和n-grams的工具 34
4.1 Gensim库介绍 34
4.2 向量以及为什么需要向量化 35
4.3 词袋(bag-of-words) 36
4.4 TF-IDF(词频-反向文档频率) 37
4.5 其他表示方式 38
4.6 Gensim中的向量变换 38
4.7 n-grams及其预处理技术 42
4.8 总结 44
第5章 词性标注及其应用 45
5.1 什么是词性标注 45
5.2 使用Python实现词性标注 49
5.3 使用spaCy进行词性标注 50
5.4 从头开始训练一个词性标注模型 53
5.5 词性标注的代码示例 57
5.6 总结 59
第6章 NER标注及其应用 60
6.1 什么是NER标注 60
6.2 用Python实现NER标注 64
6.3 使用spaCy实现NER标注 67
6.4 从头开始训练一个NER标注器 72
6.5 NER标注应用实例和可视化 77
6.6 总结 79
第7章 依存分析 80
7.1 依存分析 80
7.2 用Python实现依存分析 85
7.3 用spaCy实现依存分析 87
7.4 从头开始训练一个依存分析器 91
7.5 总结 98
第8章 主题模型 99
8.1 什么是主题模型 99
8.2 使用Gensim构建主题模型 101
8.3 隐狄利克雷分配(Latent Dirichlet Allocation) 102
8.4 潜在语义索引(Latent Semantic Indexing) 104
8.5 分层狄利特雷过程(Hierarchical Dirichlet Process) 105
8.6 动态主题模型 108
8.7 使用scikit-learn构建主题模型 109
8.8 总结 112
第9章 高级主题建模 113
9.1 高级训练技巧 113
9.2 探索文档 117
9.3 主题一致性和主题模型的评估 121
9.4 主题模型的可视化 123
9.5 总结 127
第 10章 文本聚类和文本分类 128
10.1 文本聚类 128
10.2 聚类前的准备工作 129
10.3 K-means 132
10.4 层次聚类 134
10.5 文本分类 136
10.6 总结 138
第 11章 查询词相似度计算和文本摘要 139
11.1 文本距离的度量 139
11.2 查询词相似度计算 145
11.3 文本摘要 147
11.4 总结 153
第 12章 Word2Vec、Doc2Vec和Gensim 154
12.1 Word2Vec 154
12.2 用Gensim实现Word2Vec 155
12.3 Doc2Vec 160
12.4 其他词嵌入技术 166
12.5 总结 172
第 13章 使用深度学习处理文本 173
13.1 深度学习 173
13.2 深度学习在文本上的应用 174
13.3 文本生成 177
13.4 总结 182
第 14章 使用Keras和spaCy进行深度学习 183
14.1 Keras和spaCy 183
14.2 使用Keras进行文本分类 185
14.3 使用spaCy进行文本分类 191
14.4 总结 201
第 15章 情感分析与聊天机器人 202
15.1 情感分析 202
15.2 基于Reddit的新闻数据挖掘 205
15.3 基于Twitter的微博数据挖掘 207
15.4 聊天机器人 209
15.5 总结 217

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.