登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書

『簡體書』藏文文本分析与挖掘技术研究

書城自編碼: 3615512
分類:簡體書→大陸圖書→文化传统文化
作者: 艾金勇,陈小莹
國際書號(ISBN): 9787564375904
出版社: 西南交通大学出版社
出版日期: 2021-04-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 110.0

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
东线炼狱 : 德国反坦克兵的东线日记 : 1941—1942
《 东线炼狱 : 德国反坦克兵的东线日记 : 1941—1942 》

售價:HK$ 94.2
献给皇帝的礼物:Wedgwood瓷器王国与漫长的十八世纪
《 献给皇帝的礼物:Wedgwood瓷器王国与漫长的十八世纪 》

售價:HK$ 127.4
东京札记
《 东京札记 》

售價:HK$ 151.0
大学问·明代国家权力结构及运行机制
《 大学问·明代国家权力结构及运行机制 》

售價:HK$ 139.2
蹇蹇录:甲午战争外交秘录
《 蹇蹇录:甲午战争外交秘录 》

售價:HK$ 57.8
佛教文化十八讲
《 佛教文化十八讲 》

售價:HK$ 89.7
背弃圣约:处于考验中的美国公民宗教(社会学名著译丛)
《 背弃圣约:处于考验中的美国公民宗教(社会学名著译丛) 》

售價:HK$ 46.0
卖掉法拉利的高僧
《 卖掉法拉利的高僧 》

售價:HK$ 70.9

 

內容簡介:
本书为专著,以藏文文本处理为核心任务,从理论到实践阐述了大数据环境下藏文文本类型数据的分析方法,探讨了当前主流的文本挖掘技术以及这些技术在藏文文本分析处理中的具体应用。书中阐述了藏文字符处理、词汇分析、句法分析、藏文文本表示、藏文文本分类、藏文文本聚类、藏文信息抽取等藏文文本分析与文本挖掘方面的理论与方法;书中提出的相关技术方法可以直接用于解决藏文文本分析与文本挖掘的问题。本书可作为高校藏文信息处理相关方向研究生的教材或参考书,也可以作为从事藏语自然语言处理应用研究领域专业研究人员的参考资料。
關於作者:
艾金勇,西藏民族大学副教授;研究方向为藏文信息处理、数字图书馆技术;近年来参与多项国家级和西藏自治区级项目,主持西藏自治区级项目2项;发表论文30余篇,其中核心期刊论文7篇;
陈小莹,西藏民族大学讲师;
目錄
第1章绪论
1.1藏文概述
1.1.1藏文文字的性质
1.1.2藏文文法的主要内容
1.2藏文文本特征
1.2.1藏文文字特征
1.2.2藏文词语特征
1.2.3藏文句子特征
1.3藏文编码标准情况
1.3.1ASCII码
1.3.2中文字符的编码
1.3.3藏文字符编码国家标准
1.3.4国际字符编码UNICODE及藏文字符编码国际标准
1.4藏文文本挖掘
1.4.1文本挖掘基本概念
1.4.2文本挖掘主要技术
1.4.3文本挖掘的一般过程
1.4.4文本挖掘面临的困难
第2章藏文字符处理
2.1藏字的结构
2.1.1藏字的结构分析
2.1.2藏字的构件
2.2藏文字符输入技术
2.2.1藏文字符键盘编码理论
2.2.2藏文字符键盘设计分析
2.2.3藏文字符键盘布局国家标准
2.2.4Windows藏文字符键盘输入技术
2.3藏文文字的规范化处理
2.3.1特殊符号的归一化
2.3.2外借词的藏文化处理
2.3.3黏着语的规范化处理
2.4藏文文字的结构识别
2.4.1小字符集编码的藏文音节结构
2.4.2现代藏文音节正字法知识
2.4.3藏文文字结构的辨识
2.4.4藏文音节构件的确定算法
第3章藏文词法分析
3.1藏文词法分析概述
3.1.1藏文词法分析研究的问题
3.1.2词法分析研究面临的困难
3.1.3一体化藏文词法分析框架
3.1.4藏文词法分析的意义与作用
3.1.5藏文词法分析的目标
3.2藏文自动分词
3.2.1藏文自动分词概述
3.2.2藏文分词的方法
3.2.3基于条件随机场的藏文分词方法值
3.2.4藏文未登录词的处理方法
3.3藏文词性标注
3.3.1藏文词类标记集
3.3.2基于最大熵模型的藏文词性标注
3.4藏族人名识别
3.4.1藏族人名的结构
3.4.2藏族人名的特点
3.4.3藏族人名的识别策略
3.4.4基于词位的藏族人名识别方法
3.4.5基于条件随机场的藏族人名识别
3.5藏文词处理方法测评
3.5.1黄金标准
3.5.2评价指标
第4章藏文句法分析
4.1句法分析概述
4.1.1句法分析概念
4.1.2句法分析基本策略
4.2藏文句子概述
4.2.1藏文句子概念
4.2.2藏文句子特点
4.2.3藏文句尾词性特征分析
4.3藏文句子类别
4.3.1藏文句子分类
4.3.2藏文句子基本结构
4.3.3藏文句型分类
4.3.4藏文句型功能特征分析
4.4藏文句法分析
4.4.1句法分析概述
4.4.2基于概率上下文无关文法的藏语句法分析
4.4.3藏文依存句法分析
第5章藏文文本表示模型研究
5.1文本表示概述
5.2文本特征项
5.3文本特征表示方法
5.3.1基于字的特征表示法
5.3.2基于词的特征表示法
5.3.3基于短语的特征表示法
5.3.4基于概念的特征表示法
5.4藏文文本表示方法研究
第6章藏文文本分类算法研究
6.1文本分类概述
6.1.1文本分类定义
6.1.2自动文本分类
6.1.3文本分类的基本流程
6.1.4文本分类的应用领域
6.2文本特征提取方法
6.2.1率统计法
6.2.2互信息法
6.2.3信息增益法
6.2.4卡方检验法
6.2.5其他方法
6.3文本分类算法
6.3.1朴素贝叶斯模型
6.3.2支持向量机算法
6.3.3KNN算法
6.4算法性能评价
6.4.1二元分类评价
6.4.2多类问题评价
6.5藏文文本分类算法研究
6.5.1基于朴素贝叶斯的藏文文本分类研究
6.5.2基于KNN模型的藏文文本分类研究
6.5.3基于SVM:的藏文文本分类研究
第7章藏文文本聚类算法研究
7.1文本聚类概述
7.1.1文本聚类的概念
7.1.2文本聚类的任务
7.1.3文本分类的应用领域
7.2文本聚类分析的常用特征表示
7.3文本相似性度量
7.3.1样本间的相似性
7.3.2簇间的相似性
7.3.3样本与簇间的相似性
7.4文本聚类方法
7.4.1划分聚类方法
7.4.2层次聚类方法
7.4.3密度聚类方法
7.4.4基于模型的聚类
7.4.5竞争聚类类型
7.5聚类算法性能评估
7.6藏文文本聚类方法
第8章藏文web文本挖掘方法研究
8.1web文本挖掘概述
8.1.1web文本数据应用及特点
8.1.2web文本挖掘及挖掘类型
8.1.3web文本挖掘过程
8.2网页结构特点
8.2.1网页特征
8.2.2N页结构
8.2.3网页架构
8.3web文本信息获取方式
8.3.1网络爬虫
8.3.2其他web信息程序获取方式
8.3.3web文本信息抽取
8.3.4自然语言文本结构化信息抽取
8.4web信息文本抽取相关知识
8.4.1XPath技术
8.4.2解析模板以及解析模板的生成技术
8.5藏文网页文本主题信息抽取算法实现
8.5.1藏文网页规范化处理
8.5.2藏文网页标签的线性重构
8.5.3藏文网页正文抽取算法实现
8.5.4藏文网页主题抽取算法实现
参考文献

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.