新書推薦:
《
真谛全集(共6册)
》
售價:HK$
1156.4
《
敦煌通史:魏晋北朝卷
》
售價:HK$
162.3
《
唯美手编16:知性优雅的编织
》
售價:HK$
54.9
《
情绪的惊人力量:跟随内心的指引,掌控情绪,做心想事成的自己
》
售價:HK$
50.4
《
棉的全球史(历史·文化经典译丛)
》
售價:HK$
109.8
《
超越百岁看这本就够了
》
售價:HK$
55.8
《
亚洲戏剧史·南亚卷
》
售價:HK$
143.4
《
中国历代竹器图谱与数字活化
》
售價:HK$
557.8
|
內容簡介: |
专业领域知识体系构建系统:针对研究数字化、网络化环境检索、利用化工知识的需要,通过领域本体构建等信息技术的融合与集成,将化学工业的领域知识合理分类,构建以化学化工知识点为基本单元的图书全文数据库,为科学研究、技术开发、工程设计、工程应用、技术咨询和专业学习用户提供知识服务,实现智能检索与知识语义导航,实现知识的共享与重用。
护理科学大数据平台:利用大数据处理技术、自然语言处理技术、机器学习方法对已有公认领域知识进行重构利用,在构建领域本体的基础上,利用语义标注技术实现资源结构化、语义化处理,为护理领域的从业人员提供资讯、科研、评价专业知识服务。系统主要功能包括行业前沿热点资讯、知识检索、科研报告、行业报告、对比式摘要、人才评价、期刊评价、机构评价等。
本书的具体研究内容如下。
①情报工程基础框架(第1章),阐述情报工程的基础框架,从文本到情报的处理过程中涉及的主要步骤流程。
②情报工程基本模型与算法(第2章),阐述从文本到情报的处理过程中涉及的主要模型与算法,包括结构化学习模型、主题发现模型、特征选择算法等。专业领域知识体系构建系统:针对研究数字化、网络化环境检索、利用化工知识的需要,通过领域本体构建等信息技术的融合与集成,将化学工业的领域知识合理分类,构建以化学化工知识点为基本单元的图书全文数据库,为科学研究、技术开发、工程设计、工程应用、技术咨询和专业学习用户提供知识服务,实现智能检索与知识语义导航,实现知识的共享与重用。
护理科学大数据平台:利用大数据处理技术、自然语言处理技术、机器学习方法对已有公认领域知识进行重构利用,在构建领域本体的基础上,利用语义标注技术实现资源结构化、语义化处理,为护理领域的从业人员提供资讯、科研、评价专业知识服务。系统主要功能包括行业前沿热点资讯、知识检索、科研报告、行业报告、对比式摘要、人才评价、期刊评价、机构评价等。
本书的具体研究内容如下。
①情报工程基础框架(第1章),阐述情报工程的基础框架,从文本到情报的处理过程中涉及的主要步骤流程。
②情报工程基本模型与算法(第2章),阐述从文本到情报的处理过程中涉及的主要模型与算法,包括结构化学习模型、主题发现模型、特征选择算法等。
③情报工程技术平台(第3章),阐述以知识组织、数据驱动为核心的情报工程处理支撑平台建设思路,以及情报工程技术平台的主要功能。
④对比式摘要自动生成(第4章),研究对比式摘要自动生成相关的方法与技术,包括模型定义、资源获取、话题信息挖掘、摘要生成等。
⑤面向领域的研究综述自动生成(第5章),研究面向领域的研究综述自动生成的方法与技术,包括模型构建、资源搜集原则及评价方法等。
⑥基于视频的文本摘要自动生成(第6章),研究基于视频的文本摘要自动生成的方法与技术,包括视频结构化分析技术、视频语义分析技术、文本摘要生成技术等。
⑦行业报告自动生成(第7章),研究行业报告自动生成的方法与技术,包括模型构建、指标设计、指标配置、指标统计等。
本书在编写过程中,参阅了大量的图书和文献,汲取了很多精髓,特别是引用了部分图表、数据等,在此向有关作者表示诚挚的感谢。在研究过程中也得到诸多业界专家、领导、同事的帮助和支持,在此一并致谢。笔者的硕士研究生黄毅、杨雨青、帅远华、李泽垚、朱文文、张琢不同程度地参与了前期的数据处理工作;硕士研究生邢玉艳、谢若昀、房小玮、张华珺、王亭亭、刘茹、李冠霖分别在系统测试及案例实现中做了大量的工作,在此一并表示感谢。同时,也向开发团队人员及出版校对人员表示感谢。
|
目錄:
|
第1章 情报工程基础框架 1
1.1 资源结构化 2
1.1.1 文本结构化 2
1.1.2 视频结构化 5
1.2 资源语义化 13
1.2.1 文本语义化 13
1.2.2 视频语义化 16
1.3数据可视化 23
1.3.1 基于统计图表的可视化 24
1.3.2 基于拓扑结构的可视化 30
1.3.3 基于聚类结构的可视化 31
1.3.4 基于标签云的可视化 31
1.4 本章小结 32
第2章 情报工程基本模型与算法 33
2.1 相似度模型 33
2.1.1 Word2Vec模型 33
2.1.2 Doc2Vec模型 40
2.1.3 LDA模型 46
2.2 概率模型与算法 53
2.2.1 CRF模型 54
2.2.2 TF-IDF算法 59
2.2.3 BM25算法 64
2.3 排序算法 67
2.3.1 PageRank算法 68
2.3.2 TextRank算法 74
2.4 视频图像处理模型与算法 85
2.4.1 感知哈希算法 85
2.4.2 FAST角点检测算法 91
2.4.3 直方图比较法 96
2.5 本章小结 107
第3章 情报工程技术平台 109
3.1 平台技术 109
3.1.1 网络信息采集平台 110
3.1.2 资源交换平台 113
3.1.3 Schema管理平台 115
3.1.4 资源加工平台 117
3.1.5 本体构建平台 121
3.2 系统功能 127
3.2.1 资讯查看 128
3.2.2 知识检索 128
3.2.3 科研服务 132
3.3 平台运行软硬件环境 138
3.4 本章小结 138
第4章 对比式摘要自动生成 140
4.1 思路与框架 140
4.2 开放平台领域话题知识与文献处理 143
4.2.1 领域话题知识处理 143
4.2.2 领域科学文献处理 147
4.2.3 双话题比较信息挖掘 148
4.3 比较摘要生成步骤 153
4.3.1 结合先验知识的子主题排序 153
4.3.2 结合文献外部信息的候选句排序 154
4.3.3 摘要文本生成 155
4.4 实验与分析 155
4.5 本章小结 156
第5章 面向领域的研究综述自动生成 157
5.1 思路与框架 157
5.1.1 文献综述的定义 158
5.1.2 文献综述的结构 159
5.2 资源语义化处理 159
5.2.1 领域本体构建 159
5.2.2 语义标签自动标注 161
5.3 综述生成流程步骤 162
5.3.1 综述基础模型构建 162
5.3.2 综述模板构建 166
5.3.3 综述标题与内容生成 166
5.4 自动综述的结果评价 170
5.4.1 自动摘要的评价方法 170
5.4.2 自动综述的评价方法 172
5.4.3 实验与分析 175
5.5 本章小结 176
第6章 基于视频的文本摘要自动生成 177
6.1 思路与框架 177
6.2 视频资源结构化处理 178
6.2.1 视频镜头分割 179
6.2.2 视频关键帧提取 180
6.3 视频资源语义分析 182
6.3.1 视频关键帧分类 182
6.3.2 视频主题单元划分 186
6.4 视频摘要生成流程 187
6.4.1 主题单元文本预处理 190
6.4.2 节点边权值计算 190
6.4.3 节点权重计算 192
6.4.4 节点权重优化 193
6.4.5 主题排序与摘要句抽取 195
6.4.6 摘要生成 196
6.5 实验与分析 198
6.5.1 摘要结果对比 198
6.5.2 评价标准 199
6.5.3 评价指标对比与分析 199
6.6 本章小结 201
第7章 行业报告自动生成 202
7.1 思路与框架 202
7.2 异构资源处理 203
7.2.1 科技文献解析标准 204
7.2.2 综合资源模板 204
7.2.3 资源解析实例 206
7.2.4 简单字段统计实例 207
7.3 行业报告生成流程 209
7.3.1 模板设计 209
7.3.2 指标设计 212
7.4 实验与分析 218
7.5 本章小结 222
附录 运行算法具体示例 223
图表目录 237
参考文献 245
|
|