《基于半监督与集成学习的文本分类方法》 - 唐焕玲 - Meg Book Store - 香港.大書城

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台( 0 )　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

會員書架精選

2023年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

四月出版：大陸書台灣書
三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書
12月出版：大陸書台灣書
11月出版：大陸書台灣書
十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書
七月出版：大陸書台灣書
六月出版：大陸書台灣書
五月出版：大陸書台灣書
四月出版：大陸書台灣書
三月出版：大陸書台灣書
二月出版：大陸書台灣書

『簡體書』基于半监督与集成学习的文本分类方法

書城自編碼： 2128075
分類：簡體書→大陸圖書→計算機/網絡→家庭與辦公用書
作者：唐焕玲
國際書號(ISBN)： 9787121212567
出版社：电子工业出版社
出版日期： 2013-09-01
版次： 1 印次： 1
頁數/字數： 188/205000
書度/開本： 32开釘裝：平装

售價：HK$ 76.9

我要買件

** 我創建的書架 **
未登入.

新書推薦：

大洗牌

《大洗牌》
售價：HK$ 93.6

亚洲经济发展与模式分析

《亚洲经济发展与模式分析》
售價：HK$ 106.8

浅尝难止（全2册）

《浅尝难止（全2册）》
售價：HK$ 78.0

零基础制作栩栩如生的立体纸艺花

《零基础制作栩栩如生的立体纸艺花》
售價：HK$ 58.8

第三帝国图文史（修订版）：纳粹德国浮沉实录（彩色精装典藏版）

《第三帝国图文史（修订版）：纳粹德国浮沉实录（彩色精装典藏版）》
售價：HK$ 201.6

四大会计师事务所：历史秘辛与未来挑战

《四大会计师事务所：历史秘辛与未来挑战》
售價：HK$ 82.8

中国社会经济史

《中国社会经济史》
售價：HK$ 106.8

犯罪心理X档案：法医精神科医生真实办案手记（第一季）法医精神科医师心理解剖手记

《犯罪心理X档案：法医精神科医生真实办案手记（第一季）法医精神科医师心理解剖手记》
售價：HK$ 57.6

建議一齊購買：

+

HK$ 30.8
《中文文本自动分词和标注》

+

HK$ 176.8
《基于支持向量机的聚类及文本分类关键技术研究》

+

HK$ 53.0
《半监督学习》

+

HK$ 177.0
《智能信息处理——汉语语料库加工技术及应用》

內容簡介：

文本分类技术广泛应用于新闻媒体、网络期刊文献、数字图书馆、互联网等领域，是人类处理海量文本信息的重要手段。
本书重点探讨了利用信息论中的评估函数量化特征权值的方法；基于权值调整改进Co-training的算法；利用互信息或CHI统计量构造特征独立模型，进行特征子集划分的方法；基于投票熵维护样本权重的BoostVE分类模型；融合半监督学习和集成学习的SemiBoost-CR分类模型。
其中特征选择和权值调整方法、基于特征独立模型划分特征子集的方法适用于文本分类，其他算法不仅适用于文本分类，对机器学习和数据挖掘的其他研究也有较大的参考价值和借鉴作用。

關於作者：

山东工商学院计算机科学与技术学院

目錄：

第1章绪论 1
1.1 研究背景及意义 1
1.1.1 数据挖掘和文本挖掘 1
1.1.2 文本分类及其面临的问题 3
1.2 国内外相关研究 7
1.2.1 半监督学习 7
1.2.2 集成学习 10
1.3 本书内容组织 14
第2章文本分类技术概述 17
2.1 文本分类预处理 17
2.2 文本的表示 19
2.3 特征选择 21
2.3.1 初始特征选择 22
2.3.2 特征选择算法 22
2.4 文本分类算法 24
2.4.1 质心向量分类算法 24
2.4.2 K近邻分类算法 26
2.4.3 贝叶斯分类算法 27
2.4.4 关联规则分类算法 33
2.4.5 支持向量机 33
2.4.6 其他分类算法 37
2.5 实验数据集 38
2.6 分类模型的评估方法 39
2.7 本章小结 41
第3章 TEF-WA权值调整技术 42
3.1 特征选择存在的问题 42
3.2 TEF-WA权值调整技术 43
3.2.1 TEF-WA权值调整的基本思想 43
3.2.2 各种评估函数的TEF-WA权值调整 45
3.3 实验结果与分析 48
3.3.1 TEF-WA权值调整的有效性 48
3.3.2 不同评估函数的权值调整 52
3.3.3 评估比较 62
3.4 本章小结 68
第4章结合TEF-WA技术的Co-training改进算法 69
4.1 Co-training算法及其存在的问题 69
4.2 基于TEF-WA的特征多视图 70
4.2.1 TEF-WA技术 70
4.2.2 基于TEF-WA的特征多视图 71
4.3 基分类器间的差异性评估 72
4.4 TV-SC算法与TV-DC算法 74
4.5 实验结果及其分析 76
4.6 本章小结 80
第5章基于特征独立模型的Co-training改进算法 81
5.1 特征独立模型 82
5.1.1 基于条件互信息的相互独立性 82
5.1.2 基于条件2统计量的相互独立性 83
5.1.3 特征独立模型 84
5.2 特征子集划分算法PMID 85
5.3 基于MID-Model的改进算法SC-PMID 88
5.4 实验结果及其分析 89
5.4.1 PMID-MI与PART-Rnd的实验比较 90
5.4.2 PMID-CHI与PART-Rnd的实验比较 93
5.4.3 PMID-MI、PMID-CHI和PART-Rnd的实验比较 95
5.4.4 SC-PMID-MI、SC-PMID-CHI和SC-PART-Rnd的
实验比较 96
5.5 本章小结 98
第6章基于投票信息熵和多视图的AdaBoost改进算法 99
6.1 AdaBoost算法 100
6.1.1 AdaBoost算法描述 100
6.1.2 AdaBoost提升NB文本分类器的问题 101
6.2 利用特征评估函数构造多视图 102
6.3 基于投票信息熵的样本权重维护新策略 103
6.3.1 投票信息熵 104
6.3.2 基于投票信息熵的样本权重维护新策略 105
6.3.3 样本权重对NB文本分类器的扰动 106
6.4 BoostVE算法 108
6.4.1 BoostVE算法描述 108
6.4.2 BoostVE算法的最小训练错误上界 109
6.5 实验结果及其分析 113
6.5.1 参数对BoostVE算法性能的影响 115
6.5.2 Boost VE算法与AdaBoost-MV算法、
AdaBoost算法的实验比较 118
6.5.3 BoostVE 算法提升NB文本分类器的有效性 124
6.6 本章小结 126
第7章结合半监督学习的SemiBoost-CR分类模型 128
7.1 SemiBoost-CR模型的目标函数 129
7.2 未标注样本的置信度 131
7.2.1 基于K近邻的置信度 131
7.2.2 基于最大差距的置信度 132
7.3 基于置信度的重取样策略 133
7.4 样本权重维护策略 135
7.5 SemiBoost-CR分类算法 136
7.6 实验结果及其分析 137
7.6.1 未标注近邻样本对置信度conf1的影响 139
7.6.2 两种置信度方法conf1和conf2的实验比较 140
7.6.3 topN和bottomN对SemiBoost-CR模型的影响 144
7.7 本章小结 154
第8章文本自动分类系统SECTCS 155
8.1 系统简介 155
8.2 系统总体结构 156
8.3 系统的用户界面 157
8.4 实验数据集 163
8.5 本章小结 165
结束语 166
参考文献 169

書城介紹　 |　合作申請　|　索要書目　 |　新手入門　|　聯絡方式　 |　幫助中心　|　找書說明　 |　送貨方式　|　付款方式 香港用户　 |　台灣用户　|　大陸用户　|　海外用户

megBook.com.hk

Copyright © 2013 - 2024 （香港）大書城有限公司　 All Rights Reserved.