登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書

『簡體書』大数据审计(基于Python)

書城自編碼: 4022581
分類:簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 张高煜
國際書號(ISBN): 9787121476211
出版社: 电子工业出版社
出版日期: 2024-06-01

頁數/字數: /
釘裝: 平塑

售價:HK$ 88.5

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
家书中的百年史
《 家书中的百年史 》

售價:HK$ 79.4
偏爱月亮
《 偏爱月亮 》

售價:HK$ 45.8
生物安全与环境
《 生物安全与环境 》

售價:HK$ 56.4
泥土:文明的侵蚀(城市与生态文明丛书)
《 泥土:文明的侵蚀(城市与生态文明丛书) 》

售價:HK$ 84.0
医用化学(第三版)
《 医用化学(第三版) 》

售價:HK$ 57.3
别怕,试一试
《 别怕,试一试 》

售價:HK$ 67.9
人才基因(凝聚30年人才培育经验与智慧)
《 人才基因(凝聚30年人才培育经验与智慧) 》

售價:HK$ 103.4
深度学习详解
《 深度学习详解 》

售價:HK$ 114.8

 

內容簡介:
本书为新文科教育指导思想下的金融科技编程教材,通过示例讲解Python编程在审计行业的具体应用。作者基于20多年的大学计算机教学经历与行业大数据人工智能软件开发经验,从基本的概念开始,逐步深入地介绍清洗表格数据、采集网络信息、手写票据的光学字符识别、财经文本的量化、知识图谱自动构建等热门知识要点,并通过实例给出算法原理与实现路径,同时详细介绍了代码生成的过程和结果,有助于读者真正掌握大数据审计中的Python编程思想与技术,并将其应用于自己的生产实践中。本书可作为高等院校审计、财经和金融科技等专业相关课程的教材,也可作为财经和金融科技等方面从业人员的培训用书和参考书。
目錄
第1章 审计基础与审计报告的构成1
1.1 审计概述1
1.1.1 审计概念1
1.1.2 审计目的1
1.1.3 审计风险2
1.1.4 审计证据2
1.2 会计概述2
1.2.1 会计的概念及基本假设3
1.2.2 会计信息质量要求4
1.2.3 财务会计报告简述4
1.2.4 会计科目简述5
1.3 审计报告的构成8
1.3.1 审计意见8
1.3.2 形成审计意见的基础9
1.3.3 关键审计事项10
1.3.4 其他信息10
1.3.5 管理层和治理层对财务报表的责任11
1.3.6 注册会计师对财务报表审计的责任11
1.4 智能审计国内外研究现状12
1.4.1 国外研究现状12
1.4.2 国内研究现状12
1.5 如何构建人工智能审计规则13
1.5.1 基于法律法规构建规则库14
1.5.2 基于专家经验构建规则库14
参考文献15
第2章 Python语法基础17
2.1 Python开发环境安装17
2.1.1 Anaconda的安装17
2.1.2 PyCharm的安装配置17
2.2 数据类型19
2.2.1 数字19
2.2.2 字符串19
2.2.3 列表与元组20
2.2.4 字典与集合22
2.3 语句语法24
2.3.1 变量、行、缩进与注释24
2.3.2 运算符25
2.3.3 布尔值和空值26
2.3.4 if条件语句27
2.3.5 for循环语句27
2.3.6 while循环语句28
2.3.7 break与continue29
2.4 函数与库29
2.4.1 函数的定义与调用29
2.4.2 函数的返回值与作用域30
2.4.3 常用基本函数介绍31
2.4.4 库32
2.5 文件的读与写33
2.5.1 input()函数与print()函数33
2.5.2 文件的写操作34
2.5.3 文件的读操作35
2.6 类36
2.6.1 类和对象的基本概念36
2.6.2 面向对象的特征36
2.6.3 type和isinstance37
2.7 读写数据库MySQL38
2.7.1 MySQL的安装配置38
2.7.2 Python与MySQL的交互39
参考文献41
第3章 Python科学计算与表格处理42
3.1 Python科学计算42
3.1.1 Pandas库42
3.1.2 NumPy库44
3.1.3 Pipeline44
3.2 表格处理45
3.2.1 读取表格文件45
3.2.2 表格数据的合并与拼接51
3.2.3 输出到表格文件53
第4章 数据预处理:清洗表格数据55
4.1 数据背景55
4.2 数据清洗55
4.2.1 内容替换55
4.2.2 数据类型转换58
4.2.3 删除无效数据61
4.2.4 数据创造64
4.2.5 DataFrame转换68
第5章 数据预处理:采集网络信息70
5.1 爬虫基础知识70
5.1.1 网页源代码70
5.1.2 正则表达式72
5.2 爬虫基础方式74
5.2.1 提取搜狗资讯标题、网址、日期和来源74
5.2.2 获取百度翻译结果75
5.2.3 Selenium库详解77
5.2.4 BeautifulSoup库详解80
5.3 爬虫处理方法88
5.3.1 处理数据乱码88
5.3.2 数据清洗与筛选88
5.3.3 生成数据文本文件91
5.3.4 批量爬取多家公司多页资讯91
5.3.5 基础爬虫实践92
5.3.6 Python与MySQL的交互实践93
参考文献95
第6章 数据预处理:解析财经报告96
6.1 批量下载PDF文件至指定位置96
6.2 解析单个PDF文件信息98
6.2.1 解析PDF文件的文本内容98
6.2.2 解析PDF文件的表格内容99
6.3 批量提取PDF文件信息100
6.3.1 批量输出PDF文件的文本内容100
6.3.2 筛选并转移PDF文件101
参考文献103
第7章 数据预处理:手写票据的光学字符识别104
7.1 问题场景104
7.2 表格和单元格定位108
7.2.1 解析PDF文件108
7.2.2 表格定位110
7.2.3 表格自动旋转112
7.2.4 单元格定位115
7.3 单元格配准117
7.3.1 DBSCAN聚类118
7.3.2 描述性统计120
7.3.3 模板可视化121
7.4 单元格内容识别122
7.4.1 图片预处理123
7.4.2 LSTM-RNN-CTC模型124
第8章 自然语言处理:财经文本的量化127
8.1 自然语言处理127
8.1.1 自然语言处理概述127
8.1.2 机器学习127
8.1.3 语料库128
8.1.4 HanLP环境搭建128
8.2 中文分词129
8.2.1 中文分词129
8.2.2 词典分词130
8.2.3 二元语法分词131
8.2.4 词典的构建132
8.3 命名实体识别135
8.3.1 命名实体识别135
8.3.2 基于规则的命名实体识别135
8.3.3 基于预训练模型的实体关系抽取136
8.3.4 基于依存句法分析的实体关系抽取136
8.3.5 财经文本命名实体识别137
8.4 信息提取138
8.4.1 关键词提取138
8.4.2 关键句提取139
8.4.3 情感分析140
8.5 综合训练141
参考文献142
第9章 自然语言处理:金融文本摘要143
9.1 文本摘要自动生成概述143
9.1.1 研究背景与问题定义143
9.1.2 技术分类与实现方法143
9.1.3 评价指标与数据集144
9.2 偏好构建模块145
9.2.1 获取偏好文本145
9.2.2 文本预处理145
9.2.3 LDA主题模型147
9.2.4 构建偏好语料库148
9.3 锁定段落中心句149
9.3.1 获取偏好文本关键词149
9.3.2 相似度计算150
9.3.3 提取携带偏好的段落中心句151
9.4 摘要生成模块154
9.4.1 依存句法分析154
9.4.2 结构树剪枝157
参考文献159
第10章 自然语言处理:抽取实体关系161
10.1 知识抽取任务概述161
10.1.1 知识抽取任务定义161
10.1.2 知识抽取任务分类162
10.1.3 审计领域知识抽取任务162
10.2 面向结构化数据的知识抽取163
10.3 面向非结构化数据的知识抽取164
10.3.1 深度学习与神经网络164
10.3.2 基于BERT模型的实体抽取方法165
10.3.3 关系抽取方法179
10.3.4 实体消歧186
10.3.5 实体关系抽取结果保存186
参考文献189
第11章 审计知识图谱自动构建190
11.1 知识图谱190
11.1.1 Neo4j介绍191
11.1.2 Neo4j安装教程192
11.1.3 Neo4j启动与服务器连接194
11.2 Python操作Neo4j196
11.2.1 安装py2neo包196
11.2.2 py2neo的基本用法197
11.2.3 简单图数据库编程实践分析203
11.3 审计知识图谱的实现205
11.3.1 案例分析1——读取MySQL内容创建知识图谱206
11.3.2 案例分析2——读取Excel文件数据创建审计知识图谱209
11.3.3 案例分析3-读取结构化财经文本创建审计知识图谱214
11.3.4 案例分析4-多表信息创建知识图谱219
11.3.5 案例分析5-根据原始文本自动生成知识图谱231
参考文献233
第12章 审计应用:审计规则知识库234
12.1 用一阶谓词逻辑表示法表示知识234
12.1.1 谓词逻辑概述及其特点234
12.1.2 谓词、个体和量词235
12.1.3 联结词236
12.1.4 谓词公式定义及一阶谓词逻辑表示法的特点236
12.1.5 谓词公式表示知识的步骤及方法236
12.2 审计规则知识库的设计237
12.2.1 审计规则表238
12.2.2 新审计规则表238
12.2.3 谓词逻辑表238
12.3 程序示例239
12.3.1 程序整体流程239
12.3.2 制定规则的谓词逻辑表达式239
12.3.3 设计数据表240
12.3.4 连接数据库241
12.3.5 更新替换数据表242
12.3.6 查询数据库中的数据表243
12.3.7 判断数据表中的数据是否为正确规则243
12.3.8 更新、清洗、合并数据表中的审计规则245
12.3.9 完整代码246
参考文献252
第13章 实践:综合风险审计253
13.1 审计语义网络构建253
13.1.1 审计实体定义253
13.1.2 审计关系定义254
13.2 传统审计中的逻辑推理256
13.3 审计推理机256
13.4 审计风险路径探索实战259
参考文献268
第14章 实践:审计报告自动生成270
14.1 python-docx的基础知识270
14.1.1 python-docx的下载与使用270
14.1.2 python-docx的基础操作270
14.2 审计报告中字体的设置273
14.2.1 设置中文字体273
14.2.2 设置字号与字体颜色274
14.2.3 段落中新增文字274
14.3 审计报告中段落的修改275
14.3.1 对齐方式275
14.3.2 缩进方式275
14.3.3 行距与段落间距275
14.3.4 编号与项目符号276
14.4 自动生成审计报告的实战演练276
参考文献279

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.