登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書

『簡體書』Python数据抓取技术与实战

書城自編碼: 2893497
分類:簡體書→大陸圖書→計算機/網絡程序設計
作者: 潘庆和
國際書號(ISBN): 9787121298844
出版社: 电子工业出版社
出版日期: 2016-08-01
版次: 1 印次: 1
頁數/字數: 256/
書度/開本: 16开 釘裝: 平塑

售價:HK$ 73.5

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
神灵衰落:祈雨与乾隆朝的信仰危机
《 神灵衰落:祈雨与乾隆朝的信仰危机 》

售價:HK$ 106.8
深度营销:成就营销领导力的12大原则(麦肯锡年度经管好书,12大原则揭秘营销本质,带好团队就是从领导力到影响力!)
《 深度营销:成就营销领导力的12大原则(麦肯锡年度经管好书,12大原则揭秘营销本质,带好团队就是从领导力到影响力!) 》

售價:HK$ 69.6
新质生产力:发展新动能
《 新质生产力:发展新动能 》

售價:HK$ 105.6
状态比能力更重要:108个状态调整法
《 状态比能力更重要:108个状态调整法 》

售價:HK$ 66.0
中国上市公司担保行为的影响因素及其效应研究
《 中国上市公司担保行为的影响因素及其效应研究 》

售價:HK$ 43.2
企业级数据架构:核心要素、架构模型、数据管理与平台搭建    李杨
《 企业级数据架构:核心要素、架构模型、数据管理与平台搭建 李杨 》

售價:HK$ 118.8
政和元年:宋辽金夏的国运博弈与谍战风云
《 政和元年:宋辽金夏的国运博弈与谍战风云 》

售價:HK$ 81.6
黄金圈法则
《 黄金圈法则 》

售價:HK$ 93.6

 

建議一齊購買:

+

HK$ 86.7
《 从零开始学C语言(第3版) 》
+

HK$ 133.5
《 Python高效开发实战——Django、Tornado、Flask、Twisted 》
+

HK$ 67.5
《 用Python写网络爬虫 》
+

HK$ 103.5
《 Python编程快速上手 让繁琐工作自动化 》
+

HK$ 163.5
《 Android编程权威指南 第2版 》
+

HK$ 171.1
《 Python网络数据采集 》
編輯推薦:
如何在大数据时代获得实时的数据信息,分析挖掘、提取出有价值的信息,并以直观清晰的图形表示出关键的数量关系和概念,是一个值得研究的问题。本书通过数据抓取篇(如何获得数据信息)、数据分析篇(分析挖掘,提取出有价值的信息)、数据可视化篇(以直观清晰的图形表示出关键的数量关系和概念)详细描述数据抓取、分析、展示的整个流程,每一篇自成一体,可以单独学习掌握。
內容簡介:
如何在大数据时代获得实时的数据信息,分析挖掘、提取出有价值的信息,并以直观清晰的图形表示出关键的数量关系和概念,是一个值得研究的问题。本书通过数据抓取篇(如何获得数据信息)、数据分析篇(分析挖掘,提取出有价值的信息)、数据可视化篇(以直观清晰的图形表示出关键的数量关系和概念)详细描述数据抓取、分析、展示的整个流程,每一篇自成一体,可以单独学习掌握。
關於作者:
2011年7月毕业于哈尔滨工业大学计算机科学与技术学院,计算机应用技术专业,获得工学博士学位。2011年8月至今,哈尔滨商业大学计算机与信息工程学院,计算机科学与技术专业教师,讲师,主教课程:本科专业课《操作系统》,《专业英语》,研究生《形式语言与自动机》,《大数据技术基础》。2014年获得哈尔滨商业大学优秀教师称号。
目錄
目录
第1章 Python基础1 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
11 Python安装1 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
12 安装pip 6 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
13 如何查看帮助7 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
14 第一个程序10 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
15 文件操作25 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
16 循环28 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
17 异常30 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
18 元组30 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
19 列表32 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
110 字典36 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
111 集合38 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
112 随机数39 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
113 enumerate的使用40 !!!!!!!!!!!!!!!!!!!!!!!!!!
114 第二个例子41 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
第2章 字符串解析46 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
21 常用函数46 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
22 正则表达式50 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
23 BeautifulSoup 55 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
24 json结构62 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
第3章 单机数据抓取77 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
31 单机顺序抓取77 !!!!!!!!!!!!!!!!!!!!!!!!!!!
32 requests 107 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
33 并发和并行抓取117 !!!!!!!!!!!!!!!!!!!!!!!!!!
第4章 分布式数据抓取137 !!!!!!!!!!!!!!!!!!!!!!!!!!!
41 RPC的使用138 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
42 Celery系统145 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
第5章 全能的Selenium 159 !!!!!!!!!!!!!!!!!!!!!!!!!!

51 Selenium单机159 !!!!!!!!!!!!!!!!!!!!!!!!!!!
52 Selenium分布式抓取178 !!!!!!!!!!!!!!!!!!!!!!!!
53 Linux无图形界面使用Selenium 188 !!!!!!!!!!!!!!!!!!!
第6章 神秘的Tor 191 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
61 抓取时IP封锁的问题191 !!!!!!!!!!!!!!!!!!!!!!!!
62 Tor的安装与使用192 !!!!!!!!!!!!!!!!!!!!!!!!!
63 Tor多线程197 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
64 Tor与Selenium结合205 !!!!!!!!!!!!!!!!!!!!!!!!
第7章 抓取常见问题210 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
71 Flash 210 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
72 桌面程序211 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
73 U盘213 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
74 二级三级页面214 !!!!!!!!!!!!!!!!!!!!!!!!!!!
75 图片的处理214 !!!!!!!!!!!!!!!!!!!!!!!!!!!!
76 App数据抓取214 !!!!!!!!!!!!!!!!!!!!!!!!!!!
第8章 监控框架221 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
81 框架说明223 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
82 监控系统实例225 !!!!!!!!!!!!!!!!!!!!!!!!!!!
第9章 拥抱大数据229 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
91 Hadoop生态圈229 !!!!!!!!!!!!!!!!!!!!!!!!!!!
92 Cloudera环境搭建231
內容試閱
大数据技术是当前工程和科学技术领域研究的热点。数据科学研究通常包括四个主要环节,即数据获取、数据存储、数据分析及数据可视化。本书主要聚焦数据获取环节。这是其他环节的基础。及时准确地获得丰富详实的数据,可为后续工作奠定坚实的基础,并提高分析结论的可信性和可靠性。
互联网的开放性为数据的获取带来了极大的便利。本书基于Python的数据抓取技术,主要介绍了如何快速准确地从网络上获得所需的数据,构建满足要求的数据集或大数据集。Python语言是一种通用编程语言,可以应用于各种编程领域,在数据科学领域也是一种十分热门的语言。本书使用Python作为数据抓取技术的实现语言,利用Python丰富的模块支持和语言特性,解决了绝大部分数据抓取中经常会遇到的问题。为了使不了解这门语言的读者快速上手,在第1章中介绍了阅读本书所需的Python语言基础知识。
本书介绍了数据抓取涉及的各类技术问题和解决方法,并按章节进行组织,每章内容基本独立,可使读者在遇到问题时能够快速地进行问题定位。书中的内容侧重于将已有的成熟理论原理和流行框架应用于数据抓取实际问题的解决中,在编写过程中,只侧重介绍应用于数据抓取时的应用方式,并未对某些原理和框架进行详细的描述,感兴趣的读者可以进一步查找相关文献和资料来加深对概念和理论的理解。实际上,阅读时,读者可通过运行书中的实例代码,看到现象后再回头去分析,有助于更好地理解相关的概念和原理,为进一步的研究打下基础。
本书主要面向初学者,读者可基于书中的运行实例进行改造,设计出符合自己要求的数据抓取程序。本书可以迅速用于实战,可供相关专业工程技术人员和高校本科生阅读参考。
如果读者阅读中发现问题,请及时与我们联系,希望大家多多批评指正。
编著者

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.