新書推薦:
《
生活来来往往 别等来日方长 新版(伍佰:“讲好了这一辈子,再度重相逢。”别等,别遗憾!珍惜当下才是最好的解药)
》
售價:HK$
58.2
《
一个英国军事顾问眼中的二战
》
售價:HK$
277.8
《
就业、利息和货币通论(徐毓枬译本)(经济学名著译丛)
》
售價:HK$
67.2
《
瘦肝
》
售價:HK$
99.7
《
股票大作手回忆录
》
售價:HK$
55.8
《
秩序四千年:人类如何运用法律缔造文明(世界重归混乱,文明岌岌可危,法律与秩序是我们仅有的武器。穿越时间,鸟瞰全球,一部波澜壮阔的人类文明史)
》
售價:HK$
154.6
《
民法典1000问
》
售價:HK$
99.7
《
国术健身 易筋经
》
售價:HK$
33.4
|
編輯推薦: |
·源自绿叶学习网Python教程·内容丰富,详细教程,非理工科专业也能看得懂·此系列教程被众多院校与机构选作核心教材·讲透NumPy,Pandas,Matplotlib三大数据分析利器·通俗易懂,风趣幽默,适合零基础初学人士,无痛掌握新知识·丰富资源:课件PPT+配套网站+源码素材+配套练习+技术问答
|
內容簡介: |
作者根据自己多年的前后端开发经验,站在完全零基础读者的角度,详尽介绍了Pytho数据分析的基础知识,以及大量的开发技巧,全书围绕着“数据分析三剑客(NumPy、Pandas、Matplotlib)”进行细致的介绍。这三款工具的知识点非常多,本书尽量系统细致地介绍精华的知识点,以便为读者构建一个完善的知识体系,并且为后续的工作打下坚实的基础。 每一章后面的实战题以及练习题,经过精心设计,可以锻炼读者的数据分析实战能力,对于巩固基础以及锻炼技术是非常有帮助的。
|
關於作者: |
莫振杰,毕业于暨南大学信科院计算机科学与技术专业,从事前后端开发4年多,开发过绿叶学习网、广州智能工程研究会网站、大量在线应用工具及其他各种类型网站,著有多本编程书且销量过万, 现为绿叶学习网的站长,该网站用于分享其在前后端开发中的一些经验,其制作的前后端开发在线教程在互联网引起广泛关注,每一个教程广受网友称赞与推崇。
|
目錄:
|
目 录前言 xvii第 一部分 NumPy篇第 1章 数据分析概述31.1 数据分析简介31.1.1 数据科学是什么?31.1.2 数据分析是什么?41.1.3 应该学些什么?41.2 课程介绍61.2.1 课程说明61.2.2 常见问题61.3 使用 VSCode71.3.1 安装 VSCode71.3.2 安装插件81.3.3 运行代码9第 2章 NumPy基础112.1 NumPy是什么?112.2 创建数组122.2.1 基本方法122.2.2 随机数组182.2.3 数组与列表的区别212.3 数组属性222.4 元素操作242.4.1 访问元素252.4.2 修改元素262.4.3 添加元素262.4.4 删除元素282.4.5 切片292.5 数组操作312.5.1 修改形状312.5.2 修改维度332.5.3 翻转数组342.5.4 数组去重342.5.5 合并数组352.5.6 分割数组372.6 各种运算392.6.1 基本运算392.6.2 比较运算412.6.3 标量运算422.6.4 数学函数432.6.5 统计函数452.7 遍历数组532.8 大小排序552.9 本章练习57第3章 NumPy进阶583.1 浅拷贝和深拷贝583.1.1 浅拷贝583.1.2 深拷贝593.2 axis的值603.3 广播机制613.3.1 维数不同613.3.2 维数相同633.3.3 标量运算643.4 读写文件653.4.1 读取文件653.4.2 写入文件663.5 矩阵简介673.5.1 全0矩阵683.5.2 全1矩阵693.5.3 单位矩阵693.5.4 随机矩阵703.6 本章练习71第二部分 Pandas篇第4章 Pandas简介754.1 Pandas是什么?754.2 Series764.2.1 创建Series764.2.2 Series的属性784.2.3 获取某行的值784.2.4 深入了解794.3 DataFrame794.3.1 创建DataFrame794.3.2 DataFrame的属性834.3.3 深入了解864.4 DataFrame的数据操作884.4.1 访问数据884.4.2 修改数据954.4.3 添加数据964.4.4 删除数据984.5 遍历行列1014.5.1 遍历行1014.5.2 遍历列1024.6 深入了解1034.7 本章练习105第5章 获取数据1075.1 数据分析流程1075.2 读写数据简介1085.3 读写JSON1095.3.1 JSON简介1095.3.2 读取JSON1105.3.3 写入JSON1115.4 读写CSV1135.4.1 CSV简介1135.4.2 读取CSV1145.4.3 写入CSV1165.5 读写Excel1175.5.1 Excel简介1175.5.2 读取Excel1185.5.3 写入Excel1195.6 读写HTML1205.7 深入文件读取1225.7.1 分块读取1225.7.2 只读取一部分1245.8 读取数据库1255.8.1 安装MySQL1255.8.2 安装Navicat for MySQL1295.8.3 读取MySQL1345.9 本章练习136第6章 筛选数据1376.1 筛选数据简介1376.2 获取行、列:loc[]、iloc[]和df[]1386.2.1 获取行1386.2.2 获取列1396.3 重新索引:reindex()1416.3.1 语法简介1416.3.2 深入了解1436.4 获取首尾数据:head()和tail()1456.5 随机抽样:sample()1476.6 逻辑比较1496.6.1 语法简介1496.6.2 深入了解1526.7 过滤操作1556.7.1 query()1556.7.2 filter()1576.8 模式匹配1596.9 本章练习162第7章 处理数据1647.1 处理数据简介1647.2 操作行名和列名1657.2.1 设置某一列为行名1657.2.2 重置行名1667.2.3 修改行名和列名1687.3 类型转换1717.3.1 针对DataFrame1717.3.2 针对某一列1747.4 行列转置:T1757.5 大小排序:sort_values()1767.6 数据排名:rank()1797.7 数据替换:replace()1817.8 数据移动:shift()1837.9 数据清洗1857.9.1 缺失值1867.9.2 重复值1927.9.3 异常值1967.10 数据合并1977.10.1 轴向合并:concat()1987.10.2 主键合并:merge()2037.10.3 行列连接:join()2077.10.4 纵向合并:append()2087.11 字符串处理2097.11.1 获取长度:len()2107.11.2 统计次数:count()2117.11.3 去除空格:strip()2127.11.4 替换字符串:replace()2137.11.5 分割字符串:split()2147.11.6 重复字符串:repeat()2157.11.7 连接列:cat()2167.11.8 大小写转换2197.11.9 判断类型2207.11.10 判断包含2217.12 自定义函数2227.12.1 map()2227.12.2 apply()2247.12.3 applymap()2267.13 实战题:处理天气数据2277.14 实战题:拆分数据2297.15 本章练习230第8章 分析数据2328.1 分析数据简介2328.2 基本统计函数2328.2.1 求和:sum()2338.2.2 统计个数:count()2358.2.3 求值:max()与min()2368.2.4 求中位数:median()2388.2.5 求众数:mode()2398.2.6 求平均数:mean()2408.2.7 求方差:var()2418.2.8 求标准差:std()2428.2.9 求分位数:quantile()2438.3 其他统计函数2448.3.1 统计取值种类2448.3.2 统计取值个数2458.3.3 求变化百分比2468.3.4 求值的行名2478.4 整体情况2478.4.1 describe()2488.4.2 info()2488.5 聚合函数:agg()2498.6 数据分组2528.6.1 基本语法2528.6.2 统计分析2568.7 实战题:求平均寿命2588.8 本章练习259第9章 时间序列2609.1 时间序列概述2609.1.1 时间序列简介2609.1.2 转换类型2619.1.3 获取日期2649.1.4 索引与切片2669.2 重采样:resample()2689.2.1 降采样2689.2.2 升采样2719.3 移动计算:rolling()2739.4 分组器:Grouper()2749.5 实战题:求每个月的销量总和2769.6 本章练习277第 10章 高级技术27910.1 透视表27910.1.1 透视表简介27910.1.2 统计函数28110.2 交叉表28210.3 层次化索引28410.3.1 层次化索引简介28410.3.2 常用操作28610.4 离散化处理29210.4.1 离散化简介29210.4.2 常用参数29310.5 哑变量处理29610.6 实战题:创建透视表29810.7 本章练习299第 11章 其他操作30011.1 广播机制30011.2 索引对象30111.3 inplace参数30411.4 缺失值30611.5 实战题:统计每一列的缺失值个数30711.6 本章练习308第三部分 Matplotlib篇第 12章 基础图表31312.1 Matplotlib简介31312.2 基本绘图(折线图)31512.2.1 基本语法31512.2.2 定义样式31712.3 通用设置32512.3.1 画布样式32512.3.2 定义标题32612.3.3 定义图例33012.3.4 刻度标签33212.3.5 刻度范围33512.3.6 网格线33812.3.7 参考线34012.3.8 参考区域34312.3.9 注释文本(有指向)34512.3.10 注释文本(无指向)34712.4 通用样式35012.5 散点图35012.5.1 基本语法35012.5.2 定义样式35212.5.3 气泡图35412.6 柱形图35612.6.1 基本语法35612.6.2 高级柱形图35812.6.3 条形图36112.7 直方图36212.7.1 基本语法36212.7.2 定义样式36412.8 饼状图36612.8.1 基本语法36612.8.2 定义样式36712.8.3 圆环图37212.9 实战题:绘制气温折线图37312.10 实战题:浏览器所占市场份额柱形图375第 13章 高级图表37813.1 高级图表简介37813.2 箱线图37813.2.1 基本语法37813.2.2 样式定义38113.3 面积图38713.3.1 基本语法38713.3.2 高级面积图38813.4 棉棒图38913.4.1 基本语法38913.4.2 定义样式39013.5 热力图39313.5.1 基本语法39313.5.2 定义样式39413.6 子图表39513.6.1 基本语法39513.6.2 实际案例39813.7 实战题:使用箱线图查找异常值39913.8 实战题:绘制每月销量的棉棒图401第四部分 工具篇第 14章 Jupyter Notebook40714.1 Jupyter Notebook简介40714.2 Jupyter Notebook的使用40814.2.1 安装Anaconda40914.2.2 运行Jupyter Notebook40914.3 应用场景41114.4 常用技巧41414.4.1 问号查询41414.4.2 输出多个变量41514.4.3 读取文件417第五部分 附录附录A 读写文件(Pandas)422附录B 统计函数(Pandas)423附录C 绘图函数(Matplotlib)424
|
|