新書推薦:

《
华夏文库儒学书系:明代遗民:顾炎武、王夫之、黄宗羲
》
售價:HK$
25.4

《
中国书法之美:汉字美的历程
》
售價:HK$
136.8

《
葡萄酒与战争:法国人与纳粹的斗争(格致·格尔尼卡)
》
售價:HK$
73.2

《
2025年版 中华人民共和国药典(1~4部)
》
售價:HK$
4875.4

《
清华简《系年》综合研究(全二册)
》
售價:HK$
552.2

《
微渺人生
》
售價:HK$
80.2

《
具身情绪:如何借助身体化解情绪困境
》
售價:HK$
105.0

《
卢浮幽灵
》
售價:HK$
82.6
|
內容簡介: |
1.闡述大數據的重要觀念,包括正面的效用與負面的副作用,建立讀者對大數據正確的認知。
來源:香港大書城megBookStore,http://www.megbook.com.hk 2.說明大數據時代的因應與挑戰,其中有思維的轉變、大數據分析技術、大數據的應用模式分類,也有大數據分析的流程。
3.介紹各行各業的大數據經典應用案例,讓讀者體會大數據分析的應用精隨,有機會發揮創造力,開創自己的大數據應用。
4.介紹大數據分析工具(Hadoop和Spark)的生態系統,期使讀者能充分掌握大數據的技術發展和工具的應用藍圖。
5.透過對大數據工具的實戰演練,包括安裝、設定、指令操作等,使讀者在具備大數據概念正確理解的同時,還能擁有動手實現的功力。
6.學習大數據程式語言Scala,熟悉函數式程式設計(functionalprogramming)的特點,以及它對於大數據的操作與處理,提升讀者對大數據分析演算法的開發能力。
7.使用Spark的機器學習程式庫(MLlib),應用在既有資料集的分析上,讓讀者迅速獲得大數據的預測能力。
|
目錄:
|
觀念篇
第1章 進入大數據時代
1-1大數據時代來了
1-2「大」數據有多「大」
1-3大數據的「大」特徵
1-4大數據的「大」作用
1-5大數據的「大」問題
1-6結語
第2章 大數據挑戰與因應
2-1大數據的思維轉變
2-2大數據案例
2-3大數據的應用模式分類
2-4大數據計畫的啟動
2-5結語
第3章 大數據分析技術
3-1資料科學
3-2資料分析工具箱
3-3大數據分析流程
3-4結語
工具篇
第4章 大數據工具與生態系統
4-1HadoopHDFS:分散式檔案系統
4-2Spark:平行運算框架
4-3NoSQL資料庫
4-4結語
第5章 大數據作業系統Ubuntu的安裝
5-1安裝虛擬化系統工具OracleVirtualBox
5-2新增和設定Ubuntu虛擬機
5-3安裝和設定Ubuntu作業系統
第6章 大數據平台Hadoop和Spark的安裝
6-1建立和設定master主機
6-2建立slave1虛擬機
6-3繼續master的設定
6-4啟動Hadoop主機集群
6-5試玩HDFS
6-6試玩Spark
6-7結束Spark和Hadoop
第7章 HDFS和SparkRDD的操作
7-1HDFS的操作指令
7-2SparkRDD的操作
第8章 Scala—大數據的程式語言
8-1Scala基礎
8-2基本的資料型態
8-3資料集Collections
8-4邏輯流程控制
8-5函數
8-6常用資料集處理方法
8-7模式匹配PatternMatching
應用篇
第9章 大數據分析應用基礎
9-1字數計算(wordcount)
9-2矩陣相乘
9-3頻繁項(frequentitems)分析
9-4One-hot編碼
9-5相似性(similarity)計算
9-6文件資料反向排序
第10章大數據分析範例—葡萄酒分析
10-1葡萄酒品質資料集
10-2讀入資料檔
10-3基本統計資料
10-4建立LabeledPoint資料類別格式
10-5資料標準化
10-6切割資料集
10-7預測模型訓練
10-8預測與模式評估MSE
10-9參數最佳組合與模型測試
10-10結論
第11章大數據分析範例—書籍推薦
11-1推薦技術
11-2書籍資料集
11-3讀入資料檔與資料前處理
11-4建立Rating資料格式
11-5切割資料集
11-6預測模型訓練
11-7計算均方差MSE
11-8參數最佳組合與最佳模型
11-9使用最佳模型進行推薦
第12章大數據分析範例—鳶尾花分類
12-1大數據分析流程
12-2分類演算法
12-3鳶尾花資料集
12-4讀入資料檔與資料前處理
12-5資料集隨機切割
12-6模式設定與訓練
12-7使用評價器(evaluator)計算準確度
12-8交叉驗證
12-9使用最佳模式來預測新值
附錄 參考文獻
|
|