登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書

『繁體書』最新人工智慧應用:用強化學習快速上手AI

書城自編碼: 3194610
分類:繁體書 →台灣書
作者: 郭憲,方勇純
國際書號(ISBN): 9789863796541
出版社: 佳魁資訊
出版日期: 2018-06-08
版次: 初版
頁數/字數: 304頁
書度/開本: 17x23cm

售價:HK$ 181.3

 

** 我創建的書架 **
未登入.


新書推薦:
手感烘焙聖經:150道經典創意食譜×280種特選配方×800張質感圖解,烘焙技藝完全掌握(二版)
《 手感烘焙聖經:150道經典創意食譜×280種特選配方×800張質感圖解,烘焙技藝完全掌握(二版) 》

售價:HK$ 197.0
傳奇教練丹約翰的肌力體能訓練金律:40年淬煉的42則鍛練心法,教你回歸根本,檢視心志、目標、課表……,建立簡單又有效的運動生活
《 傳奇教練丹約翰的肌力體能訓練金律:40年淬煉的42則鍛練心法,教你回歸根本,檢視心志、目標、課表……,建立簡單又有效的運動生活 》

售價:HK$ 136.4
致富思維:33個擺脫窮腦袋的財富自由心法
《 致富思維:33個擺脫窮腦袋的財富自由心法 》

售價:HK$ 103.1
為什麼我們拚命追求幸福,卻依然不快樂
《 為什麼我們拚命追求幸福,卻依然不快樂 》

售價:HK$ 115.2
圖解易經(新版)
《 圖解易經(新版) 》

售價:HK$ 110.0
戊辰戰爭:還原被隱藏的真相(兩冊)
《 戊辰戰爭:還原被隱藏的真相(兩冊) 》

售價:HK$ 232.0
吳作棟傳(1941-1990):新加坡的政壇傳奇
《 吳作棟傳(1941-1990):新加坡的政壇傳奇 》

售價:HK$ 174.0
召喚勇氣:覺察情緒衝擊、不逃避尖銳對話、從心同理創造真實的主導力
《 召喚勇氣:覺察情緒衝擊、不逃避尖銳對話、從心同理創造真實的主導力 》

售價:HK$ 130.0

 

內容簡介:
適用:本書既適合零基礎之強化學習初學者,亦適合相關領域之從業人員與大學、研究所師生。

本書特色:

風格偏向口語化,透過此種交流方式,實現一對一的訓練效果。讀者可將本書想像成自己的私人家教!
不將數學基礎單獨列出,而是在章節內容中,對應地介紹演算法設計和分析的數學基礎。即使沒有高深數學功力的讀者也可學習。而針對有基礎者,透過將兩者加以結合,更可提升數學的應用能力!
每部分都包含「理論說明」、「程式說明」與「直觀解釋」三項內容。強化學習演算法之應用性相當強大,大多讀者的學習目的是用來解決實際問題。一邊學理論、一邊寫程式,過程中同步提升理論研究與解決問題的能力!
涵蓋內容相當豐富,從最基礎到目前最先進的強化學習演算法都有所涉獵!
關於作者:

郭憲

南開大學電腦與控制工程學院博士後。2009年畢業於華中科大,同年保送到中國科學院進行碩博連讀,主攻機器人動力學建模與控制,並於2016年獲得工學博士學位。其主攻方向為機器人智慧感知與決策,目前主持兩項國家級專案,內容涉及在機器人領域中,深度學習、深度強化學習等智慧演算法的應用。
方勇純
南開大學電腦與控制工程學院副院長、第七屆吳文俊人工智慧科學技術自然科學一等獎得獎者。其亦分別獲得浙江大學學士與碩士學位、美國克萊門森大學博士學位、並曾在美國康乃爾大學進行博士後研究、2003年至今任教於南開大學。並於2013年獲得國家自然科學基金傑出青年基金的資助。
目錄
Chapter01緒論
1.1這是一本什麼書
1.2強化學習可以解決什麼問題
1.3強化學習如何解決問題
1.4強化學習演算法分類及發展趨勢
1.5強化學習模擬環境建置
1.6本書主要內容及安排
Chapter02馬可夫決策過程
2.1馬可夫決策過程理論說明
2.2MDP中的機率學基礎說明
2.3以gym為基礎的MDP實例說明
2.4習題
Chapter03以模型為基礎的動態規劃方法
3.1以模型為基礎的動態規劃方法理論
3.2動態規劃中的數學基礎說明
3.3以gym為基礎的程式設計實例
3.4最佳控制與強化學習比較
3.5習題
Chapter04以蒙地卡羅為基礎的強化學習方法
4.1以蒙地卡羅方法為基礎的理論
4.2統計學基礎知識
4.3以Python為基礎的程式設計實例
4.4習題
Chapter05以時間差分為基礎的強化學習方法
5.1基於時間差分強化學習演算法理論說明
5.2以Python和gym為基礎的程式設計實例
5.3習題
Chapter06以值函數逼近為基礎的強化學習方法
6.1以值函數逼近為基礎的理論說明
6.2DQN及其變種
6.3函數逼近方法
6.4習題
Chapter07以策略梯度為基礎的強化學習方法
7.1以策略梯度為基礎的強化學習方法理論說明
7.2以gym和TensorFlow為基礎的策略梯度演算法實現
7.3習題
Chapter08以置信域策略最佳化為基礎的強化學習方法
8.1理論基礎
8.2TRPO中的數學知識
8.3習題
Chapter09以確定性策略搜索為基礎的強化學習方法
9.1理論基礎
9.2習題
Chapter10以啟動策略搜索為基礎的強化學習方法
10.1理論基礎
10.2GPS中有關的數學基礎
10.3習題
Chapter11逆向強化學習
11.1概述
11.2以最大邊際為基礎的逆向強化學習
11.3以最大熵為基礎的逆向強化學習
11.4習題
Chapter12組合策略梯度和值函數方法
Chapter13值反覆運算網路
13.1為什麼要提出值反覆運算網路
13.2值反覆運算網路
Chapter14以模型為基礎的強化學習方法:PILCO及其擴充
14.1概述
14.2PILCO
14.3濾波PILCO和探索PILCO
14.4深度PILCO
A後記
B參考文獻

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.