

つくりながら學(xué)ぶ!深層強(qiáng)化學(xué)習(xí)?。校裕铮颍悖瑜摔瑜雽g踐プログラミング (つくりながら學(xué)ぶ!) 小川雄太郎/著
つくりながら學(xué)ぶ! 深層強(qiáng)化學(xué)習(xí) ~PyTorchによる実踐プログラミング~
定価¥ 3,280
発売日2018-06-28
メーカーマイナビ出版
小口に多少のダメージがありますが概ね良い狀態(tài)です。
通常のユーズド品のコンディションとしてご理解いただける方でお願(yuàn)い致します。
ASIN: 4839965625
JAN: 9784839965624
Pythonで実裝しながら學(xué)ぶ 強(qiáng)化學(xué)習(xí)?深層強(qiáng)化學(xué)習(xí)(DQN)
強(qiáng)化學(xué)習(xí)、さらにディープラーニングを組み合わせた深層強(qiáng)化學(xué)習(xí)DQN(Deep Q-Network)という用語(yǔ)を目にする機(jī)會(huì)が増えています。本書は関連の概念を分かりやすく解説しつつ、Python+PyTorchで「倒立振子課題」「迷路を解くプログラム」「ブロック崩しの攻略」を?qū)g裝していきます。
第1章「強(qiáng)化學(xué)習(xí)の概要」では機(jī)械學(xué)習(xí)とその3分類(教師あり學(xué)習(xí)、教師なし學(xué)習(xí)、強(qiáng)化學(xué)習(xí))について紹介します。
第2章「迷路課題に強(qiáng)化學(xué)習(xí)を?qū)g裝しよう」では、簡(jiǎn)単な強(qiáng)化學(xué)習(xí)(方策勾配法、Sarsa、Q學(xué)習(xí))のコードをひとつずつ実裝しながら、強(qiáng)化學(xué)習(xí)のアルゴリズムと実裝方法を理解します。迷路を最短ルートでゴールするよう強(qiáng)化學(xué)習(xí)させます。
第3章「倒立振子課題に強(qiáng)化學(xué)習(xí)を?qū)g裝しよう」では、2章で學(xué)んだ強(qiáng)化學(xué)習(xí)の基本をより複雑な課題への適用します。倒立振子とは、“ほうきを手のひらの上に立てる"遊びと同じ內(nèi)容でその制御ルールを強(qiáng)化學(xué)習(xí)させます。Anacondaを用いたセットアップ方法も解説します。
第4章「Pytorchでディープラーニングを?qū)g裝しよう」では、ディープラーニングの內(nèi)容を理解し、PyTorchで実裝します。ニューラルネットワークとディープラーニング発展の歴史、學(xué)習(xí)フェイズと推論フェイズについて解説。最後に手書き數(shù)字の畫像を分類するMNIST課題を?qū)g裝解説します。
第5章「深層強(qiáng)化學(xué)習(xí)DQNを?qū)g裝しよう」では、強(qiáng)化學(xué)習(xí)にディープラーニングを組み合わせた“深層強(qiáng)化學(xué)習(xí)"を理解し、DQNを?qū)g裝できるようにします。第3章の倒立振子課題に対してDQNを?qū)g裝します。
第6章「深層強(qiáng)化學(xué)習(xí)の発展版を?qū)g裝しよう」では、新しい深層強(qiáng)化學(xué)習(xí)の手法、Double-DQN、Dueling Network、Prioritized Experience Replay、そしてA3C、A2Cを理解し、実裝できるようにします。
第7章「AWSのGPU環(huán)境でブロック崩しを?qū)g裝しよう」では、ブロック崩しゲームを?qū)澫螭松顚訌?qiáng)化學(xué)習(xí)のA2Cを?qū)g裝します。実行環(huán)境としてAmazonのクラウドサービスAWSのGPU環(huán)境を使用する方法も解説します。
深層強(qiáng)化學(xué)習(xí)はまだまだ解決すべき課題の多い分野です。本書が深層強(qiáng)化學(xué)習(xí)に興味を持つ皆様の一助となれば幸いです。