曽我部東馬准教授による著書強化学習アルゴリズム入門 「平均」からはじめる基礎と応用が、オーム社より2019年2月26日に発売されます。
■「平均」という観点から強化学習の基本が理解できる!
AlphaGoがプロ棋士を破った2016年以降、さまざまな分野から注目されている深層強化学習ですが、専門書は非常に難解でわかりづらい傾向にあります。
そこで本書は、初歩的な数学を使って原理をわかりやすく解説します。価値・探索・マルコフ決定過程・動的計画法・モンテカルロ法・TD法といった強化学習の諸要素を、中高生にもなじみ深い平均値の計算から説明し、初学者でも基本とコツを自然と身につけられます。抽象的な強化学習の概念と煩雑な数学式を直感的に感じつつ、本質まで把握できることが本書の最大の特徴です。
また、すべての例題にPythonとMATLABのコードを示し、原理・数式・コードという一連の流れを紐付けて理解できるようになっています。初学者でも入りやすく、難しさを感じないまま、強化学習の基本と深層学習のコツを自然と身につけられる入門書です。
■ 本書の特徴
・難解な強化学習の原理を、中高生にもなじみ深い「平均値の計算」という観点からわかりやすく解説しています。
・すべての例題にPythonとMATLABのコードを例示しています。
◎ 強化学習に興味のある研究者・エンジニア
○ その他、人工知能に興味のある研究者・エンジニア
◾平均という概念は、自然科学の原点の一つではないでしょうか。強化学習、特に深層強化学習は、本質的に最適化と予測が融合した学問です。近づきにくく、把握しにくいという特徴がありますが、平均という平易な土台の上にアプローチすれば、抽象的概念を自然に具体化できるのです。
第一章は、どのような背景の方でも読みやすく、強化学習のアルゴリズムの全体像を掴めます。
第二章の「方策」は、よく読んで頂くと、普段の生活の中で悩んだ時、決断に迷う時の一助となるような考え方と哲学があります。
さらに専門性の高いところを目指す方には、第3章、第4章が最先端の深層強化学習の知識となりますので、内容を選びながら活用して頂ければ幸いです。
■主要目次
第1章 平均から学ぶ強化学習の基本概念
第2章 各アルゴリズムの特徴と応用
第3章 関数近似手法
第4章 深層強化学習の原理と手法