出版社内容情報
強化学習の「いま」を知り,「これから」を切り拓くための1冊.◆強化学習は「ポストビッグデータ」の技術である!
人工知能,金融工学,ロボット制御,言語処理,生産現場やサービスの最適化,あらゆる分野に応用が広がる強化学習.十分なデータが与えられることが前提とされる他の機械学習法と異なり,「足りないデータを集めながら最適化すること」に力点を置く強化学習は,ビッグデータの先を行くための重要な技術となることが期待されます.
◆強化学習の「いま」を知り,「これから」を切り拓くための1冊.
本書では,この分野を代表する執筆陣が集い,強化学習の基礎・発展・応用を多面的に解説します.
・基礎:強化学習の動作原理と基本アルゴリズムを,初学者でも分かるように導入.
・発展:より複雑な問題に対処し,高度な研究に進むための,さまざまな発展的手法を解説.
・応用:マルチロボットシステムの制御,対話処理,医療データ分析,囲碁の対局など広範な応用例・研究事例を通して,強化学習の活用法を紹介.人間の行動や脳の動作を説明するモデルとしての理論・実験も解説.
――強化学習の基礎を学びたい方,発展的手法に触れたい方,応用可能性を一望したい方に最適な1冊!
第1章 強化学習の基礎的理論
強化学習とは/強化学習の構成要素/価値関数に基づくアルゴリズム/改善に基づくアルゴリズム/部分観測マルコフ決定過程と強化学習
第2章 強化学習の発展的理論
統計学習の観点から見たTD学習/強化学習アルゴリズムの理論性能解析とベイズ統計による強化学習のモデル化/逆強化学習/試行錯誤回数の低減を指向した手法:経験強化型学習XoL/群強化学習法/リスク考慮型強化学習/複利型強化学習
第3章 強化学習の工学応用
高次元・実環境における強化学習/連続的な状態・行動空間への拡張:マルチロボットシステムへの適用/対話処理における強化学習/マルチエージェント系の報酬設計/自然言語処理における逆強化学習・模倣学習の適用/医療臨床データ分析への応用/深層学習を用いたQ関数の学習:Atariと囲碁への応用
第4章 知能のモデルとしての強化学習
脳の意思決定機構と強化学習/内発的動機付けによるエージェントの学習と発達
牧野 貴樹[マキノタカキ]
グーグル株式会社 博(理)
澁谷 長史[シブヤタケシ]
筑波大学 助教 博(工)
白川 真一[シラカワシンイチ]
横浜国立大学 講師 博(工)
浅田 稔[アサダミノル]
大阪大学 教授 工博
麻生 英樹[アソウヒデキ]
産業技術総合研究所
荒井 幸代[アライサチヨ]
千葉大学 教授 博士(工学)
飯間 等[イイマヒトシ]
京都工芸繊維大学 准教授 博(工)
伊藤 真[イトウマコト]
沖縄科学技術大学院大学 博(情報科学)
大倉 和博[オオクラカズヒロ]
広島大学 教授 博(工)
黒江 康明[クロエヤスアキ]
京都工芸繊維大学 教授 学術博士
杉本 徳和[スギモトノリカズ]
情報通信研究機構 博(工)
坪井 祐太[ツボイユウタ]
日本IBM東京基礎研究所 博(工)
銅谷 賢治[ドウヤケンジ]
沖縄科学技術大学院大学 教授 博(工)
前田 新一[マエダシンイチ]
京都大学 助教 博(理)
松井 藤五郎[マツイトウゴロウ]
中部大学 准教授 博(工)
南 泰浩[ミナミヤスヒロ]
電気通信大学 教授 工博
宮崎 和光[ミヤザキカズテル]
独立行政法人大学改革支援・学位授与機構 准教授 博(工)
目黒 豊美[メグロトヨミ]
NTTコミュニケーション科学基礎研究所
森村 哲郎[モリムラテツロウ]
日本IBM東京基礎研究所 博(工)
森本 淳[モリモトジュン]
ATR脳情報研究所 博(工)
保田 俊行[ヤスダトシユキ]
広島大学 助教 博(工)
吉本 潤一郎[ヨシモトジュンイチロウ]
奈良先端科学技術大学院大学 准教授 博(工)
内容説明
ロボット制御、金融工学、言語処理、生産現場やサービスの最適化、最強の囲碁AIまで、あらゆる分野で威力を発揮しつつある強化学習。分野を代表する執筆陣が集い、その基礎・発展・応用を多面的に解説する。
目次
第1章 強化学習の基礎的理論(強化学習とは;強化学習の構成要素 ほか)
第2章 強化学習の発展的理論(統計学習の観点から見たTD学習;強化学習アルゴリズムの理論性能解析とベイズ統計による強化学習のモデル化 ほか)
第3章 強化学習の工学応用(高次元・実環境における強化学習;連続的な状態・行動空間への拡張:マルチロボットシステムへの適用 ほか)
第4章 知能のモデルとしての強化学習(脳の意思決定機構と強化学習;内発的動機付けによるエージェントの学習と発達)