これからの強化学習

個数：

電子版価格
¥4,620

ポイントキャンペーン

これからの強化学習

牧野貴樹/澁谷長史/白川真一【編著】
価格 ¥4,620（本体¥4,200）
森北出版（2016/10発売）
ゴールデンウィークポイント2倍キャンペーン対象商品(5/6まで)
ポイント 84pt

提携先に4冊在庫がございます。（2024年05月03日 07時24分現在）
通常、5～7日程度で出荷されます。
※納期遅延や、在庫切れで解約させていただく場合もございます。
※1回のご注文は10冊までとなります
出荷予定日とご注意事項
※上記を必ずご確認ください

【出荷予定日】
通常、5～7日程度で出荷されます。

【ご注意事項】 ※必ずお読みください
◆在庫数は刻々と変動しており、ご注文手続き中に減ることもございます。
◆在庫数以上の数量をご注文の場合には、超過した分はお取り寄せとなり日数がかかります。入手できないこともございます。
◆事情により出荷が遅れる場合がございます。
◆お届け日のご指定は承っておりません。
◆「帯」はお付けできない場合がございます。
◆画像の表紙や帯等は実物とは異なる場合があります。
◆特に表記のない限り特典はありません。
◆別冊解答などの付属品はお付けできない場合がございます。
●店舗受取サービス（送料無料）もご利用いただけます。
ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら

サイズ A5判／ページ数 313p／高さ 22cm
商品コード 9784627880313
NDC分類 007.1
Cコード C3004

出版社内容情報

強化学習の「いま」を知り，「これから」を切り拓くための1冊．◆強化学習は「ポストビッグデータ」の技術である！
人工知能，金融工学，ロボット制御，言語処理，生産現場やサービスの最適化，あらゆる分野に応用が広がる強化学習．十分なデータが与えられることが前提とされる他の機械学習法と異なり，「足りないデータを集めながら最適化すること」に力点を置く強化学習は，ビッグデータの先を行くための重要な技術となることが期待されます．

◆強化学習の「いま」を知り，「これから」を切り拓くための1冊．
本書では，この分野を代表する執筆陣が集い，強化学習の基礎・発展・応用を多面的に解説します．
・基礎：強化学習の動作原理と基本アルゴリズムを，初学者でも分かるように導入．
・発展：より複雑な問題に対処し，高度な研究に進むための，さまざまな発展的手法を解説．
・応用：マルチロボットシステムの制御，対話処理，医療データ分析，囲碁の対局など広範な応用例・研究事例を通して，強化学習の活用法を紹介．人間の行動や脳の動作を説明するモデルとしての理論・実験も解説．

――強化学習の基礎を学びたい方，発展的手法に触れたい方，応用可能性を一望したい方に最適な1冊！

第1章　強化学習の基礎的理論
強化学習とは／強化学習の構成要素／価値関数に基づくアルゴリズム／改善に基づくアルゴリズム／部分観測マルコフ決定過程と強化学習

第2章　強化学習の発展的理論
統計学習の観点から見たTD学習／強化学習アルゴリズムの理論性能解析とベイズ統計による強化学習のモデル化／逆強化学習／試行錯誤回数の低減を指向した手法：経験強化型学習XoL／群強化学習法／リスク考慮型強化学習／複利型強化学習

第3章　強化学習の工学応用
高次元・実環境における強化学習／連続的な状態・行動空間への拡張：マルチロボットシステムへの適用／対話処理における強化学習／マルチエージェント系の報酬設計／自然言語処理における逆強化学習・模倣学習の適用／医療臨床データ分析への応用／深層学習を用いたQ関数の学習：Atariと囲碁への応用

第4章　知能のモデルとしての強化学習
脳の意思決定機構と強化学習／内発的動機付けによるエージェントの学習と発達

牧野貴樹［マキノタカキ］
グーグル株式会社　　博（理）

澁谷長史［シブヤタケシ］
筑波大学助教博（工）

白川真一［シラカワシンイチ］
横浜国立大学講師博（工）

浅田稔［アサダミノル］
大阪大学教授工博

麻生英樹［アソウヒデキ］
産業技術総合研究所

荒井幸代［アライサチヨ］
千葉大学教授博士（工学）

飯間等［イイマヒトシ］
京都工芸繊維大学准教授博（工）

伊藤真［イトウマコト］
沖縄科学技術大学院大学博(情報科学)

大倉和博［オオクラカズヒロ］
広島大学教授博（工）

黒江康明［クロエヤスアキ］
京都工芸繊維大学教授学術博士

杉本徳和［スギモトノリカズ］
情報通信研究機構博（工）

坪井祐太［ツボイユウタ］
日本IBM東京基礎研究所博（工）

銅谷賢治［ドウヤケンジ］
沖縄科学技術大学院大学教授博（工）

前田新一［マエダシンイチ］
京都大学助教博（理）

松井藤五郎［マツイトウゴロウ］
中部大学准教授博（工）

南泰浩［ミナミヤスヒロ］
電気通信大学教授工博

宮崎和光［ミヤザキカズテル］
独立行政法人大学改革支援・学位授与機構准教授博（工）

目黒豊美［メグロトヨミ］
NTTコミュニケーション科学基礎研究所

森村哲郎［モリムラテツロウ］
日本IBM東京基礎研究所博（工）

森本淳［モリモトジュン］
ATR脳情報研究所博（工）

保田俊行［ヤスダトシユキ］
広島大学助教博（工）

吉本潤一郎［ヨシモトジュンイチロウ］
奈良先端科学技術大学院大学准教授博（工）

内容説明

ロボット制御、金融工学、言語処理、生産現場やサービスの最適化、最強の囲碁ＡＩまで、あらゆる分野で威力を発揮しつつある強化学習。分野を代表する執筆陣が集い、その基礎・発展・応用を多面的に解説する。

第１章　強化学習の基礎的理論（強化学習とは；強化学習の構成要素　ほか）
第２章　強化学習の発展的理論（統計学習の観点から見たＴＤ学習；強化学習アルゴリズムの理論性能解析とベイズ統計による強化学習のモデル化　ほか）
第３章　強化学習の工学応用（高次元・実環境における強化学習；連続的な状態・行動空間への拡張：マルチロボットシステムへの適用　ほか）
第４章　知能のモデルとしての強化学習（脳の意思決定機構と強化学習；内発的動機付けによるエージェントの学習と発達）