機械学習スタートアップシリーズ Pythonで学ぶ強化学習 [改訂第2版] 入門から実践まで

久保隆宏(著) / KS情報科学専門書

作品情報

「Pythonで強化学習が実装できる!」と好評を得た入門書の改訂版。読者からの要望・指摘を反映させた。主に、Policy GradientとA2Cの記述・実装を見直した。・Pythonプログラミングとともに、ゼロからていねいに解説。・コードが公開されているから、すぐ実践できる。・実用でのネックとなる強化学習の弱点と、その克服方法まで紹介。【おもな内容】Day1 強化学習の位置づけを知る 強化学習とさまざまなキーワードの関係 強化学習のメリット・デメリット 強化学習における問題設定:Markov Decision Process Day2 強化学習の解法(1): 環境から計画を立てる 価値の定義と算出: Bellman Equation 動的計画法による状態評価の学習: Value Iteration 動的計画法による戦略の学習: Policy Iteration モデルベースとモデルフリーとの違いDay3 強化学習の解法(2): 経験から計画を立てる 経験の蓄積と活用のバランス: Epsilon-Greedy法 計画の修正を実績から行うか、予測で行うか: Monte Carlo vs Temporal Difference 経験を価値評価、戦略どちらの更新に利用するか:Valueベース vs PolicyベースDay4 強化学習に対するニューラルネットワークの適用 強化学習にニューラルネットワークを適用する 価値評価を、パラメーターを持った関数で実装する:Value Function Approximation 価値評価に深層学習を適用する:Deep Q-Network  戦略を、パラメーターを持った関数で実装する:Policy Gradient 戦略に深層学習を適用する:Advantage Actor Critic (A2C) 価値評価か、戦略かDay5 強化学習の弱点 サンプル効率が悪い 局所最適な行動に陥る、過学習をすることが多い 再現性が低い 弱点を前提とした対応策Day6 強化学習の弱点を克服するための手法 サンプル効率の悪さへの対応: モデルベースとの併用/表現学習 再現性の低さへの対応: 進化戦略 局所最適な行動/過学習への対応: 模倣学習/逆強化学習Day7 強化学習の活用領域 行動の最適化 学習の最適化

もっとみる

商品情報

シリーズ
機械学習スタートアップシリーズ Pythonで学ぶ強化学習 [改訂第2版] 入門から実践まで
著者
久保隆宏
ジャンル
コンピュータ・情報 - コンピュータ・インターネット
出版社
講談社
掲載誌・レーベル
KS情報科学専門書
書籍発売日
2019.09.22
Reader Store発売日
2019.12.13
ファイルサイズ
60.5MB
ページ数
304ページ

以下の製品には非対応です

  • PlayStation®Vita

機械学習スタートアップシリーズ Pythonで学ぶ強化学習 [改訂第2版] 入門から実践まで

  • 試し読み
  • 新刊通知

    • 久保隆宏

    • 機械学習スタートアップシリーズ Pythonで学

    もっとみる

    この作品のレビュー

    平均 4.0 (2件のレビュー)

    レビューを書く

    0
    2
    0
    0
    0

    すべてのレビューを見る

    新刊自動購入は、今後配信となるシリーズの最新刊を毎号自動的にお届けするサービスです。

    • ・発売と同時にすぐにお手元のデバイスに追加!
    • ・買い逃すことがありません!
    • ・いつでも解約ができるから安心!

    ※新刊自動購入の対象となるコンテンツは、次回配信分からとなります。現在発売中の最新号を含め、既刊の号は含まれません。ご契約はページ右の「新刊自動購入を始める」からお手続きください。

    ※ご契約をいただくと、このシリーズのコンテンツを配信する都度、毎回決済となります。配信されるコンテンツによって発売日・金額が異なる場合があります。ご契約中は自動的に販売を継続します。

    不定期に刊行される「増刊号」「特別号」等も、自動購入の対象に含まれますのでご了承ください。(シリーズ名が異なるものは対象となりません)

    ※再開の見込みの立たない休刊、廃刊、出版社やReader Store側の事由で契約を終了させていただくことがあります。

    ※My Sony IDを削除すると新刊自動購入は解約となります。

    お支払方法:クレジットカードのみ
    解約方法:マイページの「予約・新刊自動購入設定」より、随時解約可能です

    続巻自動購入は、今後配信となるシリーズの最新刊を毎号自動的にお届けするサービスです。

    • ・発売と同時にすぐにお手元のデバイスに追加!
    • ・買い逃すことがありません!
    • ・いつでも解約ができるから安心!
    • ・今なら優待ポイントが2倍になるおトクなキャンペーン実施中!

    ※続巻自動購入の対象となるコンテンツは、次回配信分からとなります。現在発売中の最新巻を含め、既刊の巻は含まれません。ご契約はページ右の「続巻自動購入を始める」からお手続きください。

    ※ご契約をいただくと、このシリーズのコンテンツを配信する都度、毎回決済となります。配信されるコンテンツによって発売日・金額が異なる場合があります。ご契約中は自動的に販売を継続します。

    不定期に刊行される特別号等も自動購入の対象に含まれる場合がありますのでご了承ください。(シリーズ名が異なるものは対象となりません)

    ※再開の見込みの立たない休刊、廃刊、出版社やReader Store側の事由で契約を終了させていただくことがあります。

    ※My Sony IDを削除すると続巻自動購入は解約となります。

    お支払方法:クレジットカードのみ
    解約方法:マイページの「予約自動購入設定」より、随時解約可能です

    Reader Store BOOK GIFT とは

    ご家族、ご友人などに電子書籍をギフトとしてプレゼントすることができる機能です。
    贈りたい本を「プレゼントする」のボタンからご購入頂き、お受け取り用のリンクをメールなどでお知らせするだけでOK!
    ぜひお誕生日のお祝いや、おすすめしたい本をプレゼントしてみてください。

    ※ギフトのお受け取り期限はご購入後6ヶ月となります。お受け取りされないまま期限を過ぎた場合、お受け取りや払い戻しはできませんのでご注意ください。
    ※お受け取りになる方がすでに同じ本をお持ちの場合でも払い戻しはできません。
    ※ギフトのお受け取りにはサインアップ(無料)が必要です。
    ※ご自身の本棚の本を贈ることはできません。
    ※ポイント、クーポンの利用はできません。

    クーポンコード登録

    登録

    Reader Storeをご利用のお客様へ

    ご利用ありがとうございます!

    エラー(エラーコード: )

    本棚に以下の作品が追加されました

    本棚の開き方(スマートフォン表示の場合)

    画面左上にある「三」ボタンをクリック

    サイドメニューが開いたら「(本棚アイコンの絵)」ボタンをクリック

    このレビューを不適切なレビューとして報告します。よろしいですか?

    ご協力ありがとうございました
    参考にさせていただきます。

    レビューを削除してもよろしいですか?
    削除すると元に戻すことはできません。