【強化学習】強化学習は行動選択の科学である【広大な分野だけどコアはこれ！】RL vol. 1

Рет қаралды 20,157

Күн бұрын

強化学習についての解説シリーズを始めます！
Q. 強化学習とは？ → A. 行動選択の科学です。
非常に膨大な研究と実践が広がる強化学習ですが、一言で言うならこれだと思う！
【プレイリスト】
• 強化学習の探検
【目次】
To Be Appeared
【参考文献】
分析モデル入門
amzn.to/3Ng0nC7
私の本！　この動画シリーズは、この第3部強化学習の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。
合わせてみていただくと分かり易いかと！
強化学習（第2版）
amzn.to/3K4QsR8
Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ！
ちなみに、英語版は公式で pdf もダウンロードできます → incompleteideas...
強化学習 (機械学習プロフェッショナルシリーズ)
amzn.to/44R2XYr
理論家向けの方にはこちら！
しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。
機械学習スタートアップシリーズ Pythonで学ぶ強化学習
amzn.to/3XYDrOM
手を動かしながら学びたい人向け！
サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます！
将棋AIで学ぶディープラーニング
www.amazon.co....
強化学習というと、将棋 AI を思い浮かべる人も少なくないはず！
そういう人におすすめ！
将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。
将棋を目指す方は、ぜひこれを見てみてください！
更に強いのを作るならこれ → amzn.to/3pU1aDa
強化学習の基礎と深層強化学習
www.slideshare...
合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。
【宣伝：本も買ってね！】
データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました！
本質を捉えたデータ分析のための分析モデル入門 amzn.to/3Ng0nC7
【終わりに】
ご視聴ありがとうございました！
面白かったら高評価、チャンネル登録お願いします。
動画の質問、感想などは、コメント欄や Twitter にどうぞ！
お仕事、コラボのご依頼は、公式 WebPage や Twitter の DM からお願い致します。
AIcia Solid Project - Official Website - sites.google.c...
動画生成：AIcia Solid (Twitter: / aicia_solid )
動画編集：AIbis Solid (妹)
=======
Logo: ChikakoHorioさん ( / chikakohorio )
Model: 3d.nicovideo.jp...
Model by: W01fa さん ( / w01fa )

Пікірлер: 33

@ymori-vp6rq Жыл бұрын

待望の強化学習の動画！何度か挫折しているのですがこれからの動画を見ながらまた頑張ります

@AIcia_Solid Жыл бұрын

！！たくさんご支援いただきましてありがとうございます！！！！！🤩🎉🎉🎉 強化学習はほんとに難しいですものね、、、私もかなり苦労した、、、、、！これをショートカットすべく、良き動画を生成すべく頑張ります！是非この先もお楽しみに！！！🤩🎉🎉🎉

@aocchi1638 Жыл бұрын

ありがとうございます！

@AIcia_Solid Жыл бұрын

こちらこそ！ご支援いただきましてありがとうございます！今後の活動に活用させていただきます🤩 まだまだ価値ある動画を生成し続けますので、今後も是非応援していただけると嬉しいです。よろしくお願いします！🎉

@miraiwashiro9862 5 ай бұрын

どの動画も分かりやすくて勉強になります。ありがとうございます！

@AIcia_Solid 5 ай бұрын

ご視聴コメントありがとうございます！そして、たくさんご支援いただきましてありがとうございます！！！とても助かります！とともに、少しでもお役に立てていればとても嬉しいです！！！！！😊 これからまた良き動画を生成し続けられるよう精進しますので、応援いただけるととても嬉しいです！よろしくお願いします！！！🎉

@okayamatarou7767 Жыл бұрын

新シリーズ始まった！待ってました。強化学習の意味や目的がどんどん変わっている現代のまとめを期待してます！

@AIcia_Solid Жыл бұрын

ご視聴コメントありがとうございます！ですよね！！！ただまだ、現代は rapid changing すぎるのと、私もよくわかってないので、まずは基礎から積んでいく予定です。最新的なお話は、シリーズ後半でやる予定です。お楽しみに！🎉

@小野賢一郎 Жыл бұрын

期待大！収益:　役立つ知識の獲得状態:　獲得済知識、興味、将来性行動の選択: Acia Solid Project を見る！

@AIcia_Solid Жыл бұрын

小野さん！いつもご支援いただきましてありがとうございます！！！🎉🎉🎉 いただいたお金は活動に活用させていただきます🤩 そして、その行動は素敵すぎます！🥳 是非続く動画たちもお楽しみに！！！！！🥳

@CH-dx1mj Жыл бұрын

ハマる！見事にツボを押さえているので理解しやすいです！

@AIcia_Solid Жыл бұрын

ご視聴コメントありがとうございます🎉 そう言っていただけると嬉しいです😊 この先も良い動画を生成できるよう頑張りますので、是非見てくださいー！(^o^)/

@レベル5です Жыл бұрын

まさに強化学習を仕事で使ってみようかなと考えていたところでした！すごくありがたい。

@AIcia_Solid Жыл бұрын

ご視聴コメントありがとうございます！それは良かった！🎉 ぜひご活用くださいませ🎉

@kentoo_1 Жыл бұрын

囲碁は「打つ」将棋は「指す」このあたりをしっかりしてくれるのとてもありがたいです😊

@AIcia_Solid Жыл бұрын

ご視聴コメントありがとうございます！🎉 そうなんです！実は昔、配信で間違えて指摘いただいたことがありまして、、、🙇‍♀️🙇‍♀️🙇‍♀️ なので、「次の手を打つ/指す」ではなく、「着手を選択」という、少しむずかしい表現になっております😇 言い間違えることもあるかもしれませんが、今後も気をつけつつやっていきます！

@satokan8570 Жыл бұрын

最後のサムネコーナー好き😍

@AIcia_Solid Жыл бұрын

通ですね〜😎 ありがとうございます😍

@user-tokitama Жыл бұрын

強化学習の研究室に入ったのでありがたい！

@AIcia_Solid Жыл бұрын

ご視聴コメントありがとうございます！順番に解説していくので、ぜひ今後もお楽しみください！🎉

@apatite530 Жыл бұрын

いつも有益な動画を提供いただきありがとうございます。板書のデータが欲しくwebページの方、見に行ったのですが該当ページに行きますと”アクセス権が必要です”といわれ見れない次第です。お忙しいと思いますがご確認いただけますと嬉しいです。

@AIcia_Solid Жыл бұрын

ご視聴コメントありがとうございます！！！先ほど権限を変更しました！ただ、強化学習の番所はたぶんまだ入れていないので、もう少々お待ちいただけると助かります。ご指摘いただきありがとうございます！たすかりました！！🙇‍♀️

@apatite530 Жыл бұрын

@@AIcia_Solid ご対応いただきありがとうございます！強化学習の板書も楽しみにしています

@ribfuwa2323 Жыл бұрын

強化学習は環境を用意するのが難しい・・・

@AIcia_Solid Жыл бұрын

ご視聴コメントありがとうございます！🎉 大規模とか、すごいこととか、やろうとするとそうなりますよね😇 いまだと、Unity RL とかが早くてよいのでしょうか〜？🤔

@rafmanov1497 Жыл бұрын

対象を感知するセンサーによって強化学習のプログラムも別物になるのかな？

@AIcia_Solid Жыл бұрын

理想的には、前処理だけ変えれば、学習部分以降は全部同じにしたいと思われています。いまの ChatGPT みたいに、あれは何の言語、何の話がきても、同じ仕組みで行けてますよね👀 ただ、まだ、実際には、強化学習においては、けっこう個別カスタマイズされた前処理や学習がされています。歴史的に、ひとの工夫よりすごい汎用技術が勝つ流れなので、時間の問題かとは思います！（私が読むと、5-10年くらいと思いますが、最近の進展はほんとに早いので、最速1-2年くらいでなるかも！）

@AnonymousMagician-eo4ot Жыл бұрын

強化学習、卒論のテーマにされたけど範囲広大すぎるし手法クソ多いし普通にむずくてガン萎えしてる

@AIcia_Solid Жыл бұрын

ご視聴コメントありがとうございます！🎉 分かります😇 初学時、ぜったい、そのガン萎え経験しますよね、、、😇 今回の動画シリーズは、なるべくそうならないようにすることが目的です！頑張って動画生成していきますので、分かりづらいところなどあれば是非コメント等で指摘いただけますと助かります！🎉

@kanamu4473 Жыл бұрын

私の動画試聴時間を最大化するためにリコメンドされてる動画なんだって思ってHOME画面を見てると、ちょっと恥ずかしくなってきましたw

@AIcia_Solid Жыл бұрын

ふふふ、kanamu4473 さんも、KZbin に†バレてる†くちですね😎✌️

@shm2219 Жыл бұрын

同じ意思決定を目的とした、因果推論との関連性も詳しく知りたい、、。

@AIcia_Solid Жыл бұрын

ご視聴コメントありがとうございます！因果推論との関係性！すごい、極めて深いご質問ですね😎😎😎 実は大きなテーマや発想の源となっていて、強化学習の技術が因果推論で使われたり（Off Policy Evaluation とか）、いろんな交流があります。私はまた詳しくないですが、なにか見えてきたらお伝えしたいなとおもいます！🎉