KZ
bin
Негізгі бет
Қазірдің өзінде танымал
Тікелей эфир
Ұнаған бейнелер
Қайтадан қараңыз
Жазылымдар
Кіру
Тіркелу
Ең жақсы KZbin
Фильм және анимация
Автокөліктер мен көлік құралдары
Музыка
Үй жануарлары мен аңдар
Спорт
Ойындар
Комедия
Ойын-сауық
Тәжірибелік нұсқаулар және стиль
Ғылым және технология
【強化学習】全体像を見据えておこう【2つのループが特徴】RL vol. 3 #153 #VRアカデミア #ReinforcementLearning
12:45
【数分解説】Q-Learning : 離散的な状態と行動の中で、最適な行動を学習したい 【強化学習】
6:08
VIP ACCESS
00:47
Cat mode and a glass of water #family #humor #fun
00:22
Гениальное изобретение из обычного стаканчика!
00:31
⚡Токаев ШОКИРОВАЛ Кремль! РАЗМАЗАЛ заявлением Путина #shorts
00:33
【強化学習】教師あり学習とは何が同じで何が違う?【実は共通点も多い!】RL vol. 2
Рет қаралды 10,796
Facebook
Twitter
Жүктеу
1
Жазылу 58 М.
AIcia Solid Project
Күн бұрын
Пікірлер
@me-me-661
Жыл бұрын
楽しみにしてたシリーズをありがとうございます。いろんな所を学習するから今どこをやってるかしっかり意識しなくてはいけない、刺さりました。勉強させていただきます。
@AIcia_Solid
Жыл бұрын
ご視聴コメントありがとうございます!🎉 是非、抜けないよう、深く刺しておいてください!!! よくわからない混乱のかなりが解決するかと思います!
@小野賢一郎
Жыл бұрын
教師あり学習、教師なし学習、強化学習、今日も学習!楽しい動画をありがとうございます!
@AIcia_Solid
Жыл бұрын
小野さん!!! いつもご支援いただきありがとうございます🎉🎉🎉 私も、小野さんに見ていただけてとても嬉しいです😊 是非続きも楽しみにしていてください!🎉
@shm2219
Жыл бұрын
最後の色々なところを学習するという視点を持てたのが今回の最大の収穫でした。
@AIcia_Solid
Жыл бұрын
ご視聴コメントありがとうございます! それは良かった!🎉 ホントそうなんです、ほんと色んなところをやるので、是非混乱にはお気をつけて、、、!🙏
@ちゃんぽこ-l5l
Жыл бұрын
4:05の状態が相関を持つというのは各時刻の状態を確率変数としてみた時にそれぞれ互いに独立ではないということで良いのでしょうか? 私が知っている相関があるというのは相関係数の絶対値が1に近いことなのですがこの文脈ではそういう意味では無いのでしょうか?
@AIcia_Solid
Жыл бұрын
ご視聴コメントありがとうございます! 素敵な質問ですね! 先に回答しますと、2つとも yes です! 詳しく書きます! 「相関がある」や「相関を持つ」というのは、一方が変化すればもう一方も変化するように相互に関係することで、つまり、「独立でない」とほぼ同じ意味です。 よく使うピアソンの相関係数は、その相関のうち、線形な関係性の強さを測るものです。 ピアソンの相関係数が高いことは相関がある(強い)、ことの一種ですが、 「相関がある」という概念はもっと広く使われています。 もし追加の疑問などありましたら遠慮なくお教えくださませ!
@ちゃんぽこ-l5l
Жыл бұрын
@@AIcia_Solid ありがとうございます! 相関という言葉は直線以外でも使うのですね。勉強になりました😊
@AIcia_Solid
Жыл бұрын
疑問が解けたようで良かったです! また何かあればいつでもお聞きください!🎉
@nire-hj9pe
Жыл бұрын
ちょうどmlagentsで遊ぶマイブームがきてたのでありがたいです!
@AIcia_Solid
Жыл бұрын
ご視聴コメントありがとうございます🎉 めちゃ楽しそうなことしてますね🤤🤤🤤 なにか面白いことできたら是非教えてください!(^o^)/
@やぁ-h8v
Жыл бұрын
unity で現実空間を表現するためのパラメータ調整に強化学習は使えると思いますか? 具体的には流体シミュレーションをやりたくて、現実空間でマイクロビーズの動きを観察して、その動きをunityで表現できるように、流体のパラメータを調節したいです。
@AIcia_Solid
Жыл бұрын
ご視聴コメントありがとうございます! あまり詳しくないですが、感覚的には、あまり向いていない気もします。 報酬の設計がうまくできれば良い気がしますが、 状態→行動→報酬→状態 という定式化ともあまり相性が良くない気がします。 ただ、私が思いつく問題点は、門外漢の意見ですので、ここをちゃんと乗り越えるアイデアなどあれば上手くいくかもしれないとは思います!
@chon6917
Жыл бұрын
強化学習のTD3という手法を使って複雑な多目的最適化問題を解いているのですが、学習によって得られた方策が似たり寄ったりになってしまって、、、 別の方策を得るには、パラメータを変えるだけでは限界があるのでしょうか、、?(問題の内容によってはDQN等の別の手法の方がいいのでしょうか、、?)
@AIcia_Solid
Жыл бұрын
ご視聴コメントありがとうございます! めちゃめちゃ深いところで試行錯誤をされているのですね!すごい! ただ、すみません、、、。タスクの性質にかなり依存すると思うので、いただいた情報からではお答えできません🙇♀️🙇♀️🙇♀️ 強化学習を専門でやられてる方などを探して、詳しく相談してみると良いかもしれません!
@カワイカトリ
Жыл бұрын
Q-learningの「Q」って、何かの頭文字なのでしょうか? Qの語源が気になりました。
@AIcia_Solid
Жыл бұрын
ご視聴コメントありがとうございます!🎉 Q-learning の Q は行動価値関数の Q で、どうもその Q は quality から来ているという説があるようです。 私も詳しくは分からないので、調べていただけるのが良いと思います!
12:45
【強化学習】全体像を見据えておこう【2つのループが特徴】RL vol. 3 #153 #VRアカデミア #ReinforcementLearning
AIcia Solid Project
Рет қаралды 11 М.
6:08
【数分解説】Q-Learning : 離散的な状態と行動の中で、最適な行動を学習したい 【強化学習】
ThothChildren みんなのわかりやすい技術解説動画
Рет қаралды 4,9 М.
00:47
VIP ACCESS
Natan por Aí
Рет қаралды 30 МЛН
00:22
Cat mode and a glass of water #family #humor #fun
Kotiki_Z
Рет қаралды 42 МЛН
00:31
Гениальное изобретение из обычного стаканчика!
Лютая физика | Олимпиадная физика
Рет қаралды 4,8 МЛН
00:33
⚡Токаев ШОКИРОВАЛ Кремль! РАЗМАЗАЛ заявлением Путина #shorts
24 Канал
Рет қаралды 941 М.
9:40
【強化学習】強化学習は行動選択の科学である【広大な分野だけどコアはこれ!】RL vol. 1 #151 #VRアカデミア #ReinforcementLearning
AIcia Solid Project
Рет қаралды 19 М.
17:35
【強化学習】価値関数 - 最適化の主役はこいつ!【価値関数を通して収益最大化】RL vol. 7 #161 #VRアカデミア #ReinforcementLearning
AIcia Solid Project
Рет қаралды 7 М.
19:05
【強化学習】マルコフ決定過程 - 強化学習の問題設定を決めてくれるやつ【5つのうち大事なのは2つ!】RL vol. 4 #155 #VRアカデミア #ReinforcementLearning
AIcia Solid Project
Рет қаралды 11 М.
11:03
【強化学習】方策 - 行動選択の担い手【こいつを学習します】RL vol. 5 #157 #VRアカデミア #ReinforcementLearning
AIcia Solid Project
Рет қаралды 7 М.
6:52
教師あり学習と教師なし学習の違いと代表的なアルゴリズムがわかる!
データサイエンスLab.
Рет қаралды 3 М.
16:18
[Reinforcement Learning] Introduction to Deep Reinforcement Learning - Let's take a look at the b...
AIcia Solid Project
Рет қаралды 2,4 М.
32:46
[Reinforcement Learning] Policy Gradient - Why? An overview that answers your questions! [Policy ...
AIcia Solid Project
Рет қаралды 1,3 М.
16:17
【強化学習】GPIと構造図 - 4つの対象の関係を図示して混乱と決別する!【強化学習は、探索と学習のループ】RL vol. 8 #164 #VRアカデミア #ReinforcementLearning
AIcia Solid Project
Рет қаралды 7 М.
34:57
【強化学習】方策反復法 - 方策評価と方策更新の繰り返しで最適方策を見つけよう!【GPIの元ネタ】RL vol. 11 #170 #VRアカデミア #ReinforcementLearning
AIcia Solid Project
Рет қаралды 6 М.
00:47
VIP ACCESS
Natan por Aí
Рет қаралды 30 МЛН