Huh, youtube can auto-dub videos like this now. It's surprisingly understandable. Interesting
@AIcia_Solid6 күн бұрын
Thank you for your watching and comment!!🎉 I'm also the one who are exicted about the new translation feature! I'm happy if you can get something from my video🥳 If you are interested in, please watch other videos, thank you!
分かりやすい説明ありがとうございました。平行移動に対する頑健性の理屈に興味があり、事例の26x26に対してカーネル?サイズ13x13だと確かに頑健だと思いますが、 max poolingは2x2で使われることが多いように見受けます。その場合は頑健性はほとんど発揮できないように見えるのですが、実際はそんなことはないのだと 思います。それはどのような仕組みで実現されているのでしょうか?多分、多層化することで実現できているのだと推測しますが、いまいちイメージできません。 解説頂けるとありがたいです。
@AIcia_Solid12 күн бұрын
ご視聴コメントありがとうございます! 素敵な疑問ですね!!! たしかに 2x2 Max Pooling 単体ではそんなに頑健性がないですが、 おっしゃるとおり層を重ねる中でなんども Max Pooling を利用することになります。 その積み重ねで、全体としての頑健性が得られるのだと思います! (本当に確定的に物を言うには、それを検証する実験が必要ですが、大まかな理解としては間違っていないと思います!)
ご視聴コメントありがとうございます! ご指摘のとおり、ここはやや分かりづらいかもしれませんね、、、! vol. 5 では、channel についてあまり説明していませんでした。 入力に channel が複数ある場合、たとえば W x H x C (weight, height, channel) の場合、n x n conv. の1枚の filter のパラメーターは n x n x C だけあり、チャネル方向にも内積を取っています。 そして、それが出力チャネル C' 枚だけあり、パラメーターの総数は n x n x C x C' だけあります。 なので、1x1 conv. の場合は、1枚の filter が 1 x 1 x C だけパラメーターがあり、チャネル方向の情報をまとめて処理する効果があります。 このあたりは、普通に web にある畳み込みの資料をみるのがわかりやすいかもしれません! まだ疑問があれば、遠慮なくお聞きください!