Радослав, как лектор мне нравится, но его объяснение RNN отличается от того, что встречается в CS 230, Wiki и т.д. Там сначала применяются матрицы для инпута и скрытого состояния, потом результаты складываются и сверху "обмазывается" тангенсом или сигмоидой. Формулы там соответствующие. Радослав объясняет по-другому. В смысле, концептуально идея та же, но вот с конкатенацией и порядком применения матриц - несостыковка. С LSTM - аналогично. Кстати, на kzbin.info/www/bejne/ipypc6Kwn7RqaLs формулы, используемые в торче, cs230 и в Wiki (без конкатенации и с отдельными матрицами для кажого состояния)
@pupfer4 жыл бұрын
Люди делятся на два типа: 1) те кто могут продолжать незаконченные (с)