один из немногих русскоязычных каналов для качественного изучения nlp
@AndreySozykin2 жыл бұрын
Спасибо!
@ИльяЯгупов-н4я Жыл бұрын
Просто великолепное видео! Спасибо за Ваш глубокий педагогический подход!
@НиколайКоротков-ъ7с5 жыл бұрын
Как всегда отличное видео, спасибо. Уже третий раз по окончании закрываю его а потом открываю заново, чтобы лайк поставить. Добавь напоминание в конце - ставьте лайки, подписывайтесь на канал... думаю количество лайков должно возрасти.
@AndreySozykin5 жыл бұрын
Спасибо за приятный отзыв. Напоминание про лайки и подписки в видео меня раздражает :-) Думал, большинство людей также относится. Или наоборот, все уже привыкли к призывам ставить лайки?
@ArmwrestlingTV5 жыл бұрын
Andrey Sozykin контент супер годный, спасибо
@achilleselon51683 жыл бұрын
i realize Im kind of off topic but does anyone know a good website to stream new movies online?
@gideonmorgan96843 жыл бұрын
@Achilles Elon i use FlixZone. Just search on google for it =)
@sorenkane58653 жыл бұрын
@Gideon Morgan definitely, been watching on FlixZone for since april myself :D
@galymzhankenesbekov29244 жыл бұрын
просто прекрасные видео! Огромное вам спасибо, за знания!
@AndreySozykin4 жыл бұрын
Пожалуйста! Рад, что понравилось!
@MrNovoross863 жыл бұрын
Очень очень интересно. Большое спасибо!
@AndreySozykin3 жыл бұрын
Пожалуйста!
@DenisDementiev4 жыл бұрын
Огромное Вам спасибо!
@AndreySozykin4 жыл бұрын
Пожалуйста!
@СолодушкинСвятослав2 жыл бұрын
Спасибо. Очень познавательно
@shaha24115 жыл бұрын
Спасибо большое!
@AndreySozykin5 жыл бұрын
Пожалуйста!
@Ankerok15 жыл бұрын
Спасибо за видео, ждем следующих двух! В них вы покажете способы визуализации результатов? В форме пятиконечной звезды, например, или другими.
@AndreySozykin5 жыл бұрын
Не понял про визуализацию в форме звезды :-) Можете дать ссылку на примеры?
@yaroslavmironov10754 жыл бұрын
Для рекурентных сетей рекомендуется использовать оптимизатор RMSProp
@AndreySozykin4 жыл бұрын
Есть такие рекомендации, но также есть и рекомендации использовать adam. Мне кажется, лучше пробовать оба оптимизатора.
@yaroslavmironov10754 жыл бұрын
@@AndreySozykin а в каких случаях лучше использовать adam?
@Sketlaver5 жыл бұрын
Ни разу не программист, но чет стало интересно как можно создать нейросеть которая будет играть в игру сама. Очень хочется посмотреть за процессом обучения.
@AndreySozykin5 жыл бұрын
В видео используется обучение с учителем, а для игр применяется другой тип обучения - обучение с подкреплением.
@jjj78ean4 жыл бұрын
Хорошее видео. Но совершенно непонятно , что делать не с готовым датасетом, а со своим. Не мог бы ты на небольшом примере показать, как например самим из 100 отзывов сделать датасет(токенизация,стемминг, создание массива нулей\единичек) и как засунуть это добро в нейросеть
@AndreySozykin4 жыл бұрын
Про работу со своим набором данных есть отдельное видео - kzbin.info/www/bejne/l2K0kKWworJ4eck
@da_costa-h7t4 жыл бұрын
Это же не относится напрямую к машинному обучению. Достаточно знать немного программирование
@kuqmua7555 жыл бұрын
Можете подсказать примеры детекции например "котиков/собачек" в реальном времени. Например есть news feed и для каждого поста где прикреплено изображение нужно задетектить на изображении "котика/собачку", а затем провернуть какое-то действие с этим постом до того как показать пользователю. Больше всего интересно может ли такая система с большим количеством обьектов детекции работать в real time ну или с задержкой 1-5 мин(и как оценить время детекции и размер моделей- держать их в оперативке или на ссд/жестком диске? Сколько вообще памяти могут занимать модели? Есть какая-нибудь статистика?). Интересует сколько может занимать вес модели и примеры архитектур паралельной детекции. (Например встроить промежуточный сервер который будет находиться между соц сетью/блогом и пользователем, принимать ленту новостей с сервера соц сети, детектировать кошечек/собак, удалять посты с ними а затем возвращать ленту новостей пользователю уже без кошечек и собак
@AndreySozykin5 жыл бұрын
Интересное предложение. Сделать можно, но проект будет достаточно большой и сложный. Кроме того, нужно много всего дополнительно к нейросетям знать, в том числе как деплоить модели на серверы и т.п. Работа в реал-тайм - это тоже отдельная большая тема.
@kuqmua7555 жыл бұрын
@@AndreySozykin а где про это можно спросить кроме чатика opendatascience в слаке или в каком-то чате телеграмма не подскажите?
@derafum2 жыл бұрын
Спасибо за видео. Для русского языка подойдёт нейросеть ?
@СергейПащенко-р5ж5 жыл бұрын
Мне показалось, или вы не отмасштабировали данные перед обучением. Насколько я понимаю, для сетей это критично. Когда-то читал, что переобучение может возникать в таких ситуациях, если алгоритм определения нормы по перекрестной энтропии и оптимизатор вообще сработают. Или масштабирование где-то выполнилось автоматически?
@СергейПащенко-р5ж5 жыл бұрын
I am a little confused
@da_costa-h7t4 жыл бұрын
Думаю автор просто показал как делать не нужно)
@RustemShaimagambetov5 жыл бұрын
Добрый день, Андрей! Позвольте спросить 1.А что за 4-ое видео с ограниченным доступом?) 2.когда будут следующие выпуски?? Очень сильно ждем! 3.Касательно обучения word2vec, например для казахского языка. Где можно подобрать для него соответсвующий датасет? Пробовал через api wikipedia kz, но там статьи поштучно парсить долго времени уходит(статей 200к+), встречали ли вы для таких случаях собранные в одном месте такие данные.
@AndreySozykin5 жыл бұрын
Видео с ограниченным доступом - это и есть следующий выпуск :-) Что-то было неправильно с настройками публикации, сейчас починил и видео доступно. С датасетами на казахском языке не встречался, к сожалению.
@da_costa-h7t4 жыл бұрын
Нашли данные на казахском?)
@ne4to7775 жыл бұрын
Я так понимаю, расчет количества нейронов и слоев это тайна за семью печатями, которую знают только избранные
@AndreySozykin5 жыл бұрын
Нет, это не тайна, а сложное искусство подбора гиперпараметров. Его значительно облегчают автоматические инструменты, такие как Keras Tuner и HyperOpt.
@saralige4 жыл бұрын
Скорее всего, у вас оговорка. Слово "the" имеет код 4 а не 3, и так далее...
@AndreySozykin4 жыл бұрын
Да, не правильно сказал. Спасибо, что заметили.
@EdwVee5 жыл бұрын
Почему слов 200, а входных нейронов 128?
@AndreySozykin5 жыл бұрын
Количество входный нейронов может быть любым, не обязательно по количеству слов. Каждое слово подается на вход всем нейронам. Поэтому проблем с разнам крличеством слов и нейронов не возникает.
@EdwVee5 жыл бұрын
@@AndreySozykin я не понимаю как это происходит. Вы не могли бы объяснить? Если каждое слово подаётся на вход каждому входному нейрону, то это и должны быть входные нейроны, а входные промежуточными. То есть нейросеть из четырех слоев с конфигурацией 200 128 64 1 получается.
@СергейПащенко-р5ж5 жыл бұрын
@@EdwVee можешь считать, что данные, которые подаются на вход (они же слова, точнее их интерпретация в виде частотности), это нейроны с линейным автиватором, у которых есть свой весовой коэффициент.
@ne4to7775 жыл бұрын
Честно говоря, прозрел, когда увидел, что тексты оцифруют по принципу частоты их использования и это даст результат. Как оказалось, не даст. Зачем тогда это видео?
@AndreySozykin5 жыл бұрын
Это дает результат, но не для нейронок.
@vladtamolov22924 жыл бұрын
Норм
@Думбасов3 жыл бұрын
А лекций нет, обман, ЖУЛИК
@doniyordjon_pro Жыл бұрын
index = 3 message = '' for code in x_train[index]: word = reverse_word_index.get(code-3, '?') message += word + ' ' message _________________________ что значит code-3, и почему именно -3 ?