Классификация текстов нейросетями | Нейросети для анализа текстов

Рет қаралды 22,409

Andrey Sozykin

Күн бұрын

Пікірлер: 49

@CassandraBirge 25 күн бұрын

Спасибо большое!. Спасибо за отличный канал и видеоуроки).

@CassandraBirge 25 күн бұрын

а разве при переобучении можно доверять результатам сети?

@ВикторЛавлинскикх 6 ай бұрын

Спасибо! Отличный видеоурок

@AndreySozykin 6 ай бұрын

Пожалуйста!

@web_kub 4 жыл бұрын

Ты лучший! Слушать приятно. Все четко по полочам. Ты большой молодец! Спасибо!

@AndreySozykin 4 жыл бұрын

Пожалуйста! Рад, что понравилось!

@vigilit-video1765 3 жыл бұрын

Отличное видео! Кратко и по делу! Спасибо!

@AndreySozykin 3 жыл бұрын

Пожалуйста!

@Alexcei64rus 4 жыл бұрын

Спасибо за уроки! С заголовками результат получше (CNN 0.9083). Нужно не забыть также заголовки в test_sequences добавить

@AndreySozykin 4 жыл бұрын

Отлично!

@viktorpavlov4499 2 жыл бұрын

Спасибо большое!

@AndreySozykin 2 жыл бұрын

Пожалуйста!

@vladtamolov2292 4 жыл бұрын

Спасибо за лекцию

@AndreySozykin 4 жыл бұрын

Пожалуйста!

@СолодушкинСвятослав 2 жыл бұрын

Спасибо. Ждем продолжения!

@xavivore9628 4 жыл бұрын

Спасибо за видео!! Очень познавательно. Давайте Вы в следующем видео сделайте нейросеть, которая изобретёт вакцину от вируса)

@AndreySozykin 4 жыл бұрын

Тема интересная. Вирус, как и любая ДНК - это строки, которые можно воспринимать, как текст. Однако я вряд ли смогу придумать вакцину, т.к. не специалист в этом деле.

@AlexanderRodionov95 4 жыл бұрын

Бил Гейтс уже изобрел вакцину - не переживайте ))

@Alexander-iz7kk 3 жыл бұрын

Добрый день, подскажите, как использовать сохраненную обученную нейросеть, чтобы проставить категории по новым новостям, которые не имеют правильных ответов? Собственно цель и присвоить неизвестной новости нужную категорию. Как получить этот результат?

@travmopedia5918 2 жыл бұрын

Спасибо!

@ИванГригорьев-в6з 10 ай бұрын

Тоесть нужно где то раздобыть словарь {слово: число} включающий в себя все слова в языке? Есть ли способы динамически наращивать словарь без полного переобучения сети?

@ВладимирГрищенко-в2г 2 жыл бұрын

А почему мы предварительно не привели новостные тексты к формату, исключающему запятые, знаки препинания и прочие небуквенные символы?

@AndreySozykin 2 жыл бұрын

Это курс по нейронным сетям, я пытаюсь объяснить, как работают нейронки разных видов. Конечно, если сделать пред.обработку текста, то качество работу повысится. Но это уже длительное отвлечение от темы нейронок. Сейчас делаю новый курс по обработке естественного языка, там будет эта тема.

@consoleplayer301 Жыл бұрын

У тебя со второй итерации у каждой нейросети переобучение начинается и они деградируют, это не норма, модели плохие.

@ЕкатеринаМаянцева 4 жыл бұрын

Здравствуйте, подскажите, а можно как нибудь "заморозить" сверточные слои нейросети и обучить "хвост" сети на другой базе данных для распознавания речи? Или может быть есть модели типа VGG16 или VGG19, но для распознавания речи?

@auffff779 4 жыл бұрын

Привет, вопрос такой. Почему на графиках валидация на тестовом сете (оранжевая прямая) лучше, чем на тренировочном (синий цвет)? На 13:18 или на 15:05, например, это видно

@AndreySozykin 4 жыл бұрын

Это на первой эпохе, так часто бывает.

@auffff779 4 жыл бұрын

@@AndreySozykin мне кажется, это из-за того, что у вас датасет не зашаффлен, и в тесте данные не также распределены, как в тренировочном сете. Или это можно как-то иначе объяснить?

@ТимурГильманов-ь4в Жыл бұрын

Подскажите, пожалуйста, что именно нужно изменить в коде, чтобы сеть проанализировала мой набор данных(новостей), в которой только новость, без заранее известных классов.

@atlant1707 4 жыл бұрын

А есть видео о применении модели. Т.е мы создали модель и как ее применять

@AndreySozykin 4 жыл бұрын

Можно взять примеры из предыдущих видео, например - kzbin.info/www/bejne/hIGtYp58YptmjKs. Применение сети начиная с 10 минуты.

@АндрейЛаврентьев-м4ж 4 жыл бұрын

@@AndreySozykin получается array в котором столько элементов с разными значениями, сколько у нас классов. Возникает вопрос, как теперь понять, к какому классу относится новость?

@jekabachax5552 3 жыл бұрын

@@АндрейЛаврентьев-м4ж с помощью numpy. сделай np.agrMax(array)

@АлександрМанёнок 2 жыл бұрын

а разве при переобучении можно доверять результатам сети?

@РоманБ-и7ц 4 жыл бұрын

Андрей. Спасибо большое за ваши уроки, очень понятно объясняете. Решил тоже попробовать обучить сеть на своих данных, но при методе tokenizer.fit_on_texts(news) выдает ошибку, которую никак не могу победить - AttributeError: 'float' object has no attribute 'lower' может вы сталкивались с таким и знаете решение? Заранее спасибо!

@MsCornil Жыл бұрын

tokenizer.fit_on_texts(news.astype(str))

@user-xl2tf4gq1g 4 жыл бұрын

Добрый день! У кого-нибудь есть ссылка на ноутбук с сетью CNN, которая распознает сразу несколько объектов на одном изображении?

@nicko6815 4 жыл бұрын

Здравия! А для новостей на русском языке код надо менять? Благодарю!

@AndreySozykin 4 жыл бұрын

Код обучения нейросети не нужно. Изменится код подготовки данных для обучения.

@nicko6815 4 жыл бұрын

@@AndreySozykin Спасибо!

@paramoncanal5126 4 жыл бұрын

@@AndreySozykin А как его изменить? Есть набор данных на русском, хотелось бы попробовать на нём обучить P.S. Спасибо за интересный видеокурс!

@whereispie 4 жыл бұрын

Воу

@prosto_odinochestvo 2 жыл бұрын

не интересно. весь интернет усеян подобными уроками и все работают с англоязычными данными. если вы пытаетесь нести информацию для русскоязычных, то и будьте добры это делать на русских данных.

@АлександрМанёнок 2 жыл бұрын

а в чем беда? это же урок, основанный на уже собранных данных. Вы сами соберите нужное количество данных для обучения на русском, тут уже не важно какой язык использовать по сути, все равно все слова в цифры преобразуются, и уже их сеть запоминает.