Каптчи всё! Создал НЕЙРОСЕТЬ, что ЧИТАЕТ ИХ ВСЕ!

Рет қаралды 27,474

TESSERACT

Күн бұрын

Пікірлер: 137

@tesseract_ Ай бұрын

Самое крутое моё видео. Очень старался, точно узнаете что-то новое! Приятного просмотра)

@ukrainetoday960 Ай бұрын

Спасибо

@MentorOfMentors Ай бұрын

Теперь не распознание капчи - это признак что перед вами человек )

@tvsettv Ай бұрын

Что кстати и используется умными захватами.

@СергейМарачев-щ9м 25 күн бұрын

На собеседовании: - к сожалению мы не можем принять вас на работу - почему? - вы пили воду прямо из бутылочки и не разу не подавились. Очевидно, что вы робот!

@istinaanitsi3342 3 күн бұрын

так заложите процент ошибок, срисуйте глупого и пьяного

@KostsovKonstantin Ай бұрын

3 строчки кода , 7 лет практики, 15 лет обучения. 3 строчки - ерунда. 😅😅. Видео отличное.

@tesseract_ Ай бұрын

Кстати, интересно, что капчи использовались для обучения одних из первых нейросетей. Люди, проходя их, создавали огромные датасеты. Таким образом, одни из первых нейросетей научились распознавать рукописный текст плохого качества, а также картинки и объекты на них 😮

@davidsuragan Ай бұрын

человек гений который сделал капчу и тренировал модел

@InfSub 29 күн бұрын

Подскажите, есть ли видео как обучить нейросеть? Ни когда этим не занимался, по этому полный чайник в этом вопросе . Распознание капч прикольно, но мне нужно немного для иных целей, цифры, в некоторых случаях печатный текст, гораздо реже, но тоже желательно - рукописный текст. В идеале найти/отличить на первом шаге наличие определенного объекта с текстом, а не разгадывать все что есть на картинке.

@tesseract_ 29 күн бұрын

@@InfSub Конкретно у меня нет, поскольку это известная тема и, насколько мне известно, есть куча уже готовых моделей для ваших целей. Если у вас не какие-то суперспецифические цифры, печатный или рукописный текст, то они вам подойдут. Думаю, не составит труда найти их в Интернете.

@Sopushynskyi 26 күн бұрын

@@InfSubпочитайте книгу - тарик рашид «создаем нейронную сеть»

@АнтонТай Ай бұрын

Красавчик что изучаешь ml. Рассуждаешь грамотно. Отмечу несколько важных замечаний: 1. Это не сложная нейронная сеть - это старая известная архитектура. 2. Дропаут это не слой - это метод регуляризации. 3. Капча не сложная. Если интересно развиваться в этомтнаправлении и нужна работа - пиши!

@anton73245 Ай бұрын

мне было бы интересно 🫡

@tesseract_ Ай бұрын

Спасибо. Со всеми замечаниями согласен.

@artemfhi9118 Ай бұрын

куда писать?

@Sylamnyyr Ай бұрын

@@artemfhi9118 +

@georgevonfloydmann1797 Ай бұрын

Капча капче рознь, справедливости ради) одно время наблюдал за разработкой нейросети для распознавания объектов и их положения, для того чтобы потом задать объектам нужное направление. Вот это интересно! Думаю тема капчи и нейросетей будет жить еще какое то время, пока капчу не заменят интеллектуальными задачами на логику. Кстати, мне интересно, куда писать? Мне тоже интересно развиваться)

@АндрейХарин-ы1ф Ай бұрын

Спасибо за крутой обзор, хотелось бы подробный гайд от тебя по написанию подобных нейросетей.

@cododelia Ай бұрын

Круто, думаю опробую) У меня текущая реализация на основе YOLOv10 с распознаванием боксов для каждого символа, затем по координатам собирается капча. Датасет самосборный, на 750 картинок, но общая точность уже выше 60% (что полностью меня не устраивает) проблема именно в том, что каждый дополнительный символ сильно увеличивает шанс ошибки

@Банки 19 күн бұрын

Капчи сейчас гораздо более сложные и учитывают поведение пользователей. Условно: ты думаешь, что достаточно найти все светофоры. Но так же учитывается как ты водишь мышью и как быстро находишь ответ.

@tesseract_ 19 күн бұрын

@@Банки Я уже сделал и опубликовал видео про это :)

@augustlight48 Ай бұрын

ВАУ. Очень крутое видео. Я и сам писал что-то подобное несколько лет назад, но в этом видео более элегантное решение. Увидел бы я его год или два назад - цены бы не было! Качественный материал, ещё и на русском. Ну это точно лайк и подписка

@haykera2338 11 сағат бұрын

спасибо за видео, но ощущение, будто вы пытались сделать на скорость обьяснять прям совсем с нуля не нужно, да, но банально рассказать, где какие переменные за что отвечают, можно хоть вообще в глобальные вынести, дабы было проще рассказать, как работать в случае, если хочется добавить датасеты на другие капчи (другие размеры картинок, другие размеры капч по символам) получилось то вроде интересно, но вроде и ничего полезного в сухом остатке как для проходного видео - круто как для полезного видео - очень скудно пишу не с целью как то принизить, а с целью получить вторую часть

@demonlorddragon 13 күн бұрын

4:53 - словарь это массив элементов "ключ-значение", как правило ключ - это уникальное слово или число, а значение - может быть любым набором данных. при обращении к ключу можно получить значение, но это работает и наоборот. ничего магического в этом нет. в данном случае буквам присвоены порядковые номера, массив перебирает пары в словаре, находит совпадение и выдает или номер или значение. библиотека для этого не нужна, можно и самому сделать эту функцию в 7-12 строк. А вот благодаря остальному коду "которого нет" есть лишь ссылки на библиотеки, придется лопатить кучу литературы, чтобы адаптировать под нужный тебе язык.

@DmitryStik 24 күн бұрын

Реально красава, просто мощный тип. Давай создавай теперь сверх ии😅

@Artemon-yl5ze 7 күн бұрын

Вопрос, разве 100% точности на данных обучающего датасета это не признак переобучения? Очень интересно посмотреть на проверку на других датасетах капч

@ЖанарДуйсенбиева-х5в Ай бұрын

Круто! Ждём когда напишут нейросеть который создаёт капчи

@tesseract_ Ай бұрын

@@ЖанарДуйсенбиева-х5в Это уже к генеративным ИИ) Но не удивлюсь увидеть подобное в ближайшее время.

@yagohush7414 24 күн бұрын

а сейчас капчи что, человек в ФШ рисует?..

@КириллБелоусов-и6ю 24 күн бұрын

Видео было бы идеальным, если бы ты на каждом шагу не подчёркивал, что это сложно, ну очень сложно, нереально сложно, нейросеть сложная, аж прям сложнее некуда, ну прям пентагон как сложная. Выглядело так, как будто ты всеми силами пытаешься доказать миру, что решил нереально сложную задачу повышенной сложной сложности на сложном уровне :) ML это правда сложно, но видео могло быть минут на 5 короче, если бы не было так "сложно". Ну или в эти 5 минут влезло бы больше конкретных объяснений.

@TheDergraue 19 күн бұрын

Да, но это все сложно... ))

@cherimolah9493 Ай бұрын

Видео крутое, очень интересно смотреть как создавать правильно нейронки, потому что меня ничего не получается

@EnhanceUp Ай бұрын

Блин, это реально круто! Очень крутое видео с интересными обьяснениями)

@boost_456 Ай бұрын

Очень крутая сеть получилась. Сам придумал такую архитектуру? Ещё вопрос, почему не используешь блокноты ipynb? В них же очень удобно делать всякие нейронки

@tesseract_ Ай бұрын

@@boost_456 Спасибо. Архитектуру придумал не я, это один из примеров Keras; ссылка в описании. Я о ней рассказал, добавил графический вывод, сохранение и загрузку модели.

@iarde3422 Ай бұрын

А вы картинки только вычитываете на текст, но есть же ещё те, в которых на картинки надо нажимать, на вопросы отвечать, на примеры или задачи решать, у Яндекса есть ещё значки, которые нужно выбрать, в каком порядке они на рисунке присутствуют. Ваша нейросеть все эти виды проверок решают? А ещё, как быть с проверками, где просто галочку надо поставить?

@tommygrenkin Ай бұрын

На каждый вид капчи - потребуется отдельное решение, капча Яндекса специально сделана так, чтобы нейросеть ошибалась. В этом и идея капчи, что машина не справится. Технологии развиваются, но и капчи не стоят на месте. В этом видео капчи еще эпохи до хайпа нейросетей, поэтому сейчас они все легко решились. Капча, где нужно галочку поставить - собирает информацию о пользовании сайтом: движение курсора, временной промежуток между запросами и другое взаимодействие - характерно ли оно для живого человека. Если все ок, то просто галочку поставить просят, иначе дополнительные испытания будут. Есть статья 2019 года, где такую капчу решали с помощью обучения с подкреплением и успешно в 97.4% случаях, не знаю прокатит ли такое в 2024, атвторы капчи тоже эти статьи читают

@tesseract_ Ай бұрын

@@iarde3422 Очевидно, что нет. Чтобы решались другие типы капч, нужны другие нейросети. Не знаю ничего про ваш яндекс, но про капчу гугла reCAPTCHA v2 видео будет. И, очевидно же, что галочку поставить - это совсем просто.

@JanPoklen Ай бұрын

Я человек, а 100 из 100 капч не решаю 😂

@tesseract_ Ай бұрын

@@JanPoklen Думаю за 1040 капч есть огромный шанс хоть раз ошибиться)

@МаксимЭлектрик-р3ы 29 күн бұрын

Нейросеть выделяет информацию в катрине - у человека это называется фокус внимания) 🤠

@ИванЛобанов-н7т 17 күн бұрын

"Как создать нейросеть для 100% чтения каптч?" "Будь здоров."

@mousepro9963 22 күн бұрын

эти капчи и без нейросетей я лет 10 назад решал...

@StartuePotoya Ай бұрын

Спасибо. Я как бы чуть-чуть могу пользоваться программированием. Отец попросил поставить ему локально нейросеть языковую, которую можно обучать на основании текстовых материалов, что бы задать ей определённый характер ответов (как ai жириновский) , ,но на другом человеке.. как вкатиться? Я уже на стадии открыта VScode, настроен комплятор пип инстал , инит мэйн ) что писать?)) или какой набор готовый качнуть?

@tesseract_ Ай бұрын

@@StartuePotoya Пожалуйста. Честно говорю, я не знаю как это сделать. Это очень сложно. Тут наверняка нужно использовать готовую архитектуру, но врядли даже такое можно найти, поскольку вы входите в область генеративности, где используются машины Больцмана и подобные математические аппараты, с которыми интересно, но страшно сложно. Кроме того на подобном зарабатывают деньги, а значит в свободном доступе врядли получится такое найти. Могу только пожелать успехов 🤷‍♂️

@tesseract_ Ай бұрын

@@StartuePotoya Можно попробывать типо ChatGPT с задаными условиями как ему отвечать, но это можно сделать и на их браузере онлайн. Если же нужно прям приложение, то вам уже нужен их API, что стоит денег.

@tommygrenkin Ай бұрын

Это называется файнтюн - когда берется уже обученная универсальная модель и дообучается на узко специализированной задаче. Если уже есть данные для обучения посмотри маленькие модели на huggingface, например Qwen2-7B. Код для файнтюна обычно легко гуглится, проблема лишь найти вычислительные мощности для обучения да датасет составить в требуемом формате =)

@061soul Ай бұрын

Попробуй notebooklm, можно загрузить текстовые источники и уже чатить с ними

@arhel1205 Ай бұрын

А теперь Recaptcha2 и 3 давай

@ussuratoncachi Ай бұрын

Не смотрел видео полностью, промотал его. Из того, что я увидел, здесь из капч только черный текст с полосками на белом фоне. Увы, почти везде используется гугловская рекапча или яндексовский аналог. А там анальные тесты типа "выберите животное, которое стоит вертикально" и с кучей искажений.То, что на видео, - это устаревшая на 10 лет капча. Так что нет, капча - не "всё!", вопреки заголовку.

@ussuratoncachi Ай бұрын

Видео прикольное, лайк ставлю. Но заголовок - кликбейт

@tesseract_ Ай бұрын

@@ussuratoncachi Если б не этот заголовок, ты бы не зашел и не посмотрел бы видео, что, как ты сам выразился - прикольное. Меньше всего мне хочется провести целую кучу времени, делая видео, и потом чтобы никто его не посмотрел.

@vladislavlymar 28 күн бұрын

А если длина ответа не всегда равна 5 символам? Возникает это: Cannot add tensor to the batch: number of elements does not match. Shapes are: [tensor]: [5], [batch]: [4] [Op:IteratorGetNext] Можно как-то это поправить?

@tesseract_ 28 күн бұрын

Конечно можно. По хорошему: 1. Соберите тренировочный датасет, который включает: Капчи разной длины (например, от 3 до 7 символов) Примерно равное количество капч каждой длины для баланса 2. При создании нового датасета убедитесь, что: # Проверка распределения длин lengths = [len(label) for label in labels] unique_lengths = np.unique(lengths) print("Lengths present in dataset:", unique_lengths) for length in unique_lengths: count = sum(1 for l in lengths if len(l) == length) print(f"Капч длины {length}: {count}") 3. Переобучите модель на новом датасете: # Проверьте максимальную длину в новом датасете max_length = max([len(label) for label in labels]) print(f"Maximum length in dataset: {max_length}") # Создайте и обучите модель model = build_model() history = model.fit( train_dataset, validation_data=validation_dataset, epochs=epochs, callbacks=[early_stopping], )

@tesseract_ 28 күн бұрын

Можно не по-хорошему) Использовать такую модель, но тогда нужно много чего переделывать в коде, да и не правильно это, точность будет плохая.

@AlexanderCOOLer Ай бұрын

Красава, очень годно. Буду ждать ещё видео по нейронкам и конечно ссылочки на код под видео, интересно будет самому поиграться. Когда наберётся много проектов, сделай видео для новичков, как это всё развернуть, настроить окружение с чистого листа, я думаю будет полезно. Пару советов по монтажу. В связи с тем, что ближайшее будущее за OLED экранами, лучше всего графики и тд выглядят либо на белом, а ещё лучше на чёрном фоне, но не на сером. Именно на этом оттенке +- оледы могут давать всякие визуальные эффекты некрасивые (эффект грязного экрана, временное выгорание), если хочешь чтобы твои видео и через 3 года смотрели, нужно делать их современными уже сейчас. Если требуется сменить фон с белого на чёрный, попробуй просто инвертировать цвета картинки, это работает и навыков художника не требует, времени 10 секунд на поиграться с контрастностью и прочим. У анимаций (если они не твои) ты можешь делать стоп кадры, чтобы динамика на экране совпадала с тем что ты говоришь. Это то, что сразу заметил как варианты что можно улучшить, развивай навыки монтажа, качество материала и сценарий уже на очень хорошей уровне, продолжай развиваться и твори) Успехов!

@tesseract_ Ай бұрын

@@AlexanderCOOLer Спасибо, всё учтем) Ссылочки на код уже есть и всегда у моих видео были :)

@AlexanderCOOLer Ай бұрын

@@tesseract_ да, код видел, спасибо. Я про то, что жду его не меньше чем сами видео, может не так выразился

@iarde3422 Ай бұрын

Вариационный - это который валидол принял?

@VladislavKasperchuk Ай бұрын

Это очень круто! я начинающий в изучении ии, хотел бы найти себе единомышленников, не хотел бы пообщатся?

@tesseract_ Ай бұрын

Спасибо! Рад, что тебе интересно! К сожалению, я не могу пока уделить время на общение, может когда-нибудь сделаю с этой целью стрим. Но думаю, среди других зрителей найдутся единомышленники. Удачи в изучении ИИ!

@Eazy1art Ай бұрын

Lu4iY (лучший, типо каптча :))

@danil907 Ай бұрын

Бывают и такие что и человеку то сложно понять что там нарисовано

@vladimirobernin5594 12 күн бұрын

Здравствуйте! Как с Вами связаться? Хотим предложить Вам решить задачу на коммерческой основе

@tesseract_ 12 күн бұрын

@@vladimirobernin5594 С уважением, зачем вам связываться с не понятно кем с ютуба. Если у вас все серьезно, обратитесь лучше в IT компанию.

@vladimirobernin5594 5 күн бұрын

С IT компаниями будет долго и дорого. Задача на пару сотен тыс руб. Уверен, что Вам по силам и достаточно интересная. С уважением!

@ДюжинаМолодцев-щ4г 4 күн бұрын

@@vladimirobernin5594 😁

@Vladimir3444-o6w Ай бұрын

Круто, жаль не понимаю

@tesseract_ Ай бұрын

@@Vladimir3444-o6w Спасибо. Ничего, тут рассматривается довольно сложная нейросеть. Можно начать с чего-то попроще. Например, у меня есть видео про создание простой нейросети с нуля, тоесть, с полным разбором кода. Да, там конечно не так интересно, но тем не менее, для начала то что надо.

@raphaild279 Ай бұрын

Привет. Дядя можете мне помочь понять как развернуть модель circlenet в Windows 11. Систему под обучение я настроил.

@tesseract_ Ай бұрын

Привет. Так а в чем проблема? Я конечно не всезнающий, и эту непосредственно модель я ни разу не использовал, но я зашел на их гитхаб - github.com/hrlblab/CircleNet и как мне кажется, там все предельно понятно. Даже есть пример использования. А насчет системы, какая вообще разница, хоть Windows 7 - от этого ничего не зависит.

@thebatsun 23 күн бұрын

Это все конечно хорошо, но совсем нету обоснования почему выбрана то или иная структура слоя, почему именно такая функция активации и т.д. Вы в этом не разбираетесь или решили опустить в угоду публицистике? Хотелост бы больше информации, зачем нужен тот или иной слой и почему именно он и почему именно в этот момент, а не еак букву в цифру функцией перевести. Без негатива.

@tesseract_ 22 күн бұрын

@@thebatsun Бралась архитектура под распознавание рукописного текста, а затем корректировалась под такие капчи. Создание нейросетей - это чисто эксперементальный процесс. Думаю, в даном случае, на вопросы ответит какая-нибудь подробная статья или научная робота про нейросети по распознаванию текста, где написано, как они очень очень долго эксперементировали с слоями и кол-вом нейронов, чтобы прийти к такой архитектуре.

@Alex-dd4ct 23 күн бұрын

Как теперь сделать, чтобы такая нейросеть решала эти капчи автоматически, когда они попадаются?))

@tesseract_ 22 күн бұрын

@@Alex-dd4ct Делать на её основе бота :)

@magictime8959 Ай бұрын

чтобы создать нейросеть нужно взять библиотеки для создания нейросетей тоесть чтобы создать нейросеть нужно взять готовые нейросети

@tesseract_ Ай бұрын

@@magictime8959 Абсолютно точно нет)

@tarkhidden Ай бұрын

Пока что создание нейросетей кажется похожим на средневековую алхимию. Экспериментально удалось установить, что нагретая смесь из лобковых волос молодой девственницы и нарубленных тентаклей зелёного монстра превращаются в золотистую пыльцу довольных фей, которая помогает людям быстрее запоминать песни. Немного. Количественно не измерить. На ощущениях. На всех видео, что я видел, всегда показывают уже написанный код с уже подобранными (?) слоями. Скажите, пожалуйста, если бы у вас стояла задача распознавания автомобильных номеров, с чего бы вы начали и почему? Можно снять видео, как пишется нейросеть с самого начала, включая подборку слоёв и обучение-тестирование? Мне хочется написать нейросеть для распознавания текста с картинки, как Finereader, например. Нет, мне не хочется взять уже готовые обученные нейросети, если такие есть, мне нужно разобраться, каким образом они делаются, и результат не особо важен, потому что хочется понять ПРИНЦИП ИХ СОЗДАНИЯ.

@tesseract_ Ай бұрын

@@tarkhidden Это может показаться банальным, но сразу отвечаю насчет автомобильных номеров: я бы посмотрел есть ли уже существующие модели))) И дело не в том правиле, что лучше всего тот код, что не нужно писать самому. А дело в том, что тут нет никакого правила, что бы сказало вам какие конкретно слои вам нужны. Все подбираеться эксперементально. Все нейронные сети создавались одинаково: выбирались слои, что казались найболее подходящими; обучение, тесты, выбор других слоев, обучение, тесты, сравнение. Зацикловуем это - бам, в какой-то момент мы поймем, что даст лучший результат) Почему же никто не показывает подбор слоев? - Думаю ответ уже ясен.

@Gribb-ai Ай бұрын

думаю тебе лучше начать с чего нибудь по легче, допустим распознавание рукописных цифр с помощью mlp(многослойного персептрона). изучив так сказать базу, можно будет начать изучать более сложные архитектуры. искать инфу можно в ютубе и хабре.

@tarkhidden Ай бұрын

@@tesseract_ короче, поможет только опыт) Жаль, жаль, я думал, есть какой-то универсальный рецепт, но даже теоретические знания про все слои не дают подсказок, какие из них как и когда применить. Спасибо за ответ)

@tarkhidden Ай бұрын

@@Gribb-ai наверное, так и есть)

@Gribb-ai Ай бұрын

@@tarkhidden если хочешь могу помочь 🤷‍♂️

@arsentel Ай бұрын

👌👌👌👌👍👍👍👍👍👍👍👍

@minecraft4317 Ай бұрын

Видео надо было назвать делаем уже сделаный велосипед, почитайте зачем эти капчи существовали и сейчас такие капчи не встретить, странно да? Если я не прав давай тогда сделаем распознаванием и решением новых капч с пазлами на картинках или что-то типо того:)

@tesseract_ Ай бұрын

@@minecraft4317 1. По твоей логике не нужно вообще изучать все интересное, что неактуально. 2. Я уже делаю видео про нейросеть для reCAPTCHA v2.

@ДмитрийСоломойченко 23 күн бұрын

Мне было интересно. Думаю остаться тут надолго.

@Reincarnation-rt2rm Ай бұрын

Обычная капча ладно,а более продвинутая потянет?Гугл капча,передвижение ползунка. ну выбор животных по порядку думаю проще даже.Ну помимо решения,там еще рандом и эмуляция пользователя часто нужны

@tesseract_ Ай бұрын

@@Reincarnation-rt2rm Потянет такую, на которую её научат. Тут проводилось обучение на конкретном датасете. Нужно для других типов капч, тогда учим на них :) Найти датасеты, это непросто. Формировать самому ещё сложнее.

@ROFLAN3b4L0REAAL Ай бұрын

@@tesseract_ тут можно даже не мудрить и тупо по wind mouse мышку двигать. датасет можно сделать тупо сбором с сайтов через тампермонки и методом (забыл как называется, обучаем модель на мелком датасете и через неё прогоняем весь датасет и просто корректируем его) и всё, по итогу люди заменены

@tesseract_ Ай бұрын

@@ROFLAN3b4L0REAAL Я еще не эксперт, но сейчас активно изучаю эту тему. Хочу сделать видео о решении reCAPTCHA v2. Она на самом деле очень замудренная и нужно учитывать очень много деталей. А вот reCAPTCHA v3 пока что кажется шагом назад - не удивительно, что большинство так и остались на v2. В общем, если все выйдет, а я в этом уверен, будет интересно)

@sergwest585 Ай бұрын

@@tesseract_ да нее... v3 - просто прорыв для пользователей. Ботам прийдётся эмулировать полное поведение человека: медленный ввод, qwerty и dworak, не моментальные переходы. Иначе сразу детектит бота. А если боты будут по скорости как человеки, то хороший вопрос: а зачем они? и да, под re captcha v2 тебе желательно переделать ии, тк там не настолько всё просто из-за патернов генерации

@tvsettv Ай бұрын

Тупых захватов может и прочтет всех, а хитрых - всех никогда.

@tsvigo11_70 Ай бұрын

На Python теоретически невозможно сто процентов распознать потому что он использует внутри себя числа с плавающей запятой.

@tesseract_ Ай бұрын

@@tsvigo11_70 Я надеюсь вы это не серьезно…

@sergwest585 Ай бұрын

а как это мешает?

@tsvigo11_70 Ай бұрын

@@sergwest585 , а так что это вызывает непредсказуемые ошибки потому что они при округлении ведут себя неопределённо. И если в генерации изображений да и хрен то с ним посмотри сейчас Flux лежит то в серьёзных приложениях типа роботов или архитектуры-машиностроения это нельзя.

@sergwest585 Ай бұрын

@@tsvigo11_70 про округление хз. Вроде очень даже определено. мантиса сдвигается на экспоненту вправо как и во всех языках (c, java, js, c#). И в этом мире много чего лежит, нампример последний апдейт clang'а. Это же не причина ставить крест на C'ях (тем более не понял при чём тут плавующие точки). Питон в этих областях очень даже предсказуемый (тяжёлый, но предсказуемый)

@tsvigo11_70 Ай бұрын

@@sergwest585 , найди статью Юровицкого "IEEE754-тика угрожает человечеству". C++ программы выполняются сами по себе то есть за них отвечают те программисты которые их написали а Python это язык сценариев которые выполняет интерпретатор. Если ты мне не веришь почитай рекомендации по программированию ядра Линукс там не рекомендуют числа с плавающей запятой использовать.

@DanyilDorofieiev Ай бұрын

К сожалению таких капч уже почти не существует, сейчас капчи это в основном всякие логические картинки где надо что-то выбирать, перетаскивать, это уже не вписать просто набор символов

@jackiewaltryan Ай бұрын

ага, щас! дохрена вот такого еще осталось... наверное все сайты, которые не используют каптчу Гугла, сидят вот именно на таких картинках... постоянно с такой фигнёй сталкиваюсь...

@DanyilDorofieiev Ай бұрын

@@jackiewaltryan я просто в крипте сижу, там нет древних капч

@sergwest585 Ай бұрын

@@jackiewaltryan ложь, эти капчи сильно устарели уже как десять лет. В новых (с которыми вы возможно путаете) добавлен шум, рыбий глаз сильнее и небольшие волны смещения, чтобы как раз нейронка не разбивала буквы по вертик. линиям

@zi0wiz Ай бұрын

Как это сложно. ты даже не предствляешь как это выглядит абстрактно. Только что бы обьяснить как это работает, без примеров кода можно плейлист создать.

@ForseNight Ай бұрын

Вроде сайт есть в котором за написание капч даются копейки, я там 15 рублей вроде для кое-чего заработал зачем-то : ]

@tesseract_ Ай бұрын

@@ForseNight Там наверняка каптчи посложнее, и вероятно стоит какая-нибудь защита от автоматизации.

@hobbyrussia Ай бұрын

А не слишком ли много слоев для распознавания бессвязных символов, как будто эта нейросеть больше для другого сделана, как показывается в видео далее (Распознавание слов )

@tesseract_ Ай бұрын

@@hobbyrussia Попробуй поменять и узнаешь)

@yuva6392 21 күн бұрын

Спасибо. Квасное видео😂

@aresd6936 9 күн бұрын

@txc_mmrl 28 күн бұрын

Я только начинаю вникать в ДС, поэтому вопрос может показаться глупым. Почему, когда мы получили 100% точности это не считается оверфитом? Какой вообще критерий оверфита?

@ЛеонидПопов-в7м 28 күн бұрын

самый частый критерий - точность на обучающей выборке значительно больше, чем на валидационной (которая не участвует в обучении нейросети)

@txc_mmrl 28 күн бұрын

@@ЛеонидПопов-в7м Какие ещё есть критерии?

@tesseract_ 28 күн бұрын

100% точность на тестовых данных не обязательно означает переобучение (оверфит). Ключевой момент в том, как модель достигает этих результатов и на каких данных они получены. Вот основные критерии для определения переобучения: 1. Разрыв между обучающей и тестовой выборкой: Если модель показывает 100% на обучающей выборке, но значительно хуже на тестовой - это явный признак переобучения Если 100% достигается на независимой тестовой выборке - это может быть нормально 2. Сложность задачи: В случае с капчей, если это простые символы с минимальным шумом, то 100% точность вполне достижима без переобучения Это похоже на то, как человек может безошибочно читать четкий текст 3. Поведение на новых данных: Если модель сохраняет высокую точность на совершенно новых капчах того же типа - это признак хорошей генерализации Если точность резко падает на слегка измененных капчах - это может указывать на переобучение 4. Размер и разнообразие обучающей выборки: Если 100% достигнуто на большом и разнообразном наборе данных - это более надежный результат Маленькая выборка повышает риск переобучения В нашем случае 100% точность действительно может быть нормальным результатом, а не переобучением: 1. Объем данных: 1040 изображений, из них ~936 для обучения При 5 символах в каждой капче это дает ~5200 отдельных примеров символов Для текстовой капчи с ограниченным алфавитом (цифры + буквы) это разумный объем 2. Сложность задачи: Текстовые капчи с фиксированной длиной в 5 символов - это относительно простая задача Современные CNN способны очень эффективно решать такие задачи распознавания

@sergwest585 Ай бұрын

под понятием "все капчи" автор подразумевает капчи 2000ого года, которые устарели с выходом первых ocr. Как-то даже грустно видеть такое в 2024.(и нет, из-за особеностей демонстративной модели она никогда не научится отгадывать капчи с чуть большими искажениями)

@tesseract_ Ай бұрын

@@sergwest585 Нет, действительно, давайте не будем вообще ничего интересного изучать, что неактуально. И давайте видео называть типо как «Создал нейросеть для капч 2000-го года, которые никому ни нужны», чтобы никто не зашел и не посмотрел; в том числе и те, кто с программированием не знаком вообще и мог бы заинтересоваться.

@sergwest585 Ай бұрын

@@tesseract_ "создал нейросеть для решения капч" - 0 притензий + всё ещё интересно для людей, тк несёт абсолютно ту же идею. Можно даже "создал НЕЙРОСЕТЬ для решения КАПЧ" Я не говорю "нафиг делал и изучал" это вообще-то полезно. Я жалуюсь на лишний кликбейт, без которого было бы отличное видео

@leoniddzhabiev Күн бұрын

иногда, очень хочется “вы@нуться”, ну прям как Виктор Марьяныч. В целом, ролик годный, много полезного, чё куда вставлятся и втыкаться должно объяснят.

@sergeygoncharov2441 15 күн бұрын

автор серьезно думает, что он тут что-то "объяснил"?

@tesseract_ 14 күн бұрын

Да

@mike-stpr Ай бұрын

Безумно интересный ролик, но надо сразу вначала сделать дисклеймер, что так-то это нейросеть для зла (вообще-то капчи придумали, чтобы боты не спамили и не мешали людям жить, а такая нейросеть поможет ботам обойти это). Я помню как появились первые вирусы и как все игрались с ними и радовались, что они цепляются к файлам. А потом такое началось, что никакими антивирусами уже не поможешь. Так и тут -- сама идея безумно интересна и увлекательна (обойти капчу или т.п.), но в пределе она служит злу. Так что надо сделать второй ролик -- нейросеть добра, которая делает такую капчу, которую другая нейронка обойти не может :-) СПАСИБО!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 🙂

@tesseract_ Ай бұрын

@@mike-stpr Спасибо за прикольный коммент) Не переживай, тут как в случае с теме же вирусами и антивирусами - один становятся сильнее, затем подтягиваються другой, и наоборот. Создано много новых типов каптч, которые включают выбор картинок (также обходится легко), комбинации картинок и текста. Также, например, выбор на картинке конкретного объекта, которые уже реально являются сложными каптчи, под которые сложно создать нейросеть.

@jackiewaltryan Ай бұрын

для таких как ты, нужно чтобы каптча появлялась каждую секунду, на каждое действие! хочешь сделать клик, введи каптчу! ты не представляешь как программистов задолбала каптча. сама по себе каптча никогда не была проблемой, любая каптча обходится программно, и даже разгадывать ее не нужно, но все равно это требует времени для настройки обхода...

@mike-stpr Ай бұрын

@@jackiewaltryan говоришь на меня, переводишь на себя. Я программист, а ты хаккер. А на стороне добра, а ты на стороне зла. У тебя есть печеньки?

@jackiewaltryan Ай бұрын

@@mike-stpr ок, значит я буду на стороне зла...