Самое крутое моё видео. Очень старался, точно узнаете что-то новое! Приятного просмотра)
@ukrainetoday960Ай бұрын
Спасибо
@MentorOfMentorsАй бұрын
Теперь не распознание капчи - это признак что перед вами человек )
@tvsettvАй бұрын
Что кстати и используется умными захватами.
@СергейМарачев-щ9м25 күн бұрын
На собеседовании: - к сожалению мы не можем принять вас на работу - почему? - вы пили воду прямо из бутылочки и не разу не подавились. Очевидно, что вы робот!
@istinaanitsi33423 күн бұрын
так заложите процент ошибок, срисуйте глупого и пьяного
@KostsovKonstantinАй бұрын
3 строчки кода , 7 лет практики, 15 лет обучения. 3 строчки - ерунда. 😅😅. Видео отличное.
@tesseract_Ай бұрын
Кстати, интересно, что капчи использовались для обучения одних из первых нейросетей. Люди, проходя их, создавали огромные датасеты. Таким образом, одни из первых нейросетей научились распознавать рукописный текст плохого качества, а также картинки и объекты на них 😮
@davidsuraganАй бұрын
человек гений который сделал капчу и тренировал модел
@InfSub29 күн бұрын
Подскажите, есть ли видео как обучить нейросеть? Ни когда этим не занимался, по этому полный чайник в этом вопросе . Распознание капч прикольно, но мне нужно немного для иных целей, цифры, в некоторых случаях печатный текст, гораздо реже, но тоже желательно - рукописный текст. В идеале найти/отличить на первом шаге наличие определенного объекта с текстом, а не разгадывать все что есть на картинке.
@tesseract_29 күн бұрын
@@InfSub Конкретно у меня нет, поскольку это известная тема и, насколько мне известно, есть куча уже готовых моделей для ваших целей. Если у вас не какие-то суперспецифические цифры, печатный или рукописный текст, то они вам подойдут. Думаю, не составит труда найти их в Интернете.
@Sopushynskyi26 күн бұрын
@@InfSubпочитайте книгу - тарик рашид «создаем нейронную сеть»
@АнтонТайАй бұрын
Красавчик что изучаешь ml. Рассуждаешь грамотно. Отмечу несколько важных замечаний: 1. Это не сложная нейронная сеть - это старая известная архитектура. 2. Дропаут это не слой - это метод регуляризации. 3. Капча не сложная. Если интересно развиваться в этомтнаправлении и нужна работа - пиши!
@anton73245Ай бұрын
мне было бы интересно 🫡
@tesseract_Ай бұрын
Спасибо. Со всеми замечаниями согласен.
@artemfhi9118Ай бұрын
куда писать?
@SylamnyyrАй бұрын
@@artemfhi9118 +
@georgevonfloydmann1797Ай бұрын
Капча капче рознь, справедливости ради) одно время наблюдал за разработкой нейросети для распознавания объектов и их положения, для того чтобы потом задать объектам нужное направление. Вот это интересно! Думаю тема капчи и нейросетей будет жить еще какое то время, пока капчу не заменят интеллектуальными задачами на логику. Кстати, мне интересно, куда писать? Мне тоже интересно развиваться)
@АндрейХарин-ы1фАй бұрын
Спасибо за крутой обзор, хотелось бы подробный гайд от тебя по написанию подобных нейросетей.
@cododeliaАй бұрын
Круто, думаю опробую) У меня текущая реализация на основе YOLOv10 с распознаванием боксов для каждого символа, затем по координатам собирается капча. Датасет самосборный, на 750 картинок, но общая точность уже выше 60% (что полностью меня не устраивает) проблема именно в том, что каждый дополнительный символ сильно увеличивает шанс ошибки
@Банки19 күн бұрын
Капчи сейчас гораздо более сложные и учитывают поведение пользователей. Условно: ты думаешь, что достаточно найти все светофоры. Но так же учитывается как ты водишь мышью и как быстро находишь ответ.
@tesseract_19 күн бұрын
@@Банки Я уже сделал и опубликовал видео про это :)
@augustlight48Ай бұрын
ВАУ. Очень крутое видео. Я и сам писал что-то подобное несколько лет назад, но в этом видео более элегантное решение. Увидел бы я его год или два назад - цены бы не было! Качественный материал, ещё и на русском. Ну это точно лайк и подписка
@haykera233811 сағат бұрын
спасибо за видео, но ощущение, будто вы пытались сделать на скорость обьяснять прям совсем с нуля не нужно, да, но банально рассказать, где какие переменные за что отвечают, можно хоть вообще в глобальные вынести, дабы было проще рассказать, как работать в случае, если хочется добавить датасеты на другие капчи (другие размеры картинок, другие размеры капч по символам) получилось то вроде интересно, но вроде и ничего полезного в сухом остатке как для проходного видео - круто как для полезного видео - очень скудно пишу не с целью как то принизить, а с целью получить вторую часть
@demonlorddragon13 күн бұрын
4:53 - словарь это массив элементов "ключ-значение", как правило ключ - это уникальное слово или число, а значение - может быть любым набором данных. при обращении к ключу можно получить значение, но это работает и наоборот. ничего магического в этом нет. в данном случае буквам присвоены порядковые номера, массив перебирает пары в словаре, находит совпадение и выдает или номер или значение. библиотека для этого не нужна, можно и самому сделать эту функцию в 7-12 строк. А вот благодаря остальному коду "которого нет" есть лишь ссылки на библиотеки, придется лопатить кучу литературы, чтобы адаптировать под нужный тебе язык.
@DmitryStik24 күн бұрын
Реально красава, просто мощный тип. Давай создавай теперь сверх ии😅
@Artemon-yl5ze7 күн бұрын
Вопрос, разве 100% точности на данных обучающего датасета это не признак переобучения? Очень интересно посмотреть на проверку на других датасетах капч
@ЖанарДуйсенбиева-х5вАй бұрын
Круто! Ждём когда напишут нейросеть который создаёт капчи
@tesseract_Ай бұрын
@@ЖанарДуйсенбиева-х5в Это уже к генеративным ИИ) Но не удивлюсь увидеть подобное в ближайшее время.
@yagohush741424 күн бұрын
а сейчас капчи что, человек в ФШ рисует?..
@КириллБелоусов-и6ю24 күн бұрын
Видео было бы идеальным, если бы ты на каждом шагу не подчёркивал, что это сложно, ну очень сложно, нереально сложно, нейросеть сложная, аж прям сложнее некуда, ну прям пентагон как сложная. Выглядело так, как будто ты всеми силами пытаешься доказать миру, что решил нереально сложную задачу повышенной сложной сложности на сложном уровне :) ML это правда сложно, но видео могло быть минут на 5 короче, если бы не было так "сложно". Ну или в эти 5 минут влезло бы больше конкретных объяснений.
@TheDergraue19 күн бұрын
Да, но это все сложно... ))
@cherimolah9493Ай бұрын
Видео крутое, очень интересно смотреть как создавать правильно нейронки, потому что меня ничего не получается
@EnhanceUpАй бұрын
Блин, это реально круто! Очень крутое видео с интересными обьяснениями)
@boost_456Ай бұрын
Очень крутая сеть получилась. Сам придумал такую архитектуру? Ещё вопрос, почему не используешь блокноты ipynb? В них же очень удобно делать всякие нейронки
@tesseract_Ай бұрын
@@boost_456 Спасибо. Архитектуру придумал не я, это один из примеров Keras; ссылка в описании. Я о ней рассказал, добавил графический вывод, сохранение и загрузку модели.
@iarde3422Ай бұрын
А вы картинки только вычитываете на текст, но есть же ещё те, в которых на картинки надо нажимать, на вопросы отвечать, на примеры или задачи решать, у Яндекса есть ещё значки, которые нужно выбрать, в каком порядке они на рисунке присутствуют. Ваша нейросеть все эти виды проверок решают? А ещё, как быть с проверками, где просто галочку надо поставить?
@tommygrenkinАй бұрын
На каждый вид капчи - потребуется отдельное решение, капча Яндекса специально сделана так, чтобы нейросеть ошибалась. В этом и идея капчи, что машина не справится. Технологии развиваются, но и капчи не стоят на месте. В этом видео капчи еще эпохи до хайпа нейросетей, поэтому сейчас они все легко решились. Капча, где нужно галочку поставить - собирает информацию о пользовании сайтом: движение курсора, временной промежуток между запросами и другое взаимодействие - характерно ли оно для живого человека. Если все ок, то просто галочку поставить просят, иначе дополнительные испытания будут. Есть статья 2019 года, где такую капчу решали с помощью обучения с подкреплением и успешно в 97.4% случаях, не знаю прокатит ли такое в 2024, атвторы капчи тоже эти статьи читают
@tesseract_Ай бұрын
@@iarde3422 Очевидно, что нет. Чтобы решались другие типы капч, нужны другие нейросети. Не знаю ничего про ваш яндекс, но про капчу гугла reCAPTCHA v2 видео будет. И, очевидно же, что галочку поставить - это совсем просто.
@JanPoklenАй бұрын
Я человек, а 100 из 100 капч не решаю 😂
@tesseract_Ай бұрын
@@JanPoklen Думаю за 1040 капч есть огромный шанс хоть раз ошибиться)
@МаксимЭлектрик-р3ы29 күн бұрын
Нейросеть выделяет информацию в катрине - у человека это называется фокус внимания) 🤠
@ИванЛобанов-н7т17 күн бұрын
"Как создать нейросеть для 100% чтения каптч?" "Будь здоров."
@mousepro996322 күн бұрын
эти капчи и без нейросетей я лет 10 назад решал...
@StartuePotoyaАй бұрын
Спасибо. Я как бы чуть-чуть могу пользоваться программированием. Отец попросил поставить ему локально нейросеть языковую, которую можно обучать на основании текстовых материалов, что бы задать ей определённый характер ответов (как ai жириновский) , ,но на другом человеке.. как вкатиться? Я уже на стадии открыта VScode, настроен комплятор пип инстал , инит мэйн ) что писать?)) или какой набор готовый качнуть?
@tesseract_Ай бұрын
@@StartuePotoya Пожалуйста. Честно говорю, я не знаю как это сделать. Это очень сложно. Тут наверняка нужно использовать готовую архитектуру, но врядли даже такое можно найти, поскольку вы входите в область генеративности, где используются машины Больцмана и подобные математические аппараты, с которыми интересно, но страшно сложно. Кроме того на подобном зарабатывают деньги, а значит в свободном доступе врядли получится такое найти. Могу только пожелать успехов 🤷♂️
@tesseract_Ай бұрын
@@StartuePotoya Можно попробывать типо ChatGPT с задаными условиями как ему отвечать, но это можно сделать и на их браузере онлайн. Если же нужно прям приложение, то вам уже нужен их API, что стоит денег.
@tommygrenkinАй бұрын
Это называется файнтюн - когда берется уже обученная универсальная модель и дообучается на узко специализированной задаче. Если уже есть данные для обучения посмотри маленькие модели на huggingface, например Qwen2-7B. Код для файнтюна обычно легко гуглится, проблема лишь найти вычислительные мощности для обучения да датасет составить в требуемом формате =)
@061soulАй бұрын
Попробуй notebooklm, можно загрузить текстовые источники и уже чатить с ними
@arhel1205Ай бұрын
А теперь Recaptcha2 и 3 давай
@ussuratoncachiАй бұрын
Не смотрел видео полностью, промотал его. Из того, что я увидел, здесь из капч только черный текст с полосками на белом фоне. Увы, почти везде используется гугловская рекапча или яндексовский аналог. А там анальные тесты типа "выберите животное, которое стоит вертикально" и с кучей искажений.То, что на видео, - это устаревшая на 10 лет капча. Так что нет, капча - не "всё!", вопреки заголовку.
@ussuratoncachiАй бұрын
Видео прикольное, лайк ставлю. Но заголовок - кликбейт
@tesseract_Ай бұрын
@@ussuratoncachi Если б не этот заголовок, ты бы не зашел и не посмотрел бы видео, что, как ты сам выразился - прикольное. Меньше всего мне хочется провести целую кучу времени, делая видео, и потом чтобы никто его не посмотрел.
@vladislavlymar28 күн бұрын
А если длина ответа не всегда равна 5 символам? Возникает это: Cannot add tensor to the batch: number of elements does not match. Shapes are: [tensor]: [5], [batch]: [4] [Op:IteratorGetNext] Можно как-то это поправить?
@tesseract_28 күн бұрын
Конечно можно. По хорошему: 1. Соберите тренировочный датасет, который включает: Капчи разной длины (например, от 3 до 7 символов) Примерно равное количество капч каждой длины для баланса 2. При создании нового датасета убедитесь, что: # Проверка распределения длин lengths = [len(label) for label in labels] unique_lengths = np.unique(lengths) print("Lengths present in dataset:", unique_lengths) for length in unique_lengths: count = sum(1 for l in lengths if len(l) == length) print(f"Капч длины {length}: {count}") 3. Переобучите модель на новом датасете: # Проверьте максимальную длину в новом датасете max_length = max([len(label) for label in labels]) print(f"Maximum length in dataset: {max_length}") # Создайте и обучите модель model = build_model() history = model.fit( train_dataset, validation_data=validation_dataset, epochs=epochs, callbacks=[early_stopping], )
@tesseract_28 күн бұрын
Можно не по-хорошему) Использовать такую модель, но тогда нужно много чего переделывать в коде, да и не правильно это, точность будет плохая.
@AlexanderCOOLerАй бұрын
Красава, очень годно. Буду ждать ещё видео по нейронкам и конечно ссылочки на код под видео, интересно будет самому поиграться. Когда наберётся много проектов, сделай видео для новичков, как это всё развернуть, настроить окружение с чистого листа, я думаю будет полезно. Пару советов по монтажу. В связи с тем, что ближайшее будущее за OLED экранами, лучше всего графики и тд выглядят либо на белом, а ещё лучше на чёрном фоне, но не на сером. Именно на этом оттенке +- оледы могут давать всякие визуальные эффекты некрасивые (эффект грязного экрана, временное выгорание), если хочешь чтобы твои видео и через 3 года смотрели, нужно делать их современными уже сейчас. Если требуется сменить фон с белого на чёрный, попробуй просто инвертировать цвета картинки, это работает и навыков художника не требует, времени 10 секунд на поиграться с контрастностью и прочим. У анимаций (если они не твои) ты можешь делать стоп кадры, чтобы динамика на экране совпадала с тем что ты говоришь. Это то, что сразу заметил как варианты что можно улучшить, развивай навыки монтажа, качество материала и сценарий уже на очень хорошей уровне, продолжай развиваться и твори) Успехов!
@tesseract_Ай бұрын
@@AlexanderCOOLer Спасибо, всё учтем) Ссылочки на код уже есть и всегда у моих видео были :)
@AlexanderCOOLerАй бұрын
@@tesseract_ да, код видел, спасибо. Я про то, что жду его не меньше чем сами видео, может не так выразился
@iarde3422Ай бұрын
Вариационный - это который валидол принял?
@VladislavKasperchukАй бұрын
Это очень круто! я начинающий в изучении ии, хотел бы найти себе единомышленников, не хотел бы пообщатся?
@tesseract_Ай бұрын
Спасибо! Рад, что тебе интересно! К сожалению, я не могу пока уделить время на общение, может когда-нибудь сделаю с этой целью стрим. Но думаю, среди других зрителей найдутся единомышленники. Удачи в изучении ИИ!
@Eazy1artАй бұрын
Lu4iY (лучший, типо каптча :))
@danil907Ай бұрын
Бывают и такие что и человеку то сложно понять что там нарисовано
@vladimirobernin559412 күн бұрын
Здравствуйте! Как с Вами связаться? Хотим предложить Вам решить задачу на коммерческой основе
@tesseract_12 күн бұрын
@@vladimirobernin5594 С уважением, зачем вам связываться с не понятно кем с ютуба. Если у вас все серьезно, обратитесь лучше в IT компанию.
@vladimirobernin55945 күн бұрын
С IT компаниями будет долго и дорого. Задача на пару сотен тыс руб. Уверен, что Вам по силам и достаточно интересная. С уважением!
@ДюжинаМолодцев-щ4г4 күн бұрын
@@vladimirobernin5594 😁
@Vladimir3444-o6wАй бұрын
Круто, жаль не понимаю
@tesseract_Ай бұрын
@@Vladimir3444-o6w Спасибо. Ничего, тут рассматривается довольно сложная нейросеть. Можно начать с чего-то попроще. Например, у меня есть видео про создание простой нейросети с нуля, тоесть, с полным разбором кода. Да, там конечно не так интересно, но тем не менее, для начала то что надо.
@raphaild279Ай бұрын
Привет. Дядя можете мне помочь понять как развернуть модель circlenet в Windows 11. Систему под обучение я настроил.
@tesseract_Ай бұрын
Привет. Так а в чем проблема? Я конечно не всезнающий, и эту непосредственно модель я ни разу не использовал, но я зашел на их гитхаб - github.com/hrlblab/CircleNet и как мне кажется, там все предельно понятно. Даже есть пример использования. А насчет системы, какая вообще разница, хоть Windows 7 - от этого ничего не зависит.
@thebatsun23 күн бұрын
Это все конечно хорошо, но совсем нету обоснования почему выбрана то или иная структура слоя, почему именно такая функция активации и т.д. Вы в этом не разбираетесь или решили опустить в угоду публицистике? Хотелост бы больше информации, зачем нужен тот или иной слой и почему именно он и почему именно в этот момент, а не еак букву в цифру функцией перевести. Без негатива.
@tesseract_22 күн бұрын
@@thebatsun Бралась архитектура под распознавание рукописного текста, а затем корректировалась под такие капчи. Создание нейросетей - это чисто эксперементальный процесс. Думаю, в даном случае, на вопросы ответит какая-нибудь подробная статья или научная робота про нейросети по распознаванию текста, где написано, как они очень очень долго эксперементировали с слоями и кол-вом нейронов, чтобы прийти к такой архитектуре.
@Alex-dd4ct23 күн бұрын
Как теперь сделать, чтобы такая нейросеть решала эти капчи автоматически, когда они попадаются?))
@tesseract_22 күн бұрын
@@Alex-dd4ct Делать на её основе бота :)
@magictime8959Ай бұрын
чтобы создать нейросеть нужно взять библиотеки для создания нейросетей тоесть чтобы создать нейросеть нужно взять готовые нейросети
@tesseract_Ай бұрын
@@magictime8959 Абсолютно точно нет)
@tarkhiddenАй бұрын
Пока что создание нейросетей кажется похожим на средневековую алхимию. Экспериментально удалось установить, что нагретая смесь из лобковых волос молодой девственницы и нарубленных тентаклей зелёного монстра превращаются в золотистую пыльцу довольных фей, которая помогает людям быстрее запоминать песни. Немного. Количественно не измерить. На ощущениях. На всех видео, что я видел, всегда показывают уже написанный код с уже подобранными (?) слоями. Скажите, пожалуйста, если бы у вас стояла задача распознавания автомобильных номеров, с чего бы вы начали и почему? Можно снять видео, как пишется нейросеть с самого начала, включая подборку слоёв и обучение-тестирование? Мне хочется написать нейросеть для распознавания текста с картинки, как Finereader, например. Нет, мне не хочется взять уже готовые обученные нейросети, если такие есть, мне нужно разобраться, каким образом они делаются, и результат не особо важен, потому что хочется понять ПРИНЦИП ИХ СОЗДАНИЯ.
@tesseract_Ай бұрын
@@tarkhidden Это может показаться банальным, но сразу отвечаю насчет автомобильных номеров: я бы посмотрел есть ли уже существующие модели))) И дело не в том правиле, что лучше всего тот код, что не нужно писать самому. А дело в том, что тут нет никакого правила, что бы сказало вам какие конкретно слои вам нужны. Все подбираеться эксперементально. Все нейронные сети создавались одинаково: выбирались слои, что казались найболее подходящими; обучение, тесты, выбор других слоев, обучение, тесты, сравнение. Зацикловуем это - бам, в какой-то момент мы поймем, что даст лучший результат) Почему же никто не показывает подбор слоев? - Думаю ответ уже ясен.
@Gribb-aiАй бұрын
думаю тебе лучше начать с чего нибудь по легче, допустим распознавание рукописных цифр с помощью mlp(многослойного персептрона). изучив так сказать базу, можно будет начать изучать более сложные архитектуры. искать инфу можно в ютубе и хабре.
@tarkhiddenАй бұрын
@@tesseract_ короче, поможет только опыт) Жаль, жаль, я думал, есть какой-то универсальный рецепт, но даже теоретические знания про все слои не дают подсказок, какие из них как и когда применить. Спасибо за ответ)
@tarkhiddenАй бұрын
@@Gribb-ai наверное, так и есть)
@Gribb-aiАй бұрын
@@tarkhidden если хочешь могу помочь 🤷♂️
@arsentelАй бұрын
👌👌👌👌👍👍👍👍👍👍👍👍
@minecraft4317Ай бұрын
Видео надо было назвать делаем уже сделаный велосипед, почитайте зачем эти капчи существовали и сейчас такие капчи не встретить, странно да? Если я не прав давай тогда сделаем распознаванием и решением новых капч с пазлами на картинках или что-то типо того:)
@tesseract_Ай бұрын
@@minecraft4317 1. По твоей логике не нужно вообще изучать все интересное, что неактуально. 2. Я уже делаю видео про нейросеть для reCAPTCHA v2.
@ДмитрийСоломойченко23 күн бұрын
Мне было интересно. Думаю остаться тут надолго.
@Reincarnation-rt2rmАй бұрын
Обычная капча ладно,а более продвинутая потянет?Гугл капча,передвижение ползунка. ну выбор животных по порядку думаю проще даже.Ну помимо решения,там еще рандом и эмуляция пользователя часто нужны
@tesseract_Ай бұрын
@@Reincarnation-rt2rm Потянет такую, на которую её научат. Тут проводилось обучение на конкретном датасете. Нужно для других типов капч, тогда учим на них :) Найти датасеты, это непросто. Формировать самому ещё сложнее.
@ROFLAN3b4L0REAALАй бұрын
@@tesseract_ тут можно даже не мудрить и тупо по wind mouse мышку двигать. датасет можно сделать тупо сбором с сайтов через тампермонки и методом (забыл как называется, обучаем модель на мелком датасете и через неё прогоняем весь датасет и просто корректируем его) и всё, по итогу люди заменены
@tesseract_Ай бұрын
@@ROFLAN3b4L0REAAL Я еще не эксперт, но сейчас активно изучаю эту тему. Хочу сделать видео о решении reCAPTCHA v2. Она на самом деле очень замудренная и нужно учитывать очень много деталей. А вот reCAPTCHA v3 пока что кажется шагом назад - не удивительно, что большинство так и остались на v2. В общем, если все выйдет, а я в этом уверен, будет интересно)
@sergwest585Ай бұрын
@@tesseract_ да нее... v3 - просто прорыв для пользователей. Ботам прийдётся эмулировать полное поведение человека: медленный ввод, qwerty и dworak, не моментальные переходы. Иначе сразу детектит бота. А если боты будут по скорости как человеки, то хороший вопрос: а зачем они? и да, под re captcha v2 тебе желательно переделать ии, тк там не настолько всё просто из-за патернов генерации
@tvsettvАй бұрын
Тупых захватов может и прочтет всех, а хитрых - всех никогда.
@tsvigo11_70Ай бұрын
На Python теоретически невозможно сто процентов распознать потому что он использует внутри себя числа с плавающей запятой.
@tesseract_Ай бұрын
@@tsvigo11_70 Я надеюсь вы это не серьезно…
@sergwest585Ай бұрын
а как это мешает?
@tsvigo11_70Ай бұрын
@@sergwest585 , а так что это вызывает непредсказуемые ошибки потому что они при округлении ведут себя неопределённо. И если в генерации изображений да и хрен то с ним посмотри сейчас Flux лежит то в серьёзных приложениях типа роботов или архитектуры-машиностроения это нельзя.
@sergwest585Ай бұрын
@@tsvigo11_70 про округление хз. Вроде очень даже определено. мантиса сдвигается на экспоненту вправо как и во всех языках (c, java, js, c#). И в этом мире много чего лежит, нампример последний апдейт clang'а. Это же не причина ставить крест на C'ях (тем более не понял при чём тут плавующие точки). Питон в этих областях очень даже предсказуемый (тяжёлый, но предсказуемый)
@tsvigo11_70Ай бұрын
@@sergwest585 , найди статью Юровицкого "IEEE754-тика угрожает человечеству". C++ программы выполняются сами по себе то есть за них отвечают те программисты которые их написали а Python это язык сценариев которые выполняет интерпретатор. Если ты мне не веришь почитай рекомендации по программированию ядра Линукс там не рекомендуют числа с плавающей запятой использовать.
@DanyilDorofieievАй бұрын
К сожалению таких капч уже почти не существует, сейчас капчи это в основном всякие логические картинки где надо что-то выбирать, перетаскивать, это уже не вписать просто набор символов
@jackiewaltryanАй бұрын
ага, щас! дохрена вот такого еще осталось... наверное все сайты, которые не используют каптчу Гугла, сидят вот именно на таких картинках... постоянно с такой фигнёй сталкиваюсь...
@DanyilDorofieievАй бұрын
@@jackiewaltryan я просто в крипте сижу, там нет древних капч
@sergwest585Ай бұрын
@@jackiewaltryan ложь, эти капчи сильно устарели уже как десять лет. В новых (с которыми вы возможно путаете) добавлен шум, рыбий глаз сильнее и небольшие волны смещения, чтобы как раз нейронка не разбивала буквы по вертик. линиям
@zi0wizАй бұрын
Как это сложно. ты даже не предствляешь как это выглядит абстрактно. Только что бы обьяснить как это работает, без примеров кода можно плейлист создать.
@ForseNightАй бұрын
Вроде сайт есть в котором за написание капч даются копейки, я там 15 рублей вроде для кое-чего заработал зачем-то : ]
@tesseract_Ай бұрын
@@ForseNight Там наверняка каптчи посложнее, и вероятно стоит какая-нибудь защита от автоматизации.
@hobbyrussiaАй бұрын
А не слишком ли много слоев для распознавания бессвязных символов, как будто эта нейросеть больше для другого сделана, как показывается в видео далее (Распознавание слов )
@tesseract_Ай бұрын
@@hobbyrussia Попробуй поменять и узнаешь)
@yuva639221 күн бұрын
Спасибо. Квасное видео😂
@aresd69369 күн бұрын
+
@txc_mmrl28 күн бұрын
Я только начинаю вникать в ДС, поэтому вопрос может показаться глупым. Почему, когда мы получили 100% точности это не считается оверфитом? Какой вообще критерий оверфита?
@ЛеонидПопов-в7м28 күн бұрын
самый частый критерий - точность на обучающей выборке значительно больше, чем на валидационной (которая не участвует в обучении нейросети)
@txc_mmrl28 күн бұрын
@@ЛеонидПопов-в7м Какие ещё есть критерии?
@tesseract_28 күн бұрын
100% точность на тестовых данных не обязательно означает переобучение (оверфит). Ключевой момент в том, как модель достигает этих результатов и на каких данных они получены. Вот основные критерии для определения переобучения: 1. Разрыв между обучающей и тестовой выборкой: Если модель показывает 100% на обучающей выборке, но значительно хуже на тестовой - это явный признак переобучения Если 100% достигается на независимой тестовой выборке - это может быть нормально 2. Сложность задачи: В случае с капчей, если это простые символы с минимальным шумом, то 100% точность вполне достижима без переобучения Это похоже на то, как человек может безошибочно читать четкий текст 3. Поведение на новых данных: Если модель сохраняет высокую точность на совершенно новых капчах того же типа - это признак хорошей генерализации Если точность резко падает на слегка измененных капчах - это может указывать на переобучение 4. Размер и разнообразие обучающей выборки: Если 100% достигнуто на большом и разнообразном наборе данных - это более надежный результат Маленькая выборка повышает риск переобучения В нашем случае 100% точность действительно может быть нормальным результатом, а не переобучением: 1. Объем данных: 1040 изображений, из них ~936 для обучения При 5 символах в каждой капче это дает ~5200 отдельных примеров символов Для текстовой капчи с ограниченным алфавитом (цифры + буквы) это разумный объем 2. Сложность задачи: Текстовые капчи с фиксированной длиной в 5 символов - это относительно простая задача Современные CNN способны очень эффективно решать такие задачи распознавания
@sergwest585Ай бұрын
под понятием "все капчи" автор подразумевает капчи 2000ого года, которые устарели с выходом первых ocr. Как-то даже грустно видеть такое в 2024.(и нет, из-за особеностей демонстративной модели она никогда не научится отгадывать капчи с чуть большими искажениями)
@tesseract_Ай бұрын
@@sergwest585 Нет, действительно, давайте не будем вообще ничего интересного изучать, что неактуально. И давайте видео называть типо как «Создал нейросеть для капч 2000-го года, которые никому ни нужны», чтобы никто не зашел и не посмотрел; в том числе и те, кто с программированием не знаком вообще и мог бы заинтересоваться.
@sergwest585Ай бұрын
@@tesseract_ "создал нейросеть для решения капч" - 0 притензий + всё ещё интересно для людей, тк несёт абсолютно ту же идею. Можно даже "создал НЕЙРОСЕТЬ для решения КАПЧ" Я не говорю "нафиг делал и изучал" это вообще-то полезно. Я жалуюсь на лишний кликбейт, без которого было бы отличное видео
@leoniddzhabievКүн бұрын
иногда, очень хочется “вы@нуться”, ну прям как Виктор Марьяныч. В целом, ролик годный, много полезного, чё куда вставлятся и втыкаться должно объяснят.
@sergeygoncharov244115 күн бұрын
автор серьезно думает, что он тут что-то "объяснил"?
@tesseract_14 күн бұрын
Да
@mike-stprАй бұрын
Безумно интересный ролик, но надо сразу вначала сделать дисклеймер, что так-то это нейросеть для зла (вообще-то капчи придумали, чтобы боты не спамили и не мешали людям жить, а такая нейросеть поможет ботам обойти это). Я помню как появились первые вирусы и как все игрались с ними и радовались, что они цепляются к файлам. А потом такое началось, что никакими антивирусами уже не поможешь. Так и тут -- сама идея безумно интересна и увлекательна (обойти капчу или т.п.), но в пределе она служит злу. Так что надо сделать второй ролик -- нейросеть добра, которая делает такую капчу, которую другая нейронка обойти не может :-) СПАСИБО!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 🙂
@tesseract_Ай бұрын
@@mike-stpr Спасибо за прикольный коммент) Не переживай, тут как в случае с теме же вирусами и антивирусами - один становятся сильнее, затем подтягиваються другой, и наоборот. Создано много новых типов каптч, которые включают выбор картинок (также обходится легко), комбинации картинок и текста. Также, например, выбор на картинке конкретного объекта, которые уже реально являются сложными каптчи, под которые сложно создать нейросеть.
@jackiewaltryanАй бұрын
для таких как ты, нужно чтобы каптча появлялась каждую секунду, на каждое действие! хочешь сделать клик, введи каптчу! ты не представляешь как программистов задолбала каптча. сама по себе каптча никогда не была проблемой, любая каптча обходится программно, и даже разгадывать ее не нужно, но все равно это требует времени для настройки обхода...
@mike-stprАй бұрын
@@jackiewaltryan говоришь на меня, переводишь на себя. Я программист, а ты хаккер. А на стороне добра, а ты на стороне зла. У тебя есть печеньки?