Распознавание текста с картинки. Python Tesseract ORC + OpenCV

  Рет қаралды 65,632

Гоша Дударь

Гоша Дударь

Күн бұрын

Пікірлер: 104
@iambread666
@iambread666 5 ай бұрын
Долго мучился с установкой, а тут все подробно рассказали, спасибо
@gammahilla
@gammahilla 5 ай бұрын
нифига подробного на винде, уже 4-ый день сижу не могу понять от куда что скачивать как добавить в PyCharm, если есть возможность объясните что делать я скачать PyCharm, а дальше ничего не получается
@blwashere
@blwashere 4 жыл бұрын
можно поступить проще: в терминале(cmd) установить pip и написать: pip install tesseract
@musa_usmanov
@musa_usmanov 3 жыл бұрын
pip install opencv-python
@blwashere
@blwashere 3 жыл бұрын
@@musa_usmanov Так тоже ожно)
@timofey-0307
@timofey-0307 2 жыл бұрын
Это не так работает. Нужно проинсталлировать библиотеку + установить tesseract на компьютер
@ЕгорБеляев-ы4щ
@ЕгорБеляев-ы4щ 4 жыл бұрын
Нету файла для скачивания pytesseract ocr на сайте пишет что нет актуальной версии для установки что делать?
@gooddo1852
@gooddo1852 4 жыл бұрын
Ты супер! Продолдай в томже духе
@kirill_bykov
@kirill_bykov 3 жыл бұрын
6:02 ну зачем? Делается слайс [1:] и всё.
@konstbespr619
@konstbespr619 4 жыл бұрын
Гоша, сделай пожалуйста видео на тему интеграции оплаты в телеграм бота! Нигде нет инфы на эту тему
@Cloudy-zq5yx
@Cloudy-zq5yx 4 жыл бұрын
Есть.
@konstbespr619
@konstbespr619 4 жыл бұрын
@@Cloudy-zq5yx линк?
@Cloudy-zq5yx
@Cloudy-zq5yx 4 жыл бұрын
​@@konstbespr619 physics is simple aiogram набери
@MrDlop
@MrDlop 4 жыл бұрын
Может там как в ВК боте?
@MrDlop
@MrDlop 4 жыл бұрын
Я просто не помню, давно этим не интересовался
@olzhasshabdenov3362
@olzhasshabdenov3362 4 жыл бұрын
Гоша, красавчег👍
@msmesh5666
@msmesh5666 4 жыл бұрын
Это даже не он сделал - kzbin.info/www/bejne/bHXNd6aZjZl8lcU
@zemf4you731
@zemf4you731 4 жыл бұрын
Параметры запуска тессеракта абсолютно не за то отвечают, что ты сказал. Oem - способ распознавания, psm (page segmentation mode) - режим сегментации страницы (в основном тессеракт с документами работает, при выщове помощи можно просмотреть все режимы сегментации) Вместо enumerate и проверку индекса можно было сделать срез, так как нам всё равно необходимо будет хранить считанные данные в памяти, нет смысла пытаться сохратить итератор
@amidl
@amidl 2 жыл бұрын
Больше всего меня удивило, что автор использует аббревиатуру ORC, хотя общепринятой является OCR (о чем автор даже в названии библиотеки мог увидеть).
@АрманМеликбекян-е4ш
@АрманМеликбекян-е4ш 4 жыл бұрын
Сделай курс по data science на python или про ИИ на python. В крайнем случае про нейросеть.
@baukaalimgazy2989
@baukaalimgazy2989 4 жыл бұрын
Круто, у меня вчера была идея сделать комментатор бота ВК с искусственным интеллектом который считывает данные с поста и пишет наиболее подходящий коммент и через определенное время проверять сколько лайков набралось и в зависимости от кол-ва лайков менять веса и другие параметры нейросети, но я конечно же отказался от этой идеи, так как не знал считывать текст с картинки и множество других проблем, вот и решена одна проблема, если другие тоже сами по себе решатся, то может сделаю)
@NeuralAIM
@NeuralAIM 4 жыл бұрын
Зачем тебе тогда нейросеть? Парсер странички нужен для получения данных, так быстрее, точнее и менее ресурсозатратнее. Не быть тебе программистом) И уж даже если ты и накодишь нейронку (Даже через тот же tensor) то тебе этого не хватит (Она все равно будет тупой, сколько бы ты данных не вливал) А данных для обучения нужно больше чем пару тысяч фраз...
@puturoi
@puturoi 4 жыл бұрын
судя по твоему комменту, не особо ты сечешь, как работает нс, бот и т.д. Чтобы считать текст из поста вообще нвхрен не нужен computervision c tesseractom.
@baukaalimgazy2989
@baukaalimgazy2989 4 жыл бұрын
@@NeuralAIM лол нейросеть из видео нужен, чтобы разпознать текст из картинок, а в ВК большинство постов в виде картинки. И я написал в комменте что ещё много заморочек кроме этого, но для генерации комментария GMT2 или 3, который может генерировать текст или статью а не то что коммент, просто если ему дать тему. Или можно ещё что то самому придумать.
@baukaalimgazy2989
@baukaalimgazy2989 4 жыл бұрын
@@puturoi лол, я же написал в "ВК", в ВК много постов в виде картинки, и там текст в картинке и либа с этого видео только для того что распознать текст с постов в виде картинки. И я ещё я дополнил что много проблем кроме распознавания текстов и ТД. И я хоть и практический не делал нормальные проекты с нейросетями, но знаю как сделать перцептрон и обратное распространение ошибки, и знаю какие ограничения у вк, у официального или у неофициальных VK API для бота и с ними тоже работал, делал разных ботов ВК
@stoparb357
@stoparb357 4 жыл бұрын
@@baukaalimgazy2989 а, ты тип хочешь быть самым первым комментатором под постами чи шо
@DictorDialog
@DictorDialog 2 жыл бұрын
Всё это будет работать пока фон под текстом не будет пёстрым
@YanchikDev
@YanchikDev 4 жыл бұрын
Жду видео про template matching
@villainmadless1503
@villainmadless1503 4 жыл бұрын
OCR же, OCR!
@43oiurtjkn9gfds8y98r
@43oiurtjkn9gfds8y98r 4 жыл бұрын
Спасибо
@СаятЕралы-я9з
@СаятЕралы-я9з 4 жыл бұрын
ого круто.
@иваниванов-к5т4е
@иваниванов-к5т4е 3 жыл бұрын
Спасибо все супер. Скажи можно ли из js передать картинку в питон который обрабатывает фото и результат отдаёт назад в js?
@MrFog124
@MrFog124 4 жыл бұрын
Давай видос по считыванию потокового видео с программы и распознавании собственных объектов
@ВладиславБогер
@ВладиславБогер 4 жыл бұрын
Спасибо.
@МаксОгн
@МаксОгн 3 жыл бұрын
Того файла на сайте нету про Tesseract
@qwer5822
@qwer5822 4 жыл бұрын
Видео о том как взломать чужой компьютер - kzbin.info/www/bejne/jqWwmHicmL-akNE
@stariy_bog
@stariy_bog 4 жыл бұрын
Как сделать что бы распознавал русский текст ?
@the..egoisto
@the..egoisto 4 жыл бұрын
Он же сказал что надо выбрать при загрузке и русский
@stariy_bog
@stariy_bog 4 жыл бұрын
@@the..egoisto скачал а где подключить Подключаю после конфига выдает ошибку
@Dikobrother
@Dikobrother 4 жыл бұрын
@@stariy_bog Там где конфиг он подключал пишешь , lang='rus'. Перед эти закидываешь файл с языком в папку tessdata с самим тессерактом
@sergeisuslov773
@sergeisuslov773 Жыл бұрын
Сами же говорите оптикал кхеректал рекгнишн, а потом аббревиатура меняет порядок символов на о-эр-си, когда на самом деле оно о-си-ар
@gennady3935
@gennady3935 4 жыл бұрын
Может кто подсказать, в AWS Textract можно написать price и он выведет только стоимость если она указана, т.е. сопоставляет данные и выводит именно тот текст, который нам нужен. В tesseract есть такое?
@TblKBA_Z
@TblKBA_Z 3 жыл бұрын
помогите пж, нужно создавать скрины определённой области, загружать их в скрипт, находить символы и их-же писать (как send в ahk, не в командную строку)
@Гриша-ф1б
@Гриша-ф1б 4 жыл бұрын
Ребят подскажите что делать вылазит вот эта ошибка img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) cv2.error: OpenCV(4.4.0) /private/var/folders/nz/vv4_9tw56nv9k3tkvyszvwg80000gn/T/pip-req-build-2rx9f0ng/opencv/modules/imgproc/src/color.cpp:182: error: (-215:Assertion failed) !_src.empty() in function 'cvtColor'
@hinomuratomisaburo4901
@hinomuratomisaburo4901 4 жыл бұрын
фотку название файла обрежь коротким название сделай типо temp.png
@Гриша-ф1б
@Гриша-ф1б 4 жыл бұрын
@@hinomuratomisaburo4901 не получилось
@imperria392
@imperria392 3 жыл бұрын
тоже самое, ты если понял как это сделать скажи мне пожалуйста
@imperria392
@imperria392 3 жыл бұрын
вообщем я понял, там к нему нужно путь написать
@CalmVideo
@CalmVideo 4 жыл бұрын
Всё конечно очень круто, но до того, чтобы понять, мне далековато. :) Хочу тоже этому научиться (создавать нейросети), но пока чёт не очень получается, но ничего!
@rustc2p256
@rustc2p256 4 жыл бұрын
Для начало изучи основы
@CalmVideo
@CalmVideo 4 жыл бұрын
@@rustc2p256 , стараюсь.
@kirillusenko
@kirillusenko 4 жыл бұрын
Это сложно, но вот курс по которому я пытался изучать tensorflow: kzbin.info/aero/PLtPJ9lKvJ4oiz9aaL_xcZd-x0qd8G0VN_
@CalmVideo
@CalmVideo 4 жыл бұрын
@@kirillusenko , спасибо!
@konstantin9888
@konstantin9888 4 жыл бұрын
Гоша. скинь пжл ссылки на репозиторий, тех программ которые ты использовал в качестве примера при работе с OpenCV
@shadowcode7752
@shadowcode7752 4 жыл бұрын
Запишы курс по rust.
@zaralx
@zaralx 4 жыл бұрын
Блен ты прям вот во время как раз пишу прошу для бота в игре
@ОООГеобур
@ОООГеобур 2 жыл бұрын
а можно с нескольких картинок собирать данные в Excel
@ДмитрийКлочков-ж8ю
@ДмитрийКлочков-ж8ю 4 жыл бұрын
А она может комбинировать языки? К примеру код естественно написан на английском языке ,но у него есть комментарии на русском.
@mikelieber7256
@mikelieber7256 4 жыл бұрын
Да, можно. На C#, если воспользоваться библиотекой для тессеракта, ты можешь при инициализации тессеракта указать, например, RUS+ENG, но качество OCR будет чуть ниже.
@XEROS282
@XEROS282 3 жыл бұрын
А как сканировать баркоды через Django?
@nikolaydd6219
@nikolaydd6219 4 жыл бұрын
Тесеракт довольно хреновое решение. Сам им пользуюсь и проблем с ним - полно. Хорошее решение это Yandex Vision, но капец какой дорогой.
@dictatorsupreme5447
@dictatorsupreme5447 4 жыл бұрын
Гоша, сделай пожалуйста видео на тему Перенос HTML сайта на WordPress ?
@yes_ss
@yes_ss 2 жыл бұрын
PermissionError: [WinError 5] Отказано в доступе
@casuale1200
@casuale1200 4 жыл бұрын
круть
@diasoralbekov6465
@diasoralbekov6465 4 жыл бұрын
где ссылка на виндовс инсталер
@VladKochetov
@VladKochetov 4 жыл бұрын
@Гоша Дударь, попробуй сделать урок по numba
@СергейКитин
@СергейКитин 4 жыл бұрын
Уху питон 🐍
@ЕгорБеляев-ы4щ
@ЕгорБеляев-ы4щ 4 жыл бұрын
Гошаааа видео супер но у меня проблема. Тесеракт поставился а вот с opencv проблемы. При написании просто в терминале пайчарма через pip выдаёт ошибку. Проблема с логами. Я не особо сведующий в логировании да и вообще в программировании. Прошу помощи либо у тебя либо друзья подписчики подскажите что сделать чтобы установить opencv. Заранее спасибо
@drfclub777
@drfclub777 Жыл бұрын
получилось?
@sergozar
@sergozar 3 жыл бұрын
А как распознать символы типо "·ê ·Ë· »ê ³ ·³¼ ·Ë"?
@Lucerbius
@Lucerbius Жыл бұрын
ОэрСи, боже, чувак не может три буквы OCR прочитать в правильном порядке... А по уроку выпадает ошибка: cv2.error: OpenCV(4.8.1) D:\a\opencv-python\opencv-python\opencv\modules\highgui\src\window.cpp:1272: error: (-2:Unspecified error) The function is not implemented. Rebuild the library with Windows, GTK+ 2.x or Cocoa support. If you are on Ubuntu or Debian, install libgtk2.0-dev and pkg-config, then re-run cmake or configure script in function 'cvShowImage'
@L3M-carx
@L3M-carx 9 ай бұрын
А ты не лучше, почитать ошибку можешь а не в комы вставлять. Переустанови библиотеку блять умник
@nikolaydd6219
@nikolaydd6219 4 жыл бұрын
Но ведь не удобно работать с Питоном, гораздо удобней было бы сделать программу с интерфейсом, окном и кнопками .
@dedpihto680
@dedpihto680 2 жыл бұрын
из 7 минутного видео полторы минуты реклама и никчемное вступление, потом еще и посреди ролика впихнул рекламу. топчик
@БогданКислов-ж2ж
@БогданКислов-ж2ж 4 жыл бұрын
Когда будет видио про создания игр?
@FDev404
@FDev404 4 жыл бұрын
У него этих видео жопой ешь
@sunmaxplay6491
@sunmaxplay6491 4 жыл бұрын
как быть с 4 строчкой на линуксе?
@Crd51409
@Crd51409 4 жыл бұрын
Не нужна
@a1exlovser136
@a1exlovser136 4 жыл бұрын
digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.02-20180621.exe возможно вот этот файл нужный
@FDev404
@FDev404 4 жыл бұрын
У тебя как то разрозненно всё. Я не очень люблю питухон, но могу сказать, что нужно тебе делать видео более подробные по нему. Расскажи про всё что знаешь. Smtplib, json, datetime, request, tkinter, socket, os, time. Сними самую подробную серию видео по питухону на рутубе и я думаю добьёш 1млн подписчиков к весне 21!!!
@KuKuRuuZa
@KuKuRuuZa 3 жыл бұрын
И не ORC а правильно OCR
@dmitriy2502
@dmitriy2502 3 жыл бұрын
Здравствуйте! А подскажите, можно ли этим методом распознавать цифры из потока видео? Например спортивное электронное табло с временем, время минуты +секунды?
@unknown_youtube_user
@unknown_youtube_user 3 жыл бұрын
Метод показанный в видео работает с картинками, если ты разработаешь программу которая будет делать скриншоты и вставлять для считывания, то вполне возможно.
@PythononPapyrusRU
@PythononPapyrusRU 4 жыл бұрын
Круто! Неужели ты не любишь его😭😭??? Я про Python. А если и любишь, то почему не подписан на мой канал? Исправь это🤙😎
@tarantinPipka
@tarantinPipka 9 ай бұрын
твои видео все до единого не рабочие , не заработало не чего .. хз , я уже скоко их не смотрел.. вродь пробелма в опен сиви ... она у твоему коде кривая ..щас комент вставлю что пиет джипити
@tarantinPipka
@tarantinPipka 9 ай бұрын
Кажется, возникла проблема с библиотекой OpenCV, которая используется для отображения изображений. Ошибка указывает на то, что функция cv2.imshow() не реализована. Это может быть вызвано неправильной установкой или версией OpenCV. Попробуйте переустановить OpenCV или обновить его до последней версии. Возможно, вам также потребуется установить зависимости для поддержки графического интерфейса, если вы используете его на Windows.
@wad_code
@wad_code 4 жыл бұрын
Начал с ORC закончит RAC
@pavelkross
@pavelkross 4 жыл бұрын
даешь тоже самое только на C#!!
@ДаниилФотеев-ы1й
@ДаниилФотеев-ы1й 3 жыл бұрын
Мой коммент будет явно удален, но что я хочу сказать: Гоша, тебе простительно что ты не ученый в сфере компьютерного зрения и машинного обучения. Но готовься пожалуйста лучше. Многая терминология неточна или неверная + про функции питона немного неверно говоришь)
@irgendwer234
@irgendwer234 4 жыл бұрын
Cnacubo
@pirozhekN
@pirozhekN 4 жыл бұрын
Тессеракт орк
@АнтонКруглышев-к4ц
@АнтонКруглышев-к4ц 4 жыл бұрын
Плохо работает с русским языком.
@СтаниславАлямов
@СтаниславАлямов 3 жыл бұрын
дохлый движок он распознает с кракозябрами.. это капитализм.. хорошие движки платные.. тоже с говорилками...про браузеры вообще молчу.. по моему нам слили чтобы началась гражданская война до того раздражает тупизм некоторого ПО ..вместо нормального функционала команд в консоли приходится лезть черт знает куда...
It works #beatbox #tiktok
00:34
BeatboxJCOP
Рет қаралды 41 МЛН
Что-что Мурсдей говорит? 💭 #симбочка #симба #мурсдей
00:19
It’s all not real
00:15
V.A. show / Магика
Рет қаралды 20 МЛН
Как в Python писать программы с интерфейсом?
19:23
Хауди Хо™ - Просто о мире IT!
Рет қаралды 812 М.
Делаю нейросеть с нуля
17:17
Onigiri
Рет қаралды 1,5 МЛН
Введение в OpenCV: Работа с камерой в Python
12:41
BeTry | Программирование
Рет қаралды 58 М.