👨‍💻 Получаем текст из read-only PDF. OCR для PDF. Как обычно, все просто и удобно )

  Рет қаралды 2,274

PythonGuru

PythonGuru

Күн бұрын

Пікірлер: 16
@killerpaf
@killerpaf Жыл бұрын
Привет! Спасибо за программки и за отзывчивость.
@PythonGuru_
@PythonGuru_ Жыл бұрын
пожалуйста 🙂
@_balancy_
@_balancy_ Жыл бұрын
В современном python есть альтернативный метод написания путей к файлу, через конструктор path, чтобы не надо было экранировать слэши: file_to_open = Path("c:") / "books" / "some_text.txt"
@PythonGuru_
@PythonGuru_ Жыл бұрын
Специально показал тот вариант, чтобы не попали на указанную ситуацию
@_balancy_
@_balancy_ Жыл бұрын
@@PythonGuru_ я понял. Я к тому, что можно показать еще альтернативный синтаксис, который сейчас считается менее error-prone
@PythonGuru_
@PythonGuru_ Жыл бұрын
Это, да. Спасибо. Я поэтому ваш ответ лайкнул. Если кто комменты будет читать, увидят альтернативные решения. Это приветствуется )
@МатвейТимофеев-д1ц
@МатвейТимофеев-д1ц Ай бұрын
Обожаю те самые случаи, аогда назодишь практичные ркшения саоих проблем
@МатвейТимофеев-д1ц
@МатвейТимофеев-д1ц Ай бұрын
upd. Информации оказалось не достаточно, тк Tesseract пытается перевести русские слова на английские символы
@МатвейТимофеев-д1ц
@МатвейТимофеев-д1ц 28 күн бұрын
Upd 2 - проблема решается указанием языков, на который ты хочешь сделать перевод. -m ocrmypdf -l rus+end
@Alex-t8q4z
@Alex-t8q4z 7 ай бұрын
Спасибо
@ennr9108
@ennr9108 Жыл бұрын
Здравствуйте, у меня проблема (я рукожоп). Надо спарсить данные с веб сайта использую библиотеку requests и получая get заброс у меня это - {'success': False, 'code': 400, 'message': 'Parameter error', 'data': None, 'extend': None}. Вместо {success: true, code: 200, message: "Успешно",…} code : 200 data : [{cryptoAsset: {name: "USDT", fullName: "Tether", symbol: "", scale: 6},…},…] extend : null message : "Успешно" success : true А задача у меня научиться нормально собирать данные с сайтов, но я уже все гайды пересмотрел и ничего не выходит
@PythonGuru_
@PythonGuru_ Жыл бұрын
Готовлю курс по этой теме. А пока не выложил, дайте ваш код и что пытаетесь спарсить, могу глянуть
@ennr9108
@ennr9108 Жыл бұрын
@@PythonGuru_ Здравствуйте, идёт пост запрос, где сам курс валюты храниться и там явно нужно использовать не bs4.
@Tosha.V
@Tosha.V Жыл бұрын
попробуй EasyOCR, пишут что получше будет распознавать
@PythonGuru_
@PythonGuru_ Жыл бұрын
👌
Extract Text From Images in Python (OCR)
29:24
NeuralNine
Рет қаралды 290 М.
ТЮРЕМЩИК В БОКСЕ! #shorts
00:58
HARD_MMA
Рет қаралды 1,3 МЛН
Trick-or-Treating in a Rush. Part 2
00:37
Daniel LaBelle
Рет қаралды 43 МЛН
Perfect Pitch Challenge? Easy! 🎤😎| Free Fire Official
00:13
Garena Free Fire Global
Рет қаралды 77 МЛН
Как распознать PDF в Word
10:49
Компьютерные секреты
Рет қаралды 28 М.
Rip out Drug Labels using Deep Learning with PaddleOCR & Python
36:12
Nicholas Renotte
Рет қаралды 42 М.
Persistência com Entity Framework e SQLite
31:25
Camillo Falcão
Рет қаралды 44
ТЮРЕМЩИК В БОКСЕ! #shorts
00:58
HARD_MMA
Рет қаралды 1,3 МЛН