BILD in TEXT mit PYTESSERACT umwandeln

Рет қаралды 10,384

Күн бұрын

Пікірлер: 54

@marcoarnold8022 2 жыл бұрын

Obwohl ich schon seit über einem Jahr Abonnent deines Kanals bin, ist das tatsächlich mein erster Kommentar. Deshalb möchte ich mich zunächst einmal möchte ich mich für deine sehr informativen und unterhaltsamen Videos bedanken. Dein Kanal ist ,was die Qualität der Videos angeht, ganz weit vorne mit dabei. Da ich mich gerade auch mit Tesseract beschäftige, allerdings in Java und mit dem Ziel, die Zahlen eines Sudokus richtig zu erkennen und dieses dann zu lösen, wollte ich hier mal auch meinen Senf zu der Sache geben. Da bei einem Sudoku natürlich nur die Zahlen von 1 bis 9 relevant sind, habe ich ebenfalls die Einstellung getroffen nur nach Zahlen zu suchen. Mit Java ging das allerdings mit einer sog. "Whitelist" bzw. " Blacklist", in die man einzelne Zeichen eintragen kann nach denen gesucht bzw. nicht gesucht werden soll. Die Beschränkung auf einzelne Kategorien (z.B. Ziffern, Buchstaben) entfällt somit. Je nach Qualität des Bildes kann es sinvoll sein, dieses vor der Übergabe an Tesseract dieses zu bearbeiten / Vereinfache. In meinem Fall mit dem Sudoku habe ich gute Erfahrungen mit Biarisierung gemacht . D. h. man legt fest, ab welcher "Helligkeit" ein Pixel als weiß bzw. als Schwarz gewertet werden soll. Dadurch verschwinden Grautöne, sodass es dem Algorithmus deutlich leichter fällt, die Zeichen richtig zu erkennen.

@Florian.Dalwigk 2 жыл бұрын

Danke für deinen Input :)

@andrej_sound 2 жыл бұрын

Oui das ist perfekt für ein Projekt was ich gerade starte.

@Florian.Dalwigk 2 жыл бұрын

Super :) Was hast du vor?

@andrej_sound 2 жыл бұрын

@@Florian.Dalwigk Office Tools .Also Kalender Todoliste..... Da weiß ich dann auch das die Daten bei mir sind.

@felori233 2 жыл бұрын

Verdammt gutes Video, immer sachlich, konkret und verständlich erklärt. Ich freue mich sehr, dass momentan fast jeden Tag ein Video von dir kommt, auch wenn mir klar ist, dass das wohl nicht immer so bleibt, du hast ja auch Uni etc. Mach weiter so!

@Florian.Dalwigk 2 жыл бұрын

Vielen, vielen Dank 😊

@tobiaskaruth 2 жыл бұрын

13:00 jaaaa endlich

@fhcsghgggfghghhggg4566 2 жыл бұрын

12:53. das ist der Satz, auf den ich das ganze video lang gewartet hab. und ich warte natürlich auf den dark-souls-mit-Gedanken-zocken walkthrough.

@Florian.Dalwigk 2 жыл бұрын

Danke für deine Geduld ;)

@MiauRizius 2 жыл бұрын

Das ist geil, vielen Dank xD Ich habe so oft, dass wer ein Tutorial hochläd, aber man den Code nirgendwo findet.

@Florian.Dalwigk 2 жыл бұрын

Gerne!

@olivdi4137 2 жыл бұрын

Kann man damit auch irgendwie ein Programmschreiben, welches PDF dDateien in txt oder ähnliche Dateiformate umwandeln kann?

@Florian.Dalwigk 2 жыл бұрын

Kann man.

@cheepcheep2204 2 жыл бұрын

warst du an der hochschule coburg?

@Florian.Dalwigk 2 жыл бұрын

Nein

@cheepcheep2204 2 жыл бұрын

@@Florian.Dalwigk Achsoo, weil unser C++ Lehrer hat dich empfohlen :D

@Florian.Dalwigk 2 жыл бұрын

Achso 😅 Richtig cool 😎 Grüß ihn gerne mal von mir und vielen Dank für die Empfehlung 🙏

@rayvvenn 2 жыл бұрын

oh ja sehr gutes modul. genau wegen dem von dir am Anfang beschriebenen Problem hab ich mir so ein kleines Skript geschrieben

@Florian.Dalwigk 2 жыл бұрын

Cool, was macht das?

@annaj.4740 2 жыл бұрын

spannend😃 wüsste ich auch gern.

@rayvvenn 2 жыл бұрын

@@Florian.Dalwigk Der nimmt das bild aus der zwischenablage und kopiert dann direkt den text den er findet. also ich schneide mir einen ausschnitt mit snipping tool aus, dann lasse ich das skript laufen. sehr hilfreich!

@Florian.Dalwigk 2 жыл бұрын

Richtig cool 😎

@cead2723 Жыл бұрын

Wenn ich pytesseract start mit diesen befehlen bekomme ich den Fehler "Unsupported image object" obwohl ich png verwende undauch mit bildern getestet habe die du verwendet hast. Könnte mir da vielleicht jemand helfen? PS: Ich verwende Jupyter Notebook

@forestcat512 2 жыл бұрын

Bin gespannt, Morpheus hat ja auch schon ein Video dazu gemacht. Ich fände mal eine Sache die ihr gemeinsam macht cool. Tolles Thema

@Florian.Dalwigk 2 жыл бұрын

Wir haben schon ein Video gemeinsam gemacht.

@kicobabic1551 Жыл бұрын

Ich habe zwei Fragen: 1. Kann man über pytesseract und python auch nur einen bestimmten Bereich aus dem Bild auslesen? (z.b. über RECT) 2. Kann man neben den Bildern wie png/jpg/gif auch den Text aus einem PDF auslesen? Wenn ja, mit welchen befehlen oder parametern?

@Florian.Dalwigk Жыл бұрын

Ja, mit pytesseract und Python kannst du einen bestimmten Bereich aus einem Bild auslesen. Du kannst die Parameter config und boxes von pytesseract verwenden. Der config-Parameter ermöglicht es dir, bestimmte Konfigurationen und Einstellungen für Tesseract OCR festzulegen, während der boxes-Parameter es dir ermöglicht, Tesseract anzuweisen, nur den Text innerhalb bestimmter Begrenzungsrahmen (Rectangles) zu erkennen. Hier ist ein Beispiel, wie du einen bestimmten Bereich aus einem Bild auslesen kannst: import pytesseract from PIL import Image def extract_text_from_image(image_path, rectangle): image = Image.open(image_path) cropped_image = image.crop(rectangle) # Ausschnitt des Bildes basierend auf dem Rechteck text = pytesseract.image_to_string(cropped_image) return text # Beispielaufruf image_path = 'pfad/zum/bild.png' rectangle = (x, y, width, height) # Rechteckkoordinaten des auszulesenden Bereichs text = extract_text_from_image(image_path, rectangle) print("Erkannter Text:") print(text) Stelle sicher, dass du die erforderlichen Bibliotheken pytesseract und PIL installiert hast (pip install pytesseract pillow). Ja, es ist möglich, Text aus PDF-Dateien mit Python zu extrahieren. Du kannst das PyPDF2- oder pdftotext-Modul verwenden, um den Text aus einem PDF-Dokument zu extrahieren. Mit dem PyPDF2-Modul kannst du den Text aus PDF-Dateien extrahieren. Hier ist ein Beispiel: import PyPDF2 def extract_text_from_pdf(pdf_path): with open(pdf_path, 'rb') as file: pdf_reader = PyPDF2.PdfFileReader(file) text = "" for page_num in range(pdf_reader.numPages): page = pdf_reader.getPage(page_num) text += page.extract_text() return text # Beispielaufruf pdf_path = 'pfad/zum/dokument.pdf' text = extract_text_from_pdf(pdf_path) print("Extrahierter Text:") print(text) Alternativ kannst du das pdftotext-Modul verwenden, das auf dem Befehlszeilentool "pdftotext" basiert, um Text aus PDF-Dateien zu extrahieren. Hier ist ein Beispiel: def extract_text_from_pdf(pdf_path): with open(pdf_path, 'rb') as file: pdf = pdftotext.PDF(file) text = "" for page in pdf: text += page return text # Beispielaufruf pdf_path = 'pfad/zum/dokument.pdf' text = extract_text_from_pdf(pdf_path) print("Extrahierter Text:") print(text) Stelle sicher, dass du das entsprechende Modul installiert hast. Du kannst es mit pip install PyPDF2 oder pip install pdftotext installieren. Antwort generiert von ChatGPT

@clemens3123 2 жыл бұрын

Hey, gutes Video :) Ist es möglich mit dieser Methode aus einem Bild eines Sudoku-Grids die Zahlen auszulesen? Bei mir ging dies leider nicht

@Florian.Dalwigk 2 жыл бұрын

Ja, das geht. Aber nicht zuverlässig als Matrix.

@annaj.4740 2 жыл бұрын

Du bist der Beste😄 btw. sich Deinen Quellcode abschreiben zu müssen, ist auch Meckern auf hohem Niveau😉 immerhin ist es nie langer Code und selber Schreiben macht einem viel bewusst🤘 Aber okeeeeeee, ich würde dann wahrscheinlich auch Dein Github Repository benutzen. Hast es ja extra zur Verfügung gestellt und Menschen sind eher faul😂🤣😂

@redjul9065 2 жыл бұрын

Kann man Code aus exe Files extrahieren?

@JakobDev 2 жыл бұрын

Exe Files haben keinen Code den man extrahieren könnte. Du kannst es höchstens mit einem Decompiler versuchen.

@picklerick5843 2 жыл бұрын

Warum nicht 2 Monate früher D: da hab ich tesseract zum durchsuchen von bild formaten auf einem server verwendet. Man kann einfach nach einem schlagwort suchen und bekommt alle dateien die das enthalten angezeigt. (Ist allerdings sinnvoll die Datein vorher zu komprimieren da der Vorgang sonst ewig dauern kann - je nach umfang der zu durchsuchenden datein) Gutes Video wie immer ❤️