Obwohl ich schon seit über einem Jahr Abonnent deines Kanals bin, ist das tatsächlich mein erster Kommentar. Deshalb möchte ich mich zunächst einmal möchte ich mich für deine sehr informativen und unterhaltsamen Videos bedanken. Dein Kanal ist ,was die Qualität der Videos angeht, ganz weit vorne mit dabei. Da ich mich gerade auch mit Tesseract beschäftige, allerdings in Java und mit dem Ziel, die Zahlen eines Sudokus richtig zu erkennen und dieses dann zu lösen, wollte ich hier mal auch meinen Senf zu der Sache geben. Da bei einem Sudoku natürlich nur die Zahlen von 1 bis 9 relevant sind, habe ich ebenfalls die Einstellung getroffen nur nach Zahlen zu suchen. Mit Java ging das allerdings mit einer sog. "Whitelist" bzw. " Blacklist", in die man einzelne Zeichen eintragen kann nach denen gesucht bzw. nicht gesucht werden soll. Die Beschränkung auf einzelne Kategorien (z.B. Ziffern, Buchstaben) entfällt somit. Je nach Qualität des Bildes kann es sinvoll sein, dieses vor der Übergabe an Tesseract dieses zu bearbeiten / Vereinfache. In meinem Fall mit dem Sudoku habe ich gute Erfahrungen mit Biarisierung gemacht . D. h. man legt fest, ab welcher "Helligkeit" ein Pixel als weiß bzw. als Schwarz gewertet werden soll. Dadurch verschwinden Grautöne, sodass es dem Algorithmus deutlich leichter fällt, die Zeichen richtig zu erkennen.
@Florian.Dalwigk2 жыл бұрын
Danke für deinen Input :)
@andrej_sound2 жыл бұрын
Oui das ist perfekt für ein Projekt was ich gerade starte.
@Florian.Dalwigk2 жыл бұрын
Super :) Was hast du vor?
@andrej_sound2 жыл бұрын
@@Florian.Dalwigk Office Tools .Also Kalender Todoliste..... Da weiß ich dann auch das die Daten bei mir sind.
@felori2332 жыл бұрын
Verdammt gutes Video, immer sachlich, konkret und verständlich erklärt. Ich freue mich sehr, dass momentan fast jeden Tag ein Video von dir kommt, auch wenn mir klar ist, dass das wohl nicht immer so bleibt, du hast ja auch Uni etc. Mach weiter so!
@Florian.Dalwigk2 жыл бұрын
Vielen, vielen Dank 😊
@tobiaskaruth2 жыл бұрын
13:00 jaaaa endlich
@fhcsghgggfghghhggg45662 жыл бұрын
12:53. das ist der Satz, auf den ich das ganze video lang gewartet hab. und ich warte natürlich auf den dark-souls-mit-Gedanken-zocken walkthrough.
@Florian.Dalwigk2 жыл бұрын
Danke für deine Geduld ;)
@MiauRizius2 жыл бұрын
Das ist geil, vielen Dank xD Ich habe so oft, dass wer ein Tutorial hochläd, aber man den Code nirgendwo findet.
@Florian.Dalwigk2 жыл бұрын
Gerne!
@olivdi41372 жыл бұрын
Kann man damit auch irgendwie ein Programmschreiben, welches PDF dDateien in txt oder ähnliche Dateiformate umwandeln kann?
@Florian.Dalwigk2 жыл бұрын
Kann man.
@cheepcheep22042 жыл бұрын
warst du an der hochschule coburg?
@Florian.Dalwigk2 жыл бұрын
Nein
@cheepcheep22042 жыл бұрын
@@Florian.Dalwigk Achsoo, weil unser C++ Lehrer hat dich empfohlen :D
@Florian.Dalwigk2 жыл бұрын
Achso 😅 Richtig cool 😎 Grüß ihn gerne mal von mir und vielen Dank für die Empfehlung 🙏
@rayvvenn2 жыл бұрын
oh ja sehr gutes modul. genau wegen dem von dir am Anfang beschriebenen Problem hab ich mir so ein kleines Skript geschrieben
@Florian.Dalwigk2 жыл бұрын
Cool, was macht das?
@annaj.47402 жыл бұрын
spannend😃 wüsste ich auch gern.
@rayvvenn2 жыл бұрын
@@Florian.Dalwigk Der nimmt das bild aus der zwischenablage und kopiert dann direkt den text den er findet. also ich schneide mir einen ausschnitt mit snipping tool aus, dann lasse ich das skript laufen. sehr hilfreich!
@Florian.Dalwigk2 жыл бұрын
Richtig cool 😎
@cead2723 Жыл бұрын
Wenn ich pytesseract start mit diesen befehlen bekomme ich den Fehler "Unsupported image object" obwohl ich png verwende undauch mit bildern getestet habe die du verwendet hast. Könnte mir da vielleicht jemand helfen? PS: Ich verwende Jupyter Notebook
@forestcat5122 жыл бұрын
Bin gespannt, Morpheus hat ja auch schon ein Video dazu gemacht. Ich fände mal eine Sache die ihr gemeinsam macht cool. Tolles Thema
@Florian.Dalwigk2 жыл бұрын
Wir haben schon ein Video gemeinsam gemacht.
@kicobabic1551 Жыл бұрын
Ich habe zwei Fragen: 1. Kann man über pytesseract und python auch nur einen bestimmten Bereich aus dem Bild auslesen? (z.b. über RECT) 2. Kann man neben den Bildern wie png/jpg/gif auch den Text aus einem PDF auslesen? Wenn ja, mit welchen befehlen oder parametern?
@Florian.Dalwigk Жыл бұрын
Ja, mit pytesseract und Python kannst du einen bestimmten Bereich aus einem Bild auslesen. Du kannst die Parameter config und boxes von pytesseract verwenden. Der config-Parameter ermöglicht es dir, bestimmte Konfigurationen und Einstellungen für Tesseract OCR festzulegen, während der boxes-Parameter es dir ermöglicht, Tesseract anzuweisen, nur den Text innerhalb bestimmter Begrenzungsrahmen (Rectangles) zu erkennen. Hier ist ein Beispiel, wie du einen bestimmten Bereich aus einem Bild auslesen kannst: import pytesseract from PIL import Image def extract_text_from_image(image_path, rectangle): image = Image.open(image_path) cropped_image = image.crop(rectangle) # Ausschnitt des Bildes basierend auf dem Rechteck text = pytesseract.image_to_string(cropped_image) return text # Beispielaufruf image_path = 'pfad/zum/bild.png' rectangle = (x, y, width, height) # Rechteckkoordinaten des auszulesenden Bereichs text = extract_text_from_image(image_path, rectangle) print("Erkannter Text:") print(text) Stelle sicher, dass du die erforderlichen Bibliotheken pytesseract und PIL installiert hast (pip install pytesseract pillow). Ja, es ist möglich, Text aus PDF-Dateien mit Python zu extrahieren. Du kannst das PyPDF2- oder pdftotext-Modul verwenden, um den Text aus einem PDF-Dokument zu extrahieren. Mit dem PyPDF2-Modul kannst du den Text aus PDF-Dateien extrahieren. Hier ist ein Beispiel: import PyPDF2 def extract_text_from_pdf(pdf_path): with open(pdf_path, 'rb') as file: pdf_reader = PyPDF2.PdfFileReader(file) text = "" for page_num in range(pdf_reader.numPages): page = pdf_reader.getPage(page_num) text += page.extract_text() return text # Beispielaufruf pdf_path = 'pfad/zum/dokument.pdf' text = extract_text_from_pdf(pdf_path) print("Extrahierter Text:") print(text) Alternativ kannst du das pdftotext-Modul verwenden, das auf dem Befehlszeilentool "pdftotext" basiert, um Text aus PDF-Dateien zu extrahieren. Hier ist ein Beispiel: def extract_text_from_pdf(pdf_path): with open(pdf_path, 'rb') as file: pdf = pdftotext.PDF(file) text = "" for page in pdf: text += page return text # Beispielaufruf pdf_path = 'pfad/zum/dokument.pdf' text = extract_text_from_pdf(pdf_path) print("Extrahierter Text:") print(text) Stelle sicher, dass du das entsprechende Modul installiert hast. Du kannst es mit pip install PyPDF2 oder pip install pdftotext installieren. Antwort generiert von ChatGPT
@clemens31232 жыл бұрын
Hey, gutes Video :) Ist es möglich mit dieser Methode aus einem Bild eines Sudoku-Grids die Zahlen auszulesen? Bei mir ging dies leider nicht
@Florian.Dalwigk2 жыл бұрын
Ja, das geht. Aber nicht zuverlässig als Matrix.
@annaj.47402 жыл бұрын
Du bist der Beste😄 btw. sich Deinen Quellcode abschreiben zu müssen, ist auch Meckern auf hohem Niveau😉 immerhin ist es nie langer Code und selber Schreiben macht einem viel bewusst🤘 Aber okeeeeeee, ich würde dann wahrscheinlich auch Dein Github Repository benutzen. Hast es ja extra zur Verfügung gestellt und Menschen sind eher faul😂🤣😂
@redjul90652 жыл бұрын
Kann man Code aus exe Files extrahieren?
@JakobDev2 жыл бұрын
Exe Files haben keinen Code den man extrahieren könnte. Du kannst es höchstens mit einem Decompiler versuchen.
@picklerick58432 жыл бұрын
Warum nicht 2 Monate früher D: da hab ich tesseract zum durchsuchen von bild formaten auf einem server verwendet. Man kann einfach nach einem schlagwort suchen und bekommt alle dateien die das enthalten angezeigt. (Ist allerdings sinnvoll die Datein vorher zu komprimieren da der Vorgang sonst ewig dauern kann - je nach umfang der zu durchsuchenden datein) Gutes Video wie immer ❤️
@rabin3712 жыл бұрын
Super Video! Danke!
@Florian.Dalwigk2 жыл бұрын
Gerne :)
@oida100002 жыл бұрын
Gut zu wissen. Mich wundert nur, dass die entsprechenden Trainigsdaten nicht ein Opt-In beim Installieren sind.
@Florian.Dalwigk2 жыл бұрын
Du kannst eben die Language Pakete bei der Installation schon herunterladen (wie im Video erwähnt).
@Julian-yf2ey2 жыл бұрын
Ich habe mit ocr nem pi und einem netzwekkable die Industrie um 1900 Euro unterboten .....
@Florian.Dalwigk2 жыл бұрын
😅
@patrickFREE.2 жыл бұрын
Einfach göttlich
@Florian.Dalwigk2 жыл бұрын
😊
@user-hr1vo2sr4t2 жыл бұрын
Gutes Video 👍
@Florian.Dalwigk2 жыл бұрын
Dankeschön 😁
@user-hr1vo2sr4t2 жыл бұрын
:)
@MihuKat2 жыл бұрын
me so bild in text my mind: STEGO? Stego? STEGO ??? STEGO??:D
@Florian.Dalwigk2 жыл бұрын
😂
@lofya_2 жыл бұрын
yes sir
@bauzerbuddy97412 жыл бұрын
epic
@Florian.Dalwigk2 жыл бұрын
🔥🔥🔥
@sorenholzenkamp88772 жыл бұрын
Versprecher am Anfang "menschenlesbarer Text"
@Florian.Dalwigk2 жыл бұрын
Ja mei ...
@jeyt4362 жыл бұрын
Du sprichst das Programm falsch aus, glaube ich. Ich hätte es englisch ausgesprochen.
@Florian.Dalwigk2 жыл бұрын
In meinem Umfeld wird das so ausgesprochen. Notfalls weiß man ja, was gemeint ist.