Ich konnte ein Vereinsprotokollbuch und mehrere ausführliche Gerichtsakten mehr als brauchbar transkribieren und mir blieb sehr viel manuelle Arbeit erspart. Vor allem beim Protokollbuch war dann eine Indizierung möglich, die ebenfalls viele Suchstunden für Nutzer erspart. Das geschah aber noch vor der nunmehr besser durchschaubaren Browser gestützten Version. Vom Grundsatz hat sich wenig geändert, das Handling ist deutlich intuitiver geworden. Wie im Video mehrfach angeführt, ohne Training ist meist kein ausreichendes Ergebnis zu erwarten. Ich hoffe aber durch viele Nutzer wird das Programm immer mächtiger und erschließt digitale Archive in einem großen Maßstab. Macht weiter so. Ich denke, die schwierigste Anfangszeit ist vorbei und das Ganze wird jeden Tag besser. Auf die Tabellen-Transkription bin ich schon sehr gespannt. Das wird was für Kirchenbücher. Da war ja oft jahrelang derselbe Pfarrer am Schreiben und das sollte dann auch ein gutes Handwerkszeug für Ortsfamilienbücher werden.
@homagold697 ай бұрын
Sehr informativ, hilfreich und gut erklärt. Danke 🤩
@peterhirt991 Жыл бұрын
Model Accuracy: Sie sagen, sie messen dies mit der CER. Gut, aber dies sind ja nur Zeichenerkennung. Sollte man zusätzlich nicht noch beim Wort testen, ob die Zeichenfolge, die erkannt wurde plausibel ist. Ein Beispiel: in einem Dokument wird global von Solothurn gesprochen, dann wird ein Dorfnamen als Gosslibell erkannt, aber es gibt kein Gosslibell nahe bei Solothurn, es gibt ein Gossliwil. Dies sollte eine KI Unterstützung doch erkennen können und automatische verbessern können. Dann könnte auch der ganze Satz oder die Baseline mit allen Wörtern einer KI Beurteilung unterzogen werden ("does the baseline makes sense, is it German or is it garbish)
@peterhirt991 Жыл бұрын
Sehr gutes Video! Wenn sie aber sagen, dass KI verwendet wird, um das Resultat zu verbessern, muss ich sagen, dass auf meinen Tests immer ein hochgradiges Unsicherheitslevel da ist den text als richtigen deutschen Text darzustellen. Man versucht dann, dem mit iterativen Versuchen beizukommen. Ihre Ergebnisse sind immer sehr klar und deutlich, meine sind es nicht. Ein LLM wie ChatGPT könnte doch helfen in solch einem Fall, ja? Auch sollte das gescannte Dokument dazu geeignet sein, ihren Modelzoo zu durchforsten und automatisch das beste Model vorzuschlagen. Man ersparte sich da viel Zeit
@peterhirt991 Жыл бұрын
UX design : ja besser, aber noch sehr weit von gut, sorry!