Transkribus: Unterschied zwischen den Versionen
Keine Bearbeitungszusammenfassung Markierung: Zurückgesetzt |
Keine Bearbeitungszusammenfassung Markierung: Manuelle Zurücksetzung |
||
Zeile 1: | Zeile 1: | ||
Transkribus ist eine Texterkennungssoftware, die als Web- oder Desktopapp verfügbar ist, und sowohl gedruckte als auch handschriftliche Texte lesen kann. Ich habe sie hier für das steuerlein-reimbibel.de getestet und die Ergebnisse sind vielversprechend. | Transkribus ist eine Texterkennungssoftware, die als Web- oder Desktopapp verfügbar ist, und sowohl gedruckte als auch handschriftliche Texte lesen kann. Ich habe sie hier für das steuerlein-reimbibel.de getestet und die Ergebnisse sind vielversprechend. | ||
Entwickler und Herausgeber der Software ist | Entwickler und Herausgeber der Software ist [www.readcoop.eu READ COOP], eine Kooperation von mehr als 100 institutionellen und privaten Partner, darunter zahlreichen bedeutende Universitäten, Bibliotheken und namhafte Archive, die umfangreiche Bestände an gedrucktem und handschiftlichem Schriftgut besitzen und diese Software zur digitalen Erschließung und Veröffentlichung der Texte anwenden. | ||
Die Software ist KI gestützt und erkennt Text in verschiedenen Schriftarten und -sprachen, auf die eine Reihe von KI-Modellen trainiert wurden, z.B. "The German Giant I" mit über 15 Millionen Worten. | Die Software ist KI gestützt und erkennt Text in verschiedenen Schriftarten und -sprachen, auf die eine Reihe von KI-Modellen trainiert wurden, z.B. "The German Giant I" mit über 15 Millionen Worten. |
Version vom 14. Januar 2024, 13:54 Uhr
Transkribus ist eine Texterkennungssoftware, die als Web- oder Desktopapp verfügbar ist, und sowohl gedruckte als auch handschriftliche Texte lesen kann. Ich habe sie hier für das steuerlein-reimbibel.de getestet und die Ergebnisse sind vielversprechend.
Entwickler und Herausgeber der Software ist [www.readcoop.eu READ COOP], eine Kooperation von mehr als 100 institutionellen und privaten Partner, darunter zahlreichen bedeutende Universitäten, Bibliotheken und namhafte Archive, die umfangreiche Bestände an gedrucktem und handschiftlichem Schriftgut besitzen und diese Software zur digitalen Erschließung und Veröffentlichung der Texte anwenden.
Die Software ist KI gestützt und erkennt Text in verschiedenen Schriftarten und -sprachen, auf die eine Reihe von KI-Modellen trainiert wurden, z.B. "The German Giant I" mit über 15 Millionen Worten.
Hochgeladene PDF und Image-Dateien können hochgeladen, in Sammlungen eingeordnet und gegen Credits (1 Credit für eine Seite handschriftlichen Text) vom Programm erkannt werden. Nach Abschluss des Verfahrens (man muss die Seite händisch aktualisieren um den Fortschritt zu sehen), kann man auf einem zweigeteilten Bildschirm das Ergebnis sehen:
Links wird die Originalseite angezeigt, auf der nun der Textraum ("Region", bzw. bei mehreren Spalten oder Randnoten auch mehrere Texträume) und die darin gefundenen Zeilen durchnummeriert angezeigt werden. Nicht immer klappt das so zuverlässig wie in diesem Beispiel, insbesondere wenn die Zeilen eng stehen und die Seite fleckig ist, werden manchmal Zeilen erkannt, wo keine da sind, oder einzelne Zeilen geteilt.
Man kann die Zeilenerkennung auch manuell durch anpassen. Ich habe dies aber noch nicht ausprobiert, weil es für meinen Anwendungsfall jetzt nicht so tragisch ist, wenn da etwas nicht stimmt.
Auf der rechten Seite bekommt man nun den Texte nach Regionen und Zeilen organisiert in transkribierter Form angezeigt.
Das Ergebnis ist schon ziemlich gut. Je nachdem wie sauber geschrieben ist, ist 95% Zuverlässigkeit durchaus ein Normalwert. Natürlich gibt es auch hier Ausreißer, die die KI nicht hinbekommt. Insbesondere die frühneudeutsche Sprache, was (nicht vorhandene) Rechtschreibung und das Vokabular betrifft, aber auch die dichterische Textgattung machen es wohl schwer, die Worte zu richtig zu interpretieren. Dass hier ausgerechnet die Überschrift "Der Prophet Obadia", die gefühlt am besten lesbar ist, zu einem Kauderwelch verändert wurde, ist kurios.
Schwierig sind insbesondere ansonsten Kleinbuchstaben im Wort, wie c, e, r, n und m, die sich oft wie eine gezackte Linie lesen. Aber hier hat das Programm eigentlich auch keine so schlechte Arbeit geleistet. Großes "G" und "B" sind in dieser Schriftart manchmal sehr ähnlich, weshalb das Programm auch einmal gescheitert ist ("Besendet", statt "Gesendet"). Und "a" und "o" können auch schonmal verwechselt werden. Im biblischen Kontext geht es um "Edom" und nicht um das niederländische Käsestädtchen Edam.
Man kann nun den Text Stück für Stück durch anklicken der Zeile frei korrigieren. In der Webapp etwas hinderlich: Die Zeilennummern verdecken links manchmal den Text (ich habe noch nicht herausgefunden, wie man sie verbirgt). Man kann den verbesserten Text dann speichern (wichtig, sonst gehen die Änderungen ohne Warnung verloren) und anschließend auch exportieren.
Die Vorteile des Programms sind offensichtlich. Verlassen sollte man sich ohnehin nie zu 100% auf das Programm, aber man je nach Qualität der Vorlage, spart man sich viel Abtipperei und bekommt einen Text, den man nur gelegentlich mit eigener Lesekompetenz nachkorrigieren muss.
Beim untersten Mitgliedschaftsmodell ("Individual") ist Transkribus kostenlos und man hat jeden Monat 100 Credits frei, so dass man überschaubare Textkorpora also ohne weitere bearbeiten kann.