Tesseract ist eine Open-Source-Engine zur optischen Zeichenerkennung (OCR), die von MyQ im MyQ OCR Server verwendet wird.
Die Tesseract-OCR-Engine unterstützt die folgenden Formate:
-
PDF
-
PDFA (die Konformitätsstufe von PDFA ist PDFA-1B)
-
TXT
Tesseract kann zur Verarbeitung von Dokumenten in vielen Sprachen verwendet werden – weitere Informationen finden Sie unterSupported Languages.
Weitere Informationen zur Tesseract-Engine finden Sie in der entsprechenden Dokumentation des Entwicklers.