Mit der Tesseract OCR-Engine kann die pdf, pdfa, und txt Formate werden unterstützt.

Unterstützte Sprachen: Afrikaans (afr), Albanisch (sqi), Aserbaidschanisch (aze), Weißrussisch (bel), Bosnisch (bos), Bretonisch (bre), Bulgarisch (bul), Katalanisch (cat), Cebuano (ceb), Korsisch (cos), Kroatisch (hrv), Tschechisch (ces), Dänisch (dan), Niederländisch/Flämisch (ndl), Englisch (eng), Englisch Mitte 1100-1500 (enm), Esperanto (epo), Estnisch (est), Färöisch (fao), Filipino (fil), Finnisch (fin), Französisch (fra), Gälisch (gla), Galizisch (glg), Deutsch (deu), Haitianisch (hat), Hebräisch (heb), Ungarisch (hun), Isländisch (ici), Indonesisch (ind), Irisch (gle), Italienisch (ita), Japanisch (jpn), Javanisch (jav), Kirgisisch (kir), Latein (lat), Lettisch (lav), Litauisch (lit), Mazedonisch (mkd), Malaiisch (msa), Maltesisch (mlt), Maori (mri), Norwegisch (nor), Okzitanisch (oci), Polnisch (pol), Portugiesisch (por), Quechua (que), Rumänisch/Moldauisch (ron), Russisch (rus), Serbisch (srp), Serbisch Latein (srp_latn), Slowakisch (slk), Slowenisch (slv), Spanisch (spa), Sundanesisch (sun), Swahili (swa), Schwedisch (swe), Tadschikisch (tgk), Tonga (ton), Türkisch (tur), Ukrainisch (ukr), Usbekisch (uzb), Usbekisch Kyrlisch (uzb_cyrl), Vietnamesisch (vie), Walisisch (cym), Westfriesisch (fry), Yoruba (yor), Азəрбајҹан, ქართული ენა - Georgisch.

Wenn Sie mehrere Sprachen auswählen, nimmt die Verarbeitung der Dateien viel mehr Zeit in Anspruch.

Weitere Informationen über die Engine finden Sie in der entsprechenden Dokumentation des Entwicklers.