Avec le moteur d'OCR de Tesseract, seule la partie pdf consultable est pris en charge.

Langues prises en charge: Afrikaans (Afrique du Sud), Albanais (Albanie), Azerbaïdjanais (Azerbaïdjan), Biélorusse (Biélorussie), Bosniaque (Bosnie-Herzégovine), Bulgare (Bulgarie), Catalan (Espagne), Croate (Croatie), Tchèque (République tchèque), Danois (Danemark), anglais, espéranto, estonien (Estonie), finnois (Finlande), français (France), allemand (Allemagne), hongrois (Hongrie), islandais (Islande), indonésien (Indonésie), irlandais (Irlande), italien (Italie), japonais (Japon), javanais (Java), kirghize (Kirghizstan), latin, letton (Lettonie), lituanien (Lituanie), macédonien (Macédoine), malais (Malaisie), maltais (Malte), norvégien (Norvège), polonais (Pologne), portugais (Brésil), portugais (Portugal), Roumain (Roumanie), Russe (Russie), Serbe (Serbie), Slovaque (Slovaquie), Slovène (Slovénie), Espagnol, Suédois (Suède), Turc (Turquie), Ukrainien (Ukraine), Ouzbek (Ouzbékistan), Vietnamien (Vietnam), Gallois (Pays de Galles), Yiddish.

La sélection de plusieurs langues prendra beaucoup plus de temps pour traiter les fichiers.

Pour plus d'informations sur le moteur, consultez la documentation dédiée de son développeur.