prog:ocrmypdf
Applique un OCR sur les images et ajoute une couche de texte.
Installation
ocrmypdf
: pip install ocrmypdf
tesseract
. Voir Tesseract Download UB-Mannheim Download. Utilisable uniquement avec Python 64bits. Bien penser à télécharger les langues additionnelles nécessaires. C'est possible de l'installer dans son dossier par défaut C:\Program Files\Tesseract-OCR
.
pngquant
: Site web Téléchargement Archive v2.17 Copier le contenu du zip dans le dossier Script de l'environnement python. C'est un binaire 64 bits.
jbig2
: Site web Téléchargement Archive v0.29 Copier le contenu du zip dans le dossier Script de l'environnement python. C'est un binaire 32 bits mais ça passe quand même dans un environnement Python 64 bits.
prog/ocrmypdf.txt · Dernière modification : de root