2 votes

Convertir les PDF en JPEG et déplacer les JPEG convertis dans leurs sous-dossiers respectifs

Je voulais convertir tous mes fichiers PDF en fichiers JPEG à partir d'un répertoire parent (ayant 2 ou 3 sous-répertoires) et placer les fichiers JPEG convertis dans les sous-répertoires respectifs à partir desquels ils ont été sélectionnés pour conversion.

Voici mon code que j'ai utilisé pour convertir les fichiers PDF en fichiers JPEG.

data_dir_1 = pathlib.Path("C:/Users/repertoire_parent/")

for root, dirs, files in os.walk(data_dir_1, "*.pdf"):
    for file in files:
        if file.endswith(".pdf"):
            # print(file)
            print(os.path.join(root, file))
            pages = convert_from_path(os.path.join(root, file), 500)
            for page in pages:
                page.save(file + ".jpg", "JPEG")

Est-ce que quelqu'un pourrait s'il vous plaît aider avec une méthode pour les déplacer vers leurs sous-répertoires respectifs à partir desquels ils ont été sélectionnés ?

0voto

Laurent Points 1359

Selon la documentation de pdf2image, convert_from_path accepte un paramètre "output_folder".

Donc, je suggérerais d'essayer comme ceci :

import os
import pathlib

from pdf2image import convert_from_path

data_dir_1 = pathlib.Path("C:/Users/parent_directory/")

for root, dirs, files in os.walk(data_dir_1, "*.pdf"):
    for file in files:
        if file.endswith(".pdf"):
            images = convert_from_path(
                pdf_path=os.path.join(root, file), dpi=500, output_folder=root
            )

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X