Comment convertir un PDF en Excel en Python à l'aide de l'API REST

Convertir PDF en Excel en Python à l’aide de l’API REST

PDF est l’un des formats de document polyvalents les plus couramment utilisés pour présenter des documents. Mais il est difficile d’éditer un document PDF. Pour extraire facilement un tableau ou modifier du texte dans un format de feuille de calcul, vous devez convertir le PDF en feuilles de calcul Excel modifiables. Ainsi, vous n’avez pas besoin de perdre du temps à copier manuellement du texte, puis à le modifier. Nos API de conversion PDF vers XLS ou PDF vers XLSX vous permettent de convertir rapidement des PDF au format de feuille de calcul Excel. Dans cet article, nous allons apprendre à convertir un PDF en Excel en Python à l’aide de l’API REST.

Les sujets suivants seront traités dans cet article :

API de conversion Python PDF vers Excel – Installation

Afin de convertir le fichier PDF au format Excel, nous utiliserons l’API Python SDK of GroupDocs.Conversion Cloud. Il s’agit d’une bibliothèque Python de conversion de documents et d’images riche en fonctionnalités et indépendante de la plate-forme. Il fournit une conversion rapide des images et des documents de n’importe quel format de fichier pris en charge vers n’importe quel format en haute qualité.

Vous pouvez installer la bibliothèque Python de conversion PDF vers XLSX dans votre application Python à l’aide de la commande suivante dans la console :

pip install groupdocs_conversion_cloud

Veuillez obtenir votre ID client et votre secret à partir du tableau de bord avant de suivre les étapes mentionnées. Une fois que vous avez votre identifiant et votre secret, ajoutez du code dans votre application python :

# Bibliothèque Python pour la conversion de PDF en Excel dans une application Python
import groupdocs_conversion_cloud

# Obtenez client_id et client_secret depuis https://dashboard.groupdocs.cloud après une inscription gratuite.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Obtenez différentes configurations
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "local-storage-name"

Maintenant, montrons comment convertir pdf au format xlsx étape par étape en utilisant l’API REST en Python.

Comment convertir un PDF en XLSX en Python à l’aide de l’API REST

Nous pouvons convertir un fichier pdf au format Excel par programme en suivant les étapes simples indiquées ci-dessous :

  • Tout d’abord, créez une instance de ConvertApi
  • Ensuite, créez une instance de paramètres de conversion à l’aide de ConvertSettings
  • Ensuite, indiquez le nom de stockage des fichiers
  • Définissez le chemin du fichier PDF d’entrée et le format de sortie sur “xlsx”
  • Ensuite, créez une instance de PdfLoadOptions.
  • Indiquez le mot de passe du fichier PDF
  • Ensuite, définissez les options output\path et load\
  • Après cela, créez le ConvertDocumentRequest avec ConvertSettings comme argument
  • Enfin, convertissez pdf en excel en appelant le convert\document() avec ConvertDocumentRequest

L’exemple de code suivant montre comment changer le format pdf en format excel en Python :

# Comment Python convertir un PDF en Excel en ligne
try:
  # Créer une instance de l'API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Définir les paramètres de conversion
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "xlsx"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Créer une demande de conversion de document
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Convertir le fichier .pdf au format .xlsx
  result = convert_api.convert_document(request)
  print("pdf File converted to xlsx successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Enfin, l’exemple de code ci-dessus enregistrera le fichier xlsx sur le cloud. C’est le meilleur moyen de convertir un pdf en document Excel.

Comment convertir un PDF en XLSX en Python à l'aide de l'API REST

Comment convertir un PDF en XLSX en Python à l’aide de l’API REST

Convertir une plage de pages de PDF en fichier Excel en Python

Nous pouvons convertir une plage de pages d’un document PDF en Excel en suivant les étapes ci-dessous :

  • Tout d’abord, créez une instance de ConvertApi
  • Ensuite, créez une instance de paramètres de conversion à l’aide de ConvertSettings
  • Ensuite, indiquez le nom de votre stockage cloud
  • Définissez le chemin du fichier PDF d’entrée et le format de sortie sur “xlsx”
  • Ensuite, créez une instance de XlsConvertOptions
  • Définissez les options from\page et pages\count
  • Ensuite, définissez le chemin de sortie et convertOptions
  • Maintenant, créez le ConvertDocumentRequest avec ConvertSettings comme argument
  • Enfin, convertissez le pdf en code Excel en ligne en appelant la méthode convert\document() avec ConvertDocumentRequest

L’exemple de code suivant montre comment convertir une plage de pages d’un document PDF en un fichier Excel à l’aide de Python :

# Comment convertir une plage de pages de PDF en Excel en Python
# Créer une instance d'API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Préparer les paramètres de conversion Excel
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# Options de conversion PDF : numéro de page de départ et nombre total de pages à convertir
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.from_page = 2 
convertOptions.pages_count = 3

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Créer une demande de conversion de document
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Convertir des pages de PDF en fichier Excel
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to Excel file: " + result[0].path)

Enfin, l’exemple de code ci-dessus enregistrera le document après la conversion de pdf en excel en ligne sur le cloud.

Convertir des pages spécifiques du format PDF au format Excel en Python

Nous pouvons convertir des pages spécifiques d’un document PDF en Excel en utilisant le meilleur convertisseur pdf en xlsx en ligne avec des images en suivant les étapes ci-dessous :

  • Tout d’abord, créez une instance de ConvertApi
  • Ensuite, créez une instance de paramètres de conversion à l’aide de ConvertSettings
  • Ensuite, indiquez le nom de votre stockage cloud
  • Définissez le chemin du fichier PDF d’entrée et le format de sortie sur “xlsx”
  • Ensuite, créez une instance de XlsConvertOptions
  • Ajoutez le numéro de page à convertir au format tableau
  • Ensuite, définissez le chemin de sortie et convertOptions
  • Maintenant, créez le ConvertDocumentRequest avec ConvertSettings comme argument
  • Enfin, convertissez le pdf en code Excel en ligne en appelant la méthode convert\document() avec ConvertDocumentRequest

L’exemple de code suivant montre comment exporter certaines pages d’un document PDF vers un fichier Excel à l’aide de Python :

# Comment convertir des pages spécifiques d'un fichier PDF au format Excel en Python
# Créer une instance d'API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Définir les paramètres de conversion
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# Options de conversion PDF : numéros de page à convertir
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Créer une demande de conversion de document
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Convertir un fichier PDF en fichier Excel
result = convert_api.convert_document(request)
print("Successfully converted PDF file to XLSX document: " + result[0].path)

Enfin, l’exemple de code ci-dessus convertira pdf en xlsx avec des images sur le cloud. Il existe un convertisseur de code pdf en xlsx en ligne, comme expliqué ci-dessous.

Convertisseur PDF en Excel en ligne gratuitement

Quel est le meilleur convertisseur PDF vers Excel ? Groupdocs.Conversion fournit gratuitement le meilleur convertisseur pdf en xlsx en ligne pour vous permettre de convertir le format PDF au format Excel. Il a été développé à l’aide de l’API en ligne Groupdocs.Conversion pdf vers xlsx.

Conclusion

Dans cet article, vous avez appris :

  • comment convertir un pdf en xls/xlsx sans perdre le formatage en Python ;
  • comment convertir un fichier pdf en fichier excel par plage à l’aide de Python ;
  • convertir des pages PDF spécifiques au format XLSX en Python ;

En outre, vous pouvez en savoir plus sur l’API de conversion de format de fichier GroupDocs.Conversion à l’aide de la documentation.

poser une question

Vous pouvez poser vos questions sur la façon de convertir un fichier pdf au format xlsx, via notre Forum d’assistance gratuit

Voir également