Comment extraire des pages de documents Word en Python

Comment extraire des pages de documents Word en Python

Vous devrez peut-être diviser un document Word en plusieurs documents par page par programme. En divisant des documents Word, vous pouvez facilement extraire une page d’un document Word et partager une information ou des données spécifiques avec les parties prenantes. En tant que développeur Python, vous pouvez diviser un document Word en fichiers séparés en ligne sur le cloud. Dans cet article, vous apprendrez à extraire des pages de documents Word en Python.

Les sujets suivants doivent être couverts dans cet article sur le séparateur de pages de mots :

API REST du séparateur de documents Word - SDK Python

Pour diviser un fichier Word en plusieurs fichiers, j’utiliserai le SDK Python de GroupDocs.Merger Cloud API. Il vous permet de faire pivoter, diviser, joindre, supprimer et réorganiser une seule page ou un ensemble de pages à partir de formats de documents pris en charge de Word, Excel, dessins Visio, PDF et HTML. Python référentiel de code source est disponible gratuitement sur le GitHub.

Le téléchargement gratuit du séparateur de fichiers Word est disponible. Vous pouvez installer word doc splitter dans votre application Python avec PIP depuis PyPI en utilisant la commande suivante dans le terminal :

pip install groupdocs-merger-cloud

Veuillez obtenir votre ID client et votre secret à partir du tableau de bord avant de suivre les étapes mentionnées ci-dessous. Une fois que vous avez votre identifiant et votre secret, ajoutez le code ci-dessous dans votre application pour diviser le document Word en fichiers séparés, comme indiqué ci-dessous :

# Importer le SDK de fusion de groupdocs
import groupdocs_merger_cloud

# Obtenez app_sid & app_key depuis https://dashboard.groupdocs.cloud après une inscription gratuite.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Obtenir les configurations de l'API de fichier 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Comment diviser un document Word en un seul document en Python

Vous pouvez diviser docx par programme sur le cloud en suivant les étapes mentionnées ci-dessous.

Télécharger un document Word

Tout d’abord, nous allons télécharger les fichiers Word sur le cloud pour extraire des pages de Word en ligne en utilisant l’exemple de code ci-dessous :

# Téléchargez le fichier Word sur le stockage en nuage
# Créer une instance de l'API de fichier
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Appeler la demande de téléchargement de fichier
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\word-file.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)

# Télécharger un fichier word dans le cloud
response = file_api.upload_file(request)
print(response.uploaded)

Par conséquent, les fichiers téléchargés seront disponibles dans la section fichiers de votre tableau de bord sur le cloud.

Fractionner des pages de document Word en Python

Vous pouvez diviser des pages de mots en fichiers séparés par programmation en suivant les étapes ci-dessous :

  • Tout d’abord, créez une instance de DocumentApi.
  • Ensuite, créez une instance de SplitOptions
  • Maintenant, créez une instance de FileInfo
  • Passer le chemin du fichier d’entrée comme argument à FileInfo
  • Ensuite, indiquez le chemin du fichier de sortie
  • Définir des numéros de page spécifiques dans un tableau séparé par des virgules
  • Maintenant, définissez le mode de fractionnement docx sur Pages. Il permet de diviser les numéros de page dans un tableau séparé par des virgules
  • Créer SplitRequest avec SplitOptions
  • Enfin, appelez la méthode DocumentAPI.split() avec SplitRequest comme argument et obtenez les résultats

L’extrait de code suivant montre comment diviser un fichier Word en pages distinctes à l’aide de l’API REST en Python :

# Comment diviser un document Word en un seul document en Python
try:
    # Créer une instance de l'API Document
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [1, 3]
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split word docx to single page document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))
Comment diviser un fichier Word en pages séparées en Python

Comment diviser un fichier Word en pages séparées en Python

Télécharger le fichier unique

Enfin, l’exemple de code ci-dessus enregistrera le fichier séparé sur le cloud à l’aide de python. Il peut être téléchargé à l’aide de l’exemple de code suivant :

# Initialisation de l'API pour télécharger un fichier séparé
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Créer une demande de fichier de téléchargement
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\word-file.docx", storage_name)

# Télécharger le fichier séparé
response = file_api.download_file(request)

# Déplacez le fichier téléchargé dans votre répertoire
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Diviser un document Word en un seul par plage de pages en Python

Vous pouvez diviser un document Word en plusieurs documents par page en ligne en suivant les étapes ci-dessous :

  • Créez une instance de DocumentApi
  • Ensuite, créez une instance de SplitOptions
  • Maintenant, créez une instance de FileInfo
  • Passer le chemin du fichier d’entrée comme argument à FileInfo
  • Ensuite, indiquez le chemin du fichier de sortie as “python-testing”
  • Définissez les valeurs de début\page\numéro et de fin\page\numéro
  • Définissez le mode de fractionnement docx sur Pages pour fractionner le mot
  • Créer SplitRequest avec SplitOptions
  • Enfin, appelez la méthode DocumentAPI.split() avec SplitRequest comme argument

L’extrait de code suivant montre comment extraire des pages d’un document Word en Python à l’aide de l’API REST :

# Comment diviser un document Word en un seul par plage de pages en Python
try:
    # Créer une instance de l'API Document
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word to single files by page range: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Diviser des documents Word en fichiers séparés en appliquant un filtre

Vous pouvez diviser un document Word en plusieurs documents par page en ligne en utilisant le mode plage et filtrer par programme comme indiqué ci-dessous :

  • Créer une instance de DocumentApi
  • Ensuite, créez une instance de SplitOptions
  • Maintenant, créez une instance de FileInfo
  • Passer le chemin du fichier d’entrée comme argument à FileInfo
  • Ensuite, indiquez le chemin du fichier de sortie as “python-testing”
  • Définissez les valeurs de début\page\numéro et de fin\page\numéro
  • Ensuite, définissez range\mode sur “OddPages”
  • Définissez le mode de fractionnement docx sur Pages pour fractionner le mot
  • Créer SplitRequest avec SplitOptions
  • Enfin, appelez la méthode DocumentAPI.split() avec SplitRequest comme argument

L’extrait de code suivant montre comment extraire des pages de document Word en appliquant un filtre à l’aide de l’API REST en Python :

# Comment diviser des documents Word en fichiers séparés en appliquant un filtre
try:
    # Créer une instance de l'API Document
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.range_mode = "OddPages"
    options.mode = "Pages" # mode Intervals

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word by range of pages and using filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Comment diviser un document Word en plusieurs fichiers à l’aide de Python

Vous pouvez diviser un fichier Word en plusieurs documents par programmation en suivant les étapes ci-dessous :

  • Créer une instance de DocumentApi
  • Ensuite, créez une instance de SplitOptions
  • Maintenant, créez une instance de FileInfo
  • Passer le chemin du fichier d’entrée comme argument à FileInfo
  • Ensuite, indiquez le chemin du fichier de sortie as “python-testing”
  • Ensuite, définissez la collection de pages au format tableau
  • Définissez le mode de fractionnement docx sur Intervalles pour fractionner le mot
  • Créer SplitRequest avec SplitOptions
  • Enfin, appelez la méthode DocumentAPI.split() avec SplitRequest comme argument

L’extrait de code suivant montre comment diviser docx en plusieurs fichiers à l’aide de l’API REST en Python :

# Comment diviser des fichiers Docx en plusieurs fichiers à l'aide de Python
try:
    # Créer une instance de l'API Document
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [3, 6, 8]
    options.mode = "Intervals"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word file to multiple files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Fichier Word divisé en ligne

Comment diviser un document Word en plusieurs fichiers en ligne gratuitement ? Vous pouvez essayer notre séparateur de documents Word en ligne pour diviser gratuitement un document Word en plusieurs fichiers en ligne par un nombre fixe de pages ou dans différentes plages de pages. Les documents Word de plusieurs pages sont divisés en plusieurs fichiers Word en conservant le format du document original.

Conclusion

Dans ce tutoriel, nous avons appris :

  • comment diviser un fichier Word en deux en Python sur le cloud ;
  • comment diviser le fichier docx en fichiers séparés en Python ;
  • Par programme, comment diviser un document Word par page en Python ;
  • comment diviser par programmation un document Word en plusieurs documents en ligne en Python ;
  • comment diviser un fichier Word en ligne gratuitement à l’aide du séparateur de pages Word en ligne;

De plus, vous pouvez en savoir plus sur l’API GroupDocs.Merger Cloud en utilisant la documentation. Nous fournissons également une section API Reference qui vous permet de visualiser et de communiquer avec nos API directement via le navigateur. De plus, veuillez consulter le SDK GroupDocs.Merger Cloud pour Python Exemples ici.

poser une question

Si vous avez des questions sur la façon d’extraire des pages d’un document Word en ligne, n’hésitez pas à nous les poser sur le Forum

FAQ

Comment extraire des pages d’un document Word en ligne à l’aide de l’API docx splitter ?

Installez le téléchargement gratuit du séparateur de documents bibliothèque Python pour extraire des pages de mots en ligne. Vous pouvez consulter la documentation pour obtenir des détails complets sur l’API.

Quel est le moyen le plus rapide de diviser un document Word gratuitement en ligne ?

Word page extractor online fonctionne très rapidement et vous pouvez diviser docx en ligne en quelques secondes.

Comment extraire une page d’un mot en ligne gratuitement?

  • Ouvrez extracteur de pages de mots en ligne.
  • Cliquez à l’intérieur de la zone de dépôt du fichier pour télécharger le fichier word docx ou faites glisser et déposez le fichier word.
  • Cliquez sur le bouton Convertir. Votre document sera téléchargé et converti au format DOC.
  • Le lien de téléchargement des fichiers de sortie sera disponible instantanément après la division.

Est-il sûr d’utiliser le séparateur de documents en ligne gratuit ?

Oui, le mot séparateur de documents est sûr et personne n’a accès à vos fichiers téléchargés. Nous supprimons les fichiers téléchargés après 24 heures.

Voir également