En tant que développeur Python, vous pouvez demander à vos utilisateurs de fournir une fonctionnalité de conversion de documents PDF en Word dans votre application. Parce qu’il est très difficile d’éditer des documents PDF sans Adobe Acrobat. Et les utilisateurs doivent modifier du texte, des tableaux, des images et d’autres contenus dans le document PDF. Une solution à l’exigence consiste à convertir le document PDF en un document Word modifiable. Mais, vous savez que ce n’est pas si simple par programmation. Heureusement, il existe un module ; GroupDocs.Conversion Cloud SDK for Python qui vous permet de convertir facilement un PDF en document Word modifiable avec quelques lignes de code python.

PDF à Word - API de conversion et SDK Python

GroupDocs.Conversion pour le cloud

GroupDocs.Conversion Cloud est une solution de conversion de documents et d’images indépendante de la plate-forme sans dépendre d’aucun outil ou logiciel. Il peut convertir rapidement et de manière fiable des images et des documents de n’importe quel format de fichier pris en charge. Il propose les SDK pour tous les langages de programmation populaires avec le code source et des exemples de travail. Cela permet aux développeurs d’utiliser GroupDocs.Conversion Cloud directement dans leurs applications sans se soucier des appels d’API REST sous-jacents. Dans cet article, j’utilise Python SDK pour la conversion PDF en Word.

Comment convertir un PDF en DOCX modifiable en Python

J’utiliserai Python 3.7.4, vous pouvez utiliser n’importe quelle version de Python 2.7, 3.4 ou supérieure. Avant de commencer le codage, inscrivez-vous avec groupdocs.cloud pour obtenir votre APP SID et votre APP Key.

Installez le package groupdocs-conversion-cloud à partir de pypi avec la commande suivante.

\> pip install groupdocs-conversion-cloud

Stockez votre document PDF source dans le dossier où vous enregistrez votre fichier de script.

Exemple de code Python pour la conversion

Utilisez votre éditeur préféré et suivez les étapes suivantes pour convertir le PDF en document Word modifiable en Python.

  • Importer le package GroupDocs.Conversion Cloud Python
# Module d'importation
import groupdocs_conversion_cloud
  • Initialiser l’API
# Obtenez votre app_sid et app_key sur https://dashboard.groupdocs.cloud (une inscription gratuite est requise).
app_sid = "xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Créer une instance de l'API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(app_sid, app_key)
file_api = groupdocs_conversion_cloud.FileApi.from_keys(app_sid, app_key)
  • Charger le document PDF source dans le stockage par défaut de GroupDocs
try:

        #upload soruce file to storage
        filename = '02_pages.pdf'
        remote_name = '02_pages.pdf'
        output_name= 'sample.docx'
        strformat='docx'

        request_upload = groupdocs_conversion_cloud.UploadFileRequest(remote_name,filename)
        response_upload = file_api.upload_file(request_upload)
  • Convertir le document PDF en DOCX modifiable
        #Convert PDF to Word document
        settings = groupdocs_conversion_cloud.ConvertSettings()
        settings.file_path =remote_name
        settings.format = strformat
        settings.output_path = output_name
        
        loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
        loadOptions.hide_pdf_annotations = True
        loadOptions.remove_embedded_files = False
        loadOptions.flatten_all_fields = True

        settings.load_options = loadOptions

        convertOptions = groupdocs_conversion_cloud.DocxConvertOptions()
        convertOptions.from_page = 1
        convertOptions.pages_count = 1
            
        settings.convert_options = convertOptions
                
        request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
        response = convert_api.convert_document(request)

        print("Document converted successfully: " + str(response))
except groupdocs_conversion_cloud.ApiException as e:
        print("Exception when calling get_supported_conversion_types: {0}".format(e.message))
  • Et c’est tout. Le document PDF est converti en DOCX et la réponse de l’API inclut l’URL du document résultant.
Document converted successfully: [{'name': 'sample.docx',
 'path': 'sample.docx',
 'size': 4078202,
 'url': 'https://api.groupdocs.cloud/v2.0/conversion/storage/file/sample.docx'}]

Vous avez une question ou une suggestion ? N’hésitez pas à nous laisser un commentaire ci-dessous ou à poser une question dans le forum d’assistance. Cela nous aide à améliorer et à affiner continuellement notre API.

Si vous souhaitez en savoir plus sur GroupDocs.Conversion Cloud, consultez les ressources utiles suivantes de GroupDocs.Conversion Cloud.