Als Python-Entwickler können Sie von Ihren Benutzern die Anforderung erhalten, in Ihrer Anwendung eine Funktion zur Konvertierung von PDF-in-Word Dokumenten bereitzustellen. Denn ohne Adobe Acrobat ist es sehr schwierig, PDF Dokumente zu bearbeiten. Und Benutzer müssen Text, Tabellen, Bilder und andere Inhalte im PDF Dokument bearbeiten. Eine Lösung für diese Anforderung besteht darin, das PDF Dokument in ein bearbeitbares Word Dokument zu konvertieren. Aber Sie wissen, dass es programmatisch nicht so einfach ist. Zum Glück gibt es ein Modul; GroupDocs.Conversion Cloud SDK für Python, mit dem Sie PDF Dateien mit ein paar Zeilen Python-Code ganz einfach in ein bearbeitbares Word Dokument konvertieren können.

PDF zu Word – Konvertierungs-API und Python SDK

GroupDocs.Conversion für Cloud

GroupDocs.Conversion Cloud ist eine plattformunabhängige Lösung zur Dokumenten und Bildkonvertierung, ohne auf ein Tool oder eine Software angewiesen zu sein. Es kann Bilder und Dokumente jedes unterstützten Dateiformats schnell und zuverlässig konvertieren. Es bietet die SDKs für alle gängigen Programmiersprachen mit Quellcode und Arbeitsbeispielen. Dies ermöglicht es den Entwicklern, GroupDocs.Conversion Cloud direkt in ihren Anwendungen zu verwenden, ohne sich um zugrunde liegende REST-API-Aufrufe kümmern zu müssen. In diesem Artikel verwende ich das Python SDK für die Konvertierung von PDF in Word.

So konvertieren Sie PDF in bearbeitbares DOCX in Python

Ich werde Python 3.7.4 verwenden. Sie können jede Version verwenden, die Ihnen gefällt, Python 2.7, 3.4 oder höher. Bevor wir mit dem Codieren beginnen, melden Sie sich bei groupdocs.cloud an, um Ihre APP-SID und Ihren APP-Schlüssel zu erhalten.

Installieren Sie das Paket „groupdocs-conversion-cloud“ von pypi mit dem folgenden Befehl.

\> pip install groupdocs-conversion-cloud

Speichern Sie Ihr Quell-PDF Dokument in dem Ordner, in dem Sie Ihre Skriptdatei speichern.

Beispiel-Python-Code für die Konvertierung

Verwenden Sie Ihren bevorzugten Editor und befolgen Sie die folgenden Schritte, um die PDF-Datei in ein bearbeitbares Word Dokument in Python zu konvertieren.

  • Importieren Sie das GroupDocs.Conversion Cloud Python-Paket
# Modul importieren
import groupdocs_conversion_cloud
  • Initialisieren Sie die API
# Holen Sie sich Ihre app_sid und Ihren app_key unter https://dashboard.groupdocs.cloud (kostenlose Registrierung erforderlich).
app_sid = "xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Erstellen Sie eine Instanz der API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(app_sid, app_key)
file_api = groupdocs_conversion_cloud.FileApi.from_keys(app_sid, app_key)
  • Laden Sie das Quell-PDF Dokument in den GroupDocs-Standardspeicher hoch
try:

        #upload soruce file to storage
        filename = '02_pages.pdf'
        remote_name = '02_pages.pdf'
        output_name= 'sample.docx'
        strformat='docx'

        request_upload = groupdocs_conversion_cloud.UploadFileRequest(remote_name,filename)
        response_upload = file_api.upload_file(request_upload)
  • Konvertieren Sie das PDF Dokument in bearbeitbares DOCX
        #Convert PDF to Word document
        settings = groupdocs_conversion_cloud.ConvertSettings()
        settings.file_path =remote_name
        settings.format = strformat
        settings.output_path = output_name
        
        loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
        loadOptions.hide_pdf_annotations = True
        loadOptions.remove_embedded_files = False
        loadOptions.flatten_all_fields = True

        settings.load_options = loadOptions

        convertOptions = groupdocs_conversion_cloud.DocxConvertOptions()
        convertOptions.from_page = 1
        convertOptions.pages_count = 1
            
        settings.convert_options = convertOptions
                
        request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
        response = convert_api.convert_document(request)

        print("Document converted successfully: " + str(response))
except groupdocs_conversion_cloud.ApiException as e:
        print("Exception when calling get_supported_conversion_types: {0}".format(e.message))
  • Und das ist es. Das PDF Dokument wird in DOCX konvertiert und die API-Antwort enthält die URL des resultierenden Dokuments.
Document converted successfully: [{'name': 'sample.docx',
 'path': 'sample.docx',
 'size': 4078202,
 'url': 'https://api.groupdocs.cloud/v2.0/conversion/storage/file/sample.docx'}]

Haben Sie eine Frage oder einen Vorschlag? Bitte schreiben Sie uns unten einen Kommentar oder posten Sie eine Frage im Support-Forum. Es hilft uns, unsere API kontinuierlich zu verbessern und zu verfeinern.

Möchten Sie mehr über GroupDocs.Conversion Cloud erfahren, sehen Sie sich die folgenden nützlichen Ressourcen von GroupDocs.Conversion Cloud an.