So konvertieren Sie PDF in Python mithilfe der REST-API in Excel

Konvertieren Sie PDF mithilfe der REST-API in Python in Excel

PDF ist eines der am häufigsten verwendeten vielseitigen Dokumentformate zur Präsentation von Dokumenten. Es ist jedoch schwierig, ein PDF Dokument zu bearbeiten. Um eine Tabelle einfach zu extrahieren oder Text in einem Tabellenkalkulationsformat zu bearbeiten, müssen Sie PDF in bearbeitbare Excel-Tabellen konvertieren. Sie müssen also keine Zeit damit verschwenden, Text manuell zu kopieren und anschließend zu bearbeiten. Mit unseren PDF zu XLS oder PDF zu XLSX-Konverter-APIs können Sie PDF Dateien schnell in das Excel-Tabellenformat konvertieren. In diesem Artikel erfahren Sie, wie Sie PDF mithilfe der REST-API in Python in Excel konvertieren.

Die folgenden Themen sollen in diesem Artikel behandelt werden:

Python PDF zu Excel-Konverter-API – Installation

Um eine PDF-Datei in das Excel-Format zu konvertieren, verwenden wir die API Python SDK von GroupDocs.Conversion Cloud. Es handelt sich um eine funktionsreiche, plattformunabhängige Python Bibliothek zur Konvertierung von Dokumenten und Bildern. Es ermöglicht die schnelle Konvertierung von Bildern und Dokumenten aller unterstützten Dateiformate in jedes beliebige Format in hoher Qualität.

Sie können die Python Bibliothek für die PDF zu XLSX-Konvertierung in Ihrer Python-Anwendung installieren, indem Sie den folgenden Befehl in der Konsole verwenden:

pip install groupdocs_conversion_cloud

Bitte holen Sie sich Ihre Kunden-ID und Ihr Geheimnis aus dem Dashboard, bevor Sie die genannten Schritte ausführen. Sobald Sie Ihre ID und Ihr Geheimnis haben, fügen Sie Code in Ihre Python-Anwendung ein:

#  Python Bibliothek für die Konvertierung von PDF in Excel in einer Python-Anwendung
import groupdocs_conversion_cloud

# Holen Sie sich client_id und client_secret nach der kostenlosen Registrierung von https://dashboard.groupdocs.cloud.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Erhalten Sie verschiedene Konfigurationen
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "local-storage-name"

Lassen Sie uns nun Schritt für Schritt zeigen, wie Sie PDF mithilfe der REST-API in Python in das XLSX-Format konvertieren.

So konvertieren Sie PDF in Python mithilfe der REST-API in XLSX

Wir können eine PDF-Datei programmgesteuert in das Excel-Format konvertieren, indem wir die folgenden einfachen Schritte ausführen:

  • Erstellen Sie zunächst eine Instanz von ConvertApi
  • Erstellen Sie dann mithilfe von ConvertSettings eine Konvertierungseinstellungsinstanz
  • Geben Sie als Nächstes den Namen des Dateispeichers an
  • Legen Sie den Pfad der Eingabe-PDF-Datei und das Ausgabeformat auf „xlsx“ fest.
  • Erstellen Sie als Nächstes eine Instanz von PdfLoadOptions.
  • Geben Sie das Passwort für die PDF-Datei an
  • Legen Sie dann den Ausgabepfad und die Ladeoptionen fest
  • Erstellen Sie anschließend ConvertDocumentRequest mit ConvertSettings als Argument
  • Konvertieren Sie abschließend PDF in Excel, indem Sie convert\document() mit ConvertDocumentRequest aufrufen

Das folgende Codebeispiel zeigt, wie man PDF in Python in das Excel-Format ändert:

# So konvertieren Sie PDF mit Python online in Excel
try:
  # Erstellen Sie eine Instanz der API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Definieren Sie Konvertierungseinstellungen
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "xlsx"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Erstellen Sie eine Anfrage zum Konvertieren eines Dokuments
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Konvertieren Sie die PDF-Datei in das XLSX-Format
  result = convert_api.convert_document(request)
  print("pdf File converted to xlsx successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Schließlich speichert das obige Codebeispiel die XLSX-Datei in der Cloud. Dies ist der beste Weg, PDF Dokumente in Excel Dokumente umzuwandeln.

So konvertieren Sie PDF in Python mithilfe der REST-API in XLSX

So konvertieren Sie PDF in Python mithilfe der REST-API in XLSX

Konvertieren Sie einen Seitenbereich von PDF in eine Excel-Datei in Python

Wir können einen Seitenbereich eines PDF Dokuments in Excel konvertieren, indem wir die folgenden Schritte ausführen:

  • Erstellen Sie zunächst eine Instanz von ConvertApi
  • Erstellen Sie dann mithilfe von ConvertSettings eine Konvertierungseinstellungsinstanz
  • Geben Sie als Nächstes den Namen Ihres Cloud-Speichers ein
  • Legen Sie den Pfad der Eingabe-PDF-Datei und das Ausgabeformat auf „xlsx“ fest.
  • Erstellen Sie als Nächstes eine Instanz von XlsConvertOptions
  • Legen Sie die Optionen „von\Seite“ und „Seiten\Anzahl“ fest
  • Legen Sie dann den Ausgabepfad und „convertOptions“ fest
  • Erstellen Sie nun ConvertDocumentRequest mit ConvertSettings als Argument
  • Konvertieren Sie abschließend PDF online in Excel-Code, indem Sie die Methode convert\document() mit ConvertDocumentRequest aufrufen

Das folgende Codebeispiel zeigt, wie man mit Python eine Reihe von Seiten von einem PDF Dokument in eine Excel-Datei konvertiert:

# So konvertieren Sie einen Seitenbereich von PDF in Excel in Python
# Erstellen Sie eine API-Instanz
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Bereiten Sie die Konvertierungseinstellungen für Excel vor
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# PDF-Konvertierungsoptionen: Startseitenzahl und Gesamtzahl der zu konvertierenden Seiten
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.from_page = 2 
convertOptions.pages_count = 3

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Erstellen Sie eine Anfrage zum Konvertieren eines Dokuments
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Konvertieren Sie Seiten einer PDF-Datei in eine Excel-Datei
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to Excel file: " + result[0].path)

Schließlich speichert das obige Codebeispiel das Dokument nach der Konvertierung von PDF in Excel online in der Cloud.

Konvertieren Sie bestimmte PDF-Seiten in das Excel-Format in Python

Wir können bestimmte Seiten eines PDF Dokuments mit dem besten PDF zu XLSX-Konverter online mit Bildern in Excel konvertieren, indem wir die folgenden Schritte ausführen:

  • Erstellen Sie zunächst eine Instanz von ConvertApi
  • Erstellen Sie dann mithilfe von ConvertSettings eine Konvertierungseinstellungsinstanz
  • Geben Sie als Nächstes den Namen Ihres Cloud-Speichers ein
  • Legen Sie den Pfad der Eingabe-PDF-Datei und das Ausgabeformat auf „xlsx“ fest.
  • Erstellen Sie als Nächstes eine Instanz von XlsConvertOptions
  • Fügen Sie die Seitenzahl hinzu, die in das Array-Format konvertiert werden soll
  • Legen Sie dann den Ausgabepfad und „convertOptions“ fest
  • Erstellen Sie nun ConvertDocumentRequest mit ConvertSettings als Argument
  • Konvertieren Sie schließlich PDF Dateien online in Excel-Code, indem Sie die Methode convert\document() mit ConvertDocumentRequest aufrufen

Das folgende Codebeispiel zeigt, wie man mit Python bestimmte Seiten eines PDF Dokuments in eine Excel-Datei exportiert:

# So konvertieren Sie bestimmte Seiten einer PDF-Datei in Python in das Excel-Format
# Erstellen Sie eine API-Instanz
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Definieren Sie Konvertierungseinstellungen
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# PDF-Konvertierungsoptionen: Zu konvertierende Seitenzahlen
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Erstellen Sie eine Anfrage zum Konvertieren eines Dokuments
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Konvertieren Sie eine PDF-Datei in eine Excel-Datei
result = convert_api.convert_document(request)
print("Successfully converted PDF file to XLSX document: " + result[0].path)

Schließlich konvertiert das obige Codebeispiel PDF in XLSX mit Bildern in der Cloud. Es gibt einen Online-PDF zu XLSX-Codekonverter, wie unten erläutert.

Kostenloser Online-PDF zu Excel-Konverter

Was ist der beste PDF zu Excel-Konverter? Groupdocs.Conversion bietet den besten kostenlosen Online-PDF zu XLSX-Konverter, mit dem Sie PDF Dateien in das Excel-Format konvertieren können. Es wurde mit der Online-PDF zu XLSX-API von Groupdocs.Conversion entwickelt.

Abschluss

In diesem Artikel haben Sie gelernt:

  • wie man PDF in XLS/XLSX konvertiert, ohne die Formatierung in Python zu verlieren;
  • wie man mit Python eine PDF-Datei nach Bereich in eine Excel-Datei konvertiert;
  • Konvertieren bestimmter PDF-Seiten in das XLSX-Format in Python;

Darüber hinaus können Sie mithilfe der Dokumentation mehr über die Dateiformatkonvertierungs-API GroupDocs.Conversion erfahren.

Stelle eine Frage

Sie können Ihre Fragen zum Konvertieren von PDF Dateien in das XLSX-Format über unser Kostenloses Support-Forum stellen.

Siehe auch