PDF ist heute eines der am häufigsten verwendeten Dateiformate, das plattformübergreifende Unterstützung bietet. Es ist jedoch schwierig, auf eine bestimmte Seite in einem PDF Dokument zu verlinken, und PDF Dateien lassen sich nicht einfach in sozialen Netzwerken teilen. Sie können das Erscheinungsbild eines PDF Dokuments im HTML-Format beibehalten, das schnell bearbeitet werden kann. In diesem Artikel erfahren Sie, wie Sie PDF Dateien in Python in HTML konvertieren.

Die folgenden Themen sollen in diesem Artikel behandelt werden:

Python PDF to HTML Converter API – Installation

Um PDF Dateien in HTML-Webseiten zu konvertieren, verwenden wir die API Python SDK von GroupDocs.Conversion Cloud. Es handelt sich um eine funktionsreiche, plattformunabhängige Python Bibliothek zur Konvertierung von Dokumenten und Bildern. Es ermöglicht die schnelle Konvertierung von Bildern und Dokumenten aller unterstützten Dateiformate in jedes beliebige Format in hoher Qualität.

Sie können die Python Bibliothek für die PDF zu HTML-Konvertierung installieren und in Ihre Python-Anwendungen integrieren, indem Sie den folgenden Befehl in der Konsole verwenden:

pip install groupdocs_conversion_cloud

Bitte holen Sie sich Ihre Kunden-ID und Ihr Geheimnis aus dem Dashboard, bevor Sie die genannten Schritte ausführen. Sobald Sie Ihre ID und Ihr Geheimnis haben, fügen Sie Code in Ihre Python-Anwendung ein:

# Laden Sie die  Python Bibliothek für die PDF zu HTML-Konvertierung in der Python-Anwendung
import groupdocs_conversion_cloud

# Holen Sie sich client_id und client_secret nach der kostenlosen Registrierung von https://dashboard.groupdocs.cloud.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Erhalten Sie verschiedene Konfigurationen
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"

Lassen Sie uns nun Schritt für Schritt zeigen, wie Sie mithilfe der REST-API in Python PDF Dateien in das HTML-Format konvertieren.

So konvertieren Sie PDF online in Python mithilfe der REST-API in HTML

Wir können eine PDF-Datei programmgesteuert in das HTML-Format konvertieren, indem wir die folgenden einfachen Schritte ausführen:

  • Erstellen Sie zunächst eine Instanz von ConvertApi
  • Erstellen Sie dann mithilfe von ConvertSettings eine Instanz der Konvertierungseinstellungen
  • Geben Sie als Nächstes den Namen des Dateispeichers an
  • Legen Sie den Pfad der PDF-Eingabedatei und das Ausgabeformat auf „html“ fest.
  • Erstellen Sie als Nächstes eine Instanz von PdfLoadOptions.
  • Geben Sie das Passwort für die PDF-Datei an
  • Legen Sie dann den Ausgabepfad und die Ladeoptionen fest
  • Erstellen Sie anschließend ConvertDocumentRequest mit ConvertSettings als Argument
  • Konvertieren Sie abschließend PDF in HTML, indem Sie convert\document() mit ConvertDocumentRequest aufrufen

Das folgende Codebeispiel zeigt, wie man in Python das PDF-Format in das HTML-Format ändert:

# So konvertieren Sie PDF mit Python online in HTML
try:
  # Erstellen Sie eine Instanz der API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Definieren Sie Konvertierungseinstellungen
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "html"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Erstellen Sie eine Anfrage zum Konvertieren eines Dokuments
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Konvertieren Sie eine PDF-Datei in eine HTML-Webseite
  result = convert_api.convert_document(request)
  print("pdf File converted to html successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Schließlich speichert das obige Codebeispiel die HTML-Datei in der Cloud. Dies ist die beste Möglichkeit, PDF Dokumente in HTML Dokumente umzuwandeln.

So konvertieren Sie PDF Dateien in Python in HTML

So konvertieren Sie PDF Dateien in Python in HTML

Konvertieren Sie einen Seitenbereich von einer PDF-Datei in eine HTML-Datei in Python

Wir können einen Seitenbereich eines PDF Dokuments in HTML konvertieren, indem wir die folgenden Schritte ausführen:

  • Erstellen Sie zunächst eine Instanz von ConvertApi
  • Erstellen Sie dann mithilfe von ConvertSettings eine Instanz der Konvertierungseinstellungen
  • Geben Sie als Nächstes den Namen Ihres Cloud-Speichers ein
  • Legen Sie den Pfad der PDF-Eingabedatei und das Ausgabeformat auf „html“ fest.
  • Erstellen Sie als Nächstes eine Instanz von HtmlConvertOptions
  • Legen Sie die Optionen „von\Seite“ und „Seiten\Anzahl“ fest
  • Legen Sie dann den Ausgabepfad und „convertOptions“ fest
  • Erstellen Sie nun ConvertDocumentRequest mit ConvertSettings als Argument
  • Konvertieren Sie abschließend PDF online in HTML-Code, indem Sie die Methode convert\document() mit ConvertDocumentRequest aufrufen

Das folgende Codebeispiel zeigt, wie man mit Python eine Reihe von Seiten von einem PDF Dokument in eine HTML-Datei konvertiert:

# So konvertieren Sie einen Seitenbereich von PDF in HTML in Python
# Erstellen Sie eine API-Instanz
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Bereiten Sie die HTML-Konvertierungseinstellungen vor
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# PDF-Konvertierungsoptionen: Startseitenzahl und Gesamtzahl der zu konvertierenden Seiten
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Erstellen Sie eine Anfrage zum Konvertieren eines Dokuments
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Konvertieren Sie Seiten einer PDF-Datei in eine HTML-Datei
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)

Schließlich speichert das obige Codebeispiel das Dokument nach der Konvertierung von PDF in HTML online in der Cloud.

Konvertieren Sie bestimmte Seiten vom PDF- in das HTML-Format in Python

Mit dem besten Online-PDF zu HTML-Konverter mit Bildern können wir bestimmte Seiten eines PDF Dokuments in HTML konvertieren, indem wir die folgenden Schritte ausführen:

  • Erstellen Sie zunächst eine Instanz von ConvertApi
  • Erstellen Sie dann mithilfe von ConvertSettings eine Instanz der Konvertierungseinstellungen
  • Geben Sie als Nächstes den Namen Ihres Cloud-Speichers ein
  • Legen Sie den Pfad der PDF-Eingabedatei und das Ausgabeformat auf „html“ fest.
  • Erstellen Sie als Nächstes eine Instanz von HtmlConvertOptions
  • Fügen Sie die Seitenzahl hinzu, die in das Array-Format konvertiert werden soll
  • Legen Sie dann den Ausgabepfad und „convertOptions“ fest
  • Erstellen Sie nun ConvertDocumentRequest mit ConvertSettings als Argument
  • Konvertieren Sie abschließend PDF online in HTML-Code, indem Sie die Methode convert\document() mit ConvertDocumentRequest aufrufen

Das folgende Codebeispiel zeigt, wie man mit Python bestimmte Seiten eines PDF Dokuments in eine HTML-Datei exportiert:

# So konvertieren Sie bestimmte Seiten einer PDF-Datei in Python in das HTML-Webseitenformat
# Erstellen Sie eine API-Instanz
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Definieren Sie Konvertierungseinstellungen
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# PDF-Konvertierungsoptionen: Zu konvertierende Seitenzahlen
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Erstellen Sie eine Anfrage zum Konvertieren eines Dokuments
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Konvertieren Sie eine PDF-Datei in eine HTML-Datei
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)

Schließlich konvertiert das obige Codebeispiel PDF in HTML mit Bildern in der Cloud. Es gibt einen Online-Konverter für PDF zu HTML-Code, wie unten erläutert.

Kostenloser Online-PDF zu HTML-Konverter

Was ist der beste PDF zu HTML-Konverter? Groupdocs.Conversion bietet Ihnen den besten kostenlosen Online-PDF zu HTML-Konverter zum Konvertieren von PDF Dateien in das HTML-Format. Es wurde mit der Online-PDF zu HTML-API von Groupdocs.Conversion entwickelt.

Abschluss

In diesem Artikel haben Sie gelernt:

  • wie man PDF in HTML konvertiert, ohne die Formatierung in Python zu verlieren;
  • wie man mit Python eine PDF-Datei nach Bereich in eine HTML-Datei konvertiert;
  • Konvertieren bestimmter PDF-Seiten in das HTML-Format in Python;
  • kostenloser Online-PDF zu HTML-Konverter;

Darüber hinaus können Sie mithilfe der Dokumentation mehr über die Dateiformatkonvertierungs-API GroupDocs.Conversion erfahren.

Stelle eine Frage

Sie können Ihre Fragen zum Konvertieren von PDF Dateien in das HTML-Format über unser Kostenloses Support-Forum stellen.

Siehe auch