So extrahieren Sie Seiten aus Word Dokumenten in Python

So extrahieren Sie Seiten aus Word Dokumenten in Python

Möglicherweise müssen Sie ein Word Dokument programmgesteuert in mehrere Dokumente seitenweise aufteilen. Durch die Aufteilung von Word Dokumenten können Sie ganz einfach Seiten aus Word Dokumenten extrahieren und bestimmte Informationen oder Daten mit den Beteiligten teilen. Als Python-Entwickler können Sie Word Dokumente online in der Cloud in separate Dateien aufteilen. In diesem Artikel erfahren Sie, wie Sie Seiten aus Word Dokumenten in Python extrahieren.

Die folgenden Themen werden in diesem Word-Seitensplitter-Artikel behandelt:

Word Dokument-Splitter-REST-API – Python SDK

Um eine Word-Datei in mehrere Dateien aufzuteilen, verwende ich das Python SDK der GroupDocs.Merger Cloud API. Es ermöglicht Ihnen, eine einzelne Seite oder eine Sammlung von Seiten aus unterstützten Dokumentformaten von Word, Excel, [Visio-Zeichnungen] zu drehen, zu teilen, zu verbinden, zu entfernen und neu anzuordnen. 6], PDF und HTML. Python Quellcode-Repository ist auf GitHub frei verfügbar.

Der kostenlose Download des Word-Dateisplitters ist verfügbar. Sie können den Word-Doc-Splitter mit PIP von PyPI in Ihrer Python-Anwendung installieren, indem Sie den folgenden Befehl im Terminal verwenden:

pip install groupdocs-merger-cloud

Bitte holen Sie sich Ihre Kunden-ID und Ihr Geheimnis aus dem Dashboard, bevor Sie die unten aufgeführten Schritte ausführen. Sobald Sie Ihre ID und Ihr Geheimnis haben, fügen Sie den folgenden Code in Ihre Anwendung ein, um das Word Dokument wie unten gezeigt in separate Dateien aufzuteilen:

# Importieren Sie das GroupDocs Merger SDK
import groupdocs_merger_cloud

# Holen Sie sich nach der kostenlosen Registrierung app_sid und app_key von https://dashboard.groupdocs.cloud.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Datei-API-Konfigurationen abrufen 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

So teilen Sie ein Word Dokument in Python in ein einzelnes Dokument auf

Sie können docx programmgesteuert in der Cloud aufteilen, indem Sie die unten aufgeführten Schritte ausführen.

Laden Sie ein Word Dokument hoch

Zuerst laden wir die Word Dateien in die Cloud hoch, um Seiten aus Word online zu extrahieren, indem wir das unten angegebene Codebeispiel verwenden:

# Laden Sie die Word-Datei in den Cloud-Speicher hoch
# Erstellen Sie eine Instanz der Datei-API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Rufen Sie die Dateianfrage zum Hochladen an
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\word-file.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)

# Laden Sie die Word-Datei in die Cloud hoch
response = file_api.upload_file(request)
print(response.uploaded)

Dadurch sind die hochgeladenen Dateien im Dateienbereich Ihres Dashboards in der Cloud verfügbar.

Teilen Sie Word Dokumentseiten in Python

Sie können Word-Seiten programmgesteuert in separate Dateien aufteilen, indem Sie die folgenden Schritte ausführen:

  • Erstellen Sie zunächst eine Instanz von DocumentApi.
  • Erstellen Sie dann eine Instanz von SplitOptions
  • Erstellen Sie nun eine Instanz von FileInfo
  • Übergeben Sie den Pfad der Eingabedatei als Argument an FileInfo
  • Geben Sie als Nächstes den Pfad der Ausgabedatei an
  • Legen Sie bestimmte Seitenzahlen in einem durch Kommas getrennten Array fest
  • Stellen Sie nun den DOCX-Split-Modus auf „Seiten“ ein. Es ermöglicht die Aufteilung von Seitenzahlen in ein durch Kommas getrenntes Array
  • Erstellen Sie SplitRequest mit SplitOptions
  • Rufen Sie abschließend die Methode DocumentAPI.split() mit SplitRequest als Argument auf und erhalten Sie Ergebnisse

Der folgende Codeausschnitt zeigt, wie man eine Word-Datei mithilfe der REST-API in Python in separate Seiten aufteilt:

# So teilen Sie ein Word Dokument in Python in ein einzelnes Dokument auf
try:
    # Erstellen Sie eine Instanz der Document API
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [1, 3]
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split word docx to single page document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))
So teilen Sie eine Word-Datei in Python in separate Seiten auf

So teilen Sie eine Word-Datei in Python in separate Seiten auf

Laden Sie die einzelne Datei herunter

Schließlich speichert das obige Codebeispiel die getrennte Datei mithilfe von Python in der Cloud. Es kann mit dem folgenden Codebeispiel heruntergeladen werden:

# API-Initialisierung zum Herunterladen der getrennten Datei
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Erstellen Sie eine Download-Dateianfrage
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\word-file.docx", storage_name)

# Laden Sie die separate Datei herunter
response = file_api.download_file(request)

# Verschieben Sie die heruntergeladene Datei in Ihr Verzeichnis
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Teilen Sie ein Word Dokument in Python nach Seitenbereich in einzelne auf

Mit den folgenden Schritten können Sie ein Word Dokument online nach Seiten in mehrere Dokumente aufteilen:

  • Erstellen Sie eine Instanz der DocumentApi
  • Erstellen Sie dann eine Instanz von SplitOptions
  • Erstellen Sie nun eine Instanz von FileInfo
  • Übergeben Sie den Pfad der Eingabedatei als Argument an FileInfo
  • Geben Sie als Nächstes den Pfad der Ausgabedatei an as “python-testing”
  • Legen Sie die Werte für Start\Seite\Nummer und Ende\Seite\Nummer fest
  • Stellen Sie den DOCX-Teilungsmodus auf „Seiten“ ein, um das Wort zu teilen
  • Erstellen Sie SplitRequest mit SplitOptions
  • Rufen Sie abschließend die Methode DocumentAPI.split() mit SplitRequest als Argument auf

Der folgende Codeausschnitt zeigt, wie man mithilfe der REST-API Seiten aus einem Word Dokument in Python extrahiert:

# So teilen Sie ein Word Dokument in Python nach Seitenbereich in einzelne auf
try:
    # Erstellen Sie eine Instanz der Document API
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word to single files by page range: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Teilen Sie Word Dokumente durch Anwenden eines Filters in separate Dateien auf

Sie können ein Word Dokument online im Bereichsmodus seitenweise in mehrere Dokumente aufteilen und programmgesteuert filtern, wie unten gezeigt:

  • Erstellen Sie eine Instanz der DocumentApi
  • Erstellen Sie dann eine Instanz von SplitOptions
  • Erstellen Sie nun eine Instanz von FileInfo
  • Übergeben Sie den Pfad der Eingabedatei als Argument an FileInfo
  • Geben Sie als Nächstes den Pfad der Ausgabedatei an as “python-testing”
  • Legen Sie die Werte für Start\Seite\Nummer und Ende\Seite\Nummer fest
  • Als nächstes setzen Sie „range\mode“ auf „OddPages“
  • Stellen Sie den DOCX-Teilungsmodus auf „Seiten“ ein, um das Wort zu teilen
  • Erstellen Sie SplitRequest mit SplitOptions
  • Rufen Sie abschließend die Methode DocumentAPI.split() mit SplitRequest als Argument auf

Der folgende Codeausschnitt zeigt, wie Seiten von Word Dokumenten durch Anwenden eines Filters mithilfe der REST-API in Python extrahiert werden:

# So teilen Sie Word Dokumente durch Anwenden eines Filters in separate Dateien auf
try:
    # Erstellen Sie eine Instanz der Document API
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.range_mode = "OddPages"
    options.mode = "Pages" # mode Intervals

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word by range of pages and using filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

So teilen Sie Word Dokumente mit Python in mehrere Dateien auf

Sie können eine Word-Datei programmgesteuert in mehrere Dokumente aufteilen, indem Sie die folgenden Schritte ausführen:

  • Erstellen Sie eine Instanz der DocumentApi
  • Erstellen Sie dann eine Instanz von SplitOptions
  • Erstellen Sie nun eine Instanz von FileInfo
  • Übergeben Sie den Pfad der Eingabedatei als Argument an FileInfo
  • Geben Sie als Nächstes den Pfad der Ausgabedatei an as “python-testing”
  • Legen Sie dann die Seitensammlung im Array-Format fest
  • Stellen Sie den DOCX-Aufteilungsmodus auf „Intervalle“ ein, um Wörter aufzuteilen
  • Erstellen Sie SplitRequest mit SplitOptions
  • Rufen Sie abschließend die Methode DocumentAPI.split() mit SplitRequest als Argument auf

Der folgende Codeausschnitt zeigt, wie man docx mithilfe der REST-API in Python in mehrere Dateien aufteilt:

# So teilen Sie Docx Dateien mit Python in mehrere Dateien auf
try:
    # Erstellen Sie eine Instanz der Document API
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [3, 6, 8]
    options.mode = "Intervals"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word file to multiple files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Online-Split-Word-Datei

Wie teile ich ein Word Dokument kostenlos online in mehrere Dateien auf? Sie können unseren Word Dokument-Splitter online ausprobieren, um Word Dokumente online kostenlos in mehrere Dateien mit einer festen Seitenanzahl oder in verschiedenen Seitenbereichen aufzuteilen. Mehrseitige Word Dokumente werden in mehrere Word Dateien aufgeteilt, wobei das Format des Originaldokuments erhalten bleibt.

Abschluss

In diesem Tutorial haben wir gelernt:

  • wie man eine Word-Datei in Python in der Cloud in zwei Teile aufteilt;
  • wie man eine docx-Datei in Python in separate Dateien aufteilt;
  • Programmgesteuertes Aufteilen eines Word Dokuments nach Seiten in Python;
  • Programmgesteuert, wie man ein Word Dokument online in Python in mehrere Dokumente aufteilt;
  • Wie man eine Word-Datei online kostenlos mit dem Online-Word-Seitensplitter aufteilt;

Darüber hinaus können Sie mithilfe der Dokumentation mehr über die GroupDocs.Merger Cloud API erfahren. Wir bieten auch einen Abschnitt API-Referenz an, mit dem Sie unsere APIs direkt über den Browser visualisieren und mit ihnen kommunizieren können. Weitere Informationen finden Sie im GroupDocs.Merger Cloud SDK für Python Beispiele hier.

Stelle eine Frage

Wenn Sie Fragen zum Online-Extrahieren von Seiten aus einem Word Dokument haben, können Sie uns diese gerne im Forum stellen.

FAQs

Wie extrahiere ich Seiten aus einem Word Dokument online mithilfe der DocX-Splitter-API?

Installieren Sie den kostenlosen Download von Document Splitter Python Bibliothek, um Word-Seiten online zu extrahieren. Vollständige API-Details finden Sie in der Dokumentation.

Was ist der schnellste Weg, ein Word Dokument kostenlos online aufzuteilen?

Word-Seitenextraktor online funktioniert sehr schnell und Sie können docx online in wenigen Sekunden aufteilen.

Wie extrahiere ich kostenlos eine Seite aus Word online?

  • Öffnen Sie Online-Word-Seitenextraktor.
  • Klicken Sie in den Dateiablagebereich, um eine Word-Docx-Datei hochzuladen oder eine Word-Datei per Drag & Drop zu verschieben.
  • Klicken Sie auf die Schaltfläche „Konvertieren“. Ihr Dokument wird hochgeladen und in das DOC-Format konvertiert.
  • Der Download-Link der Ausgabedateien ist sofort nach der Aufteilung verfügbar.

Ist es sicher, den kostenlosen Online Dokumentensplitter zu verwenden?

Ja, Document Splitter Word ist sicher und niemand hat Zugriff auf Ihre hochgeladenen Dateien. Wir löschen hochgeladene Dateien nach 24 Stunden.

Siehe auch