So konvertieren Sie eine PDF-Datei in mehrere PDFs in Python

Aufteilen von Python Dokumenten – Teilen Sie eine PDF-Datei mit Python in mehrere PDF Dateien auf.

PDF(Portable Document Format) ist ein weit verbreitetes Dateiformat für Dokumente, die geteilt, gedruckt oder archiviert werden müssen. Sind Sie es leid, sich mit großen PDF Dateien herumzuschlagen, die mehrere Dokumente oder Abschnitte enthalten? Fällt es Ihnen schwer, bestimmte Seiten oder Abschnitte aus einer einzelnen PDF-Datei als separate Dokumente zu extrahieren? Das Aufteilen einer PDF-Datei in mehrere kleinere Dateien kann Ihre Dokumentenverwaltungsaufgaben erheblich vereinfachen. In diesem Artikel erfahren Sie, wie Sie mit dem GroupDocs.Merger Cloud SDK für Python eine PDF-Datei in Python in mehrere PDF Dateien aufteilen.

Die folgenden Themen sollen in diesem Artikel behandelt werden:

Python-REST-API zum Aufteilen von PDF Dateien in Seiten und SDK-Installation

GroupDocs.Merger Cloud SDK für Python ist ein leistungsstarkes und funktionsreiches Software-Entwicklungskit, mit dem Sie PDF Dateien programmgesteuert bearbeiten können. Es bietet verschiedene Funktionen, darunter das Teilen, Zusammenführen, Drehen und Neuanordnen einer Sammlung von Seiten in unterstützten Dokumentformaten. Das SDK kann in eine Python-basierte Anwendung integriert werden, um Ihren Entwicklungsprozess zu vereinfachen und die Produktivität zu steigern.

Sie können die Merger-API in Ihrer Python-Anwendung mit PIP von PyPI installieren, indem Sie den folgenden Befehl im Terminal ausführen:

pip install groupdocs-merger-cloud

Als Nächstes müssen Sie sich auf der GroupDocs-Website für ein kostenloses Testkonto anmelden oder ein Abonnement erwerben und Ihren API-Schlüssel erhalten. Sobald Sie die Client-ID und das Client-Geheimnis haben, fügen Sie den folgenden Codeausschnitt zu einer Python-basierten Anwendung hinzu:

# Importieren Sie das GroupDocs Merger SDK
import groupdocs_merger_cloud

# Holen Sie sich nach der kostenlosen Registrierung app_sid und app_key von https://dashboard.groupdocs.cloud.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Datei-API-Konfigurationen abrufen 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

So teilen Sie PDF-Seiten in separate PDF Dateien in Python auf

Um eine PDF-Datei mithilfe des GroupDocs.Merger Cloud SDK für Python in mehrere PDF Dateien aufzuteilen, führen Sie die folgenden Schritte aus:

Laden Sie die Dateien hoch

Laden Sie zunächst die PDF-Datei mithilfe des unten angegebenen Codebeispiels in die Cloud hoch:

# Erstellen Sie eine Instanz der Datei-API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Rufen Sie die Dateianfrage zum Hochladen an
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# Laden Sie die Datei in die Cloud hoch
response = file_api.upload_file(request)
print(response.uploaded)

Dadurch sind die hochgeladenen Dateien im Dateienbereich Ihres Dashboards in der Cloud verfügbar.

PDF in einzelne Seiten in Python aufteilen

In diesem Abschnitt schreiben wir Schritte und ein Beispielcode-Snippet, um PDF-Seiten programmgesteuert in separate PDF Dateien aufzuteilen, wie unten angegeben:

  • Erstellen Sie zunächst eine Instanz der Klasse DocumentApi.
  • Zweitens erstellen Sie eine Instanz der SplitOptions Klasse.
  • Drittens erstellen Sie eine Instanz der Klasse FileInfo.
  • Geben Sie den Eingabedateipfad als Parameter für FileInfo an.
  • Geben Sie als Nächstes den Pfad zum Ausgabeverzeichnis an.
  • Legen Sie bestimmte Seitenzahlen in einem durch Kommas getrennten Array fest.
  • Stellen Sie nun den PDF-Aufteilungsmodus auf „Seiten“ ein, um die Seitenzahlen aufzuteilen.
  • Erstellen Sie dann eine Instanz der SplitRequest Klasse und übergeben Sie den SplitOptions-Parameter.
  • Rufen Sie abschließend die Methode DocumentAPI.split() auf und übergeben Sie den SplitRequest-Parameter, um die Ergebnisse zu erhalten.

Der folgende Codeausschnitt zeigt, wie PDF Dateien in Python mithilfe der REST-API aufgeteilt werden:

# So teilen Sie eine PDF-Datei in Python in mehrere einzelne PDF Dateien auf
try:
	# Erstellen Sie eine Instanz der Document API
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [1, 3]
	options.mode = "Pages"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF to single page PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Laden Sie die Datei herunter

Das obige Codebeispiel speichert die getrennte Datei in der Cloud. Sie können es mit dem folgenden Codebeispiel herunterladen:

# API-Initialisierung zum Herunterladen der Datei
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Erstellen Sie eine Download-Dateianfrage
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\input-sample-file.pdf", storage_name)

# Download-Datei
response = file_api.download_file(request)

# Verschieben Sie die heruntergeladene Datei in Ihr Verzeichnis
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Das ist es!

PDF Dokument durch Anwenden des Bereichsfilters in separate Dateien aufteilen

Sie können PDF Dateien trennen, indem Sie einen Seitenbereichsmodus bereitstellen und programmgesteuert filtern, indem Sie die folgenden Schritte ausführen:

  • Erstellen Sie zunächst eine Instanz der Klasse DocumentApi.
  • Zweitens erstellen Sie eine Instanz der SplitOptions Klasse.
  • Drittens erstellen Sie eine Instanz der Klasse FileInfo.
  • Geben Sie den Eingabedateipfad als Parameter für FileInfo an.
  • Geben Sie als Nächstes den Ausgabeverzeichnispfad als „python-testing“ an.
  • Legen Sie die Werte startpagenumber und endpagenumber fest.
  • Als nächstes setzen Sie den Seitenbereichsmodus auf „OddPages“.
  • Stellen Sie nun den PDF-Aufteilungsmodus auf „Seiten“ ein, um die Seitenzahlen aufzuteilen.
  • Erstellen Sie dann eine Instanz der SplitRequest Klasse und übergeben Sie den SplitOptions-Parameter.
  • Rufen Sie abschließend die Methode DocumentAPI.split() auf und übergeben Sie den SplitRequest-Parameter, um die Ergebnisse zu erhalten.

Der folgende Codeausschnitt zeigt, wie Sie eine PDF-Datei durch Anwenden eines Filters in Python mithilfe der REST-API aufteilen:

# So teilen Sie eine PDF-Datei durch Anwenden eines Filters in mehrere einzelne PDFs auf
try:
	# Erstellen Sie eine Instanz der Document API
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.start_page_number = 3
	options.end_page_number = 9
	options.range_mode = "OddPages"
	options.mode = "Pages" # mode Intervals

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file using pages range filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Teilen Sie PDF-Seiten in mehrere Dateien in Python auf, indem Sie einen Array-Filter anwenden

In diesem Abschnitt schreiben wir Schritte und ein Beispielcode-Snippet, um PDF Dateien programmgesteuert in mehrseitige PDF Dateien aufzuteilen:

  • Erstellen Sie zunächst eine Instanz der Klasse DocumentApi.
  • Zweitens erstellen Sie eine Instanz der SplitOptions Klasse.
  • Drittens erstellen Sie eine Instanz der Klasse FileInfo.
  • Geben Sie den Eingabedateipfad als Parameter für FileInfo an.
  • Geben Sie als Nächstes den Ausgabeverzeichnispfad als „python-testing“ an.
  • Legen Sie dann die Seitensammlung im Array-Format fest.
  • Stellen Sie den PDF-Teilungsmodus auf „Intervalle“ ein, um PDF Dateien zu teilen.
  • Erstellen Sie dann eine Instanz der SplitRequest Klasse und übergeben Sie den SplitOptions-Parameter.
  • Rufen Sie abschließend die Methode DocumentAPI.split() auf und übergeben Sie den SplitRequest-Parameter, um die Ergebnisse zu erhalten.

Der folgende Codeausschnitt zeigt, wie Sie PDF Dateien in Python mithilfe der REST-API in mehrere PDF Dateien aufteilen:

# So teilen Sie eine PDF-Datei in Python in mehrere mehrseitige Dateien auf
try:
	# Erstellen Sie eine Instanz der Document API
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [3, 6, 8]
	options.mode = "Intervals"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file to multiple PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Kostenloser Online-PDF-Splitter

Wie teilt man PDF Dateien kostenlos online auf? Bitte probieren Sie das folgende Online-PDF-Splitter-Tool aus, um PDF Dokumente kostenlos zu teilen. Dieses Online-Tool zur Dokumententrennung wurde unter Verwendung der oben genannten REST-API entwickelt.

Fazit

Zusammenfassend lässt sich sagen, dass die Aufteilung einer PDF-Datei in mehrere PDF Dateien mit dem GroupDocs.Merger Cloud SDK für Python eine bequeme Möglichkeit zur Verwaltung und Bearbeitung Ihrer PDF Dokumente bietet. Folgendes haben Sie in diesem Artikel gelernt:

  • wie man eine PDF-Datei mit Python in der Cloud in mehrere Dateien aufteilt;
  • Laden Sie die Dateien programmgesteuert in Python in die Cloud hoch und laden Sie sie herunter.
  • Teilen Sie PDF Dateien in Python mithilfe eines Seitenbereichsfilters in mehrere Dateien auf.
  • und teilen Sie PDF Dateien kostenlos mit einem Online-PDF-Splitter.

Darüber hinaus stellen wir auch einen API-Referenzabschnitt zur Verfügung, mit dem Sie unsere APIs direkt über den Browser visualisieren und mit ihnen kommunizieren können. Der vollständige Quellcode des Python SDK ist auf GitHub frei verfügbar. Bitte überprüfen Sie das GroupDocs.Merger Cloud SDK für Python Beispiele hier.

Darüber hinaus empfehlen wir Ihnen, unserem Leitfaden „Erste Schritte“ zu folgen, um detaillierte Schritte und die API-Nutzung zu erfahren.

Schließlich schreiben wir weiterhin neue Blog-Beiträge zu verschiedenen Dokumentvorgängen mithilfe der REST-API. Bitte kontaktieren Sie uns für die regelmäßigen Updates.

Stelle eine Frage

Wenn Sie Fragen zur PDF Dokument-Splitter-API haben, können Sie uns diese gerne im Kostenlosen Support-Forum stellen.

FAQs

Kann ich eine PDF-Datei basierend auf bestimmten Seiten in mehrere Dateien aufteilen?

Ja, mit dem GroupDocs.Merger Cloud SDK für Python können Sie den Seitenbereich definieren, um eine PDF-Datei zu extrahieren und in separate PDF Dateien aufzuteilen.

Unterstützt das GroupDocs.Merger Cloud SDK für Python neben PDF auch andere Dokumentformate?

Ja, GroupDocs.Merger Cloud SDK für Python unterstützt verschiedene Dokumentformate, darunter DOCX, XLSX, PPTX und mehr. Sie können ähnliche Vorgänge auch für diese Dateitypen ausführen.

Ist es möglich, die geteilten PDF Dateien bei Bedarf wieder in einer einzigen Datei zusammenzuführen?

Ja, GroupDocs.Merger Cloud SDK für Python unterstützt auch das Zusammenführen von PDF Dateien. Bei Bedarf können Sie die aufgeteilten PDF Dateien problemlos zu einem einzigen Dokument zusammenfassen.

Behält das GroupDocs.Merger Cloud SDK für Python die ursprüngliche Formatierung der PDF Dateien während des Aufteilungsvorgangs bei?

Ja, das SDK behält die ursprüngliche Formatierung und das Layout der PDF Dateien bei, während es sie in mehrere Dateien aufteilt.

Siehe auch

Für weitere Informationen zu verwandten Themen empfehlen wir einen Blick auf die folgenden Artikel: