Entfernen Sie Anmerkungen aus PDF mithilfe der REST-API in Python.

Anmerkungen stellen zusätzliche Informationen im Dokument in Form von Kommentaren, Popups und verschiedenen anderen grafischen Objekten bereit. In einigen Fällen müssen wir möglicherweise Anmerkungen aus kommentierten PDF Dokumenten entfernen. In diesem Artikel erfahren Sie, wie Sie mithilfe einer REST-API in Python Anmerkungen aus PDF Dokumenten entfernen oder extrahieren.

Die folgenden Themen sollen in diesem Artikel behandelt werden:

REST-API und Python SDK zum Entfernen von Anmerkungen

Zum Extrahieren oder Entfernen der Anmerkungen aus PDF Dokumenten verwenden wir die API Python SDK von GroupDocs.Annotation Cloud. Es ermöglicht das Hinzufügen von Anmerkungen, Wasserzeichen-Overlays, Textersetzungen und -markierungen sowie Haftnotizen zu den unterstützten Dokumentformaten. Bitte installieren Sie es mit dem folgenden Befehl in der Konsole:

pip install groupdocs_annotation_cloud

Bitte holen Sie sich Ihre Kunden-ID und Ihr Geheimnis aus dem Dashboard, bevor Sie die genannten Schritte ausführen. Sobald Sie Ihre ID und Ihr Geheimnis haben, fügen Sie den Code wie unten gezeigt ein:

# Dieses Codebeispiel zeigt, wie ClientID und Secret hinzugefügt werden
client_id = "659fe7da-715b-4744-a0f7-cf469a392b73"
client_secret = "b377c36cfa28fa69960ebac6b6e36421"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

Entfernen Sie Anmerkungen aus PDF Dateien mithilfe einer REST-API in Python

Wir können alle Anmerkungen aus PDF Dateien löschen, indem wir die folgenden einfachen Schritte ausführen:

Laden Sie das Dokument hoch

Zunächst laden wir die PDF-Datei mithilfe des unten angegebenen Codebeispiels in die Cloud hoch:

# Dieses Codebeispiel zeigt, wie eine PDF-Datei in die Cloud hochgeladen wird.
# Erstellen Sie eine Instanz der API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# Laden Sie Beispieldateien hoch
request = groupdocs_annotation_cloud.UploadFileRequest("sample.pdf", "C:\\Files\\sample.pdf", my_storage)
response = file_api.upload_file(request)

Dadurch ist die hochgeladene Datei im Dateienbereich des Dashboards in der Cloud verfügbar.

Entfernen Sie Anmerkungen aus PDF in Python

Jetzt entfernen wir die Anmerkungen programmgesteuert aus dem PDF Dokument, indem wir die folgenden Schritte ausführen:

  • Erstellen Sie zunächst eine Instanz von AnnotateApi.
  • Erstellen Sie als Nächstes eine Instanz von FileInfo.
  • Legen Sie dann den Pfad der Eingabe-PDF-Datei fest.
  • Erstellen Sie als Nächstes eine Instanz von RemoveOptions.
  • Weisen Sie dann FileInfo RemoveOptions zu.
  • Geben Sie als Nächstes die zu entfernenden Anmerkungs-IDs in einem durch Kommas getrennten Array an.
  • Legen Sie dann den Pfad der Ausgabedatei fest.
  • Erstellen Sie anschließend eine Anfrage, indem Sie die RemoveAnnotationsRequest-Methode mit dem RemoveOptions Objekt aufrufen.
  • Abschließend erhalten Sie Ergebnisse, indem Sie die Methode AnnotateApi.remove\annotations() mit RemoveAnnotationsRequest als Argument aufrufen.

Das folgende Codebeispiel zeigt, wie Sie mithilfe einer REST-API in Python Anmerkungen aus dem PDF Dokument entfernen. Wir müssen lediglich die Anmerkungs-IDs erwähnen, die aus dem Dokument entfernt werden sollen. Wir können Anmerkungs-IDs mithilfe der Methode extract() mit ExtractRequest abrufen, wie hier beschrieben.

# Dieses Codebeispiel zeigt, wie Anmerkungen aus PDF entfernt werden.
# API-Instanz
api = groupdocs_annotation_cloud.AnnotateApi(configuration)

# Details zur Eingabedatei
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"

# Optionen entfernen
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2]

# Ausgabedatei
options.output_path = "annotations_removed.pdf"

# Anfrage entfernen
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
Entfernen Sie Anmerkungen aus PDF in Python.

Entfernen Sie Anmerkungen aus PDF in Python.

Laden Sie die Ausgabedatei herunter

Das obige Codebeispiel speichert die Ausgabedatei nach dem Entfernen von Anmerkungen aus der PDF-Datei in der Cloud. Es kann mit dem folgenden Codebeispiel heruntergeladen werden:

# Dieses Codebeispiel zeigt, wie Sie eine PDF-Datei aus der Cloud herunterladen.
# API-Initialisierung
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# Erstellen Sie eine Download-Dateianfrage
request = groupdocs_annotation_cloud.DownloadFileRequest("annotations_removed.pdf", my_storage)

# Download-Datei
response = file_api.download_file(request)

# Verschieben Sie die heruntergeladene Datei in Ihr Arbeitsverzeichnis
shutil.move(response, "C:\\Files\\")

Extrahieren Sie Anmerkungen aus PDF Dokumenten in Python

Wir können Anmerkungen programmgesteuert aus den PDF Dokumenten extrahieren, indem wir die folgenden Schritte ausführen:

  • Erstellen Sie zunächst eine Instanz von AnnotateApi.
  • Erstellen Sie als Nächstes eine Instanz von FileInfo.
  • Legen Sie dann den Pfad der Eingabedatei fest.
  • Erstellen Sie anschließend eine Anfrage, indem Sie die ExtractRequest-Methode mit dem FileInfo Objekt aufrufen.
  • Abschließend erhalten Sie Ergebnisse, indem Sie die Methode AnnotateApi.extract() mit ExtractRequest als Argument aufrufen.

Das folgende Codebeispiel zeigt, wie Sie mithilfe einer REST-API in Python Anmerkungen aus dem PDF Dokument extrahieren.

# Dieses Codebeispiel zeigt, wie Anmerkungen aus einer PDF-Datei extrahiert werden.
# API-Instanz
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# Details zur Eingabedatei
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"

# Anmerkungsanfrage extrahieren
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

# Ergebnisse anzeigen
for x in range(len(result)):
  print(result[x]);

Das obige Codebeispiel gibt ein Array aller Anmerkungen im JSON-Format zurück, wie unten gezeigt:

Extrahieren Sie Anmerkungen aus PDF Dokumenten in Python.

Extrahieren Sie Anmerkungen aus PDF Dokumenten in Python.

Versuchen Sie es online

Bitte probieren Sie das folgende kostenlose Online-PDF-Anmerkungstool aus, das mit der oben genannten API entwickelt wurde. https://products.groupdocs.app/annotation/pdf

Abschluss

In diesem Artikel haben wir erfahren, wie man Anmerkungen aus PDF Dokumenten in der Cloud entfernt. Wir haben auch gesehen, wie man mit Python Anmerkungen aus PDF Dokumenten extrahiert. In diesem Artikel wurde auch erläutert, wie Sie eine PDF-Datei programmgesteuert in die Cloud hochladen und die Datei aus der Cloud herunterladen. Außerdem können Sie mithilfe der Dokumentation noch mehr über die GroupDocs.Annotation Cloud API erfahren. Wir bieten auch einen Abschnitt API-Referenz an, mit dem Sie unsere APIs direkt über den Browser visualisieren und mit ihnen interagieren können. Bei Unklarheiten können Sie uns gerne im Forum kontaktieren.

Siehe auch