Python extrahiert oder entfernt Anmerkungen aus Word Dateien.

Als Python-Entwickler können Sie jede Word-Datei (.doc oder .docx) programmgesteuert in der Cloud mit Anmerkungen versehen. Sie können alle Anmerkungen auch mit Python aus Word Dateien extrahieren oder entfernen. Zu den Anmerkungen gehören Kommentare, Popups und verschiedene andere grafische Objekte im Dokument, die zusätzliche Informationen bereitstellen. Dieser Artikel konzentriert sich auf das Extrahieren oder Entfernen von Anmerkungen aus DOCX Dateien mithilfe einer REST-API in Python.

Die folgenden Themen sollen in diesem Artikel behandelt werden:

Document Annotation REST API und Python SDK

Zum Extrahieren oder Entfernen von Anmerkungen aus DOC oder DOCX Dateien verwende ich die Python SDK of GroupDocs.Annotation Cloud API. Es ermöglicht Ihnen, programmgesteuert Online-Tools für Dokument und Bildanmerkungen zu erstellen. Solche Tools können zum Hinzufügen von Anmerkungen, Wasserzeichenüberlagerungen, Textersetzungen, Schwärzungen, Haftnotizen und Textmarkierungen zu Geschäftsdokumenten aller gängigen Formate verwendet werden. Es stellt außerdem .NET-, Java-, PHP-, Ruby und Node.js-SDKs als Mitglieder der Dokumentanmerkungsfamilie für die Cloud-API bereit.

Sie können GroupDocs.Annotation Cloud mit dem folgenden Befehl in der Konsole in Ihrem Python-Projekt installieren:

pip install groupdocs_annotation_cloud

Bitte rufen Sie Ihre Client-ID und Ihr Client-Geheimnis vom Dashboard ab, bevor Sie mit dem Befolgen der Schritte und verfügbaren Codebeispiele beginnen. Sobald Sie Ihre ID und Ihr Geheimnis haben, fügen Sie den Code wie unten gezeigt ein:

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"

Extrahieren oder entfernen Sie Anmerkungen aus DOCX Dateien mithilfe einer REST-API in Python

Sie können alle Anmerkungen aus den DOCX Dateien extrahieren oder löschen, indem Sie die folgenden einfachen Schritte ausführen:

Laden Sie das Dokument hoch

Laden Sie zunächst die DOCX-Datei mithilfe des unten angegebenen Codebeispiels in die Cloud hoch:

# API-Instanz
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# Datei hochladen
request = groupdocs_annotation_cloud.UploadFileRequest("input.docx", "C:\\Files\\input.docx", my_storage)
response = file_api.upload_file(request)

Dadurch ist die hochgeladene DOCX-Datei (input.docx) im Dateienbereich Ihres Dashboards in der Cloud verfügbar.

Extrahieren Sie Anmerkungen aus DOCX Dateien in Python

Bitte befolgen Sie die unten aufgeführten Schritte, um Anmerkungen programmgesteuert aus dem Word Dokument zu extrahieren.

  • Erstellen Sie eine Instanz von AnnotateApi
  • Erstellen Sie eine FileInfo-Instanz
  • Legen Sie den Dateipfad fest
  • Erstellen Sie eine Anfrage, indem Sie die ExtractRequest-Methode aufrufen
  • Erhalten Sie Ergebnisse, indem Sie die Methode AnnotateApi.extract() aufrufen

Der folgende Codeausschnitt zeigt, wie Sie mithilfe einer REST-API Anmerkungen aus dem Word Dokument extrahieren.

# API-Instanz
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# Details zur Eingabedatei
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# Anmerkungsanforderung extrahieren
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

Das obige Codebeispiel gibt ein Array aller Anmerkungen im JSON-Format zurück, wie unten gezeigt:

Extrahieren Sie Anmerkungen aus einer DOCX-Datei mit Python

Extrahieren Sie Anmerkungen aus einer DOCX-Datei mit Python

Entfernen Sie Anmerkungen aus DOCX Dateien in Python

Bitte befolgen Sie die unten aufgeführten Schritte, um Anmerkungen programmgesteuert aus dem Word Dokument zu löschen.

  • Erstellen Sie eine Instanz von AnnotateApi
  • Erstellen Sie eine FileInfo-Instanz
  • Legen Sie den Dateipfad fest
  • Definieren Sie RemoveOptions
  • Legen Sie die Dateiinformationen auf „AnnotateOptions“ fest
  • Geben Sie Anmerkungs-IDs zum Entfernen an
  • Legen Sie den Pfad der Ausgabedatei fest
  • Erstellen Sie eine Anfrage, indem Sie die RemoveAnnotationsRequest-Methode aufrufen
  • Erhalten Sie Ergebnisse, indem Sie die Methode AnnotateApi.remove\annotations() aufrufen

Der folgende Codeausschnitt zeigt, wie Sie mithilfe einer REST-API Anmerkungen aus dem Word Dokument entfernen. Sie müssen Anmerkungs-IDs erwähnen, die aus dem Dokument entfernt werden müssen.

# API-Instanz
api = groupdocs_annotation_cloud.AnnotateApi.from_keys(client_id, client_secret)

# Details zur Eingabedatei
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# Optionen entfernen
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2,3,4,5,6,7,8,9,10,11]

# Ausgabedatei
options.output_path = "output.docx"

# Anfrage entfernen
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
Entfernen Sie Anmerkungen aus der DOCX-Datei mit Python

Entfernen Sie Anmerkungen aus der DOCX-Datei mit Python

Laden Sie die Ausgabedatei herunter

Das obige Codebeispiel speichert die ausgegebene DOCX-Datei (output.docx), nachdem Anmerkungen in der Cloud entfernt wurden. Sie können es mit dem folgenden Codebeispiel herunterladen:

# API-Instanz
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# Datei-Download-Anfrage
request = groupdocs_annotation_cloud.DownloadFileRequest("output.docx", my_storage)
response = file_api.download_file(request)

# Verschieben Sie die heruntergeladene Datei in Ihr Arbeitsverzeichnis
shutil.move(response, "C:\\Files\\")

Versuchen Sie es online

Bitte probieren Sie das folgende kostenlose Online-DOCX-Annotationstool aus, das mit der oben genannten API entwickelt wurde. https://products.groupdocs.app/annotation/docx

Abschluss

In diesem Artikel haben Sie erfahren, wie Sie mit Python Anmerkungen aus Word Dokumenten in der Cloud extrahieren oder entfernen. Sie haben außerdem gelernt, wie Sie die DOCX-Datei programmgesteuert in die Cloud hochladen und aus der Cloud herunterladen. Weitere Informationen zur GroupDocs.Annotation Cloud API finden Sie in der Dokumentation. Wir bieten auch einen Abschnitt API-Referenz an, mit dem Sie unsere APIs direkt über den Browser visualisieren und mit ihnen interagieren können. Bei Unklarheiten können Sie uns gerne im Forum kontaktieren.

Siehe auch