Python wyodrębnia lub usuwa adnotacje z plików Word.

Jako programista Python możesz programowo dodawać adnotacje do dowolnego pliku programu Word (.doc lub .docx) w chmurze. Możesz także wyodrębnić lub usunąć wszystkie adnotacje z plików Word za pomocą Python. Adnotacje obejmują komentarze, wyskakujące okienka i różne inne obiekty graficzne w dokumencie, które dostarczają dodatkowych informacji. Ten artykuł skupi się na tym, jak wyodrębnić lub usunąć adnotacje z plików DOCX za pomocą interfejsu API REST w Python.

W tym artykule zostaną omówione następujące tematy:

Adnotacje w dokumentach REST API i Python SDK

Do wyodrębniania lub usuwania adnotacji z plików DOC lub DOCX będę używać Python SDK of GroupDocs.Annotation Cloud API. Umożliwia programowe tworzenie narzędzi do adnotacji dokumentów i obrazów online. Takie narzędzia mogą być używane do dodawania adnotacji, nakładek ze znakami wodnymi, zastępowania tekstu, redagowania, karteczek samoprzylepnych i znaczników tekstowych do dokumentów biznesowych we wszystkich popularnych formatach. Udostępnia również zestawy SDK .NET, Java, PHP, Ruby i Node.js jako członkowie rodziny adnotacji dokumentów dla Cloud API.

Możesz zainstalować GroupDocs.Annotation Cloud w swoim projekcie Python za pomocą następującego polecenia w konsoli:

pip install groupdocs_annotation_cloud

Uzyskaj swój identyfikator klienta i klucz tajny klienta z panelu nawigacyjnego, zanim zaczniesz postępować zgodnie z instrukcjami i dostępnymi przykładami kodu. Po uzyskaniu identyfikatora i tajnego kodu dodaj kod, jak pokazano poniżej:

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"

Wyodrębnij lub usuń adnotacje z plików DOCX za pomocą interfejsu API REST w Python

Możesz wyodrębnić lub usunąć wszystkie adnotacje z plików DOCX, wykonując proste czynności wymienione poniżej:

Prześlij dokument

Najpierw prześlij plik DOCX do chmury, korzystając z przykładowego kodu podanego poniżej:

# instancja interfejsu API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# Przesyłanie pliku
request = groupdocs_annotation_cloud.UploadFileRequest("input.docx", "C:\\Files\\input.docx", my_storage)
response = file_api.upload_file(request)

W rezultacie przesłany plik DOCX (input.docx) będzie dostępny w sekcji plików Twojego dashboardu w chmurze.

Wyodrębnij adnotacje z plików DOCX w Python

Wykonaj czynności wymienione poniżej, aby programowo wyodrębnić adnotacje z dokumentu programu Word.

  • Utwórz instancję AnnotateApi
  • Utwórz instancję FileInfo
  • Ustaw ścieżkę pliku
  • Utwórz żądanie, wywołując metodę ExtractRequest
  • Uzyskaj wyniki, wywołując metodę AnnotateApi.extract().

Poniższy fragment kodu pokazuje, jak wyodrębnić adnotacje z dokumentu programu Word przy użyciu interfejsu API REST.

# instancja interfejsu API
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# wprowadź szczegóły pliku
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# wyodrębnij żądanie adnotacji
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

Powyższy przykładowy kod zwróci tablicę wszystkich adnotacji w formacie JSON, jak pokazano poniżej:

Wyodrębnij adnotacje z pliku DOCX za pomocą Python

Wyodrębnij adnotacje z pliku DOCX za pomocą Python

Usuń adnotacje z plików DOCX w Python

Wykonaj czynności wymienione poniżej, aby programowo usunąć adnotacje z dokumentu programu Word.

  • Utwórz instancję AnnotateApi
  • Utwórz instancję FileInfo
  • Ustaw ścieżkę pliku
  • Zdefiniuj opcje usuwania
  • Ustaw informacje o pliku na AnnotateOptions
  • Podaj identyfikatory adnotacji do usunięcia
  • Ustaw ścieżkę pliku wyjściowego
  • Utwórz żądanie, wywołując metodę RemoveAnnotationsRequest
  • Uzyskaj wyniki, wywołując metodę AnnotateApi.remove\annotations().

Poniższy fragment kodu pokazuje, jak usunąć adnotacje z dokumentu programu Word przy użyciu interfejsu API REST. Musisz podać identyfikatory adnotacji, które mają zostać usunięte z dokumentu.

# instancja interfejsu API
api = groupdocs_annotation_cloud.AnnotateApi.from_keys(client_id, client_secret)

# wprowadź szczegóły pliku
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# usuń opcje
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2,3,4,5,6,7,8,9,10,11]

# plik wyjściowy
options.output_path = "output.docx"

# usunąć prośbę
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
Usuń adnotacje z pliku DOCX za pomocą Python

Usuń adnotacje z pliku DOCX za pomocą Python

Pobierz plik wyjściowy

Powyższy przykładowy kod zapisze wyjściowy plik DOCX (output.docx) po usunięciu adnotacji w chmurze. Możesz go pobrać, korzystając z następującego przykładowego kodu:

# instancja interfejsu API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# prośba o pobranie pliku
request = groupdocs_annotation_cloud.DownloadFileRequest("output.docx", my_storage)
response = file_api.download_file(request)

# Przenieś pobrany plik do katalogu roboczego
shutil.move(response, "C:\\Files\\")

Wypróbuj online

Wypróbuj następujące bezpłatne narzędzie online do tworzenia adnotacji DOCX, które zostało opracowane przy użyciu powyższego interfejsu API. https://products.groupdocs.app/annotation/docx

Wniosek

W tym artykule nauczyłeś się, jak wyodrębniać lub usuwać adnotacje z dokumentów Word w chmurze za pomocą Python. Nauczyłeś się również, jak programowo przesyłać plik DOCX do chmury i pobierać plik z chmury. Możesz dowiedzieć się jeszcze więcej o GroupDocs.Annotation Cloud API, korzystając z dokumentacji. Udostępniamy również sekcję Informacje o interfejsach API, która umożliwia wizualizację naszych interfejsów API i interakcję z nimi bezpośrednio w przeglądarce. W przypadku jakichkolwiek niejasności prosimy o kontakt na forum.

Zobacz też