Python extrahuje nebo odstraňuje anotace ze souborů aplikace Word.

Jako vývojář Pythonu můžete v cloudu programově anotovat jakýkoli soubor Wordu (.doc nebo .docx). Pomocí Pythonu můžete také extrahovat nebo odstranit všechny anotace ze souborů aplikace Word. Anotace zahrnují komentáře, vyskakovací okna a různé další grafické objekty v dokumentu poskytující další informace. Tento článek se zaměří na to, jak extrahovat nebo odstraňovat anotace ze souborů DOCX pomocí REST API v Pythonu.

V tomto článku se budou zabývat následujícími tématy:

Anotace dokumentu REST API a Python SDK

Pro extrahování nebo odstranění anotací ze souborů DOC nebo DOCX budu používat Python SDK of GroupDocs.Annotation Cloud API. Umožňuje vám programově vytvářet online nástroje pro anotaci dokumentů a obrázků. Tyto nástroje lze použít k přidávání anotací, překryvných vodoznaků, nahrazování textu, redigování, poznámek a textových označení do obchodních dokumentů všech oblíbených formátů. Poskytuje také .NET, Java, PHP, Ruby a Node.js SDK jako členové rodiny anotací dokumentu pro Cloud API.

GroupDocs.Annotation Cloud můžete nainstalovat do svého projektu Python pomocí následujícího příkazu v konzole:

pip install groupdocs_annotation_cloud

Než začnete postupovat podle kroků a dostupných příkladů kódu, získejte své ID klienta a tajný klíč klienta z dashboard. Jakmile budete mít své ID a tajemství, přidejte kód, jak je uvedeno níže:

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"

Extrahujte nebo odeberte anotace ze souborů DOCX pomocí REST API v Pythonu

Všechny anotace ze souborů DOCX můžete extrahovat nebo odstranit pomocí následujících jednoduchých kroků:

Nahrajte dokument

Nejprve nahrajte soubor DOCX do cloudu pomocí níže uvedeného příkladu kódu:

# instance API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# nahrát soubor
request = groupdocs_annotation_cloud.UploadFileRequest("input.docx", "C:\\Files\\input.docx", my_storage)
response = file_api.upload_file(request)

V důsledku toho bude nahraný soubor DOCX (input.docx) dostupný v sekce souborů vašeho řídicího panelu v cloudu.

Extrahujte anotace ze souborů DOCX v Pythonu

Chcete-li programově extrahovat anotace z dokumentu Word, postupujte podle níže uvedených kroků.

  • Vytvořte instanci AnnotateApi
  • Vytvořte instanci FileInfo
  • Nastavte cestu k souboru
  • Vytvořte požadavek voláním metody ExtractRequest
  • Získejte výsledky voláním metody AnnotateApi.extract()

Následující fragment kódu ukazuje, jak extrahovat anotace z dokumentu Word pomocí REST API.

# instance API
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# podrobnosti vstupního souboru
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# extrahovat žádost o anotaci
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

Výše uvedená ukázka kódu vrátí pole všech anotací ve formátu JSON, jak je uvedeno níže:

Extrahujte anotace ze souboru DOCX pomocí Pythonu

Extrahujte anotace ze souboru DOCX pomocí Pythonu

Odebrat anotace ze souborů DOCX v Pythonu

Chcete-li programově odstranit anotace z dokumentu aplikace Word, postupujte podle níže uvedených kroků.

  • Vytvořte instanci AnnotateApi
  • Vytvořte instanci FileInfo
  • Nastavte cestu k souboru
  • Definujte možnosti RemoveOptions
  • Nastavte informace o souboru na AnnotateOptions
  • Zadejte ID anotací, které chcete odstranit
  • Nastavit cestu k výstupnímu souboru
  • Vytvořte požadavek voláním metody RemoveAnnotationsRequest
  • Výsledky získáte voláním metody AnnotateApi.remove\annotations()

Následující fragment kódu ukazuje, jak odstranit anotace z dokumentu aplikace Word pomocí rozhraní REST API. Musíte zmínit ID anotací, které je třeba z dokumentu odstranit.

# instance API
api = groupdocs_annotation_cloud.AnnotateApi.from_keys(client_id, client_secret)

# podrobnosti vstupního souboru
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# odebrat možnosti
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2,3,4,5,6,7,8,9,10,11]

# výstupní soubor
options.output_path = "output.docx"

# odstranit požadavek
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
Odstraňte anotace ze souboru DOCX pomocí Pythonu

Odstraňte anotace ze souboru DOCX pomocí Pythonu

Stáhněte si výstupní soubor

Výše uvedená ukázka kódu uloží výstupní soubor DOCX (output.docx) po odstranění anotací v cloudu. Můžete si jej stáhnout pomocí následující ukázky kódu:

# instance API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# žádost o stažení souboru
request = groupdocs_annotation_cloud.DownloadFileRequest("output.docx", my_storage)
response = file_api.download_file(request)

# Přesuňte stažený soubor do svého pracovního adresáře
shutil.move(response, "C:\\Files\\")

Vyzkoušejte online

Vyzkoušejte prosím následující bezplatný online anotační nástroj DOCX, který je vyvinut pomocí výše uvedeného API. https://products.groupdocs.app/annotation/docx

Závěr

V tomto článku jste se naučili, jak extrahovat nebo odstraňovat anotace z dokumentů Wordu v cloudu pomocí Pythonu. Také jste se naučili, jak programově nahrát soubor DOCX do cloudu a stáhnout soubor z cloudu. Můžete se dozvědět ještě více o GroupDocs.Annotation Cloud API pomocí dokumentace. Poskytujeme také sekci API Reference, která vám umožní vizualizovat naše API a pracovat s nimi přímo prostřednictvím prohlížeče. V případě jakýchkoliv nejasností nás neváhejte kontaktovat na fóru.

Viz také