Jako vývojář Pythonu můžete v cloudu programově anotovat jakýkoli soubor Wordu (.doc nebo .docx). Pomocí Pythonu můžete také extrahovat nebo odstranit všechny anotace ze souborů aplikace Word. Anotace zahrnují komentáře, vyskakovací okna a různé další grafické objekty v dokumentu poskytující další informace. Tento článek se zaměří na to, jak extrahovat nebo odstraňovat anotace ze souborů DOCX pomocí REST API v Pythonu.
V tomto článku se budou zabývat následujícími tématy:
- Anotace dokumentu REST API a Python SDK
- Extrahujte nebo odeberte anotaci ze souborů DOCX pomocí REST API
Anotace dokumentu REST API a Python SDK
Pro extrahování nebo odstranění anotací ze souborů DOC nebo DOCX budu používat Python SDK of GroupDocs.Annotation Cloud API. Umožňuje vám programově vytvářet online nástroje pro anotaci dokumentů a obrázků. Tyto nástroje lze použít k přidávání anotací, překryvných vodoznaků, nahrazování textu, redigování, poznámek a textových označení do obchodních dokumentů všech oblíbených formátů. Poskytuje také .NET, Java, PHP, Ruby a Node.js SDK jako členové rodiny anotací dokumentu pro Cloud API.
GroupDocs.Annotation Cloud můžete nainstalovat do svého projektu Python pomocí následujícího příkazu v konzole:
pip install groupdocs_annotation_cloud
Než začnete postupovat podle kroků a dostupných příkladů kódu, získejte své ID klienta a tajný klíč klienta z dashboard. Jakmile budete mít své ID a tajemství, přidejte kód, jak je uvedeno níže:
client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"
configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
Extrahujte nebo odeberte anotace ze souborů DOCX pomocí REST API v Pythonu
Všechny anotace ze souborů DOCX můžete extrahovat nebo odstranit pomocí následujících jednoduchých kroků:
- Nahrajte soubor DOCX do cloudu
- Extrahovat anotace ze souborů DOCX v Pythonu
- Odebrat anotace ze souborů DOCX v Pythonu
- Stáhnout aktualizovaný soubor
Nahrajte dokument
Nejprve nahrajte soubor DOCX do cloudu pomocí níže uvedeného příkladu kódu:
# instance API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)
# nahrát soubor
request = groupdocs_annotation_cloud.UploadFileRequest("input.docx", "C:\\Files\\input.docx", my_storage)
response = file_api.upload_file(request)
V důsledku toho bude nahraný soubor DOCX (input.docx) dostupný v sekce souborů vašeho řídicího panelu v cloudu.
Extrahujte anotace ze souborů DOCX v Pythonu
Chcete-li programově extrahovat anotace z dokumentu Word, postupujte podle níže uvedených kroků.
- Vytvořte instanci AnnotateApi
- Vytvořte instanci FileInfo
- Nastavte cestu k souboru
- Vytvořte požadavek voláním metody ExtractRequest
- Získejte výsledky voláním metody AnnotateApi.extract()
Následující fragment kódu ukazuje, jak extrahovat anotace z dokumentu Word pomocí REST API.
# instance API
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)
# podrobnosti vstupního souboru
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"
# extrahovat žádost o anotaci
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)
print("ExtractAnnotations: annotations count: " + str(len(result)))
Výše uvedená ukázka kódu vrátí pole všech anotací ve formátu JSON, jak je uvedeno níže:
Odebrat anotace ze souborů DOCX v Pythonu
Chcete-li programově odstranit anotace z dokumentu aplikace Word, postupujte podle níže uvedených kroků.
- Vytvořte instanci AnnotateApi
- Vytvořte instanci FileInfo
- Nastavte cestu k souboru
- Definujte možnosti RemoveOptions
- Nastavte informace o souboru na AnnotateOptions
- Zadejte ID anotací, které chcete odstranit
- Nastavit cestu k výstupnímu souboru
- Vytvořte požadavek voláním metody RemoveAnnotationsRequest
- Výsledky získáte voláním metody AnnotateApi.remove\annotations()
Následující fragment kódu ukazuje, jak odstranit anotace z dokumentu aplikace Word pomocí rozhraní REST API. Musíte zmínit ID anotací, které je třeba z dokumentu odstranit.
# instance API
api = groupdocs_annotation_cloud.AnnotateApi.from_keys(client_id, client_secret)
# podrobnosti vstupního souboru
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"
# odebrat možnosti
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2,3,4,5,6,7,8,9,10,11]
# výstupní soubor
options.output_path = "output.docx"
# odstranit požadavek
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)
print("RemoveAnnotations: Annotations removed: " + result['href'])
Stáhněte si výstupní soubor
Výše uvedená ukázka kódu uloží výstupní soubor DOCX (output.docx) po odstranění anotací v cloudu. Můžete si jej stáhnout pomocí následující ukázky kódu:
# instance API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)
# žádost o stažení souboru
request = groupdocs_annotation_cloud.DownloadFileRequest("output.docx", my_storage)
response = file_api.download_file(request)
# Přesuňte stažený soubor do svého pracovního adresáře
shutil.move(response, "C:\\Files\\")
Vyzkoušejte online
Vyzkoušejte prosím následující bezplatný online anotační nástroj DOCX, který je vyvinut pomocí výše uvedeného API. https://products.groupdocs.app/annotation/docx
Závěr
V tomto článku jste se naučili, jak extrahovat nebo odstraňovat anotace z dokumentů Wordu v cloudu pomocí Pythonu. Také jste se naučili, jak programově nahrát soubor DOCX do cloudu a stáhnout soubor z cloudu. Můžete se dozvědět ještě více o GroupDocs.Annotation Cloud API pomocí dokumentace. Poskytujeme také sekci API Reference, která vám umožní vizualizovat naše API a pracovat s nimi přímo prostřednictvím prohlížeče. V případě jakýchkoliv nejasností nás neváhejte kontaktovat na fóru.