Anotace poskytují další informace v dokumentu ve formě komentářů, vyskakovacích oken a různých dalších grafických objektů. V některých případech může být nutné odstranit anotace z anotovaných PDF dokumentů. V tomto článku se naučíme, jak odstranit nebo extrahovat anotace z dokumentů PDF pomocí REST API v Pythonu.
V tomto článku se budou zabývat následujícími tématy:
- REST API a Python SDK pro odstranění anotací
- Odstraňte anotace ze souborů PDF pomocí REST API v Pythonu
- Extrahujte anotace z dokumentů PDF v Pythonu
REST API a Python SDK pro odstranění anotací
Pro extrahování nebo odstranění anotací z dokumentů PDF budeme používat Python SDK of GroupDocs.Annotation Cloud API. Umožňuje přidávat anotace, překryvy vodoznaku, nahrazování textu a označení a poznámek k podporované formáty dokumentů. Nainstalujte jej pomocí následujícího příkazu v konzole:
pip install groupdocs_annotation_cloud
Před provedením uvedených kroků získejte své ID klienta a tajný klíč z řídicího panelu. Jakmile budete mít své ID a tajemství, přidejte kód, jak je uvedeno níže:
# Tento příklad kódu ukazuje, jak přidat ClientID a Secret
client_id = "659fe7da-715b-4744-a0f7-cf469a392b73"
client_secret = "b377c36cfa28fa69960ebac6b6e36421"
configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""
Odstraňte anotace ze souborů PDF pomocí REST API v Pythonu
Všechny anotace ze souborů PDF můžeme odstranit pomocí následujících jednoduchých kroků:
- Nahrát soubor PDF do cloudu
- Odebrat anotace z PDF v Pythonu
- Stáhnout aktualizovaný soubor
Nahrajte dokument
Nejprve nahrajeme soubor PDF do cloudu pomocí níže uvedeného příkladu kódu:
# Tento příklad kódu ukazuje, jak nahrát soubor PDF do cloudu.
# Vytvořte instanci API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)
# Nahrajte ukázkové soubory
request = groupdocs_annotation_cloud.UploadFileRequest("sample.pdf", "C:\\Files\\sample.pdf", my_storage)
response = file_api.upload_file(request)
V důsledku toho bude nahraný soubor dostupný v sekce souborů řídicího panelu v cloudu.
Odebrat anotace z PDF v Pythonu
Nyní odstraníme anotace z dokumentu PDF programově podle následujících kroků:
- Nejprve vytvořte instanci AnnotateApi.
- Dále vytvořte instanci souboru FileInfo.
- Poté nastavte cestu k vstupnímu souboru PDF.
- Dále vytvořte instanci RemoveOptions.
- Poté přiřaďte FileInfo k RemoveOptions.
- Dále zadejte ID anotací v poli odděleném čárkami, které chcete odstranit.
- Poté nastavte cestu k výstupnímu souboru.
- Poté vytvořte požadavek voláním metody RemoveAnnotationsRequest s objektem RemoveOptions.
- Nakonec získejte výsledky voláním metody AnnotateApi.remove\annotations() s argumentem RemoveAnnotationsRequest.
Následující ukázka kódu ukazuje, jak odstranit anotace z dokumentu PDF pomocí REST API v Pythonu. Potřebujeme pouze zmínit ID anotací, které mají být z dokumentu odstraněny. ID anotací můžeme získat pomocí metody extract() s ExtractRequest, jak je popsáno zde.
# Tyto příklady kódu ukazují, jak odstranit anotace z PDF.
# Instance API
api = groupdocs_annotation_cloud.AnnotateApi(configuration)
# Podrobnosti o vstupním souboru
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"
# Odebrat možnosti
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2]
# Výstupní soubor
options.output_path = "annotations_removed.pdf"
# Odebrat požadavek
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)
print("RemoveAnnotations: Annotations removed: " + result['href'])
Stáhněte si výstupní soubor
Výše uvedená ukázka kódu uloží výstupní soubor po odstranění anotací ze souboru PDF v cloudu. Lze jej stáhnout pomocí následující ukázky kódu:
# Tento příklad kódu ukazuje, jak stáhnout soubor PDF z cloudu.
# Inicializace API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)
# Vytvořit požadavek na stažení souboru
request = groupdocs_annotation_cloud.DownloadFileRequest("annotations_removed.pdf", my_storage)
# Stáhnout soubor
response = file_api.download_file(request)
# Přesuňte stažený soubor do svého pracovního adresáře
shutil.move(response, "C:\\Files\\")
Extrahujte anotace z dokumentů PDF v Pythonu
Anotace z dokumentů PDF můžeme extrahovat programově podle následujících kroků:
- Nejprve vytvořte instanci AnnotateApi.
- Dále vytvořte instanci souboru FileInfo.
- Poté nastavte cestu vstupního souboru.
- Poté vytvořte požadavek voláním metody ExtractRequest s objektem FileInfo.
- Nakonec získejte výsledky voláním metody AnnotateApi.extract() s argumentem ExtractRequest.
Následující ukázka kódu ukazuje, jak extrahovat anotace z dokumentu PDF pomocí REST API v Pythonu.
# Tento příklad kódu ukazuje, jak extrahovat anotace ze souboru PDF.
# Instance API
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)
# Podrobnosti o vstupním souboru
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"
# Žádost o extrahování anotace
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)
print("ExtractAnnotations: annotations count: " + str(len(result)))
# Zobrazit výsledky
for x in range(len(result)):
print(result[x]);
Výše uvedená ukázka kódu vrátí pole všech anotací ve formátu JSON, jak je uvedeno níže:
Vyzkoušejte online
Vyzkoušejte prosím následující bezplatný online nástroj pro anotaci PDF, který je vyvinut pomocí výše uvedeného API. https://products.groupdocs.app/annotation/pdf
Závěr
V tomto článku jsme se naučili, jak odstranit anotace z dokumentů PDF v cloudu. Také jsme viděli, jak extrahovat anotace z dokumentů PDF pomocí Pythonu. Tento článek také vysvětluje, jak programově nahrát soubor PDF do cloudu a stáhnout soubor z cloudu. Kromě toho se můžete dozvědět ještě více o GroupDocs.Annotation Cloud API pomocí dokumentace. Poskytujeme také sekci API Reference, která vám umožní vizualizovat a pracovat s našimi API přímo prostřednictvím prohlížeče. V případě jakýchkoliv nejasností nás prosím neváhejte kontaktovat na fóru.