Odstraňte anotace z PDF pomocí REST API v Pythonu.

Anotace poskytují další informace v dokumentu ve formě komentářů, vyskakovacích oken a různých dalších grafických objektů. V některých případech může být nutné odstranit anotace z anotovaných PDF dokumentů. V tomto článku se naučíme, jak odstranit nebo extrahovat anotace z dokumentů PDF pomocí REST API v Pythonu.

V tomto článku se budou zabývat následujícími tématy:

REST API a Python SDK pro odstranění anotací

Pro extrahování nebo odstranění anotací z dokumentů PDF budeme používat Python SDK of GroupDocs.Annotation Cloud API. Umožňuje přidávat anotace, překryvy vodoznaku, nahrazování textu a označení a poznámek k podporované formáty dokumentů. Nainstalujte jej pomocí následujícího příkazu v konzole:

pip install groupdocs_annotation_cloud

Před provedením uvedených kroků získejte své ID klienta a tajný klíč z řídicího panelu. Jakmile budete mít své ID a tajemství, přidejte kód, jak je uvedeno níže:

# Tento příklad kódu ukazuje, jak přidat ClientID a Secret
client_id = "659fe7da-715b-4744-a0f7-cf469a392b73"
client_secret = "b377c36cfa28fa69960ebac6b6e36421"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

Odstraňte anotace ze souborů PDF pomocí REST API v Pythonu

Všechny anotace ze souborů PDF můžeme odstranit pomocí následujících jednoduchých kroků:

Nahrajte dokument

Nejprve nahrajeme soubor PDF do cloudu pomocí níže uvedeného příkladu kódu:

# Tento příklad kódu ukazuje, jak nahrát soubor PDF do cloudu.
# Vytvořte instanci API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# Nahrajte ukázkové soubory
request = groupdocs_annotation_cloud.UploadFileRequest("sample.pdf", "C:\\Files\\sample.pdf", my_storage)
response = file_api.upload_file(request)

V důsledku toho bude nahraný soubor dostupný v sekce souborů řídicího panelu v cloudu.

Odebrat anotace z PDF v Pythonu

Nyní odstraníme anotace z dokumentu PDF programově podle následujících kroků:

  • Nejprve vytvořte instanci AnnotateApi.
  • Dále vytvořte instanci souboru FileInfo.
  • Poté nastavte cestu k vstupnímu souboru PDF.
  • Dále vytvořte instanci RemoveOptions.
  • Poté přiřaďte FileInfo k RemoveOptions.
  • Dále zadejte ID anotací v poli odděleném čárkami, které chcete odstranit.
  • Poté nastavte cestu k výstupnímu souboru.
  • Poté vytvořte požadavek voláním metody RemoveAnnotationsRequest s objektem RemoveOptions.
  • Nakonec získejte výsledky voláním metody AnnotateApi.remove\annotations() s argumentem RemoveAnnotationsRequest.

Následující ukázka kódu ukazuje, jak odstranit anotace z dokumentu PDF pomocí REST API v Pythonu. Potřebujeme pouze zmínit ID anotací, které mají být z dokumentu odstraněny. ID anotací můžeme získat pomocí metody extract() s ExtractRequest, jak je popsáno zde.

# Tyto příklady kódu ukazují, jak odstranit anotace z PDF.
# Instance API
api = groupdocs_annotation_cloud.AnnotateApi(configuration)

# Podrobnosti o vstupním souboru
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"

# Odebrat možnosti
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2]

# Výstupní soubor
options.output_path = "annotations_removed.pdf"

# Odebrat požadavek
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
Odebrat anotace z PDF v Pythonu.

Odebrat anotace z PDF v Pythonu.

Stáhněte si výstupní soubor

Výše uvedená ukázka kódu uloží výstupní soubor po odstranění anotací ze souboru PDF v cloudu. Lze jej stáhnout pomocí následující ukázky kódu:

# Tento příklad kódu ukazuje, jak stáhnout soubor PDF z cloudu.
# Inicializace API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# Vytvořit požadavek na stažení souboru
request = groupdocs_annotation_cloud.DownloadFileRequest("annotations_removed.pdf", my_storage)

# Stáhnout soubor
response = file_api.download_file(request)

# Přesuňte stažený soubor do svého pracovního adresáře
shutil.move(response, "C:\\Files\\")

Extrahujte anotace z dokumentů PDF v Pythonu

Anotace z dokumentů PDF můžeme extrahovat programově podle následujících kroků:

  • Nejprve vytvořte instanci AnnotateApi.
  • Dále vytvořte instanci souboru FileInfo.
  • Poté nastavte cestu vstupního souboru.
  • Poté vytvořte požadavek voláním metody ExtractRequest s objektem FileInfo.
  • Nakonec získejte výsledky voláním metody AnnotateApi.extract() s argumentem ExtractRequest.

Následující ukázka kódu ukazuje, jak extrahovat anotace z dokumentu PDF pomocí REST API v Pythonu.

# Tento příklad kódu ukazuje, jak extrahovat anotace ze souboru PDF.
# Instance API
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# Podrobnosti o vstupním souboru
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"

# Žádost o extrahování anotace
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

# Zobrazit výsledky
for x in range(len(result)):
  print(result[x]);

Výše uvedená ukázka kódu vrátí pole všech anotací ve formátu JSON, jak je uvedeno níže:

Extrahujte anotace z dokumentů PDF v Pythonu.

Extrahujte anotace z dokumentů PDF v Pythonu.

Vyzkoušejte online

Vyzkoušejte prosím následující bezplatný online nástroj pro anotaci PDF, který je vyvinut pomocí výše uvedeného API. https://products.groupdocs.app/annotation/pdf

Závěr

V tomto článku jsme se naučili, jak odstranit anotace z dokumentů PDF v cloudu. Také jsme viděli, jak extrahovat anotace z dokumentů PDF pomocí Pythonu. Tento článek také vysvětluje, jak programově nahrát soubor PDF do cloudu a stáhnout soubor z cloudu. Kromě toho se můžete dozvědět ještě více o GroupDocs.Annotation Cloud API pomocí dokumentace. Poskytujeme také sekci API Reference, která vám umožní vizualizovat a pracovat s našimi API přímo prostřednictvím prohlížeče. V případě jakýchkoliv nejasností nás prosím neváhejte kontaktovat na fóru.

Viz také