As anotações fornecem informações adicionais no documento na forma de comentários, pop-ups e vários outros objetos gráficos. Em alguns casos, pode ser necessário remover anotações de documentos PDF anotados. Neste artigo, aprenderemos como remover ou extrair anotações de documentos PDF usando uma API REST em Python.
Os seguintes tópicos serão abordados neste artigo:
- API REST e Python SDK para remover anotações
- Remover anotações de arquivos PDF usando uma API REST em Python
- Extrair anotações de documentos PDF em Python
API REST e Python SDK para remover anotações
Para extrair ou remover as anotações de documentos PDF, usaremos a API Python SDK of GroupDocs.Annotation Cloud. Ele permite adicionar anotações, sobreposições de marcas d’água, substituições e marcações de texto e notas adesivas aos formatos de documentos suportados. Instale-o usando o seguinte comando no console:
pip install groupdocs_annotation_cloud
Por favor, obtenha seu ID e Segredo do cliente no painel antes de seguir as etapas mencionadas. Depois de ter seu ID e segredo, adicione o código conforme mostrado abaixo:
# Este exemplo de código demonstra como adicionar ClientID e Secret
client_id = "659fe7da-715b-4744-a0f7-cf469a392b73"
client_secret = "b377c36cfa28fa69960ebac6b6e36421"
configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""
Remover anotações de arquivos PDF usando uma API REST em Python
Podemos excluir todas as anotações de arquivos PDF seguindo as etapas simples mencionadas abaixo:
- Carregar o arquivo PDF para a nuvem
- Remover anotações do PDF em Python
- Baixe o arquivo atualizado
Carregue o Documento
Em primeiro lugar, faremos o upload do arquivo PDF para a nuvem usando o exemplo de código fornecido abaixo:
# Este exemplo de código demonstra como carregar um arquivo PDF para a nuvem.
# Criar instância da API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)
# Carregar arquivos de amostra
request = groupdocs_annotation_cloud.UploadFileRequest("sample.pdf", "C:\\Files\\sample.pdf", my_storage)
response = file_api.upload_file(request)
Como resultado, o arquivo carregado estará disponível na seção de arquivos do painel na nuvem.
Remover anotações de PDF em Python
Agora, removeremos as anotações do documento PDF programaticamente seguindo as etapas abaixo:
- Em primeiro lugar, crie uma instância de AnnotateApi.
- Em seguida, crie uma instância do FileInfo.
- Em seguida, defina o caminho do arquivo PDF de entrada.
- Em seguida, crie uma instância do RemoveOptions.
- Em seguida, atribua FileInfo a RemoveOptions.
- Em seguida, forneça IDs de anotação em uma matriz separada por vírgulas para remover.
- Em seguida, defina o caminho do arquivo de saída.
- Depois disso, crie uma solicitação chamando o método RemoveAnnotationsRequest com o objeto RemoveOptions.
- Finalmente, obtenha resultados chamando o método AnnotateApi.remove\annotations() com RemoveAnnotationsRequest como argumento.
O exemplo de código a seguir mostra como remover anotações do documento PDF usando uma API REST em Python. Só precisamos mencionar os IDs de anotação a serem removidos do documento. Podemos obter IDs de anotação usando o método extract() com ExtractRequest conforme descrito aqui.
# Este exemplo de código demonstra como remover anotações do PDF.
# instância da API
api = groupdocs_annotation_cloud.AnnotateApi(configuration)
# Detalhes do arquivo de entrada
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"
# Remover opções
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2]
# Arquivo de saída
options.output_path = "annotations_removed.pdf"
# Remover solicitação
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)
print("RemoveAnnotations: Annotations removed: " + result['href'])
Baixe o arquivo de saída
O exemplo de código acima salvará o arquivo de saída após remover as anotações do arquivo PDF na nuvem. Ele pode ser baixado usando o seguinte exemplo de código:
# Este exemplo de código demonstra como baixar um arquivo PDF da nuvem.
# inicialização da API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)
# Criar solicitação de arquivo de download
request = groupdocs_annotation_cloud.DownloadFileRequest("annotations_removed.pdf", my_storage)
# ⇬ Fazer download do arquivo
response = file_api.download_file(request)
# Mova o arquivo baixado para o seu diretório de trabalho
shutil.move(response, "C:\\Files\\")
Extrair anotações de documentos PDF em Python
Podemos extrair anotações dos documentos PDF programaticamente seguindo as etapas abaixo:
- Em primeiro lugar, crie uma instância de AnnotateApi.
- Em seguida, crie uma instância do FileInfo.
- Em seguida, defina o caminho do arquivo de entrada.
- Depois disso, crie uma solicitação chamando o método ExtractRequest com o objeto FileInfo.
- Finalmente, obtenha resultados chamando o método AnnotateApi.extract() com ExtractRequest como argumento.
O exemplo de código a seguir mostra como extrair anotações do documento PDF usando uma API REST em Python.
# Este exemplo de código demonstra como extrair anotações de um arquivo PDF.
# instância da API
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)
# Detalhes do arquivo de entrada
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"
# Solicitação de anotação de extração
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)
print("ExtractAnnotations: annotations count: " + str(len(result)))
# Exibir resultados
for x in range(len(result)):
print(result[x]);
O exemplo de código acima retornará uma matriz de todas as anotações no formato JSON, conforme mostrado abaixo:
Experimente on-line
Experimente a seguinte ferramenta de anotação de PDF on-line gratuita, desenvolvida usando a API acima. https://products.groupdocs.app/annotation/pdf
Conclusão
Neste artigo, aprendemos como remover anotações de documentos PDF na nuvem. Também vimos como extrair anotações de documentos PDF usando Python. Este artigo também explicou como carregar programaticamente um arquivo PDF para a nuvem e baixar o arquivo da nuvem. Além disso, você pode aprender ainda mais sobre GroupDocs.Annotation Cloud API usando a documentação. Também fornecemos uma seção Referência de API que permite visualizar e interagir com nossas APIs diretamente pelo navegador. Em caso de ambiguidade, sinta-se à vontade para nos contatar no fórum.