Elimine anotaciones de PDF usando REST API en Python.

Las anotaciones proporcionan información adicional en el documento en forma de comentarios, ventanas emergentes y varios otros objetos gráficos. En algunos casos, es posible que debamos eliminar las anotaciones de los documentos PDF anotados. En este artículo, aprenderemos cómo eliminar o extraer anotaciones de documentos PDF utilizando una API REST en Python.

En este artículo se tratarán los siguientes temas:

REST API y Python SDK para eliminar anotaciones

Para extraer o eliminar las anotaciones de los documentos PDF, utilizaremos la API Python SDK of GroupDocs.Annotation Cloud. Permite agregar anotaciones, superposiciones de marcas de agua, reemplazos de texto y marcas, y notas adhesivas a los formatos de documentos admitidos. Instálalo usando el siguiente comando en la consola:

pip install groupdocs_annotation_cloud

Por favor, obtenga su ID de cliente y secreto del tablero antes de seguir los pasos mencionados. Una vez que tenga su ID y secreto, agregue el código como se muestra a continuación:

# Este ejemplo de código muestra cómo agregar ClientID y Secret
client_id = "659fe7da-715b-4744-a0f7-cf469a392b73"
client_secret = "b377c36cfa28fa69960ebac6b6e36421"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

Eliminar anotaciones de archivos PDF usando una API REST en Python

Podemos eliminar todas las anotaciones de los archivos PDF siguiendo los sencillos pasos que se mencionan a continuación:

Sube el documento

En primer lugar, cargaremos el archivo PDF en la nube utilizando el ejemplo de código que se proporciona a continuación:

# Este ejemplo de código demuestra cómo cargar un archivo PDF en la nube.
# Crear instancia de la API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# Subir archivos de muestra
request = groupdocs_annotation_cloud.UploadFileRequest("sample.pdf", "C:\\Files\\sample.pdf", my_storage)
response = file_api.upload_file(request)

Como resultado, el archivo cargado estará disponible en la sección de archivos del tablero en la nube.

Eliminar anotaciones de PDF en Python

Ahora, eliminaremos las anotaciones del documento PDF mediante programación siguiendo los pasos que se indican a continuación:

  • En primer lugar, cree una instancia de AnnotateApi.
  • A continuación, cree una instancia de FileInfo.
  • Luego, establezca la ruta del archivo PDF de entrada.
  • A continuación, cree una instancia de RemoveOptions.
  • Luego, asigne FileInfo a RemoveOptions.
  • A continuación, proporcione los ID de anotación en una matriz separada por comas para eliminar.
  • Luego, establezca la ruta del archivo de salida.
  • Después de eso, cree una solicitud llamando al método RemoveAnnotationsRequest con el objeto RemoveOptions.
  • Finalmente, obtenga resultados llamando al método AnnotateApi.remove\annotations() con RemoveAnnotationsRequest como argumento.

El siguiente ejemplo de código muestra cómo eliminar anotaciones del documento PDF mediante una API REST en Python. Solo necesitamos mencionar los ID de anotación que se eliminarán del documento. Podemos obtener ID de anotación usando el método extract() con ExtractRequest como se describe aquí.

# Este ejemplo de código demuestra cómo eliminar anotaciones de PDF.
# instancia de API
api = groupdocs_annotation_cloud.AnnotateApi(configuration)

# Detalles del archivo de entrada
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"

# Quitar opciones
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2]

# Archivo de salida
options.output_path = "annotations_removed.pdf"

# Eliminar solicitud
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
Eliminar anotaciones de PDF en Python.

Eliminar anotaciones de PDF en Python.

Descargar el archivo de salida

El ejemplo de código anterior guardará el archivo de salida después de eliminar las anotaciones del archivo PDF en la nube. Se puede descargar usando el siguiente ejemplo de código:

# Este ejemplo de código demuestra cómo descargar un archivo PDF desde la nube.
# Inicialización de la API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# Crear solicitud de archivo de descarga
request = groupdocs_annotation_cloud.DownloadFileRequest("annotations_removed.pdf", my_storage)

# Descargar archivo
response = file_api.download_file(request)

# Mueva el archivo descargado a su directorio de trabajo
shutil.move(response, "C:\\Files\\")

Extraer anotaciones de documentos PDF en Python

Podemos extraer anotaciones de los documentos PDF mediante programación siguiendo los pasos que se detallan a continuación:

  • En primer lugar, cree una instancia de AnnotateApi.
  • A continuación, cree una instancia de FileInfo.
  • Luego, configure la ruta del archivo de entrada.
  • Después de eso, cree una solicitud llamando al método ExtractRequest con el objeto FileInfo.
  • Finalmente, obtenga resultados llamando al método AnnotateApi.extract() con ExtractRequest como argumento.

El siguiente ejemplo de código muestra cómo extraer anotaciones del documento PDF mediante una API REST en Python.

# Este ejemplo de código demuestra cómo extraer anotaciones de un archivo PDF.
# instancia de API
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# Detalles del archivo de entrada
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"

# Extraer solicitud de anotación
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

# Mostrar resultados
for x in range(len(result)):
  print(result[x]);

El ejemplo de código anterior devolverá una matriz de todas las anotaciones en formato JSON, como se muestra a continuación:

Extraiga anotaciones de documentos PDF en Python.

Extraiga anotaciones de documentos PDF en Python.

Prueba en línea

Pruebe la siguiente herramienta gratuita de anotación de PDF en línea, que se desarrolla utilizando la API anterior. https://products.groupdocs.app/annotation/pdf

Conclusión

En este artículo, hemos aprendido cómo eliminar anotaciones de documentos PDF en la nube. También hemos visto cómo extraer anotaciones de documentos PDF usando Python. Este artículo también explicó cómo cargar mediante programación un archivo PDF a la nube y descargar el archivo desde la nube. Además, puede aprender aún más sobre GroupDocs.Annotation Cloud API utilizando la documentación. También proporcionamos una sección Referencia de API que le permite visualizar e interactuar con nuestras API directamente a través del navegador. En caso de cualquier ambigüedad, no dude en contactarnos en el foro.

Ver también