Python extrae o elimina anotaciones de archivos de Word.

Como desarrollador de Python, puede anotar cualquier archivo de Word (.doc o .docx) mediante programación en la nube. También puede extraer o eliminar todas las anotaciones de los archivos de Word usando Python. Las anotaciones incluyen comentarios, ventanas emergentes y varios otros objetos gráficos en el documento que brindan información adicional. Este artículo se centrará en cómo extraer o eliminar anotaciones de archivos DOCX mediante una API REST en Python.

En este artículo se tratarán los siguientes temas:

API REST de anotación de documentos y SDK de Python

Para extraer o eliminar anotaciones de archivos DOC o DOCX, usaré la API Python SDK de GroupDocs.Annotation Cloud. Le permite crear mediante programación herramientas de anotación de imágenes y documentos en línea. Dichas herramientas se pueden usar para agregar anotaciones, superposiciones de marcas de agua, reemplazos de texto, redacciones, notas adhesivas y marcas de texto a los documentos comerciales de todos los formatos populares. También proporciona los SDK de .NET, Java, PHP, Ruby y Node.js como sus miembros de la familia de anotaciones de documentos para la API de la nube.

Puede instalar GroupDocs.Annotation Cloud en su proyecto de Python usando el siguiente comando en la consola:

pip install groupdocs_annotation_cloud

Obtenga su ID de cliente y Secreto de cliente del panel de control antes de comenzar a seguir los pasos y los ejemplos de código disponibles. Una vez que tenga su ID y secreto, agregue el código como se muestra a continuación:

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"

Extraiga o elimine anotaciones de archivos DOCX usando una API REST en Python

Puede extraer o eliminar todas las anotaciones de los archivos DOCX siguiendo los sencillos pasos que se mencionan a continuación:

Sube el documento

En primer lugar, cargue el archivo DOCX en la nube utilizando el ejemplo de código que se muestra a continuación:

# instancia de API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# subir archivo
request = groupdocs_annotation_cloud.UploadFileRequest("input.docx", "C:\\Files\\input.docx", my_storage)
response = file_api.upload_file(request)

Como resultado, el archivo DOCX cargado (input.docx) estará disponible en la sección de archivos de su tablero en la nube.

Extraer anotaciones de archivos DOCX en Python

Siga los pasos que se mencionan a continuación para extraer anotaciones del documento de Word mediante programación.

  • Crear una instancia de AnnotateApi
  • Crear una instancia de FileInfo
  • Establecer la ruta del archivo
  • Cree una solicitud llamando al método ExtractRequest
  • Obtenga resultados llamando al método AnnotateApi.extract()

El siguiente fragmento de código muestra cómo extraer anotaciones del documento de Word mediante una API REST.

# instancia de API
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# detalles del archivo de entrada
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# extraer solicitud de anotación
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

El ejemplo de código anterior devolverá una matriz de todas las anotaciones en formato JSON como se muestra a continuación:

Extraiga anotaciones del archivo DOCX usando Python

Extraiga anotaciones del archivo DOCX usando Python

Eliminar anotaciones de archivos DOCX en Python

Siga los pasos que se mencionan a continuación para eliminar las anotaciones del documento de Word mediante programación.

  • Crear una instancia de AnnotateApi
  • Crear una instancia de FileInfo
  • Establecer la ruta del archivo
  • Definir QuitarOpciones
  • Establecer información de archivo en AnnotateOptions
  • Proporcione ID de anotación para eliminar
  • Establecer la ruta del archivo de salida
  • Cree una solicitud llamando al método RemoveAnnotationsRequest
  • Obtenga resultados llamando al método AnnotateApi.remove\annotations()

El siguiente fragmento de código muestra cómo eliminar anotaciones del documento de Word mediante una API REST. Debe mencionar los ID de anotación que deben eliminarse del documento.

# instancia de API
api = groupdocs_annotation_cloud.AnnotateApi.from_keys(client_id, client_secret)

# detalles del archivo de entrada
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# eliminar opciones
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2,3,4,5,6,7,8,9,10,11]

# archivo de salida
options.output_path = "output.docx"

# eliminar solicitud
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
Eliminar anotaciones del archivo DOCX usando Python

Eliminar anotaciones del archivo DOCX usando Python

Descargar el archivo de salida

El ejemplo de código anterior guardará el archivo DOCX de salida (output.docx) después de eliminar las anotaciones en la nube. Puede descargarlo utilizando el siguiente ejemplo de código:

# instancia de API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# solicitud de descarga de archivo
request = groupdocs_annotation_cloud.DownloadFileRequest("output.docx", my_storage)
response = file_api.download_file(request)

# Mueva el archivo descargado a su directorio de trabajo
shutil.move(response, "C:\\Files\\")

Prueba en línea

Pruebe la siguiente herramienta de anotación DOCX en línea gratuita, que se desarrolla utilizando la API anterior. https://products.groupdocs.app/annotation/docx

Conclusión

En este artículo, aprendió cómo extraer o eliminar anotaciones de documentos de Word en la nube usando Python. También aprendió cómo cargar mediante programación el archivo DOCX en la nube y descargar el archivo desde la nube. Puede aprender aún más sobre GroupDocs.Annotation Cloud API utilizando la documentación. También proporcionamos una sección Referencia de API que le permite visualizar e interactuar con nuestras API directamente a través del navegador. En caso de cualquier ambigüedad, no dude en contactarnos en el foro.

Ver también