Python extrait ou supprime les annotations des fichiers Word.

En tant que développeur Python, vous pouvez annoter n’importe quel fichier Word (.doc ou .docx) par programmation sur le cloud. Vous pouvez également extraire ou supprimer toutes les annotations des fichiers Word à l’aide de Python. Les annotations incluent des commentaires, des fenêtres contextuelles et divers autres objets graphiques dans le document fournissant des informations supplémentaires. Cet article se concentrera sur la façon d’extraire ou de supprimer des annotations de fichiers DOCX à l’aide d’une API REST en Python.

Les sujets suivants seront traités dans cet article :

API REST d’annotation de documents et SDK Python

Pour extraire ou supprimer des annotations de fichiers DOC ou DOCX, j’utiliserai l’API Python SDK of GroupDocs.Annotation Cloud. Il vous permet de créer par programmation des outils d’annotation de documents et d’images en ligne. Ces outils peuvent être utilisés pour ajouter des annotations, des superpositions de filigranes, des remplacements de texte, des caviardages, des notes autocollantes et des annotations de texte aux documents commerciaux de tous les formats courants. Il fournit également les SDK .NET, Java, PHP, Ruby et Node.js en tant que membres de la famille d’annotations de documents pour l’API Cloud.

Vous pouvez installer GroupDocs.Annotation Cloud dans votre projet Python à l’aide de la commande suivante dans la console :

pip install groupdocs_annotation_cloud

Veuillez obtenir votre ID client et votre secret client à partir du tableau de bord avant de commencer à suivre les étapes et les exemples de code disponibles. Une fois que vous avez votre identifiant et votre secret, ajoutez le code comme indiqué ci-dessous :

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"

Extraire ou supprimer des annotations de fichiers DOCX à l’aide d’une API REST en Python

Vous pouvez extraire ou supprimer toutes les annotations des fichiers DOCX en suivant les étapes simples mentionnées ci-dessous :

Télécharger le document

Tout d’abord, téléchargez le fichier DOCX sur le Cloud en utilisant l’exemple de code ci-dessous :

# instance d'API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# téléverser un fichier
request = groupdocs_annotation_cloud.UploadFileRequest("input.docx", "C:\\Files\\input.docx", my_storage)
response = file_api.upload_file(request)

Par conséquent, le fichier DOCX téléchargé (input.docx) sera disponible dans la section fichiers de votre tableau de bord sur le cloud.

Extraire des annotations de fichiers DOCX en Python

Veuillez suivre les étapes mentionnées ci-dessous pour extraire les annotations du document Word par programme.

  • Créer une instance d’AnnotateApi
  • Créer une instance FileInfo
  • Définir le chemin du fichier
  • Créer une requête en appelant la méthode ExtractRequest
  • Obtenez des résultats en appelant la méthode AnnotateApi.extract()

L’extrait de code suivant montre comment extraire des annotations du document Word à l’aide d’une API REST.

# instance d'API
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# détails du fichier d'entrée
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# extraire la demande d'annotation
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

L’exemple de code ci-dessus renverra un tableau de toutes les annotations au format JSON, comme indiqué ci-dessous :

Extraire les annotations du fichier DOCX à l'aide de Python

Extraire les annotations du fichier DOCX à l’aide de Python

Supprimer les annotations des fichiers DOCX en Python

Veuillez suivre les étapes mentionnées ci-dessous pour supprimer les annotations du document Word par programmation.

  • Créer une instance d’AnnotateApi
  • Créer une instance FileInfo
  • Définir le chemin du fichier
  • Définir les options de suppression
  • Définir les informations de fichier sur AnnotateOptions
  • Fournir des ID d’annotation à supprimer
  • Définir le chemin du fichier de sortie
  • Créer une requête en appelant la méthode RemoveAnnotationsRequest
  • Obtenez des résultats en appelant la méthode AnnotateApi.remove\annotations()

L’extrait de code suivant montre comment supprimer des annotations du document Word à l’aide d’une API REST. Vous devez mentionner les ID d’annotation qui doivent être supprimés du document.

# instance d'API
api = groupdocs_annotation_cloud.AnnotateApi.from_keys(client_id, client_secret)

# détails du fichier d'entrée
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# supprimer les options
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2,3,4,5,6,7,8,9,10,11]

# fichier de sortie
options.output_path = "output.docx"

# supprimer la demande
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
Supprimer les annotations du fichier DOCX à l'aide de Python

Supprimer les annotations du fichier DOCX à l’aide de Python

Télécharger le fichier de sortie

L’exemple de code ci-dessus enregistrera le fichier DOCX de sortie (output.docx) après avoir supprimé les annotations sur le cloud. Vous pouvez le télécharger à l’aide de l’exemple de code suivant :

# instance d'API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# demande de téléchargement de fichier
request = groupdocs_annotation_cloud.DownloadFileRequest("output.docx", my_storage)
response = file_api.download_file(request)

# Déplacez le fichier téléchargé dans votre répertoire de travail
shutil.move(response, "C:\\Files\\")

Essayez en ligne

Veuillez essayer l’outil d’annotation DOCX en ligne gratuit suivant, qui est développé à l’aide de l’API ci-dessus. https://products.groupdocs.app/annotation/docx

Conclusion

Dans cet article, vous avez appris à extraire ou à supprimer des annotations de documents Word sur le cloud à l’aide de Python. Vous avez également appris à télécharger par programmation le fichier DOCX sur le cloud et à télécharger le fichier à partir du cloud. Vous pouvez en savoir plus sur l’API GroupDocs.Annotation Cloud en utilisant la documentation. Nous fournissons également une section API Reference qui vous permet de visualiser et d’interagir avec nos API directement via le navigateur. En cas d’ambiguïté, n’hésitez pas à nous contacter sur le forum.

Voir également