Python витягує або видаляє анотації з файлів Word.

Як розробник Python, ви можете програмно анотувати будь-який файл Word (.doc або .docx) у хмарі. Ви також можете витягнути або видалити всі анотації з файлів Word за допомогою Python. Анотації включають коментарі, спливаючі вікна та різні інші графічні об’єкти в документі, що надають додаткову інформацію. Ця стаття буде зосереджена на тому, як витягнути або видалити анотації з файлів DOCX за допомогою REST API у Python.

У цій статті будуть розглянуті такі теми:

Анотація документа REST API та Python SDK

Для видобування або видалення анотацій із файлів DOC або DOCX я буду використовувати API Python SDK GroupDocs.Annotation Cloud. Це дозволяє програмним шляхом створювати онлайн-інструменти анотування документів і зображень. Такі інструменти можна використовувати для додавання анотацій, накладень водяних знаків, замін тексту, редагування, наліпок і текстових розміток до ділових документів усіх популярних форматів. Він також надає .NET, Java, PHP, Ruby та Node.js SDK як члени сімейства анотацій документів для Cloud API.

Ви можете встановити GroupDocs.Annotation Cloud у свій проект Python за допомогою такої команди в консолі:

pip install groupdocs_annotation_cloud

Будь ласка, отримайте свій ідентифікатор клієнта та секрет клієнта з інформаційної панелі, перш ніж почати виконувати кроки та доступні приклади коду. Отримавши ідентифікатор і секрет, додайте код, як показано нижче:

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"

Видобувайте або видаляйте анотації з файлів DOCX за допомогою REST API у Python

Ви можете витягнути або видалити всі анотації з файлів DOCX, виконавши прості дії, зазначені нижче:

Завантажте документ

По-перше, завантажте файл DOCX у хмару, використовуючи наведений нижче приклад коду:

# екземпляр API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# завантажити файл
request = groupdocs_annotation_cloud.UploadFileRequest("input.docx", "C:\\Files\\input.docx", my_storage)
response = file_api.upload_file(request)

У результаті завантажений файл DOCX (input.docx) буде доступний у розділі файлів вашої інформаційної панелі в хмарі.

Витягніть анотації з файлів DOCX на Python

Виконайте наведені нижче кроки, щоб отримати анотації з документа Word програмним шляхом.

  • Створіть екземпляр AnnotateApi
  • Створіть екземпляр FileInfo
  • Встановіть шлях до файлу
  • Створіть запит, викликавши метод ExtractRequest
  • Отримайте результати, викликавши метод AnnotateApi.extract().

У наведеному нижче фрагменті коду показано, як отримати анотації з документа Word за допомогою REST API.

# екземпляр API
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# деталі вхідного файлу
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# запит на вилучення анотації
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

Наведений вище приклад коду поверне масив усіх анотацій у форматі JSON, як показано нижче:

Витягніть анотації з файлу DOCX за допомогою Python

Витягніть анотації з файлу DOCX за допомогою Python

Видаліть анотації з файлів DOCX у Python

Виконайте наведені нижче кроки, щоб видалити анотації з документа Word програмним шляхом.

  • Створіть екземпляр AnnotateApi
  • Створіть екземпляр FileInfo
  • Встановіть шлях до файлу
  • Визначте RemoveOptions
  • Установіть для інформації про файл значення AnnotateOptions
  • Укажіть ідентифікатори анотацій для видалення
  • Встановити вихідний шлях до файлу
  • Створіть запит, викликавши метод RemoveAnnotationsRequest
  • Отримайте результати, викликавши метод AnnotateApi.remove\annotations()

У наведеному нижче фрагменті коду показано, як видалити анотації з документа Word за допомогою REST API. Потрібно вказати ідентифікатори анотацій, які потрібно видалити з документа.

# екземпляр API
api = groupdocs_annotation_cloud.AnnotateApi.from_keys(client_id, client_secret)

# деталі вхідного файлу
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# видалити параметри
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2,3,4,5,6,7,8,9,10,11]

# вихідний файл
options.output_path = "output.docx"

# видалити запит
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
Видаліть анотації з файлу DOCX за допомогою Python

Видаліть анотації з файлу DOCX за допомогою Python

Завантажте вихідний файл

Наведений вище приклад коду збереже вихідний файл DOCX (output.docx) після видалення анотацій у хмарі. Ви можете завантажити його за допомогою наступного зразка коду:

# екземпляр API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# запит на завантаження файлу
request = groupdocs_annotation_cloud.DownloadFileRequest("output.docx", my_storage)
response = file_api.download_file(request)

# Перемістіть завантажений файл у свій робочий каталог
shutil.move(response, "C:\\Files\\")

Спробуйте онлайн

Будь ласка, спробуйте наведений нижче безкоштовний онлайн-інструмент анотації DOCX, розроблений за допомогою вищезазначеного API. https://products.groupdocs.app/annotation/docx

Висновок

У цій статті ви дізналися, як видобувати або видаляти анотації з документів Word у хмарі за допомогою Python. Ви також дізналися, як програмно завантажити файл DOCX у хмару та завантажити файл із хмари. Ви можете дізнатися більше про GroupDocs.Annotation Cloud API за допомогою документації. Ми також надаємо розділ API Reference, який дозволяє візуалізувати наші API та взаємодіяти з ними безпосередньо через браузер. У разі будь-яких неясностей зв’яжіться з нами на форумі.

Дивись також