Удалите аннотации из PDF с помощью REST API в Python.

Аннотации предоставляют дополнительную информацию в документе в виде комментариев, всплывающих окон и различных других графических объектов. В некоторых случаях нам может потребоваться удалить аннотации из аннотированных документов PDF. В этой статье мы узнаем, как удалять или извлекать аннотации из PDF-документов с помощью REST API в Python.

В этой статье должны быть раскрыты следующие темы:

REST API и Python SDK для удаления аннотаций

Для извлечения или удаления аннотаций из документов PDF мы будем использовать API Python SDK of GroupDocs.Annotation Cloud. Он позволяет добавлять аннотации, наложения водяных знаков, замену текста и пометки, а также стикеры в поддерживаемые форматы документов. Пожалуйста, установите его с помощью следующей команды в консоли:

pip install groupdocs_annotation_cloud

Пожалуйста, получите свой идентификатор клиента и секрет из панели инструментов, прежде чем выполнять указанные шаги. Получив свой идентификатор и секрет, добавьте код, как показано ниже:

# В этом примере кода показано, как добавить ClientID и секрет
client_id = "659fe7da-715b-4744-a0f7-cf469a392b73"
client_secret = "b377c36cfa28fa69960ebac6b6e36421"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

Удаление аннотаций из PDF-файлов с помощью REST API в Python

Мы можем удалить все аннотации из файлов PDF, выполнив простые шаги, указанные ниже:

Загрузить документ

Во-первых, мы загрузим файл PDF в облако, используя пример кода, приведенный ниже:

# В этом примере кода показано, как загрузить PDF-файл в облако.
# Создать экземпляр API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# Загрузить примеры файлов
request = groupdocs_annotation_cloud.UploadFileRequest("sample.pdf", "C:\\Files\\sample.pdf", my_storage)
response = file_api.upload_file(request)

В результате загруженный файл будет доступен в разделе файлов панели инструментов в облаке.

Удалить аннотации из PDF в Python

Теперь мы удалим аннотации из документа PDF программно, выполнив следующие шаги:

  • Во-первых, создайте экземпляр AnnotateApi.
  • Затем создайте экземпляр FileInfo.
  • Затем укажите путь к входному файлу PDF.
  • Затем создайте экземпляр RemoveOptions.
  • Затем назначьте FileInfo для RemoveOptions.
  • Затем укажите идентификаторы аннотаций в массиве, разделенном запятыми, для удаления.
  • Затем установите путь к выходному файлу.
  • После этого создайте запрос, вызвав метод RemoveAnnotationsRequest с объектом RemoveOptions.
  • Наконец, получите результаты, вызвав метод AnnotateApi.remove\annotations() с RemoveAnnotationsRequest в качестве аргумента.

В следующем примере кода показано, как удалить аннотации из документа PDF с помощью REST API в Python. Нам просто нужно указать идентификаторы аннотаций, которые нужно удалить из документа. Мы можем получить идентификаторы аннотаций, используя метод extract() с ExtractRequest, как описано здесь.

# В этом примере кода показано, как удалить аннотации из PDF.
# Экземпляр API
api = groupdocs_annotation_cloud.AnnotateApi(configuration)

# Сведения о входном файле
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"

# Удалить параметры
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2]

# Выходной файл
options.output_path = "annotations_removed.pdf"

# Удалить запрос
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
Удалить аннотации из PDF в Python.

Удалить аннотации из PDF в Python.

Загрузите выходной файл

Приведенный выше пример кода сохранит выходной файл после удаления аннотаций из файла PDF в облаке. Его можно загрузить с помощью следующего примера кода:

# В этом примере кода показано, как загрузить PDF-файл из облака.
# Инициализация API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# Создать запрос на скачивание файла
request = groupdocs_annotation_cloud.DownloadFileRequest("annotations_removed.pdf", my_storage)

# Загрузить файл
response = file_api.download_file(request)

# Переместите загруженный файл в свой рабочий каталог
shutil.move(response, "C:\\Files\\")

Извлечение аннотаций из PDF-документов в Python

Мы можем программно извлекать аннотации из PDF-документов, выполнив следующие шаги:

  • Во-первых, создайте экземпляр AnnotateApi.
  • Затем создайте экземпляр FileInfo.
  • Затем укажите путь к входному файлу.
  • После этого создайте запрос, вызвав метод ExtractRequest с объектом FileInfo.
  • Наконец, получите результаты, вызвав метод AnnotateApi.extract() с ExtractRequest в качестве аргумента.

В следующем примере кода показано, как извлечь аннотации из документа PDF с помощью REST API в Python.

# В этом примере кода показано, как извлечь аннотации из файла PDF.
# Экземпляр API
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# Сведения о входном файле
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"

# Извлечь запрос аннотации
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

# Показать результаты
for x in range(len(result)):
  print(result[x]);

Приведенный выше пример кода вернет массив всех аннотаций в формате JSON, как показано ниже:

Извлечение аннотаций из PDF-документов в Python.

Извлечение аннотаций из PDF-документов в Python.

Попробуйте онлайн

Попробуйте следующий бесплатный онлайн-инструмент для создания аннотаций PDF, разработанный с использованием указанного выше API. https://products.groupdocs.app/annotation/pdf

Заключение

В этой статье мы узнали, как удалить аннотации из PDF-документов в облаке. Мы также видели, как извлекать аннотации из документов PDF с помощью Python. В этой статье также объясняется, как программно загрузить файл PDF в облако и загрузить файл из облака. Кроме того, вы можете узнать еще больше о GroupDocs.Annotation Cloud API, воспользовавшись документацией. Мы также предоставляем раздел Справочник по API, который позволяет визуализировать наши API и взаимодействовать с ними непосредственно через браузер. В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на форуме.

Смотрите также