Как конвертировать PDF в Excel в Python с помощью REST API

Преобразование PDF в Excel на Python с использованием REST API

PDF — один из наиболее часто используемых универсальных форматов документов для представления документов. Но трудно редактировать документ PDF. Чтобы легко извлечь таблицу или отредактировать текст в формате электронной таблицы, вам необходимо преобразовать PDF в редактируемые электронные таблицы Excel. Таким образом, вам не нужно тратить время на ручное копирование текста, а затем редактировать его. Наши API конвертера PDF в XLS или PDF в XLSX позволяют быстро конвертировать PDF в формат электронных таблиц Excel. В этой статье мы узнаем, как конвертировать PDF в Excel на Python с помощью REST API.

В этой статье должны быть раскрыты следующие темы:

Python PDF to Excel Converter API — установка

Чтобы преобразовать файл PDF в формат Excel, мы будем использовать API Python SDK of GroupDocs.Conversion Cloud. Это многофункциональная, независимая от платформы библиотека Python для преобразования документов и изображений. Обеспечивает быстрое преобразование изображений и документов любого поддерживаемого формата файлов в любой формат в высоком качестве.

Вы можете установить библиотеку Python для преобразования PDF в XLSX в свое приложение Python, используя следующую команду в консоли:

pip install groupdocs_conversion_cloud

Пожалуйста, получите свой идентификатор клиента и секрет из панели управления, прежде чем выполнять указанные шаги. Получив свой идентификатор и секрет, добавьте код в свое приложение Python:

# Библиотека Python для преобразования PDF в Excel в приложении Python
import groupdocs_conversion_cloud

# Получите client_id и client_secret с https://dashboard.groupdocs.cloud после бесплатной регистрации.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Получите разные конфигурации
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "local-storage-name"

Теперь давайте продемонстрируем, как шаг за шагом конвертировать pdf в формат xlsx с помощью REST API в Python.

Как конвертировать PDF в XLSX в Python с помощью REST API

Мы можем преобразовать файл PDF в формат Excel программно, выполнив простые шаги, указанные ниже:

  • Во-первых, создайте экземпляр ConvertApi.
  • Затем создайте экземпляр параметров преобразования с помощью ConvertSettings.
  • Затем укажите имя хранилища файлов
  • Установите путь к входному файлу PDF и выходной формат как «xlsx».
  • Затем создайте экземпляр PdfLoadOptions.
  • Укажите пароль к файлу PDF
  • Затем установите выход\путь и загрузку\параметры
  • После этого создайте ConvertDocumentRequest с ConvertSettings в качестве аргумента.
  • Наконец, конвертируйте pdf в excel, вызвав convert\document() с ConvertDocumentRequest

В следующем примере кода показано, как преобразовать pdf в формат excel в Python:

# Как Python конвертировать PDF в Excel онлайн
try:
  # Создайте экземпляр API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Определить настройки преобразования
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "xlsx"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Создать запрос на преобразование документа
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Преобразование файла .pdf в формат .xlsx
  result = convert_api.convert_document(request)
  print("pdf File converted to xlsx successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Наконец, приведенный выше пример кода сохранит файл xlsx в облаке. Это лучший способ конвертировать pdf в документ excel.

Как конвертировать PDF в XLSX в Python с помощью REST API

Как конвертировать PDF в XLSX в Python с помощью REST API

Преобразование диапазона страниц из PDF в файл Excel в Python

Мы можем преобразовать диапазон страниц документа PDF в Excel, выполнив следующие действия:

  • Сначала создайте экземпляр ConvertApi.
  • Затем создайте экземпляр параметров преобразования с помощью ConvertSettings.
  • Затем укажите имя вашего облачного хранилища
  • Установите путь к входному файлу PDF и выходной формат как «xlsx».
  • Затем создайте экземпляр XlsConvertOptions.
  • Установите параметры from\page и pages\count
  • Затем установите выходной путь и convertOptions
  • Теперь создайте ConvertDocumentRequest с ConvertSettings в качестве аргумента.
  • Наконец, преобразуйте pdf в код Excel онлайн, вызвав метод convert\document() с ConvertDocumentRequest.

В следующем примере кода показано, как преобразовать диапазон страниц из документа PDF в файл Excel с помощью Python:

# Как преобразовать диапазон страниц из PDF в Excel в Python
# Создать экземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Подготовьте настройки конвертации Excel
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# Параметры преобразования PDF: номер начальной страницы и общее количество страниц для преобразования
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.from_page = 2 
convertOptions.pages_count = 3

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Создать запрос на преобразование документа
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Преобразование страниц PDF в файл Excel
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to Excel file: " + result[0].path)

Наконец, приведенный выше пример кода сохранит документ после преобразования из PDF в Excel онлайн в облаке.

Преобразование определенных страниц PDF в формат Excel в Python

Мы можем преобразовать определенные страницы документа PDF в Excel, используя лучший онлайн-конвертер pdf в xlsx с изображениями, выполнив следующие действия:

  • Сначала создайте экземпляр ConvertApi.
  • Затем создайте экземпляр параметров преобразования с помощью ConvertSettings.
  • Затем укажите имя вашего облачного хранилища
  • Установите путь к входному файлу PDF и выходной формат как «xlsx».
  • Затем создайте экземпляр XlsConvertOptions.
  • Добавьте номер страницы для преобразования в формат массива
  • Затем установите выходной путь и convertOptions
  • Теперь создайте ConvertDocumentRequest с ConvertSettings в качестве аргумента.
  • Наконец, преобразуйте pdf в код Excel онлайн, вызвав метод convert\document() с ConvertDocumentRequest.

В следующем примере кода показано, как экспортировать определенные страницы документа PDF в файл Excel с помощью Python:

# Как преобразовать определенные страницы файла PDF в формат Excel в Python
# Создать экземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Определить настройки преобразования
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# Варианты преобразования PDF: номера страниц для преобразования
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Создать запрос на преобразование документа
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Преобразование файла PDF в файл Excel
result = convert_api.convert_document(request)
print("Successfully converted PDF file to XLSX document: " + result[0].path)

Наконец, приведенный выше пример кода преобразует pdf в xlsx с изображениями в облаке. Существует онлайн-конвертер кода pdf в xlsx, как описано ниже.

Онлайн-конвертер PDF в Excel бесплатно

Какой лучший конвертер PDF в Excel? Groupdocs.Conversion предоставляет лучший бесплатный онлайн-конвертер pdf в xlsx для конвертации PDF в формат Excel. Он был разработан с использованием онлайн-интерфейса Groupdocs.Conversion pdf to xlsx API.

Заключение

В этой статье вы узнали:

  • как преобразовать pdf в xls/xlsx без потери форматирования в Python;
  • как преобразовать pdf в файл excel по диапазону с помощью Python;
  • преобразование определенных страниц PDF в формат XLSX в Python;

Кроме того, вы можете узнать больше об API преобразования формата файла GroupDocs.Conversion, используя документацию.

Задайте вопрос

Вы можете задать свои вопросы о том, как преобразовать файл pdf в формат xlsx, через наш Форум бесплатной поддержки

Смотрите также