PDF — один из наиболее часто используемых универсальных форматов документов для представления документов. Но трудно редактировать документ PDF. Чтобы легко извлечь таблицу или отредактировать текст в формате электронной таблицы, вам необходимо преобразовать PDF в редактируемые электронные таблицы Excel. Таким образом, вам не нужно тратить время на ручное копирование текста, а затем редактировать его. Наши API конвертера PDF в XLS или PDF в XLSX позволяют быстро конвертировать PDF в формат электронных таблиц Excel. В этой статье мы узнаем, как конвертировать PDF в Excel на Python с помощью REST API.
В этой статье должны быть раскрыты следующие темы:
- Python PDF to Excel Converter API — установка
- Как конвертировать PDF в XLSX в Python с помощью REST API
- Преобразование диапазона страниц из PDF в файл Excel в Python
- Преобразование определенных страниц PDF в формат Excel в Python
Python PDF to Excel Converter API — установка
Чтобы преобразовать файл PDF в формат Excel, мы будем использовать API Python SDK of GroupDocs.Conversion Cloud. Это многофункциональная, независимая от платформы библиотека Python для преобразования документов и изображений. Обеспечивает быстрое преобразование изображений и документов любого поддерживаемого формата файлов в любой формат в высоком качестве.
Вы можете установить библиотеку Python для преобразования PDF в XLSX в свое приложение Python, используя следующую команду в консоли:
pip install groupdocs_conversion_cloud
Пожалуйста, получите свой идентификатор клиента и секрет из панели управления, прежде чем выполнять указанные шаги. Получив свой идентификатор и секрет, добавьте код в свое приложение Python:
# Библиотека Python для преобразования PDF в Excel в приложении Python
import groupdocs_conversion_cloud
# Получите client_id и client_secret с https://dashboard.groupdocs.cloud после бесплатной регистрации.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# Получите разные конфигурации
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "local-storage-name"
Теперь давайте продемонстрируем, как шаг за шагом конвертировать pdf в формат xlsx с помощью REST API в Python.
Как конвертировать PDF в XLSX в Python с помощью REST API
Мы можем преобразовать файл PDF в формат Excel программно, выполнив простые шаги, указанные ниже:
- Во-первых, создайте экземпляр ConvertApi.
- Затем создайте экземпляр параметров преобразования с помощью ConvertSettings.
- Затем укажите имя хранилища файлов
- Установите путь к входному файлу PDF и выходной формат как «xlsx».
- Затем создайте экземпляр PdfLoadOptions.
- Укажите пароль к файлу PDF
- Затем установите выход\путь и загрузку\параметры
- После этого создайте ConvertDocumentRequest с ConvertSettings в качестве аргумента.
- Наконец, конвертируйте pdf в excel, вызвав convert\document() с ConvertDocumentRequest
В следующем примере кода показано, как преобразовать pdf в формат excel в Python:
# Как Python конвертировать PDF в Excel онлайн
try:
# Создайте экземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# Определить настройки преобразования
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"
loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
loadOptions.password = "password"
settings.load_options = loadOptions
settings.output_path = "python-testing"
# Создать запрос на преобразование документа
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# Преобразование файла .pdf в формат .xlsx
result = convert_api.convert_document(request)
print("pdf File converted to xlsx successfully: " + result[0].path)
except groupdocs_conversion_cloud.ApiException as e:
print("Exception when calling convert_document: {0}".format(e.message))
Наконец, приведенный выше пример кода сохранит файл xlsx в облаке. Это лучший способ конвертировать pdf в документ excel.
Преобразование диапазона страниц из PDF в файл Excel в Python
Мы можем преобразовать диапазон страниц документа PDF в Excel, выполнив следующие действия:
- Сначала создайте экземпляр ConvertApi.
- Затем создайте экземпляр параметров преобразования с помощью ConvertSettings.
- Затем укажите имя вашего облачного хранилища
- Установите путь к входному файлу PDF и выходной формат как «xlsx».
- Затем создайте экземпляр XlsConvertOptions.
- Установите параметры from\page и pages\count
- Затем установите выходной путь и convertOptions
- Теперь создайте ConvertDocumentRequest с ConvertSettings в качестве аргумента.
- Наконец, преобразуйте pdf в код Excel онлайн, вызвав метод convert\document() с ConvertDocumentRequest.
В следующем примере кода показано, как преобразовать диапазон страниц из документа PDF в файл Excel с помощью Python:
# Как преобразовать диапазон страниц из PDF в Excel в Python
# Создать экземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# Подготовьте настройки конвертации Excel
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"
# Параметры преобразования PDF: номер начальной страницы и общее количество страниц для преобразования
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.from_page = 2
convertOptions.pages_count = 3
settings.convert_options = convertOptions
settings.output_path = "python-testing"
# Создать запрос на преобразование документа
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# Преобразование страниц PDF в файл Excel
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to Excel file: " + result[0].path)
Наконец, приведенный выше пример кода сохранит документ после преобразования из PDF в Excel онлайн в облаке.
Преобразование определенных страниц PDF в формат Excel в Python
Мы можем преобразовать определенные страницы документа PDF в Excel, используя лучший онлайн-конвертер pdf в xlsx с изображениями, выполнив следующие действия:
- Сначала создайте экземпляр ConvertApi.
- Затем создайте экземпляр параметров преобразования с помощью ConvertSettings.
- Затем укажите имя вашего облачного хранилища
- Установите путь к входному файлу PDF и выходной формат как «xlsx».
- Затем создайте экземпляр XlsConvertOptions.
- Добавьте номер страницы для преобразования в формат массива
- Затем установите выходной путь и convertOptions
- Теперь создайте ConvertDocumentRequest с ConvertSettings в качестве аргумента.
- Наконец, преобразуйте pdf в код Excel онлайн, вызвав метод convert\document() с ConvertDocumentRequest.
В следующем примере кода показано, как экспортировать определенные страницы документа PDF в файл Excel с помощью Python:
# Как преобразовать определенные страницы файла PDF в формат Excel в Python
# Создать экземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# Определить настройки преобразования
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"
# Варианты преобразования PDF: номера страниц для преобразования
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.pages = [1, 3, 5]
settings.convert_options = convertOptions
settings.output_path = "python-testing"
# Создать запрос на преобразование документа
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# Преобразование файла PDF в файл Excel
result = convert_api.convert_document(request)
print("Successfully converted PDF file to XLSX document: " + result[0].path)
Наконец, приведенный выше пример кода преобразует pdf в xlsx с изображениями в облаке. Существует онлайн-конвертер кода pdf в xlsx, как описано ниже.
Онлайн-конвертер PDF в Excel бесплатно
Какой лучший конвертер PDF в Excel? Groupdocs.Conversion предоставляет лучший бесплатный онлайн-конвертер pdf в xlsx для конвертации PDF в формат Excel. Он был разработан с использованием онлайн-интерфейса Groupdocs.Conversion pdf to xlsx API.
Заключение
В этой статье вы узнали:
- как преобразовать pdf в xls/xlsx без потери форматирования в Python;
- как преобразовать pdf в файл excel по диапазону с помощью Python;
- преобразование определенных страниц PDF в формат XLSX в Python;
Кроме того, вы можете узнать больше об API преобразования формата файла GroupDocs.Conversion, используя документацию.
Задайте вопрос
Вы можете задать свои вопросы о том, как преобразовать файл pdf в формат xlsx, через наш Форум бесплатной поддержки