PDF — один из наиболее часто используемых сегодня форматов файлов, обеспечивающий межплатформенную поддержку. Но трудно сделать ссылку на конкретную страницу в документе PDF, а PDF-файлами нелегко поделиться в социальных сетях. Вы можете сохранить внешний вид документа PDF в формате HTML, которым можно быстро манипулировать. В этой статье мы узнаем, как конвертировать файлы PDF в HTML в Python.
В этой статье должны быть раскрыты следующие темы:
- Python PDF to HTML Converter API — установка
- Как конвертировать PDF в HTML онлайн на Python с помощью REST API
- Преобразование диапазона страниц из файла PDF в файл HTML в Python
- Преобразование определенных страниц из формата PDF в формат HTML в Python
Python PDF to HTML Converter API — установка {#Python-PDF-to-HTML-Converter-API — Установка}
Чтобы преобразовать файл PDF в веб-страницы HTML, мы будем использовать API Python SDK of GroupDocs.Conversion Cloud. Это многофункциональная, независимая от платформы библиотека Python для преобразования документов и изображений. Обеспечивает быстрое преобразование изображений и документов любого поддерживаемого формата файлов в любой формат в высоком качестве.
Вы можете установить и интегрировать библиотеку Python для преобразования PDF в HTML в свои приложения Python, используя следующую команду в консоли:
pip install groupdocs_conversion_cloud
Пожалуйста, получите свой идентификатор клиента и секрет из панели управления, прежде чем выполнять указанные шаги. Получив свой идентификатор и секрет, добавьте код в свое приложение Python:
# Загрузите библиотеку Python для преобразования PDF в HTML в приложении Python
import groupdocs_conversion_cloud
# Получите client_id и client_secret с https://dashboard.groupdocs.cloud после бесплатной регистрации.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# Получите разные конфигурации
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"
Теперь давайте продемонстрируем, как шаг за шагом конвертировать формат pdf в html, используя REST API в Python.
Как конвертировать PDF в HTML онлайн на Python с помощью REST API
Мы можем преобразовать файл PDF в формат html программно, выполнив простые шаги, указанные ниже:
- Во-первых, создайте экземпляр ConvertApi.
- Затем создайте экземпляр параметров преобразования с помощью ConvertSettings.
- Затем укажите имя хранилища файлов
- Установите путь к входному файлу PDF и выходной формат как «html».
- Затем создайте экземпляр PdfLoadOptions.
- Укажите пароль к файлу PDF
- Затем установите выход\путь и загрузку\параметры
- После этого создайте ConvertDocumentRequest с ConvertSettings в качестве аргумента.
- Наконец, конвертируйте pdf в html, вызвав convert\document() с ConvertDocumentRequest.
В следующем примере кода показано, как изменить формат pdf на html в Python:
# Как Python конвертировать PDF в HTML онлайн
try:
# Создайте экземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# Определить настройки преобразования
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"
loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
loadOptions.password = "password"
settings.load_options = loadOptions
settings.output_path = "python-testing"
# Создать запрос на преобразование документа
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# Преобразование файла .pdf в веб-страницу HTML
result = convert_api.convert_document(request)
print("pdf File converted to html successfully: " + result[0].path)
except groupdocs_conversion_cloud.ApiException as e:
print("Exception when calling convert_document: {0}".format(e.message))
Наконец, приведенный выше пример кода сохранит HTML-файл в облаке. Это лучший способ конвертировать pdf в html документ.
Преобразование диапазона страниц из файла PDF в файл HTML в Python
Мы можем преобразовать диапазон страниц документа PDF в HTML, выполнив следующие действия:
- Сначала создайте экземпляр ConvertApi.
- Затем создайте экземпляр параметров преобразования с помощью ConvertSettings.
- Затем укажите имя вашего облачного хранилища
- Установите путь к входному файлу PDF и выходной формат как «html».
- Затем создайте экземпляр HtmlConvertOptions.
- Установите параметры from\page и pages\count
- Затем установите выходной путь и convertOptions
- Теперь создайте ConvertDocumentRequest с ConvertSettings в качестве аргумента.
- Наконец, конвертируйте pdf-код в html-код онлайн, вызвав метод convert\document() с ConvertDocumentRequest.
В следующем примере кода показано, как преобразовать диапазон страниц из документа PDF в файл HTML с помощью Python:
# Как преобразовать диапазон страниц из PDF в HTML в Python
# Создать экземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# Подготовьте настройки конвертации html
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"
# Параметры преобразования PDF: номер начальной страницы и общее количество страниц для преобразования
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1
convertOptions.pages_count = 1
settings.convert_options = convertOptions
settings.output_path = "python-testing"
# Создать запрос на преобразование документа
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# Преобразование страниц PDF в файл HTML
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)
Наконец, приведенный выше пример кода сохранит документ после преобразования из pdf в html онлайн в облаке.
Преобразование определенных страниц из формата PDF в формат HTML в Python
Мы можем преобразовать определенные страницы документа PDF в HTML, используя лучший онлайн-конвертер pdf в html с изображениями, выполнив следующие действия:
- Сначала создайте экземпляр ConvertApi.
- Затем создайте экземпляр параметров преобразования с помощью ConvertSettings.
- Затем укажите имя вашего облачного хранилища
- Установите путь к входному файлу PDF и выходной формат как «html».
- Затем создайте экземпляр HtmlConvertOptions.
- Добавьте номер страницы для преобразования в формат массива
- Затем установите выходной путь и convertOptions
- Теперь создайте ConvertDocumentRequest с ConvertSettings в качестве аргумента.
- Наконец, преобразуйте pdf в html-код онлайн, вызвав метод convert\document() с ConvertDocumentRequest.
В следующем примере кода показано, как экспортировать определенные страницы документа PDF в файл HTML с помощью Python:
# Как преобразовать определенные страницы файла PDF в формат веб-страницы HTML в Python
# Создать экземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# Определить настройки преобразования
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"
# Варианты преобразования PDF: номера страниц для преобразования
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]
settings.convert_options = convertOptions
settings.output_path = "python-testing"
# Создать запрос на преобразование документа
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# Преобразование PDF-файла в HTML-файл
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)
Наконец, приведенный выше пример кода преобразует pdf в html с изображениями в облаке. Существует онлайн-конвертер pdf в html, как описано ниже.
Онлайн-конвертер PDF в HTML бесплатно
Какой лучший конвертер PDF в HTML? Groupdocs.Conversion предоставляет лучший бесплатный онлайн-конвертер pdf в html для преобразования PDF в формат HTML. Он был разработан с использованием онлайн-интерфейса Groupdocs.Conversion pdf to html API.
Заключение
В этой статье вы узнали:
- как конвертировать pdf в html без потери форматирования в Python;
- как преобразовать pdf в html файл по диапазону с помощью Python;
- преобразование определенных страниц PDF в формат HTML в Python;
- бесплатный онлайн-конвертер pdf в html;
Кроме того, вы можете узнать больше об API преобразования формата файла GroupDocs.Conversion, используя документацию.
Задайте вопрос
Вы можете задать свои вопросы о том, как преобразовать файл PDF в формат html, через наш Бесплатный форум поддержки