PDF — один из наиболее часто используемых сегодня форматов файлов, обеспечивающий межплатформенную поддержку. Но трудно сделать ссылку на конкретную страницу в документе PDF, а PDF-файлами нелегко поделиться в социальных сетях. Вы можете сохранить внешний вид документа PDF в формате HTML, которым можно быстро манипулировать. В этой статье мы узнаем, как конвертировать файлы PDF в HTML в Python.

В этой статье должны быть раскрыты следующие темы:

Python PDF to HTML Converter API — установка {#Python-PDF-to-HTML-Converter-API — Установка}

Чтобы преобразовать файл PDF в веб-страницы HTML, мы будем использовать API Python SDK of GroupDocs.Conversion Cloud. Это многофункциональная, независимая от платформы библиотека Python для преобразования документов и изображений. Обеспечивает быстрое преобразование изображений и документов любого поддерживаемого формата файлов в любой формат в высоком качестве.

Вы можете установить и интегрировать библиотеку Python для преобразования PDF в HTML в свои приложения Python, используя следующую команду в консоли:

pip install groupdocs_conversion_cloud

Пожалуйста, получите свой идентификатор клиента и секрет из панели управления, прежде чем выполнять указанные шаги. Получив свой идентификатор и секрет, добавьте код в свое приложение Python:

# Загрузите библиотеку Python для преобразования PDF в HTML в приложении Python
import groupdocs_conversion_cloud

# Получите client_id и client_secret с https://dashboard.groupdocs.cloud после бесплатной регистрации.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Получите разные конфигурации
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"

Теперь давайте продемонстрируем, как шаг за шагом конвертировать формат pdf в html, используя REST API в Python.

Как конвертировать PDF в HTML онлайн на Python с помощью REST API

Мы можем преобразовать файл PDF в формат html программно, выполнив простые шаги, указанные ниже:

  • Во-первых, создайте экземпляр ConvertApi.
  • Затем создайте экземпляр параметров преобразования с помощью ConvertSettings.
  • Затем укажите имя хранилища файлов
  • Установите путь к входному файлу PDF и выходной формат как «html».
  • Затем создайте экземпляр PdfLoadOptions.
  • Укажите пароль к файлу PDF
  • Затем установите выход\путь и загрузку\параметры
  • После этого создайте ConvertDocumentRequest с ConvertSettings в качестве аргумента.
  • Наконец, конвертируйте pdf в html, вызвав convert\document() с ConvertDocumentRequest.

В следующем примере кода показано, как изменить формат pdf на html в Python:

# Как Python конвертировать PDF в HTML онлайн
try:
  # Создайте экземпляр API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Определить настройки преобразования
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "html"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Создать запрос на преобразование документа
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Преобразование файла .pdf в веб-страницу HTML
  result = convert_api.convert_document(request)
  print("pdf File converted to html successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Наконец, приведенный выше пример кода сохранит HTML-файл в облаке. Это лучший способ конвертировать pdf в html документ.

Как конвертировать PDF-файлы в HTML в Python

Как конвертировать PDF-файлы в HTML в Python

Преобразование диапазона страниц из файла PDF в файл HTML в Python

Мы можем преобразовать диапазон страниц документа PDF в HTML, выполнив следующие действия:

  • Сначала создайте экземпляр ConvertApi.
  • Затем создайте экземпляр параметров преобразования с помощью ConvertSettings.
  • Затем укажите имя вашего облачного хранилища
  • Установите путь к входному файлу PDF и выходной формат как «html».
  • Затем создайте экземпляр HtmlConvertOptions.
  • Установите параметры from\page и pages\count
  • Затем установите выходной путь и convertOptions
  • Теперь создайте ConvertDocumentRequest с ConvertSettings в качестве аргумента.
  • Наконец, конвертируйте pdf-код в html-код онлайн, вызвав метод convert\document() с ConvertDocumentRequest.

В следующем примере кода показано, как преобразовать диапазон страниц из документа PDF в файл HTML с помощью Python:

# Как преобразовать диапазон страниц из PDF в HTML в Python
# Создать экземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Подготовьте настройки конвертации html
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Параметры преобразования PDF: номер начальной страницы и общее количество страниц для преобразования
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Создать запрос на преобразование документа
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Преобразование страниц PDF в файл HTML
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)

Наконец, приведенный выше пример кода сохранит документ после преобразования из pdf в html онлайн в облаке.

Преобразование определенных страниц из формата PDF в формат HTML в Python

Мы можем преобразовать определенные страницы документа PDF в HTML, используя лучший онлайн-конвертер pdf в html с изображениями, выполнив следующие действия:

  • Сначала создайте экземпляр ConvertApi.
  • Затем создайте экземпляр параметров преобразования с помощью ConvertSettings.
  • Затем укажите имя вашего облачного хранилища
  • Установите путь к входному файлу PDF и выходной формат как «html».
  • Затем создайте экземпляр HtmlConvertOptions.
  • Добавьте номер страницы для преобразования в формат массива
  • Затем установите выходной путь и convertOptions
  • Теперь создайте ConvertDocumentRequest с ConvertSettings в качестве аргумента.
  • Наконец, преобразуйте pdf в html-код онлайн, вызвав метод convert\document() с ConvertDocumentRequest.

В следующем примере кода показано, как экспортировать определенные страницы документа PDF в файл HTML с помощью Python:

# Как преобразовать определенные страницы файла PDF в формат веб-страницы HTML в Python
# Создать экземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Определить настройки преобразования
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Варианты преобразования PDF: номера страниц для преобразования
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Создать запрос на преобразование документа
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Преобразование PDF-файла в HTML-файл
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)

Наконец, приведенный выше пример кода преобразует pdf в html с изображениями в облаке. Существует онлайн-конвертер pdf в html, как описано ниже.

Онлайн-конвертер PDF в HTML бесплатно

Какой лучший конвертер PDF в HTML? Groupdocs.Conversion предоставляет лучший бесплатный онлайн-конвертер pdf в html для преобразования PDF в формат HTML. Он был разработан с использованием онлайн-интерфейса Groupdocs.Conversion pdf to html API.

Заключение

В этой статье вы узнали:

  • как конвертировать pdf в html без потери форматирования в Python;
  • как преобразовать pdf в html файл по диапазону с помощью Python;
  • преобразование определенных страниц PDF в формат HTML в Python;
  • бесплатный онлайн-конвертер pdf в html;

Кроме того, вы можете узнать больше об API преобразования формата файла GroupDocs.Conversion, используя документацию.

Задайте вопрос

Вы можете задать свои вопросы о том, как преобразовать файл PDF в формат html, через наш Бесплатный форум поддержки

Смотрите также