PDF є одним із найпоширеніших форматів файлів сьогодні, який підтримує крос-платформу. Але важко зробити посилання на конкретну сторінку в PDF-документі, а PDF-файли нелегко поділитися в соціальних мережах. Ви можете зберегти зовнішній вигляд документа PDF у форматі HTML, яким можна швидко керувати. У цій статті ми дізнаємося, як конвертувати файли PDF у HTML за допомогою Python.

У цій статті будуть розглянуті такі теми:

Python PDF to HTML Converter API – встановлення

Щоб конвертувати PDF-файл у веб-сторінки HTML, ми будемо використовувати Python SDK GroupDocs.Conversion Cloud API. Це багатофункціональна, незалежна від платформи бібліотека Python для конвертації документів і зображень. Він забезпечує швидке перетворення зображень і документів будь-якого підтримуваного формату файлу у будь-який формат високої якості.

Ви можете встановити та інтегрувати бібліотеку Python для перетворення PDF у HTML у свої програми Python за допомогою такої команди в консолі:

pip install groupdocs_conversion_cloud

Будь ласка, отримайте свій ідентифікатор клієнта та секрет на інформаційній панелі, перш ніж виконувати вказані дії. Отримавши ідентифікатор і секрет, додайте код у програму python:

# Завантажте бібліотеку Python для перетворення PDF у HTML у програмі python
import groupdocs_conversion_cloud

# Отримайте client_id і client_secret на https://dashboard.groupdocs.cloud після безкоштовної реєстрації.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Отримайте різні конфігурації
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"

Тепер давайте продемонструємо, як крок за кроком перетворити pdf у формат html за допомогою REST API у Python.

Як конвертувати PDF у HTML онлайн на Python за допомогою REST API

Ми можемо програмно конвертувати pdf-файл у формат html, дотримуючись простих кроків, наведених нижче:

  • По-перше, створіть екземпляр ConvertApi
  • Потім створіть екземпляр параметрів перетворення за допомогою ConvertSettings
  • Далі вкажіть назву сховища файлів
  • Установіть шлях до вхідного PDF-файлу та вихідний формат як “html”
  • Далі створіть екземпляр PdfLoadOptions.
  • Введіть пароль PDF-файлу
  • Потім встановіть вихід\шлях і параметри завантаження
  • Після цього створіть ConvertDocumentRequest із ConvertSettings як аргумент
  • Нарешті, перетворіть pdf на html, викликавши convert\document() за допомогою ConvertDocumentRequest

У наведеному нижче прикладі коду показано, як змінити формат pdf на html у Python:

# Як Python конвертувати PDF у HTML онлайн
try:
  # Створіть екземпляр API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Визначте параметри конвертації
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "html"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Створити запит на конвертацію документа
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Перетворення файлу .pdf на веб-сторінку HTML
  result = convert_api.convert_document(request)
  print("pdf File converted to html successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Нарешті, наведений вище зразок коду збереже файл HTML у хмарі. Це найкращий спосіб конвертувати pdf в html документ.

Як конвертувати PDF-файли в HTML на Python

Як конвертувати PDF-файли в HTML на Python

Перетворення діапазону сторінок із файлу PDF у файл HTML у Python

Ми можемо конвертувати діапазон сторінок документа PDF у HTML, виконавши наведені нижче дії.

  • Спочатку створіть екземпляр ConvertApi
  • Потім створіть екземпляр параметрів перетворення за допомогою ConvertSettings
  • Далі введіть назву вашого хмарного сховища
  • Установіть шлях до вхідного PDF-файлу та вихідний формат як «html»
  • Далі створіть екземпляр HtmlConvertOptions
  • Установіть параметри from\page і pages\count
  • Потім встановіть вихідний шлях і convertOptions
  • Тепер створіть ConvertDocumentRequest із ConvertSettings як аргумент
  • Нарешті, конвертуйте pdf-код у html-код онлайн, викликавши метод convert\document() за допомогою ConvertDocumentRequest

У наведеному нижче прикладі коду показано, як перетворити діапазон сторінок із документа PDF у файл HTML за допомогою Python:

# Як конвертувати діапазон сторінок із PDF у HTML на Python
# Створіть екземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Підготуйте налаштування конвертації html
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Параметри конвертації PDF: номер початкової сторінки та загальна кількість сторінок для конвертації
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Створити запит на конвертацію документа
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Перетворюйте сторінки файлу PDF у файл HTML
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)

Нарешті, наведений вище зразок коду збереже документ після конвертації з pdf у html онлайн у хмарі.

Перетворення певних сторінок із формату PDF у формат HTML у Python

Ми можемо конвертувати певні сторінки PDF-документа в HTML за допомогою найкращого онлайн-конвертера pdf у html із зображеннями, дотримуючись наведених нижче кроків:

  • Спочатку створіть екземпляр ConvertApi
  • Потім створіть екземпляр параметрів перетворення за допомогою ConvertSettings
  • Далі введіть назву вашого хмарного сховища
  • Установіть шлях до вхідного PDF-файлу та вихідний формат як «html»
  • Далі створіть екземпляр HtmlConvertOptions
  • Додайте номер сторінки для перетворення у формат масиву
  • Потім встановіть вихідний шлях і convertOptions
  • Тепер створіть ConvertDocumentRequest із ConvertSettings як аргумент
  • Нарешті, конвертуйте pdf-код у html-код онлайн, викликавши метод convert\document() за допомогою ConvertDocumentRequest

У наведеному нижче прикладі коду показано, як експортувати певні сторінки документа PDF у файл HTML за допомогою Python:

# Як конвертувати певні сторінки файлу PDF у формат веб-сторінки HTML у Python
# Створіть екземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Визначте параметри конвертації
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Параметри конвертації PDF: номери сторінок для конвертації
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Створити запит на конвертацію документа
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Перетворення файлу PDF у файл HTML
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)

Нарешті, наведений вище зразок коду перетворить pdf на html із зображеннями в хмарі. Існує онлайн-конвертер коду pdf у html, як описано нижче.

Безкоштовний онлайн-конвертер PDF у HTML

Який найкращий конвертер PDF у HTML? Groupdocs.Conversion пропонує найкращий безкоштовний онлайн-конвертер pdf у html для конвертації PDF у формат HTML. Його було розроблено за допомогою API Groupdocs.Conversion онлайн pdf у html.

Висновок

У цій статті ви дізналися:

  • як конвертувати pdf в html без втрати форматування в Python;
  • як конвертувати pdf в html файл за діапазоном за допомогою Python;
  • конвертація певних сторінок PDF у формат HTML на Python;
  • безкоштовний онлайн конвертер pdf в html;

Крім того, ви можете дізнатися більше про API перетворення формату файлу GroupDocs.Conversion за допомогою документації.

Задайте питання

Ви можете поставити свої запитання про те, як конвертувати файл pdf у формат html, на нашому безкоштовному форумі підтримки

Дивись також