PDF є одним із найпоширеніших форматів файлів сьогодні, який підтримує крос-платформу. Але важко зробити посилання на конкретну сторінку в PDF-документі, а PDF-файли нелегко поділитися в соціальних мережах. Ви можете зберегти зовнішній вигляд документа PDF у форматі HTML, яким можна швидко керувати. У цій статті ми дізнаємося, як конвертувати файли PDF у HTML за допомогою Python.
У цій статті будуть розглянуті такі теми:
- Python PDF to HTML Converter API – встановлення
- Як конвертувати PDF у HTML онлайн на Python за допомогою REST API
- Перетворення діапазону сторінок із файлу PDF у файл HTML у Python
- Перетворення певних сторінок із формату PDF у формат HTML у Python
Python PDF to HTML Converter API – встановлення
Щоб конвертувати PDF-файл у веб-сторінки HTML, ми будемо використовувати Python SDK GroupDocs.Conversion Cloud API. Це багатофункціональна, незалежна від платформи бібліотека Python для конвертації документів і зображень. Він забезпечує швидке перетворення зображень і документів будь-якого підтримуваного формату файлу у будь-який формат високої якості.
Ви можете встановити та інтегрувати бібліотеку Python для перетворення PDF у HTML у свої програми Python за допомогою такої команди в консолі:
pip install groupdocs_conversion_cloud
Будь ласка, отримайте свій ідентифікатор клієнта та секрет на інформаційній панелі, перш ніж виконувати вказані дії. Отримавши ідентифікатор і секрет, додайте код у програму python:
# Завантажте бібліотеку Python для перетворення PDF у HTML у програмі python
import groupdocs_conversion_cloud
# Отримайте client_id і client_secret на https://dashboard.groupdocs.cloud після безкоштовної реєстрації.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# Отримайте різні конфігурації
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"
Тепер давайте продемонструємо, як крок за кроком перетворити pdf у формат html за допомогою REST API у Python.
Як конвертувати PDF у HTML онлайн на Python за допомогою REST API
Ми можемо програмно конвертувати pdf-файл у формат html, дотримуючись простих кроків, наведених нижче:
- По-перше, створіть екземпляр ConvertApi
- Потім створіть екземпляр параметрів перетворення за допомогою ConvertSettings
- Далі вкажіть назву сховища файлів
- Установіть шлях до вхідного PDF-файлу та вихідний формат як “html”
- Далі створіть екземпляр PdfLoadOptions.
- Введіть пароль PDF-файлу
- Потім встановіть вихід\шлях і параметри завантаження
- Після цього створіть ConvertDocumentRequest із ConvertSettings як аргумент
- Нарешті, перетворіть pdf на html, викликавши convert\document() за допомогою ConvertDocumentRequest
У наведеному нижче прикладі коду показано, як змінити формат pdf на html у Python:
# Як Python конвертувати PDF у HTML онлайн
try:
# Створіть екземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# Визначте параметри конвертації
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"
loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
loadOptions.password = "password"
settings.load_options = loadOptions
settings.output_path = "python-testing"
# Створити запит на конвертацію документа
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# Перетворення файлу .pdf на веб-сторінку HTML
result = convert_api.convert_document(request)
print("pdf File converted to html successfully: " + result[0].path)
except groupdocs_conversion_cloud.ApiException as e:
print("Exception when calling convert_document: {0}".format(e.message))
Нарешті, наведений вище зразок коду збереже файл HTML у хмарі. Це найкращий спосіб конвертувати pdf в html документ.
Перетворення діапазону сторінок із файлу PDF у файл HTML у Python
Ми можемо конвертувати діапазон сторінок документа PDF у HTML, виконавши наведені нижче дії.
- Спочатку створіть екземпляр ConvertApi
- Потім створіть екземпляр параметрів перетворення за допомогою ConvertSettings
- Далі введіть назву вашого хмарного сховища
- Установіть шлях до вхідного PDF-файлу та вихідний формат як «html»
- Далі створіть екземпляр HtmlConvertOptions
- Установіть параметри from\page і pages\count
- Потім встановіть вихідний шлях і convertOptions
- Тепер створіть ConvertDocumentRequest із ConvertSettings як аргумент
- Нарешті, конвертуйте pdf-код у html-код онлайн, викликавши метод convert\document() за допомогою ConvertDocumentRequest
У наведеному нижче прикладі коду показано, як перетворити діапазон сторінок із документа PDF у файл HTML за допомогою Python:
# Як конвертувати діапазон сторінок із PDF у HTML на Python
# Створіть екземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# Підготуйте налаштування конвертації html
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"
# Параметри конвертації PDF: номер початкової сторінки та загальна кількість сторінок для конвертації
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1
convertOptions.pages_count = 1
settings.convert_options = convertOptions
settings.output_path = "python-testing"
# Створити запит на конвертацію документа
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# Перетворюйте сторінки файлу PDF у файл HTML
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)
Нарешті, наведений вище зразок коду збереже документ після конвертації з pdf у html онлайн у хмарі.
Перетворення певних сторінок із формату PDF у формат HTML у Python
Ми можемо конвертувати певні сторінки PDF-документа в HTML за допомогою найкращого онлайн-конвертера pdf у html із зображеннями, дотримуючись наведених нижче кроків:
- Спочатку створіть екземпляр ConvertApi
- Потім створіть екземпляр параметрів перетворення за допомогою ConvertSettings
- Далі введіть назву вашого хмарного сховища
- Установіть шлях до вхідного PDF-файлу та вихідний формат як «html»
- Далі створіть екземпляр HtmlConvertOptions
- Додайте номер сторінки для перетворення у формат масиву
- Потім встановіть вихідний шлях і convertOptions
- Тепер створіть ConvertDocumentRequest із ConvertSettings як аргумент
- Нарешті, конвертуйте pdf-код у html-код онлайн, викликавши метод convert\document() за допомогою ConvertDocumentRequest
У наведеному нижче прикладі коду показано, як експортувати певні сторінки документа PDF у файл HTML за допомогою Python:
# Як конвертувати певні сторінки файлу PDF у формат веб-сторінки HTML у Python
# Створіть екземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# Визначте параметри конвертації
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"
# Параметри конвертації PDF: номери сторінок для конвертації
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]
settings.convert_options = convertOptions
settings.output_path = "python-testing"
# Створити запит на конвертацію документа
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# Перетворення файлу PDF у файл HTML
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)
Нарешті, наведений вище зразок коду перетворить pdf на html із зображеннями в хмарі. Існує онлайн-конвертер коду pdf у html, як описано нижче.
Безкоштовний онлайн-конвертер PDF у HTML
Який найкращий конвертер PDF у HTML? Groupdocs.Conversion пропонує найкращий безкоштовний онлайн-конвертер pdf у html для конвертації PDF у формат HTML. Його було розроблено за допомогою API Groupdocs.Conversion онлайн pdf у html.
Висновок
У цій статті ви дізналися:
- як конвертувати pdf в html без втрати форматування в Python;
- як конвертувати pdf в html файл за діапазоном за допомогою Python;
- конвертація певних сторінок PDF у формат HTML на Python;
- безкоштовний онлайн конвертер pdf в html;
Крім того, ви можете дізнатися більше про API перетворення формату файлу GroupDocs.Conversion за допомогою документації.
Задайте питання
Ви можете поставити свої запитання про те, як конвертувати файл pdf у формат html, на нашому безкоштовному форумі підтримки