PDF je dnes jeden z nejběžněji používaných formátů souborů, který poskytuje podporu napříč platformami. Je ale obtížné odkazovat na konkrétní stránku v dokumentu PDF a soubory PDF nelze snadno sdílet na sociálních sítích. Vzhled a chování dokumentu PDF můžete zachovat ve formátu HTML, se kterým lze rychle manipulovat. V tomto článku se naučíme, jak převést soubory PDF do HTML v Pythonu.

Tento článek bude obsahovat následující témata:

Python PDF to HTML Converter API – instalace

Abychom mohli převést soubor PDF na webové stránky HTML, použijeme Python SDK of GroupDocs.Conversion Cloud API. Jedná se o funkčně bohatou knihovnu Python pro konverzi dokumentů a obrázků nezávislou na platformě. Poskytuje rychlý převod obrázků a dokumentů jakéhokoli podporovaného formátu souboru do jakéhokoli formátu ve vysoké kvalitě.

Knihovnu Python pro převod PDF do HTML můžete nainstalovat a integrovat do svých aplikací Python pomocí následujícího příkazu v konzole:

pip install groupdocs_conversion_cloud

Před provedením uvedených kroků získejte své ID klienta a tajný klíč z řídicího panelu. Jakmile budete mít své ID a tajemství, přidejte kód do aplikace python:

# Načtěte knihovnu Python pro převod PDF do HTML v aplikaci python
import groupdocs_conversion_cloud

# Získejte client_id a client_secret z https://dashboard.groupdocs.cloud po bezplatné registraci.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Získejte různé konfigurace
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"

Nyní si ukážeme, jak převést pdf do formátu html krok za krokem pomocí REST API v Pythonu.

Jak převést PDF do HTML Online v Pythonu pomocí REST API

Soubor PDF můžeme převést do formátu html programově podle následujících jednoduchých kroků:

  • Nejprve vytvořte instanci ConvertApi
  • Poté vytvořte instanci nastavení převodu pomocí ConvertSettings
  • Dále zadejte název úložiště souborů
  • Nastavit cestu vstupního souboru PDF a výstupní formát jako „html“
  • Dále vytvořte instanci PdfLoadOptions.
  • Zadejte heslo souboru PDF
  • Poté nastavte output\path a load\options
  • Poté vytvořte ConvertDocumentRequest s ConvertSettings jako argumentem
  • Nakonec převeďte pdf na html voláním convert\document() pomocí ConvertDocumentRequest

Následující ukázka kódu ukazuje, jak změnit formát pdf na formát html v Pythonu:

# Jak Python převést PDF do HTML online
try:
  # Vytvořte instanci rozhraní API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Definujte nastavení převodu
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "html"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Vytvořit žádost o převod dokumentu
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Převést soubor .pdf na webovou stránku HTML
  result = convert_api.convert_document(request)
  print("pdf File converted to html successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Nakonec výše uvedená ukázka kódu uloží soubor HTML do cloudu. Toto je nejlepší způsob, jak převést pdf na html dokument.

Jak převést soubory PDF do HTML v Pythonu

Jak převést soubory PDF do HTML v Pythonu

Převeďte rozsah stránek ze souboru PDF do souboru HTML v Pythonu

Rozsah stránek dokumentu PDF můžeme převést do HTML pomocí následujících kroků:

  • Nejprve vytvořte instanci ConvertApi
  • Poté vytvořte instanci nastavení převodu pomocí ConvertSettings
  • Dále zadejte název cloudového úložiště
  • Nastavit cestu vstupního souboru PDF a výstupní formát jako „html“
  • Dále vytvořte instanci HtmlConvertOptions
  • Nastavte možnosti from\page a pages\count
  • Poté nastavte výstupní cestu a convertOptions
  • Nyní vytvořte ConvertDocumentRequest s ConvertSettings jako argument
  • Nakonec převeďte pdf na html kód online voláním metody convert\document() pomocí ConvertDocumentRequest

Následující ukázka kódu ukazuje, jak převést rozsah stránek z dokumentu PDF do souboru HTML pomocí Pythonu:

# Jak převést rozsah stránek z PDF do HTML v Pythonu
# Vytvořte instanci API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Připravte nastavení převodu html
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Možnosti převodu PDF: číslo úvodní stránky a celkový počet stránek k převodu
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Vytvořit žádost o převod dokumentu
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Převést stránky PDF do HTML souboru
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)

Nakonec výše uvedená ukázka kódu uloží dokument po převodu z pdf do html online v cloudu.

Převeďte konkrétní stránky z PDF do formátu HTML v Pythonu

Konkrétní stránky dokumentu PDF můžeme převést do HTML pomocí nejlepšího online převodníku pdf do html s obrázky podle následujících kroků:

  • Nejprve vytvořte instanci ConvertApi
  • Poté vytvořte instanci nastavení převodu pomocí ConvertSettings
  • Dále zadejte název cloudového úložiště
  • Nastavit cestu vstupního souboru PDF a výstupní formát jako „html“
  • Dále vytvořte instanci HtmlConvertOptions
  • Přidejte číslo stránky, kterou chcete převést do formátu pole
  • Poté nastavte výstupní cestu a convertOptions
  • Nyní vytvořte ConvertDocumentRequest s ConvertSettings jako argument
  • Nakonec převeďte pdf na html kód online voláním metody convert\document() pomocí ConvertDocumentRequest

Následující ukázka kódu ukazuje, jak exportovat určité stránky dokumentu PDF do souboru HTML pomocí Pythonu:

# Jak převést konkrétní stránky souboru PDF do formátu webové stránky HTML v Pythonu
# Vytvořte instanci API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Definujte nastavení převodu
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Možnosti převodu PDF: čísla stránek k převodu
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Vytvořit žádost o převod dokumentu
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Převést soubor PDF na soubor HTML
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)

Nakonec výše uvedená ukázka kódu převede pdf do html s obrázky v cloudu. Existuje online konvertor kódu pdf na html, jak je vysvětleno níže.

Online převodník PDF do HTML zdarma

Jaký je nejlepší převodník PDF do HTML? Groupdocs.Conversion poskytuje nejlepší online převodník PDF do HTML zdarma pro převod PDF do formátu HTML. Byl vyvinut pomocí Groupdocs.Conversion online pdf to html API.

Závěr

V tomto článku jste se dozvěděli:

  • jak převést pdf na html bez ztráty formátování v Pythonu;
  • jak převést pdf na html soubor podle rozsahu pomocí Pythonu;
  • převod konkrétních stránek PDF do formátu HTML v Pythonu;
  • bezplatný online převodník pdf do html;

Kromě toho se můžete dozvědět více o rozhraní API pro konverzi formátu souborů GroupDocs.Conversion pomocí dokumentace.

Položit otázku

Své dotazy ohledně převodu souboru pdf do formátu html můžete položit prostřednictvím našeho Free Support Forum

Viz také