PDF è uno dei formati di file più comunemente usati oggi che fornisce supporto multipiattaforma. Ma è difficile collegarsi a una pagina specifica in un documento PDF e i file PDF non sono facilmente condivisi sui social network. È possibile mantenere l’aspetto del documento PDF nel formato HTML che può essere manipolato rapidamente. In questo articolo impareremo come convertire i file PDF in HTML in Python.

In questo articolo saranno trattati i seguenti argomenti:

API di conversione da PDF a HTML Python – Installazione

Per convertire il file PDF in pagine Web HTML, utilizzeremo l’API Python SDK di GroupDocs.Conversion Cloud. È una libreria Python per la conversione di documenti e immagini indipendente dalla piattaforma e ricca di funzionalità. Fornisce una rapida conversione di immagini e documenti di qualsiasi formato file supportato in qualsiasi formato in alta qualità.

Puoi installare e integrare la libreria Python di conversione da PDF a HTML nelle tue applicazioni Python utilizzando il seguente comando nella console:

pip install groupdocs_conversion_cloud

Si prega di ottenere l’ID cliente e il segreto dalla dashboard prima di seguire i passaggi menzionati. Una volta che hai il tuo ID e segreto, aggiungi il codice nella tua applicazione python:

# Carica la libreria Python per la conversione da PDF a HTML nell'applicazione Python
import groupdocs_conversion_cloud

# Ottieni client_id e client_secret da https://dashboard.groupdocs.cloud dopo la registrazione gratuita.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Ottieni diverse configurazioni
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"

Ora, dimostriamo come convertire passo dopo passo il formato pdf in formato html utilizzando l’API REST in Python.

Come convertire PDF in HTML online in Python utilizzando l’API REST

Possiamo convertire il file pdf in formato html a livello di codice seguendo i semplici passaggi indicati di seguito:

  • Innanzitutto, crea un’istanza di ConvertApi
  • Quindi, crea un’istanza delle impostazioni di conversione utilizzando ConvertSettings
  • Successivamente, fornire il nome di archiviazione dei file
  • Imposta il percorso del file PDF di input e il formato di output come “html”
  • Successivamente, crea un’istanza di PdfLoadOptions.
  • Fornire la password del file PDF
  • Quindi, imposta output\path e load\options
  • Successivamente, crea ConvertDocumentRequest con ConvertSettings come argomento
  • Infine, converti pdf in html chiamando convert\document() con ConvertDocumentRequest

Il seguente esempio di codice mostra come modificare il formato pdf in html in Python:

# Come convertire in Python un PDF in HTML online
try:
  # Crea un'istanza dell'API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Definire le impostazioni di conversione
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "html"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Crea una richiesta di conversione del documento
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Converti file .pdf in pagina web HTML
  result = convert_api.convert_document(request)
  print("pdf File converted to html successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Infine, l’esempio di codice precedente salverà il file HTML nel cloud. Questo è il modo migliore per convertire pdf in documenti html.

Come convertire i file PDF in HTML in Python

Come convertire i file PDF in HTML in Python

Converti intervallo di pagine da file PDF a file HTML in Python

Possiamo convertire un intervallo di pagine di un documento PDF in HTML seguendo i passaggi indicati di seguito:

  • Innanzitutto, crea un’istanza di ConvertApi
  • Quindi, crea un’istanza delle impostazioni di conversione utilizzando ConvertSettings
  • Successivamente, fornisci il nome del tuo archivio cloud
  • Imposta il percorso del file PDF di input e il formato di output come “html”
  • Successivamente, crea un’istanza di HtmlConvertOptions
  • Imposta le opzioni from\page e pages\count
  • Quindi, imposta il percorso di output e convertOptions
  • Ora crea ConvertDocumentRequest con ConvertSettings come argomento
  • Infine, converti il pdf in codice html online chiamando il metodo convert\document() con ConvertDocumentRequest

Il seguente esempio di codice mostra come convertire un intervallo di pagine da un documento PDF a un file HTML utilizzando Python:

# Come convertire un intervallo di pagine da PDF a HTML in Python
# Crea un'istanza dell'API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Preparare le impostazioni di conversione html
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Opzioni di conversione PDF: numero di pagina iniziale e pagine totali da convertire
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Crea una richiesta di conversione del documento
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Converti pagine di PDF in file HTML
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)

Infine, l’esempio di codice sopra riportato salverà il documento dopo la conversione da pdf a html online sul cloud.

Converti pagine specifiche da PDF a formato HTML in Python

Possiamo convertire pagine specifiche di un documento PDF in HTML utilizzando il miglior convertitore da pdf a html online con immagini seguendo i passaggi indicati di seguito:

  • Innanzitutto, crea un’istanza di ConvertApi
  • Quindi, crea un’istanza delle impostazioni di conversione utilizzando ConvertSettings
  • Successivamente, fornisci il nome del tuo archivio cloud
  • Imposta il percorso del file PDF di input e il formato di output come “html”
  • Successivamente, crea un’istanza di HtmlConvertOptions
  • Aggiungi il numero di pagina da convertire in formato array
  • Quindi, imposta il percorso di output e convertOptions
  • Ora crea ConvertDocumentRequest con ConvertSettings come argomento
  • Infine, converti pdf in codice html online chiamando il metodo convert\document() con ConvertDocumentRequest

Il seguente esempio di codice mostra come esportare determinate pagine di un documento PDF in un file HTML utilizzando Python:

# Come convertire pagine specifiche di file PDF in formato di pagina Web HTML in Python
# Crea un'istanza dell'API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Definire le impostazioni di conversione
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Opzioni di conversione PDF: numeri di pagina da convertire
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Crea una richiesta di conversione del documento
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Converti file PDF in file HTML
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)

Infine, l’esempio di codice precedente convertirà pdf in html con immagini sul cloud. Esiste un convertitore online da pdf a codice html come spiegato di seguito.

Convertitore online da PDF a HTML gratuitamente

Qual è il miglior convertitore da PDF a HTML? Groupdocs.Conversion fornisce il miglior convertitore online gratuito da pdf a html per convertire i PDF in formato HTML. È stato sviluppato utilizzando l’API Groupdocs.Conversion online da pdf a html.

Conclusione

In questo articolo hai imparato:

  • come convertire pdf in html senza perdere la formattazione in Python;
  • come convertire pdf in file html per intervallo usando Python;
  • convertire pagine PDF specifiche in formato HTML in Python;
  • convertitore online gratuito da pdf a html;

Inoltre, puoi saperne di più sull’API di conversione del formato di file GroupDocs.Conversion utilizzando la documentazione.

Fai una domanda

Puoi porre le tue domande su come convertire un file pdf in formato html, tramite il nostro Forum di supporto gratuito

Guarda anche