PDF é um dos formatos de arquivo mais usados atualmente que oferece suporte a várias plataformas. Mas é difícil vincular a uma página específica em um documento PDF e os arquivos PDF não são facilmente compartilhados nas redes sociais. Você pode manter a aparência do documento PDF no formato HTML que pode ser manipulado rapidamente. Neste artigo, aprenderemos como converter arquivos PDF para HTML em Python.

Os seguintes tópicos serão abordados neste artigo:

Python PDF to HTML Converter API – Instalação

Para converter arquivos PDF em páginas da Web em HTML, usaremos a API Python SDK do GroupDocs.Conversion Cloud. É uma biblioteca Python de conversão de documentos e imagens independente de plataforma e rica em recursos. Ele fornece conversão rápida de imagens e documentos de qualquer formato de arquivo suportado para qualquer formato de alta qualidade.

Você pode instalar e integrar a biblioteca Python de conversão de PDF para HTML em seus aplicativos Python usando o seguinte comando no console:

pip install groupdocs_conversion_cloud

Por favor, obtenha seu ID e Segredo do cliente no painel antes de seguir as etapas mencionadas. Depois de obter seu ID e segredo, adicione o código em seu aplicativo python:

# Carregar biblioteca Python para conversão de PDF para HTML no aplicativo python
import groupdocs_conversion_cloud

# Obtenha client_id e client_secret em https://dashboard.groupdocs.cloud após o registro gratuito.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Obtenha configurações diferentes
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"

Agora, vamos demonstrar como converter passo a passo o formato pdf para html usando a API REST em Python.

Como converter PDF para HTML online em Python usando a API REST

Podemos converter o arquivo pdf para o formato html programaticamente seguindo as etapas simples fornecidas abaixo:

  • Em primeiro lugar, crie uma instância do ConvertApi
  • Em seguida, crie uma instância de configurações de conversão usando ConvertSettings
  • Em seguida, forneça o nome de armazenamento de arquivos
  • Defina o caminho do arquivo PDF de entrada e o formato de saída como “html”
  • Em seguida, crie uma instância de PdfLoadOptions.
  • Forneça a senha do arquivo PDF
  • Em seguida, defina as opções output\path e load\
  • Depois disso, crie o ConvertDocumentRequest com ConvertSettings como argumento
  • Por fim, converta pdf em html chamando convert\document() com ConvertDocumentRequest

O exemplo de código a seguir mostra como alterar o formato pdf para html em Python:

# Como Python Converter PDF para HTML Online
try:
  # Criar uma instância da API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Definir configurações de conversão
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "html"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Criar solicitação de conversão de documento
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Converter arquivo .pdf em página da web HTML
  result = convert_api.convert_document(request)
  print("pdf File converted to html successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Por fim, o exemplo de código acima salvará o arquivo HTML na nuvem. Esta é a melhor maneira de converter pdf em documento html.

Como converter arquivos PDF para HTML em Python

Como converter arquivos PDF para HTML em Python

Converter intervalo de páginas de arquivo PDF para arquivo HTML em Python

Podemos converter um intervalo de páginas de um documento PDF em HTML seguindo as etapas abaixo:

  • Primeiro, crie uma instância do ConvertApi
  • Em seguida, crie uma instância de configurações de conversão usando ConvertSettings
  • Em seguida, forneça o nome do seu armazenamento em nuvem
  • Defina o caminho do arquivo PDF de entrada e o formato de saída como “html”
  • Em seguida, crie uma instância do HtmlConvertOptions
  • Defina as opções de\página e páginas\contagem
  • Em seguida, defina o caminho de saída e convertOptions
  • Agora, crie o ConvertDocumentRequest com ConvertSettings como argumento
  • Por fim, converta pdf em código html online chamando o método convert\document() com ConvertDocumentRequest

O exemplo de código a seguir mostra como converter um intervalo de páginas de documento PDF em arquivo HTML usando Python:

# Como converter intervalo de páginas de PDF para HTML em Python
# Criar uma instância de API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Prepare as configurações de conversão de html
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Opções de conversão de PDF: número da página inicial e total de páginas a converter
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Criar solicitação de conversão de documento
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Converter páginas de PDF para arquivo HTML
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)

Por fim, o exemplo de código acima salvará o documento após a conversão de pdf para html online na nuvem.

Converter páginas específicas do formato PDF para HTML em Python

Podemos converter páginas específicas de um documento PDF em HTML usando o melhor conversor online de pdf para html com imagens, seguindo as etapas abaixo:

  • Primeiro, crie uma instância do ConvertApi
  • Em seguida, crie uma instância de configurações de conversão usando ConvertSettings
  • Em seguida, forneça o nome do seu armazenamento em nuvem
  • Defina o caminho do arquivo PDF de entrada e o formato de saída como “html”
  • Em seguida, crie uma instância do HtmlConvertOptions
  • Adicione o número da página para converter em formato de matriz
  • Em seguida, defina o caminho de saída e convertOptions
  • Agora, crie o ConvertDocumentRequest com ConvertSettings como argumento
  • Por fim, converta pdf em código html online chamando o método convert\document() com ConvertDocumentRequest

O exemplo de código a seguir mostra como exportar determinadas páginas de um documento PDF para um arquivo HTML usando Python:

# Como converter páginas específicas de arquivo PDF para o formato de página da Web HTML em Python
# Criar uma instância de API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Definir configurações de conversão
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Opções de conversão de PDF: números de página para converter
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Criar solicitação de conversão de documento
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Converter arquivo PDF para arquivo HTML
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)

Por fim, o exemplo de código acima converterá pdf em html com imagens na nuvem. Existe um conversor de código pdf para html online, conforme explicado abaixo.

Conversor de PDF para HTML Online Grátis

Qual é o melhor conversor de PDF para HTML? Groupdocs.Conversion oferece o melhor conversor online de pdf para html grátis para você converter PDF para o formato HTML. Ele foi desenvolvido usando a API online Groupdocs.Conversion pdf to html.

Conclusão

Neste artigo, você aprendeu:

  • como converter pdf para html sem perder a formatação em Python;
  • como converter arquivo pdf para html por intervalo usando Python;
  • converter páginas PDF específicas para o formato HTML em Python;
  • conversor online gratuito de pdf para html;

Além disso, você pode aprender mais sobre a API de conversão de formato de arquivo GroupDocs.Conversion usando a documentação.

Faça uma pergunta

Você pode fazer suas perguntas sobre como converter arquivo pdf para o formato html, através do nosso Fórum de Suporte Gratuito

Veja também