Como converter PDF para Excel em Python usando a API REST

Converta PDF para Excel em Python usando a API REST

PDF é um dos formatos de documentos versáteis mais comumente usados para apresentar documentos. Mas é difícil editar um documento PDF. Para extrair facilmente uma tabela ou editar texto em um formato de planilha, você precisa converter PDF em planilhas Excel editáveis. Portanto, você não precisa perder tempo copiando texto manualmente e depois editando-o. Nossas APIs de conversão de PDF para XLS ou PDF para XLSX permitem que você converta PDF em formato de planilha do Excel rapidamente. Neste artigo, aprenderemos como converter PDF para Excel em Python usando a API REST.

Os seguintes tópicos serão abordados neste artigo:

Python PDF to Excel Converter API – Instalação

Para converter o arquivo PDF para o formato Excel, usaremos a API Python SDK of GroupDocs.Conversion Cloud. É uma biblioteca Python de conversão de documentos e imagens independente de plataforma e rica em recursos. Ele fornece conversão rápida de imagens e documentos de qualquer formato de arquivo suportado para qualquer formato de alta qualidade.

Você pode instalar a biblioteca Python de conversão de PDF para XLSX em seu aplicativo Python usando o seguinte comando no console:

pip install groupdocs_conversion_cloud

Por favor, obtenha seu ID e Segredo do cliente no painel antes de seguir as etapas mencionadas. Depois de obter seu ID e segredo, adicione o código em seu aplicativo python:

# Biblioteca Python para conversão de PDF para Excel no aplicativo python
import groupdocs_conversion_cloud

# Obtenha client_id e client_secret em https://dashboard.groupdocs.cloud após o registro gratuito.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Obtenha configurações diferentes
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "local-storage-name"

Agora, vamos demonstrar como converter pdf para o formato xlsx passo a passo usando a API REST em Python.

Como converter PDF para XLSX em Python usando a API REST

Podemos converter o arquivo pdf para o formato excel programaticamente seguindo as etapas simples abaixo:

  • Em primeiro lugar, crie uma instância do ConvertApi
  • Em seguida, crie uma instância de configurações de conversão usando ConvertSettings
  • Em seguida, forneça o nome de armazenamento de arquivos
  • Defina o caminho do arquivo PDF de entrada e o formato de saída como “xlsx”
  • Em seguida, crie uma instância de PdfLoadOptions.
  • Forneça a senha do arquivo PDF
  • Em seguida, defina as opções output\path e load\
  • Depois disso, crie o ConvertDocumentRequest com ConvertSettings como argumento
  • Por fim, converta pdf em excel chamando convert\document() com ConvertDocumentRequest

O exemplo de código a seguir mostra como alterar o formato pdf para excel em Python:

# Como Python Converter PDF para Excel Online
try:
  # Criar uma instância da API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Definir configurações de conversão
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "xlsx"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Criar solicitação de conversão de documento
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Converter arquivo .pdf para o formato .xlsx
  result = convert_api.convert_document(request)
  print("pdf File converted to xlsx successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Por fim, o exemplo de código acima salvará o arquivo xlsx na nuvem. Esta é a melhor maneira de converter pdf em documento excel.

Como converter PDF para XLSX em Python usando a API REST

Como converter PDF para XLSX em Python usando a API REST

Converter intervalo de páginas de PDF para arquivo do Excel em Python

Podemos converter um intervalo de páginas de um documento PDF em Excel seguindo as etapas abaixo:

  • Primeiro, crie uma instância do ConvertApi
  • Em seguida, crie uma instância de configurações de conversão usando ConvertSettings
  • Em seguida, forneça o nome do seu armazenamento em nuvem
  • Defina o caminho do arquivo PDF de entrada e o formato de saída como “xlsx”
  • Em seguida, crie uma instância do XlsConvertOptions
  • Defina as opções de\página e páginas\contagem
  • Em seguida, defina o caminho de saída e convertOptions
  • Agora, crie o ConvertDocumentRequest com ConvertSettings como argumento
  • Por fim, converta pdf em código Excel online chamando o método convert\document() com ConvertDocumentRequest

O exemplo de código a seguir mostra como converter um intervalo de páginas de um documento PDF em um arquivo Excel usando Python:

# Como converter intervalo de páginas de PDF para Excel em Python
# Criar uma instância de API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Prepare as configurações de conversão do Excel
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# Opções de conversão de PDF: número da página inicial e total de páginas a converter
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.from_page = 2 
convertOptions.pages_count = 3

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Criar solicitação de conversão de documento
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Converter páginas de PDF para arquivo Excel
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to Excel file: " + result[0].path)

Por fim, o exemplo de código acima salvará o documento após a conversão de pdf para excel online na nuvem.

Converter páginas específicas de PDF para o formato Excel em Python

Podemos converter páginas específicas de um documento PDF para Excel usando o melhor conversor online de pdf para xlsx com imagens, seguindo as etapas abaixo:

  • Primeiro, crie uma instância do ConvertApi
  • Em seguida, crie uma instância de configurações de conversão usando ConvertSettings
  • Em seguida, forneça o nome do seu armazenamento em nuvem
  • Defina o caminho do arquivo PDF de entrada e o formato de saída como “xlsx”
  • Em seguida, crie uma instância do XlsConvertOptions
  • Adicione o número da página para converter em formato de matriz
  • Em seguida, defina o caminho de saída e convertOptions
  • Agora, crie o ConvertDocumentRequest com ConvertSettings como argumento
  • Por fim, converta pdf em código Excel online chamando o método convert\document() com ConvertDocumentRequest

O exemplo de código a seguir mostra como exportar determinadas páginas de um documento PDF para um arquivo do Excel usando Python:

# Como converter páginas específicas de um arquivo PDF para o formato Excel em Python
# Criar uma instância de API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Definir configurações de conversão
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# Opções de conversão de PDF: números de página para converter
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Criar solicitação de conversão de documento
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Converter arquivo PDF para arquivo Excel
result = convert_api.convert_document(request)
print("Successfully converted PDF file to XLSX document: " + result[0].path)

Por fim, o exemplo de código acima converterá pdf em xlsx com imagens na nuvem. Existe um conversor de código pdf para xlsx online, conforme explicado abaixo.

Conversor de PDF para Excel Online Grátis

Qual é o melhor conversor de PDF para Excel? Groupdocs.Conversion fornece o melhor conversor de pdf para xlsx online grátis para você converter PDF para o formato Excel. Ele foi desenvolvido usando o Groupdocs.Conversion on-line pdf para xlsx API.

Conclusão

Neste artigo, você aprendeu:

  • como converter pdf para xls/xlsx sem perder a formatação em Python;
  • como converter pdf para arquivo excel por intervalo usando Python;
  • converter páginas PDF específicas para o formato XLSX em Python;

Além disso, você pode aprender mais sobre a API de conversão de formato de arquivo GroupDocs.Conversion usando a documentação.

Faça uma pergunta

Você pode fazer suas perguntas sobre como converter arquivo pdf para o formato xlsx, através do nosso Fórum de suporte gratuito

Veja também