Cómo convertir PDF a Excel en Python usando REST API

Convierta PDF a Excel en Python usando REST API

PDF es uno de los formatos de documentos versátiles más utilizados para presentar documentos. Pero es difícil editar un documento PDF. Para extraer fácilmente una tabla o editar texto en formato de hoja de cálculo, debe convertir PDF a hojas de cálculo Excel editables. Por lo tanto, no necesita perder tiempo copiando manualmente el texto y luego editándolo. Nuestras API de conversión de PDF a XLS o PDF a XLSX le permiten convertir PDF a formato de hoja de cálculo de Excel rápidamente. En este artículo, aprenderemos cómo convertir PDF a Excel en Python utilizando la API REST.

En este artículo se tratarán los siguientes temas:

Python PDF to Excel Converter API – Instalación

Para convertir un archivo PDF a formato Excel, utilizaremos la API Python SDK de GroupDocs.Conversion Cloud. Es una biblioteca de Python de conversión de documentos e imágenes independiente de la plataforma y rica en características. Proporciona una conversión rápida de imágenes y documentos de cualquier formato de archivo compatible a cualquier formato en alta calidad.

Puede instalar la biblioteca Python de conversión de PDF a XLSX en su aplicación Python usando el siguiente comando en la consola:

pip install groupdocs_conversion_cloud

Por favor, obtenga su ID de cliente y secreto del tablero antes de seguir los pasos mencionados. Una vez que tenga su ID y secreto, agregue el código en su aplicación python:

# Biblioteca de Python para la conversión de PDF a Excel en la aplicación de Python
import groupdocs_conversion_cloud

# Obtenga client_id y client_secret de https://dashboard.groupdocs.cloud después del registro gratuito.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Consigue diferentes configuraciones
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "local-storage-name"

Ahora, demostremos cómo convertir pdf a formato xlsx paso a paso usando REST API en Python.

Cómo convertir PDF a XLSX en Python usando la API REST

Podemos convertir un archivo pdf a formato Excel mediante programación siguiendo los sencillos pasos que se indican a continuación:

  • En primer lugar, cree una instancia de ConvertApi
  • Luego, cree una instancia de configuración de conversión usando ConvertSettings
  • A continuación, proporcione el nombre de almacenamiento de archivos
  • Establezca la ruta del archivo PDF de entrada y el formato de salida como “xlsx”
  • A continuación, cree una instancia de PdfLoadOptions.
  • Proporcione la contraseña del archivo PDF
  • Luego, configure la ruta de salida y las opciones de carga
  • Después de eso, cree ConvertDocumentRequest con ConvertSettings como argumento
  • Finalmente, convierta pdf a excel llamando a convert\document() con ConvertDocumentRequest

El siguiente ejemplo de código muestra cómo cambiar el formato pdf a excel en Python:

# Cómo Python convertir PDF a Excel en línea
try:
  # Crear una instancia de la API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Definir la configuración de conversión
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "xlsx"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Crear solicitud de documento de conversión
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Convertir archivo .pdf a formato .xlsx
  result = convert_api.convert_document(request)
  print("pdf File converted to xlsx successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Finalmente, el ejemplo de código anterior guardará el archivo xlsx en la nube. Esta es la mejor manera de convertir un documento PDF a Excel.

Cómo convertir PDF a XLSX en Python usando la API REST

Cómo convertir PDF a XLSX en Python usando la API REST

Convierta rango de páginas de PDF a archivo de Excel en Python

Podemos convertir el rango de páginas de un documento PDF a Excel siguiendo los pasos que se detallan a continuación:

  • Primero, crea una instancia de ConvertApi
  • Luego, cree una instancia de configuración de conversión usando ConvertSettings
  • A continuación, proporcione el nombre de su almacenamiento en la nube
  • Establezca la ruta del archivo PDF de entrada y el formato de salida como “xlsx”
  • A continuación, cree una instancia de XlsConvertOptions
  • Establecer las opciones desde\página y páginas\recuento
  • Luego, configure la ruta de salida y convertOptions
  • Ahora, cree ConvertDocumentRequest con ConvertSettings como argumento
  • Finalmente, convierta pdf a código de Excel en línea llamando al método convert\document() con ConvertDocumentRequest

El siguiente ejemplo de código muestra cómo convertir un rango de páginas de un documento PDF a un archivo de Excel usando Python:

# Cómo convertir un rango de páginas de PDF a Excel en Python
# Crear una instancia de API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Preparar la configuración de conversión de Excel
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# Opciones de conversión de PDF: número de página de inicio y páginas totales para convertir
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.from_page = 2 
convertOptions.pages_count = 3

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Crear solicitud de documento de conversión
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Convertir páginas de PDF a archivo de Excel
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to Excel file: " + result[0].path)

Finalmente, el ejemplo de código anterior guardará el documento después de convertirlo de pdf a excel en línea en la nube.

Convierta páginas específicas de PDF a formato Excel en Python

Podemos convertir páginas específicas de un documento PDF a Excel utilizando el mejor convertidor de pdf a xlsx en línea con imágenes siguiendo los pasos que se detallan a continuación:

  • Primero, crea una instancia de ConvertApi
  • Luego, cree una instancia de configuración de conversión usando ConvertSettings
  • A continuación, proporcione el nombre de su almacenamiento en la nube
  • Establezca la ruta del archivo PDF de entrada y el formato de salida como “xlsx”
  • A continuación, cree una instancia de XlsConvertOptions
  • Agregue el número de página para convertir en formato de matriz
  • Luego, configure la ruta de salida y convertOptions
  • Ahora, cree ConvertDocumentRequest con ConvertSettings como argumento
  • Finalmente, convierta pdf a código de Excel en línea llamando al método convert\document() con ConvertDocumentRequest

El siguiente ejemplo de código muestra cómo exportar ciertas páginas de un documento PDF a un archivo de Excel usando Python:

# Cómo convertir páginas específicas de un archivo PDF a formato Excel en Python
# Crear una instancia de API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Definir la configuración de conversión
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# Opciones de conversión de PDF: números de página para convertir
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Crear solicitud de documento de conversión
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Convertir archivo PDF a archivo Excel
result = convert_api.convert_document(request)
print("Successfully converted PDF file to XLSX document: " + result[0].path)

Finalmente, el ejemplo de código anterior convertirá pdf a xlsx con imágenes en la nube. Hay un convertidor de código de pdf a xlsx en línea como se explica a continuación.

Conversor de PDF a Excel en línea gratis

¿Cuál es el mejor conversor de PDF a Excel? Groupdocs.Conversion proporciona el mejor convertidor de pdf a xlsx en línea gratis para convertir PDF a formato Excel. Ha sido desarrollado usando la API de Groupdocs.Conversion online pdf to xlsx.

Conclusión

En este artículo, has aprendido:

  • cómo convertir pdf a xls/xlsx sin perder formato en Python;
  • cómo convertir un archivo pdf a excel por rango usando Python;
  • convertir páginas PDF específicas al formato XLSX en Python;

Además, puede obtener más información sobre la API de conversión de formato de archivo GroupDocs.Conversion utilizando la documentación.

Hacer una pregunta

Puede hacer sus consultas sobre cómo convertir un archivo pdf a formato xlsx, a través de nuestro Foro de soporte gratuito

Ver también