PDF es uno de los formatos de documentos versátiles más utilizados para presentar documentos. Pero es difícil editar un documento PDF. Para extraer fácilmente una tabla o editar texto en formato de hoja de cálculo, debe convertir PDF a hojas de cálculo Excel editables. Por lo tanto, no necesita perder tiempo copiando manualmente el texto y luego editándolo. Nuestras API de conversión de PDF a XLS o PDF a XLSX le permiten convertir PDF a formato de hoja de cálculo de Excel rápidamente. En este artículo, aprenderemos cómo convertir PDF a Excel en Python utilizando la API REST.
En este artículo se tratarán los siguientes temas:
- Python PDF to Excel Converter API – Instalación
- Cómo convertir PDF a XLSX en Python usando la API REST
- Convierta rango de páginas de PDF a archivo de Excel en Python
- Convertir páginas específicas de PDF a formato Excel en Python
Python PDF to Excel Converter API – Instalación
Para convertir un archivo PDF a formato Excel, utilizaremos la API Python SDK de GroupDocs.Conversion Cloud. Es una biblioteca de Python de conversión de documentos e imágenes independiente de la plataforma y rica en características. Proporciona una conversión rápida de imágenes y documentos de cualquier formato de archivo compatible a cualquier formato en alta calidad.
Puede instalar la biblioteca Python de conversión de PDF a XLSX en su aplicación Python usando el siguiente comando en la consola:
pip install groupdocs_conversion_cloud
Por favor, obtenga su ID de cliente y secreto del tablero antes de seguir los pasos mencionados. Una vez que tenga su ID y secreto, agregue el código en su aplicación python:
# Biblioteca de Python para la conversión de PDF a Excel en la aplicación de Python
import groupdocs_conversion_cloud
# Obtenga client_id y client_secret de https://dashboard.groupdocs.cloud después del registro gratuito.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# Consigue diferentes configuraciones
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "local-storage-name"
Ahora, demostremos cómo convertir pdf a formato xlsx paso a paso usando REST API en Python.
Cómo convertir PDF a XLSX en Python usando la API REST
Podemos convertir un archivo pdf a formato Excel mediante programación siguiendo los sencillos pasos que se indican a continuación:
- En primer lugar, cree una instancia de ConvertApi
- Luego, cree una instancia de configuración de conversión usando ConvertSettings
- A continuación, proporcione el nombre de almacenamiento de archivos
- Establezca la ruta del archivo PDF de entrada y el formato de salida como “xlsx”
- A continuación, cree una instancia de PdfLoadOptions.
- Proporcione la contraseña del archivo PDF
- Luego, configure la ruta de salida y las opciones de carga
- Después de eso, cree ConvertDocumentRequest con ConvertSettings como argumento
- Finalmente, convierta pdf a excel llamando a convert\document() con ConvertDocumentRequest
El siguiente ejemplo de código muestra cómo cambiar el formato pdf a excel en Python:
# Cómo Python convertir PDF a Excel en línea
try:
# Crear una instancia de la API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# Definir la configuración de conversión
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"
loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
loadOptions.password = "password"
settings.load_options = loadOptions
settings.output_path = "python-testing"
# Crear solicitud de documento de conversión
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# Convertir archivo .pdf a formato .xlsx
result = convert_api.convert_document(request)
print("pdf File converted to xlsx successfully: " + result[0].path)
except groupdocs_conversion_cloud.ApiException as e:
print("Exception when calling convert_document: {0}".format(e.message))
Finalmente, el ejemplo de código anterior guardará el archivo xlsx en la nube. Esta es la mejor manera de convertir un documento PDF a Excel.
Convierta rango de páginas de PDF a archivo de Excel en Python
Podemos convertir el rango de páginas de un documento PDF a Excel siguiendo los pasos que se detallan a continuación:
- Primero, crea una instancia de ConvertApi
- Luego, cree una instancia de configuración de conversión usando ConvertSettings
- A continuación, proporcione el nombre de su almacenamiento en la nube
- Establezca la ruta del archivo PDF de entrada y el formato de salida como “xlsx”
- A continuación, cree una instancia de XlsConvertOptions
- Establecer las opciones desde\página y páginas\recuento
- Luego, configure la ruta de salida y convertOptions
- Ahora, cree ConvertDocumentRequest con ConvertSettings como argumento
- Finalmente, convierta pdf a código de Excel en línea llamando al método convert\document() con ConvertDocumentRequest
El siguiente ejemplo de código muestra cómo convertir un rango de páginas de un documento PDF a un archivo de Excel usando Python:
# Cómo convertir un rango de páginas de PDF a Excel en Python
# Crear una instancia de API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# Preparar la configuración de conversión de Excel
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"
# Opciones de conversión de PDF: número de página de inicio y páginas totales para convertir
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.from_page = 2
convertOptions.pages_count = 3
settings.convert_options = convertOptions
settings.output_path = "python-testing"
# Crear solicitud de documento de conversión
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# Convertir páginas de PDF a archivo de Excel
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to Excel file: " + result[0].path)
Finalmente, el ejemplo de código anterior guardará el documento después de convertirlo de pdf a excel en línea en la nube.
Convierta páginas específicas de PDF a formato Excel en Python
Podemos convertir páginas específicas de un documento PDF a Excel utilizando el mejor convertidor de pdf a xlsx en línea con imágenes siguiendo los pasos que se detallan a continuación:
- Primero, crea una instancia de ConvertApi
- Luego, cree una instancia de configuración de conversión usando ConvertSettings
- A continuación, proporcione el nombre de su almacenamiento en la nube
- Establezca la ruta del archivo PDF de entrada y el formato de salida como “xlsx”
- A continuación, cree una instancia de XlsConvertOptions
- Agregue el número de página para convertir en formato de matriz
- Luego, configure la ruta de salida y convertOptions
- Ahora, cree ConvertDocumentRequest con ConvertSettings como argumento
- Finalmente, convierta pdf a código de Excel en línea llamando al método convert\document() con ConvertDocumentRequest
El siguiente ejemplo de código muestra cómo exportar ciertas páginas de un documento PDF a un archivo de Excel usando Python:
# Cómo convertir páginas específicas de un archivo PDF a formato Excel en Python
# Crear una instancia de API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# Definir la configuración de conversión
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"
# Opciones de conversión de PDF: números de página para convertir
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.pages = [1, 3, 5]
settings.convert_options = convertOptions
settings.output_path = "python-testing"
# Crear solicitud de documento de conversión
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# Convertir archivo PDF a archivo Excel
result = convert_api.convert_document(request)
print("Successfully converted PDF file to XLSX document: " + result[0].path)
Finalmente, el ejemplo de código anterior convertirá pdf a xlsx con imágenes en la nube. Hay un convertidor de código de pdf a xlsx en línea como se explica a continuación.
Conversor de PDF a Excel en línea gratis
¿Cuál es el mejor conversor de PDF a Excel? Groupdocs.Conversion proporciona el mejor convertidor de pdf a xlsx en línea gratis para convertir PDF a formato Excel. Ha sido desarrollado usando la API de Groupdocs.Conversion online pdf to xlsx.
Conclusión
En este artículo, has aprendido:
- cómo convertir pdf a xls/xlsx sin perder formato en Python;
- cómo convertir un archivo pdf a excel por rango usando Python;
- convertir páginas PDF específicas al formato XLSX en Python;
Además, puede obtener más información sobre la API de conversión de formato de archivo GroupDocs.Conversion utilizando la documentación.
Hacer una pregunta
Puede hacer sus consultas sobre cómo convertir un archivo pdf a formato xlsx, a través de nuestro Foro de soporte gratuito