Come convertire PDF in Excel in Python utilizzando l'API REST

Converti PDF in Excel in Python utilizzando l’API REST

PDF è uno dei formati di documenti versatili più comunemente usati per presentare documenti. Ma è difficile modificare un documento PDF. Per estrarre facilmente una tabella o modificare il testo in un formato di foglio di calcolo, è necessario convertire i PDF in fogli di calcolo Excel modificabili. Quindi, non è necessario perdere tempo per copiare manualmente il testo e quindi modificarlo. Le nostre API di conversione da PDF a XLS o da PDF a XLSX ti consentono di convertire rapidamente PDF in formato foglio di calcolo Excel. In questo articolo impareremo come convertire PDF in Excel in Python utilizzando l’API REST.

In questo articolo saranno trattati i seguenti argomenti:

API di conversione da PDF a Excel Python – Installazione

Per convertire il file PDF in formato Excel, utilizzeremo l’API Python SDK of GroupDocs.Conversion Cloud. È una libreria Python per la conversione di documenti e immagini indipendente dalla piattaforma e ricca di funzionalità. Fornisce una rapida conversione di immagini e documenti di qualsiasi formato file supportato in qualsiasi formato in alta qualità.

Puoi installare la libreria Python di conversione da PDF a XLSX nella tua applicazione Python utilizzando il seguente comando nella console:

pip install groupdocs_conversion_cloud

Si prega di ottenere l’ID cliente e il segreto dalla dashboard prima di seguire i passaggi menzionati. Una volta che hai il tuo ID e segreto, aggiungi il codice nella tua applicazione python:

# Libreria Python per la conversione da PDF a Excel nell'applicazione Python
import groupdocs_conversion_cloud

# Ottieni client_id e client_secret da https://dashboard.groupdocs.cloud dopo la registrazione gratuita.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Ottieni diverse configurazioni
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "local-storage-name"

Ora, dimostriamo come convertire passo dopo passo il formato pdf in formato xlsx utilizzando l’API REST in Python.

Come convertire PDF in XLSX in Python utilizzando l’API REST

Possiamo convertire il file pdf in formato excel a livello di codice seguendo i semplici passaggi indicati di seguito:

  • Innanzitutto, crea un’istanza di ConvertApi
  • Quindi, crea un’istanza delle impostazioni di conversione utilizzando ConvertSettings
  • Successivamente, fornire il nome di archiviazione dei file
  • Imposta il percorso del file PDF di input e il formato di output come “xlsx”
  • Successivamente, crea un’istanza di PdfLoadOptions.
  • Fornire la password del file PDF
  • Quindi, imposta output\path e load\options
  • Successivamente, crea ConvertDocumentRequest con ConvertSettings come argomento
  • Infine, converti pdf in excel chiamando convert\document() con ConvertDocumentRequest

Il seguente esempio di codice mostra come modificare il formato pdf in formato excel in Python:

# Come convertire Python in PDF in Excel online
try:
  # Crea un'istanza dell'API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Definire le impostazioni di conversione
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "xlsx"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Crea una richiesta di conversione del documento
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Converti file .pdf in formato .xlsx
  result = convert_api.convert_document(request)
  print("pdf File converted to xlsx successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Infine, l’esempio di codice precedente salverà il file xlsx nel cloud. Questo è il modo migliore per convertire i pdf in documenti excel.

Come convertire PDF in XLSX in Python utilizzando l'API REST

Come convertire PDF in XLSX in Python utilizzando l’API REST

Converti intervallo di pagine da PDF a file Excel in Python

Possiamo convertire un intervallo di pagine di un documento PDF in Excel seguendo i passaggi indicati di seguito:

  • Innanzitutto, crea un’istanza di ConvertApi
  • Quindi, crea un’istanza delle impostazioni di conversione utilizzando ConvertSettings
  • Successivamente, fornisci il nome del tuo archivio cloud
  • Imposta il percorso del file PDF di input e il formato di output come “xlsx”
  • Successivamente, crea un’istanza di XlsConvertOptions
  • Imposta le opzioni from\page e pages\count
  • Quindi, imposta il percorso di output e convertOptions
  • Ora crea ConvertDocumentRequest con ConvertSettings come argomento
  • Infine, converti pdf in codice excel online chiamando il metodo convert\document() con ConvertDocumentRequest

Il seguente esempio di codice mostra come convertire un intervallo di pagine da un documento PDF a un file Excel utilizzando Python:

# Come convertire un intervallo di pagine da PDF a Excel in Python
# Crea un'istanza dell'API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Preparare le impostazioni di conversione di Excel
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# Opzioni di conversione PDF: numero di pagina iniziale e pagine totali da convertire
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.from_page = 2 
convertOptions.pages_count = 3

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Crea una richiesta di conversione del documento
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Converti pagine di PDF in file Excel
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to Excel file: " + result[0].path)

Infine, l’esempio di codice sopra riportato salverà il documento dopo la conversione da pdf a excel online sul cloud.

Converti pagine specifiche di PDF in formato Excel in Python

Possiamo convertire pagine specifiche di un documento PDF in Excel utilizzando il miglior convertitore online da pdf a xlsx con immagini seguendo i passaggi indicati di seguito:

  • Innanzitutto, crea un’istanza di ConvertApi
  • Quindi, crea un’istanza delle impostazioni di conversione utilizzando ConvertSettings
  • Successivamente, fornisci il nome del tuo archivio cloud
  • Imposta il percorso del file PDF di input e il formato di output come “xlsx”
  • Successivamente, crea un’istanza di XlsConvertOptions
  • Aggiungi il numero di pagina da convertire in formato array
  • Quindi, imposta il percorso di output e convertOptions
  • Ora crea ConvertDocumentRequest con ConvertSettings come argomento
  • Infine, converti pdf in codice excel online chiamando il metodo convert\document() con ConvertDocumentRequest

Il seguente esempio di codice mostra come esportare determinate pagine di un documento PDF in un file Excel utilizzando Python:

# Come convertire pagine specifiche di file PDF in formato Excel in Python
# Crea un'istanza dell'API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Definire le impostazioni di conversione
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# Opzioni di conversione PDF: numeri di pagina da convertire
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Crea una richiesta di conversione del documento
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Converti file PDF in file Excel
result = convert_api.convert_document(request)
print("Successfully converted PDF file to XLSX document: " + result[0].path)

Infine, l’esempio di codice precedente convertirà pdf in xlsx con immagini sul cloud. Esiste un convertitore di codice online da pdf a xlsx come spiegato di seguito.

Convertitore online da PDF a Excel gratuitamente

Qual è il miglior convertitore da PDF a Excel? Groupdocs.Conversion fornisce gratuitamente il miglior convertitore da pdf a xlsx online per convertire PDF in formato Excel. È stato sviluppato utilizzando Groupdocs.Conversion online pdf to xlsx API.

Conclusione

In questo articolo hai imparato:

  • come convertire pdf in xls/xlsx senza perdere la formattazione in Python;
  • come convertire pdf in file excel per intervallo usando Python;
  • convertire pagine PDF specifiche in formato XLSX in Python;

Inoltre, puoi saperne di più sull’API di conversione del formato di file GroupDocs.Conversion utilizzando la documentazione.

Fai una domanda

Puoi porre le tue domande su come convertire un file pdf in formato xlsx, tramite il nostro Forum di supporto gratuito

Guarda anche