Come convertire un file PDF in più PDF in Python

Suddivisione del documento Python: dividi il file PDF in più file PDF utilizzando Python.

PDF(Portable Document Format) è un formato di file ampiamente utilizzato per i documenti che devono essere condivisi, stampati o archiviati. Sei stanco di avere a che fare con file PDF di grandi dimensioni che contengono più documenti o sezioni? Trovi difficile estrarre pagine o sezioni specifiche da un singolo file PDF come documenti separati? La divisione di un file PDF in più file più piccoli può semplificare notevolmente le attività di gestione dei documenti. In questo articolo, esploreremo come dividere un file PDF in più file PDF in Python utilizzando GroupDocs.Merger Cloud SDK per Python.

In questo articolo saranno trattati i seguenti argomenti:

API REST Python per dividere PDF in pagine e installazione SDK

GroupDocs.Merger Cloud SDK for Python è un kit di sviluppo software potente e ricco di funzionalità che consente di manipolare i file PDF in modo programmatico. Fornisce varie funzionalità, tra cui la divisione, l’unione, la rotazione e la riorganizzazione di una raccolta di pagine in formati di documenti supportati. L’SDK può essere integrato in un’applicazione basata su Python per semplificare il processo di sviluppo e migliorare la produttività.

Puoi installare l’API Merger nella tua applicazione Python con PIP da PyPI eseguendo il seguente comando nel terminale:

pip install groupdocs-merger-cloud

Successivamente, devi iscriverti per un account di prova gratuito o acquistare un piano di abbonamento sul sito web di GroupDocs e ottenere la tua chiave API. Dopo aver ottenuto l’ID client e il segreto client, aggiungi lo snippet di codice seguente a un’applicazione basata su Python:

# Importa l'SDK di fusione di groupdocs
import groupdocs_merger_cloud

# Ottieni app_sid e app_key da https://dashboard.groupdocs.cloud dopo la registrazione gratuita.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Ottieni le configurazioni dell'API File 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Come dividere le pagine PDF in file PDF separati in Python

Per dividere un file PDF in più file PDF utilizzando GroupDocs.Merger Cloud SDK per Python, procedi nel seguente modo:

Carica i file

Innanzitutto, carica il file PDF nel cloud utilizzando l’esempio di codice fornito di seguito:

# Crea un'istanza dell'API file
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Chiama la richiesta di caricamento del file
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# Carica il file nel cloud
response = file_api.upload_file(request)
print(response.uploaded)

Di conseguenza, i file caricati saranno disponibili nella sezione file della dashboard sul cloud.

Dividi il PDF in singole pagine in Python

In questa sezione, scriveremo i passaggi e uno snippet di codice di esempio per dividere le pagine PDF in file PDF separati a livello di codice come indicato di seguito:

  • Innanzitutto, crea un’istanza della classe DocumentApi.
  • In secondo luogo, creare un’istanza della classe SplitOptions.
  • In terzo luogo, crea un’istanza della classe FileInfo.
  • Fornire il percorso del file di input come parametro a FileInfo.
  • Successivamente, fornire il percorso della directory di output.
  • Imposta numeri di pagina specifici in un array separato da virgole.
  • Ora, imposta la modalità di divisione PDF su Pagine per dividere i numeri di pagina.
  • Quindi, crea un’istanza della classe SplitRequest e passa il parametro SplitOptions.
  • Infine, chiama il metodo DocumentAPI.split() e passa il parametro SplitRequest per ottenere i risultati.

Il seguente frammento di codice mostra come dividere i file PDF in Python utilizzando l’API REST:

# Come dividere un file PDF in più singoli file PDF in Python
try:
	# Crea un'istanza dell'API del documento
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [1, 3]
	options.mode = "Pages"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF to single page PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Scarica il file

L’esempio di codice precedente salverà il file separato sul cloud. Puoi scaricarlo utilizzando il seguente esempio di codice:

# Inizializzazione dell'API per scaricare il file
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Crea richiesta di download del file
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\input-sample-file.pdf", storage_name)

# Download file
response = file_api.download_file(request)

# Sposta il file scaricato nella tua directory
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Questo è tutto!

Dividi il documento PDF in file separati applicando il filtro intervallo

È possibile separare i file PDF fornendo una modalità intervallo di pagine e filtrare a livello di codice seguendo i passaggi indicati di seguito:

  • Innanzitutto, crea un’istanza della classe DocumentApi.
  • In secondo luogo, creare un’istanza della classe SplitOptions.
  • In terzo luogo, crea un’istanza della classe FileInfo.
  • Fornire il percorso del file di input come parametro a FileInfo.
  • Quindi, fornisci il percorso della directory di output come “python-testing”.
  • Imposta i valori startpagenumber e endpagenumber.
  • Successivamente, imposta page rangemode su OddPages.
  • Ora, imposta la modalità di divisione PDF su Pagine per dividere i numeri di pagina.
  • Quindi, crea un’istanza della classe SplitRequest e passa il parametro SplitOptions.
  • Infine, chiama il metodo DocumentAPI.split() e passa il parametro SplitRequest per ottenere i risultati.

Il seguente frammento di codice mostra come dividere un file PDF applicando un filtro in Python utilizzando l’API REST:

# Come dividere un file PDF in più singoli PDF applicando il filtro
try:
	# Crea un'istanza dell'API del documento
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.start_page_number = 3
	options.end_page_number = 9
	options.range_mode = "OddPages"
	options.mode = "Pages" # mode Intervals

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file using pages range filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Dividi le pagine PDF in più file in Python applicando il filtro array

In questa sezione, scriveremo i passaggi e uno snippet di codice di esempio per suddividere i file PDF in file PDF multipagina a livello di programmazione:

  • Innanzitutto, crea un’istanza della classe DocumentApi.
  • In secondo luogo, creare un’istanza della classe SplitOptions.
  • In terzo luogo, crea un’istanza della classe FileInfo.
  • Fornire il percorso del file di input come parametro a FileInfo.
  • Quindi, fornisci il percorso della directory di output come “python-testing”.
  • Quindi, imposta la raccolta di pagine in formato matrice.
  • Imposta la modalità di suddivisione PDF su Intervalli per dividere i file PDF.
  • Quindi, crea un’istanza della classe SplitRequest e passa il parametro SplitOptions.
  • Infine, chiama il metodo DocumentAPI.split() e passa il parametro SplitRequest per ottenere i risultati.

Il seguente frammento di codice mostra come dividere i file PDF in più file PDF in Python utilizzando l’API REST:

# Come dividere un file PDF in più file multipagina in Python
try:
	# Crea un'istanza dell'API del documento
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [3, 6, 8]
	options.mode = "Intervals"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file to multiple PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Separatore di PDF online gratuito

Come dividere i file PDF online gratuitamente? Prova il seguente strumento divisore PDF online per dividere documenti PDF gratuitamente. Questo strumento online per la divisione dei documenti è stato sviluppato utilizzando l’API REST sopra menzionata.

Conclusione

In conclusione, la suddivisione di un file PDF in più file PDF utilizzando GroupDocs.Merger Cloud SDK per Python offre un modo conveniente per gestire e manipolare i documenti PDF. Quanto segue è ciò che hai imparato in questo articolo:

  • come dividere un file PDF in più file usando Python sul cloud;
  • caricare e scaricare in modo programmatico i file in Python sul cloud;
  • dividere i file PDF in più file in Python utilizzando un filtro dell’intervallo di pagine;
  • e dividi i file PDF gratuitamente utilizzando uno splitter PDF online.

Inoltre, forniamo anche una sezione di riferimento API che consente di visualizzare e comunicare con le nostre API direttamente tramite il browser. Il codice sorgente completo di Python SDK è disponibile gratuitamente su GitHub. Controlla GroupDocs.Merger Cloud SDK per Python Esempi qui.

Inoltre, ti consigliamo di seguire la nostra Guida introduttiva per i passaggi dettagliati e l’utilizzo dell’API.

Infine, continuiamo a scrivere nuovi post sul blog su diverse operazioni sui documenti utilizzando l’API REST. Quindi, ti preghiamo di contattarci per gli aggiornamenti regolari.

Fai una domanda

In caso di domande sull’API del separatore di documenti PDF, non esitare a contattarci nel Forum di supporto gratuito.

Domande frequenti

Posso dividere un file PDF in più file in base a pagine specifiche?

Sì, utilizzando GroupDocs.Merger Cloud SDK for Python, puoi definire l’intervallo di pagine da estrarre e suddividere un PDF in file PDF separati.

GroupDocs.Merger Cloud SDK per Python supporta altri formati di documenti oltre al PDF?

Sì, GroupDocs.Merger Cloud SDK for Python supporta vari formati di documenti, tra cui DOCX, XLSX, PPTX e altri. È possibile eseguire operazioni simili anche su questi tipi di file.

È possibile unire nuovamente i file PDF divisi in un unico file, se necessario?

Sì, GroupDocs.Merger Cloud SDK for Python supporta anche l’unione di file PDF. È possibile combinare facilmente i file PDF divisi in un unico documento quando richiesto.

GroupDocs.Merger Cloud SDK per Python conserva la formattazione originale dei file PDF durante il processo di divisione?

Sì, l’SDK mantiene la formattazione e il layout originali dei file PDF suddividendoli in più file.

Guarda anche

Per approfondimenti su argomenti correlati, suggeriamo di dare uno sguardo ai seguenti articoli: