Come estrarre pagine PDF in Java

Estrai pagine da PDF in Java - Separa pagine PDF online.

Se stai lavorando con file PDF, potresti trovarti in una situazione in cui devi estrarre pagine da un file PDF. L’estrazione di pagine da un file PDF può richiedere molto tempo, soprattutto se devi farlo manualmente o se hai a che fare con documenti di grandi dimensioni. Fortunatamente, con l’aiuto di GroupDocs.Merger Cloud SDK for Java, puoi facilmente estrarre le pagine da un file PDF a livello di programmazione. In questo articolo, esploreremo come estrarre pagine da PDF in Java.

In questo articolo saranno trattati i seguenti argomenti:

Java PDF Pages Extractor API REST e installazione SDK

GroupDocs.Merger Cloud SDK for Java è un’API basata su cloud che consente agli sviluppatori di unire, estrarre, dividere, riordinare e rimuovere pagine da file e altri tipi di documenti, inclusi Word, Excel , PowerPoint, HTML, PDF e molti altri. Questo potente SDK è facile da usare e può essere integrato in un’applicazione basata su Java per automatizzare le attività di manipolazione dei file.

Puoi scaricare il file JAR dell’API o installarlo utilizzando Maven aggiungendo il seguente repository e dipendenza nel file pom.xml del tuo progetto:

Repository esperto:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dipendenza Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

Ora devi iscriverti per un account di prova gratuito o acquistare un piano di abbonamento sul sito web di GroupDocs per ottenere la tua chiave API. Dopo aver ottenuto l’ID client e il segreto client, aggiungi lo snippet di codice seguente a un’applicazione basata su Java:

# Ottieni il tuo client_id e client_secret da https://dashboard.groupdocs.cloud dopo la registrazione.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Come estrarre le pagine PDF in base ai numeri di pagina esatti in Java

Per estrarre pagine da un file PDF utilizzando GroupDocs.Merger Cloud SDK per Java, dovrai seguire questi passaggi:

Carica i file

Innanzitutto, carica il file PDF nel cloud utilizzando l’esempio di codice fornito di seguito:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Carica il file su Cloud Storage utilizzando Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Di conseguenza, il file PDF caricato sarà disponibile nella sezione file della dashboard sul cloud.

Estrai pagine da file PDF in Java

Ecco una guida dettagliata e uno snippet di codice di esempio su come estrarre pagine da un file PDF utilizzando GroupDocs.Merger Cloud SDK per Java:

  • Innanzitutto, importa le classi richieste nel tuo file Java.
  • In secondo luogo, crea un’istanza della classe PagesApi.
  • In terzo luogo, crea un’istanza della classe FileInfo.
  • Successivamente, imposta il percorso del file di input di origine.
  • Ora, crea un’istanza della classe ExtractOptions().
  • Quindi, definire le opzioni di estrazione setFileInfo, setOutputPath e la raccolta setPages in formato matrice.
  • Ora, crea un’istanza della classe ExtractRequest() e passa il parametro ExtractOptions.
  • Infine, estrai le pagine chiamando il metodo extract() di PagesApi e passando il parametro ExtractRequest.

Il seguente frammento di codice mostra come separare i file PDF in singole pagine in Java utilizzando l’API REST:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Come estrarre pagine PDF in base ai numeri di pagina esatti in Java.
public class App {

	public static void main(String[] args) {

		// Crea un'istanza dell'API Pages.			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Preparare le impostazioni
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.pdf");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Ottieni il percorso del file di output
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Scarica il file

L’esempio di codice precedente salverà pagine specifiche di PDF sul cloud. Puoi scaricarlo utilizzando il seguente esempio di codice:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Scarica il file dal Cloud Storage utilizzando Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.pdf", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Come estrarre pagine da PDF per intervalli di pagine utilizzando Java

In questa sezione tratteremo una guida passo-passo e uno snippet di codice di esempio per salvare pagine selezionate da PDF utilizzando Java applicando l’intervallo di pagine:

  • Innanzitutto, importa le classi richieste nel tuo file Java.
  • In secondo luogo, crea un’istanza della classe PagesApi.
  • In terzo luogo, crea un’istanza della classe FileInfo.
  • Successivamente, imposta il percorso del file di input di origine.
  • Ora, crea un’istanza della classe ExtractOptions().
  • Quindi, definire le opzioni di estrazione setFileInfo, setOutputPath, setStartPageNumber e setEndPageNumber.
  • Successivamente, imposta le opzioni di pagina setRangeMode su EVENPAGES.
  • Ora, crea un’istanza della classe ExtractRequest() e passa il parametro ExtractOptions.
  • Infine, estrai le pagine chiamando il metodo extract() di PagesApi e passando il parametro ExtractRequest.

Il seguente frammento di codice mostra come estrarre le pagine PDF applicando l’intervallo e la modalità delle pagine in Java:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Come estrarre pagine da PDF per intervalli di pagine utilizzando Java.
public class App {

	public static void main(String[] args) {
		
		// Crea un'istanza dell'API Pages.		
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Preparare le impostazioni
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.pdf");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Ottieni il percorso del file di output
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Estrattore di pagine PDF online gratuito

Come estrarre pagine PDF gratuitamente? Prova l’estrattore di pagine PDF gratuito per estrarre pagine specifiche da PDF gratuitamente. Questo estrattore di pagine PDF online è sviluppato utilizzando le suddette API Groupdocs.Merger Cloud.

Conclusione

GroupDocs.Merger Cloud SDK per Java offre un modo semplice per estrarre le pagine PDF in un nuovo PDF in Java. Quanto segue è ciò che hai imparato in questo articolo:

  • come separare i file PDF in più pagine in base al numero utilizzando Java;
  • caricare e scaricare in modo programmatico il file PDF utilizzando Java sul cloud;
  • separare PDF in singole pagine in Java utilizzando intervalli di pagine;
  • ed estrai pagine da PDF online gratuitamente utilizzando un estrattore di pagine PDF gratuito online.

Inoltre, forniamo anche una sezione di riferimento API che consente di visualizzare e comunicare con le nostre API direttamente tramite il browser. Il codice sorgente completo di Java SDK è disponibile gratuitamente su GitHub. Controlla GroupDocs.Merger Cloud SDK per Java Esempi qui.

Inoltre, ti consigliamo di seguire la nostra Guida introduttiva per i passaggi dettagliati e l’utilizzo dell’API.

Infine, continuiamo a scrivere nuovi post sul blog su diverse operazioni sui documenti utilizzando l’API REST. Quindi, ti preghiamo di contattarci per gli aggiornamenti regolari.

Fai una domanda

In caso di domande sull’API dell’estrattore di pagine PDF, non esitare a contattarci nel Forum di supporto gratuito.

Domande frequenti

Come estraggo le pagine da un file PDF in Java?

Puoi estrarre pagine da un file PDF utilizzando GroupDocs.Merger Cloud SDK for Java.

È possibile esportare una singola pagina da PDF in Java?

Sì, puoi estrarre le pagine PDF in singoli file in modo programmatico in Java utilizzando GroupDocs.Merger Cloud SDK for Java.

Da quali formati di file posso estrarre le pagine utilizzando GroupDocs.Merger Cloud SDK per Java?

Oltre ai file PDF, GroupDocs.Merger Cloud SDK for Java può estrarre pagine da Microsoft Word, Excel, PowerPoint, HTML e altri formati di file.

Guarda anche

Ecco alcuni articoli correlati che potresti trovare utili: