Come estrarre pagine di documenti Word online in Java

Estrai pagine documento - Estrai pagine da file Word in Java.

Stai lottando per estrarre pagine specifiche da un documento Word in Java? Quando si lavora con documenti Word di grandi dimensioni, può essere un’attività impegnativa estrarre pagine specifiche da un documento Word di grandi dimensioni. Fortunatamente, GroupDocs.Merger Cloud SDK per Java ti aiuta a semplificare questo processo. In questo articolo, esploreremo come estrarre pagine da un file Word in Java utilizzando GroupDocs.Merger Cloud SDK per Java.

In questo articolo saranno trattati i seguenti argomenti:

API REST Java per estrarre pagine di documenti Word - Installazione SDK

GroupDocs.Merger Cloud SDK for Java è una potente API che consente agli sviluppatori di unire, dividere, riordinare, estrarre e manipolare documenti e file nel cloud. Fornisce un modo semplice, affidabile e rapido per gestire le pagine dei documenti e il loro contenuto. È compatibile con i formati di file più popolari come PDF, Word, Excel, HTML, PowerPoint e molti altri. Questo potente SDK è facile da usare e può essere integrato in un’applicazione basata su Java per automatizzare il processo di manipolazione dei file.

Puoi scaricare il file JAR dell’API o installarlo utilizzando Maven aggiungendo il seguente repository e dipendenza nel file pom.xml del tuo progetto:

Repository esperto:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dipendenza Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

Ora devi iscriverti per un account di prova gratuito o acquistare un piano di abbonamento sul sito web di GroupDocs per ottenere la tua chiave API. Dopo aver ottenuto l’ID client e il segreto client, aggiungi lo snippet di codice seguente a un’applicazione basata su Java:

# Ottieni il tuo client_id e client_secret da https://dashboard.groupdocs.cloud dopo la registrazione.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Estrai pagine da documenti Word in Java utilizzando i numeri di pagina esatti

Ora che abbiamo configurato il nostro ambiente, vediamo come utilizzare GroupDocs.Merger Cloud SDK per Java per estrarre pagine da un documento Word. Ecco i passaggi:

Carica i file

Innanzitutto, carica il documento Word nel cloud utilizzando l’esempio di codice fornito di seguito:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Carica il file su Cloud Storage utilizzando Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.docx");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.docx", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Di conseguenza, il file Word caricato sarà disponibile nella sezione file della dashboard sul cloud.

Estrai pagine da documenti Word in Java

In questa sezione, tratteremo i passaggi e uno snippet di codice di esempio su come estrarre pagine da un documento Word utilizzando GroupDocs.Merger Cloud SDK per Java:

  • Innanzitutto, importa le classi richieste nel tuo file Java.
  • In secondo luogo, crea un’istanza della classe PagesApi.
  • In terzo luogo, crea un’istanza della classe FileInfo.
  • Successivamente, imposta il percorso del file di input di origine.
  • Ora, crea un’istanza della classe ExtractOptions().
  • Quindi, definire le opzioni di estrazione setFileInfo, setOutputPath e la raccolta setPages in formato matrice.
  • Ora, crea un’istanza della classe ExtractRequest() e passa il parametro ExtractOptions.
  • Infine, estrai le pagine DOCX chiamando il metodo extract() di PagesApi e passando il parametro ExtractRequest.

Il seguente frammento di codice mostra come estrarre le pagine del documento di Word in un nuovo file in Java utilizzando l’API REST:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Estrai le pagine dal documento word in Java utilizzando i numeri di pagina esatti.
public class App {

	public static void main(String[] args) {

		// Crea un'istanza dell'API Pages.			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Preparare le impostazioni
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Ottieni il percorso del file di output
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Scarica il file

L’esempio di codice precedente salverà le pagine estratte dei documenti di Word nel cloud. Puoi scaricarlo utilizzando il seguente esempio di codice:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Scarica il file dal Cloud Storage utilizzando Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.docx", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Estrai pagine da file Word in Java utilizzando l’intervallo di numeri di pagina

In questa sezione, forniremo i passaggi e uno snippet di codice di esempio su come estrarre pagine specifiche da un documento Word in base all’intervallo esatto di numeri di pagina:

  • Innanzitutto, importa le classi richieste nel tuo file Java.
  • In secondo luogo, crea un’istanza della classe PagesApi.
  • In terzo luogo, crea un’istanza della classe FileInfo.
  • Successivamente, imposta il percorso del file di input di origine.
  • Ora, crea un’istanza della classe ExtractOptions().
  • Quindi, definire le opzioni di estrazione setFileInfo, setOutputPath, setStartPageNumber e setEndPageNumber.
  • Successivamente, imposta le opzioni di pagina setRangeMode su EVENPAGES.
  • Ora, crea un’istanza della classe ExtractRequest() e passa il parametro ExtractOptions.
  • Infine, estrai le pagine chiamando il metodo extract() di PagesApi e passando il parametro ExtractRequest.

Il seguente frammento di codice mostra come estrarre pagine di file Word applicando l’intervallo e la modalità di pagine utilizzando Java:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Estrai le pagine dal file Word in Java utilizzando l'intervallo di numeri di pagina.
public class App {

	public static void main(String[] args) {
		
		// Crea un'istanza dell'API Pages.
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Preparare le impostazioni
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Ottieni il percorso del file di output
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Estrattore di documenti Word online gratuito

Come estrarre pagine di documenti Word gratuitamente? Prova l’estrattore di pagine Word online per estrarre pagine specifiche da documenti Word gratuitamente. Questo strumento di estrazione di pagine Word online è sviluppato utilizzando le suddette API Groupdocs.Merger Cloud.

Conclusione

In conclusione, GroupDocs.Merger Cloud SDK per Java è un’ottima scelta che può aiutare gli sviluppatori a estrarre pagine da documenti Word online. Quanto segue è ciò che hai imparato in questo articolo:

  • come estrarre pagine da documenti Word per numero di pagina usando Java;
  • caricare e scaricare in modo programmatico il documento Word sul cloud;
  • estrarre le pagine Word DOCX in Java utilizzando l’intervallo esatto dei numeri di pagina;
  • ed estrai pagine da Word gratuitamente utilizzando uno strumento di estrazione di pagine Word online.

Inoltre, forniamo anche una sezione di riferimento API che consente di visualizzare e comunicare con le nostre API direttamente tramite il browser. Il codice sorgente completo di Java SDK è disponibile gratuitamente su GitHub. Controlla GroupDocs.Merger Cloud SDK per Java Esempi qui.

Inoltre, ti consigliamo di seguire la nostra Guida introduttiva per i passaggi dettagliati e l’utilizzo dell’API.

Infine, continuiamo a scrivere nuovi post sul blog su diverse operazioni sui documenti utilizzando l’API REST. Quindi, ti preghiamo di contattarci per gli aggiornamenti regolari.

Fai una domanda

In caso di domande su come estrarre le pagine del documento, non esitare a contattarci nel Forum di supporto gratuito.

Domande frequenti

Come estraggo pagine da un documento Word online in Java?

Puoi estrarre pagine da un file Word utilizzando GroupDocs.Merger Cloud SDK for Java e semplificare il tuo flusso di lavoro.

Posso estrarre pagine specifiche utilizzando l’API REST?

Sì, puoi specificare il numero di pagina in un formato array per estrarre pagine specifiche utilizzando GroupDocs.Merger Cloud SDK for Java.

Quali formati di file sono supportati da GroupDocs.Merger Cloud SDK per Java?

GroupDocs.Merger Cloud SDK for Java supporta una vasta gamma di formati di file, inclusi Word, Excel, JPG, PowerPoint, PDF, HTML e molti altri.

Posso estrarre più pagine da un file Word utilizzando GroupDocs.Merger Cloud SDK per Java?

Sì, puoi estrarre più pagine da un documento Word utilizzando GroupDocs.Merger Cloud SDK for Java specificando l’intervallo di pagine che desideri estrarre.

Guarda anche

Ecco alcuni articoli correlati che potresti trovare utili: