Como extrair páginas de documentos do Word online em Java

Extrair páginas do documento - Extrair páginas do arquivo do Word em Java.

Você está lutando para extrair páginas específicas de um documento do Word em Java? Ao trabalhar com grandes documentos do Word, pode ser uma tarefa desafiadora extrair páginas específicas de um grande documento do Word. Felizmente, o GroupDocs.Merger Cloud SDK para Java ajuda você a tornar esse processo mais fácil. Neste artigo, exploraremos como extrair páginas de um arquivo do Word em Java usando GroupDocs.Merger Cloud SDK for Java.

Os seguintes tópicos serão abordados neste artigo:

Java REST API para extrair páginas de documentos do Word - Instalação do SDK

GroupDocs.Merger Cloud SDK for Java é uma API poderosa que permite aos desenvolvedores mesclar, dividir, reordenar, extrair e manipular documentos e arquivos na nuvem. Ele fornece uma maneira fácil, confiável e rápida de gerenciar páginas de documentos e seu conteúdo. É compatível com os [formatos de arquivo] mais populares 5, como PDF, Word, Excel, HTML, PowerPoint e muitos mais. Este poderoso SDK é fácil de usar e pode ser integrado a um aplicativo baseado em Java para automatizar o processo de manipulação de arquivos.

Você pode baixar o arquivo JAR da API ou instalá-lo usando o Maven adicionando o seguinte repositório e dependência ao arquivo pom.xml do seu projeto:

Repositório Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dependência do Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

Agora, você deve inscrever-se para uma conta de avaliação gratuita ou comprar um plano de assinatura no site do GroupDocs para obter sua chave de API. Depois de obter o ID do cliente e o segredo do cliente, adicione o trecho de código abaixo a um aplicativo baseado em Java:

# Obtenha seu client_id e client_secret em https://dashboard.groupdocs.cloud após o registro.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Extraia páginas de documentos do Word em Java usando números de página exatos

Agora que configuramos nosso ambiente, vamos ver como usar o GroupDocs.Merger Cloud SDK for Java para extrair páginas de um documento do Word. Aqui estão os passos:

  • Carregar os arquivos do Word para a nuvem
  • Extrair Páginas do Word online em Java
  • Baixar o documento do Word

Envie os arquivos

Em primeiro lugar, carregue o documento do Word na nuvem usando o exemplo de código abaixo:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Carregar arquivo para o Cloud Storage usando Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.docx");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.docx", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Como resultado, o arquivo do Word carregado estará disponível na seção de arquivos do seu painel na nuvem.

Extraia páginas de documentos do Word em Java

Nesta seção, abordaremos as etapas e um trecho de código de exemplo sobre como extrair páginas de um documento do Word usando GroupDocs.Merger Cloud SDK for Java:

  • Em primeiro lugar, importe as classes necessárias para o seu arquivo Java.
  • Em segundo lugar, crie uma instância da classe PagesApi.
  • Em terceiro lugar, crie uma instância da classe FileInfo.
  • Depois disso, defina o caminho do arquivo de entrada de origem.
  • Agora, crie uma instância da classe ExtractOptions().
  • Em seguida, defina as opções de extração setFileInfo, setOutputPath e coleção setPages em formato de matriz.
  • Agora, crie uma instância da classe ExtractRequest() e passe o parâmetro ExtractOptions.
  • Por fim, extraia as páginas DOCX chamando o método extract() da PagesApi e passando o parâmetro ExtractRequest.

O trecho de código a seguir mostra como extrair páginas de documentos do Word em um novo arquivo em Java usando a API REST:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Extraia páginas do documento do Word em Java usando números de página exatos.
public class App {

	public static void main(String[] args) {

		// Crie uma instância da API de páginas.			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Prepare as configurações
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Obter caminho do arquivo de saída
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Baixe o arquivo

O exemplo de código acima salvará páginas extraídas de documentos do Word na nuvem. Você pode baixá-lo usando o seguinte exemplo de código:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Baixe o arquivo do armazenamento em nuvem usando Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.docx", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Extraia páginas de arquivos do Word em Java usando o intervalo de números de página

Nesta seção, forneceremos etapas e um trecho de código de exemplo sobre como extrair páginas específicas de um documento do Word pelo intervalo de número de página exato:

  • Em primeiro lugar, importe as classes necessárias para o seu arquivo Java.
  • Em segundo lugar, crie uma instância da classe PagesApi.
  • Em terceiro lugar, crie uma instância da classe FileInfo.
  • Depois disso, defina o caminho do arquivo de entrada de origem.
  • Agora, crie uma instância da classe ExtractOptions().
  • Em seguida, defina as opções de extração setFileInfo, setOutputPath, setStartPageNumber e setEndPageNumber.
  • Em seguida, defina as opções de página setRangeMode como EVENPAGES.
  • Agora, crie uma instância da classe ExtractRequest() e passe o parâmetro ExtractOptions.
  • Por fim, extraia as páginas chamando o método extract() da PagesApi e passando o parâmetro ExtractRequest.

O trecho de código a seguir mostra como extrair páginas de arquivo do Word aplicando intervalo e modo de páginas usando Java:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Extraia páginas do arquivo do Word em Java usando o intervalo de números de página.
public class App {

	public static void main(String[] args) {
		
		// Crie uma instância da API de páginas.
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Prepare as configurações
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Obter caminho do arquivo de saída
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extrator de Documentos do Word Online Gratuito

Como extrair páginas de documentos do Word gratuitamente? Por favor, experimente o extrator de página online do Word para extrair páginas específicas de documentos do Word gratuitamente. Esta ferramenta online de extração de páginas do Word foi desenvolvida usando as APIs Groupdocs.Merger Cloud mencionadas acima.

Conclusão

Em conclusão, o GroupDocs.Merger Cloud SDK para Java é uma ótima opção que pode ajudar os desenvolvedores a extrair páginas de documentos do Word online. O seguinte é o que você aprendeu neste artigo:

  • como extrair páginas de documentos do Word por número de página usando Java;
  • carregar e baixar programaticamente o documento do Word na nuvem;
  • extrair páginas Word DOCX em Java usando o intervalo exato de números de página;
  • e extraia páginas do Word gratuitamente usando uma ferramenta online de extração de páginas do Word.

Além disso, também fornecemos uma seção de referência de API que permite que você visualize e se comunique com nossas APIs diretamente pelo navegador. O código-fonte completo do Java SDK está disponível gratuitamente no Github. Verifique o GroupDocs.Merger Cloud SDK para Java Exemplos aqui.

Além disso, sugerimos que você siga nosso Guia de primeiros passos para obter etapas detalhadas e uso da API.

Por fim, continuamos escrevendo novas postagens de blog sobre diferentes operações de documentos usando a API REST. Então, por favor, entre em contato para as atualizações regulares.

Faça uma pergunta

Se você tiver alguma dúvida sobre como extrair páginas de documentos, sinta-se à vontade para nos perguntar no Fórum de suporte gratuito.

perguntas frequentes

Como faço para extrair páginas de um documento do Word online em Java?

Você pode extrair páginas de um arquivo do Word usando GroupDocs.Merger Cloud SDK for Java e agilizar seu fluxo de trabalho.

Posso extrair páginas específicas usando a API REST?

Sim, você pode especificar o número da página em um formato de array para extrair páginas específicas usando GroupDocs.Merger Cloud SDK for Java.

Quais formatos de arquivo são suportados pelo GroupDocs.Merger Cloud SDK for Java?

GroupDocs.Merger Cloud SDK para Java oferece suporte a uma grande variedade de formatos de arquivo, incluindo Word, Excel, JPG, PowerPoint, PDF, HTML e muitos mais.

Posso extrair várias páginas de um arquivo do Word usando GroupDocs.Merger Cloud SDK para Java?

Sim, você pode extrair várias páginas de um documento do Word usando GroupDocs.Merger Cloud SDK for Java especificando o intervalo de páginas que deseja extrair.

Veja também

Aqui estão alguns artigos relacionados que podem ser úteis: