Как извлечь страницы документа Word онлайн на Java

Извлечение страниц документа — извлечение страниц из файла Word в Java.

Вы изо всех сил пытаетесь извлечь определенные страницы из документа Word на Java? При работе с большими документами Word извлечение определенных страниц из большого документа Word может оказаться сложной задачей. К счастью, GroupDocs.Merger Cloud SDK для Java поможет упростить этот процесс. В этой статье мы рассмотрим, как извлечь страницы из файла Word в Java с помощью GroupDocs.Merger Cloud SDK для Java.

В этой статье должны быть раскрыты следующие темы:

Java REST API для извлечения страниц документа Word — установка SDK

GroupDocs.Merger Cloud SDK для Java — это мощный API, который позволяет разработчикам объединять, разделять, переупорядочивать, извлекать и манипулировать документами и файлами в облаке. Он обеспечивает простой, надежный и быстрый способ управления страницами документа и их содержимым. Он совместим с большинством популярных форматов файлов, таких как PDF, Word, Excel, HTML, PowerPoint и многими другими. Этот мощный SDK прост в использовании и может быть интегрирован в приложение на основе Java для автоматизации процесса манипулирования файлами.

Вы можете либо скачать файл JAR API, либо установить его с помощью Maven, добавив следующий репозиторий и зависимость в файл pom.xml вашего проекта:

Репозиторий Мавена:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Зависимость Мейвена:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

Теперь вам нужно зарегистрироваться для получения бесплатной пробной учетной записи или приобрести план подписки на веб-сайте GroupDocs, чтобы получить ключ API. Получив идентификатор клиента и секрет клиента, добавьте приведенный ниже фрагмент кода в приложение на основе Java:

# Получите свой client_id и client_secret с https://dashboard.groupdocs.cloud после регистрации.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Извлечение страниц из документов Word в Java с использованием точных номеров страниц

Теперь, когда мы настроили нашу среду, давайте посмотрим, как использовать пакет SDK GroupDocs.Merger Cloud для Java для извлечения страниц из документа Word. Вот шаги:

Загрузите файлы

Во-первых, загрузите документ Word в облако, используя приведенный ниже пример кода:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Загрузить файл в облачное хранилище с помощью Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.docx");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.docx", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

В результате загруженный файл Word будет доступен в разделе файлов вашей панели инструментов в облаке.

Извлечение страниц из документов Word в Java

В этом разделе мы рассмотрим шаги и пример фрагмента кода, как извлечь страницы из документа Word с помощью GroupDocs.Merger Cloud SDK для Java:

  • Во-первых, импортируйте необходимые классы в ваш файл Java.
  • Во-вторых, создайте экземпляр класса PagesApi.
  • В-третьих, создайте экземпляр класса FileInfo.
  • После этого установите путь к исходному входному файлу.
  • Теперь создайте экземпляр класса ExtractOptions().
  • Затем определите параметры извлечения setFileInfo, setOutputPath и коллекции setPages в формате массива.
  • Теперь создайте экземпляр класса ExtractRequest() и передайте параметр ExtractOptions.
  • Наконец, извлеките страницы DOCX, вызвав метод extract() PagesApi и передав параметр ExtractRequest.

В следующем фрагменте кода показано, как извлечь страницы документа Word в новый файл на Java с помощью REST API:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Извлечение страниц из документа Word на Java с использованием точных номеров страниц.
public class App {

	public static void main(String[] args) {

		// Создайте экземпляр API страниц.			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Подготовьте настройки
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Получить путь к выходному файлу
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Загрузите файл

Приведенный выше пример кода сохранит извлеченные страницы документов Word в облаке. Вы можете загрузить его, используя следующий пример кода:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Скачать файл из облачного хранилища с помощью Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.docx", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Извлечение страниц из файлов Word в Java с использованием диапазона номеров страниц

В этом разделе мы предоставим шаги и пример фрагмента кода о том, как извлечь определенные страницы из документа Word по точному диапазону номеров страниц:

  • Во-первых, импортируйте необходимые классы в ваш файл Java.
  • Во-вторых, создайте экземпляр класса PagesApi.
  • В-третьих, создайте экземпляр класса FileInfo.
  • После этого установите путь к исходному входному файлу.
  • Теперь создайте экземпляр класса ExtractOptions().
  • Затем определите параметры извлечения setFileInfo, setOutputPath, setStartPageNumber и setEndPageNumber.
  • Затем установите для параметров страницы setRangeMode значение EVENPAGES.
  • Теперь создайте экземпляр класса ExtractRequest() и передайте параметр ExtractOptions.
  • Наконец, извлеките страницы, вызвав метод extract() PagesApi и передав параметр ExtractRequest.

В следующем фрагменте кода показано, как извлечь страницы файла Word, применяя диапазон и режим страниц с помощью Java:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Извлечение страниц из файла Word в Java с использованием диапазона номеров страниц.
public class App {

	public static void main(String[] args) {
		
		// Создайте экземпляр API страниц.
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Подготовьте настройки
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Получить путь к выходному файлу
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Бесплатный онлайн-экстрактор документов Word

Как извлечь страницы документа Word бесплатно? Попробуйте онлайн-экстрактор страниц Word, чтобы бесплатно извлечь определенные страницы из документов Word. Этот онлайн-инструмент для извлечения страниц Word разработан с использованием вышеупомянутых облачных API-интерфейсов Groupdocs.Merger.

Заключение

В заключение, GroupDocs.Merger Cloud SDK для Java — отличный выбор, который может помочь разработчикам извлекать страницы из документов Word в Интернете. Вот что вы узнали из этой статьи:

  • как извлекать страницы из документов Word по номеру страницы с помощью Java;
  • программно загружать и скачивать документ Word в облаке;
  • извлекать страницы Word DOCX в Java, используя точный диапазон номеров страниц;
  • и извлекайте страницы из Word бесплатно с помощью онлайн-инструмента для извлечения страниц Word.

Кроме того, мы также предоставляем раздел Справочника по API, который позволяет вам визуализировать и взаимодействовать с нашими API напрямую через браузер. Полный исходный код Java SDK находится в свободном доступе на Github. Пожалуйста, проверьте GroupDocs.Merger Cloud SDK для Java Примеры здесь.

Кроме того, мы предлагаем вам следовать нашему Руководству по началу работы для получения подробных инструкций и использования API.

Наконец, мы продолжаем писать новые сообщения в блогах о различных операциях с документами с использованием REST API. Поэтому, пожалуйста, свяжитесь с нами для получения регулярных обновлений.

Задайте вопрос

Если у вас есть какие-либо вопросы о том, как извлечь страницы документа, задайте их нам на Форуме бесплатной поддержки.

Часто задаваемые вопросы

Как извлечь страницы из документа Word онлайн на Java?

Вы можете извлекать страницы из файла Word с помощью GroupDocs.Merger Cloud SDK для Java и оптимизировать рабочий процесс.

Могу ли я извлечь определенные страницы с помощью REST API?

Да, вы можете указать номер страницы в формате массива для извлечения определенных страниц с помощью GroupDocs.Merger Cloud SDK для Java.

Какие форматы файлов поддерживает GroupDocs.Merger Cloud SDK для Java?

GroupDocs.Merger Cloud SDK для Java поддерживает широкий диапазон форматов файлов, включая Word, Excel, JPG, PowerPoint, PDF, HTML и многие другие.

Можно ли извлечь несколько страниц из файла Word с помощью GroupDocs.Merger Cloud SDK для Java?

Да, вы можете извлечь несколько страниц из документа Word с помощью GroupDocs.Merger Cloud SDK для Java, указав диапазон страниц, которые вы хотите извлечь.

Смотрите также

Вот несколько связанных статей, которые могут оказаться полезными: