So extrahieren Sie Word Dokumentseiten online in Java

Dokumentseiten extrahieren – Extrahieren Sie Seiten aus einer Word-Datei in Java.

Haben Sie Schwierigkeiten, bestimmte Seiten aus einem Word Dokument in Java zu extrahieren? Bei der Arbeit mit großen Word Dokumenten kann es eine Herausforderung sein, bestimmte Seiten aus einem großen Word Dokument zu extrahieren. Glücklicherweise hilft Ihnen das GroupDocs.Merger Cloud SDK für Java dabei, diesen Prozess zu vereinfachen. In diesem Artikel erfahren Sie, wie Sie mithilfe des GroupDocs.Merger Cloud SDK für Java Seiten aus einer Word-Datei in Java extrahieren.

Die folgenden Themen sollen in diesem Artikel behandelt werden:

Java REST API zum Extrahieren von Word Dokumentseiten – SDK-Installation

GroupDocs.Merger Cloud SDK für Java ist eine leistungsstarke API, die es Entwicklern ermöglicht, Dokumente und Dateien in der Cloud zusammenzuführen, aufzuteilen, neu anzuordnen, zu extrahieren und zu bearbeiten. Es bietet eine einfache, zuverlässige und schnelle Möglichkeit, Dokumentseiten und deren Inhalte zu verwalten. Es ist mit den gängigsten Dateiformaten wie PDF, Word, Excel, HTML, PowerPoint und vielen mehr kompatibel. Dieses leistungsstarke SDK ist einfach zu verwenden und kann in eine Java-basierte Anwendung integriert werden, um den Dateibearbeitungsprozess zu automatisieren.

Sie können entweder die JAR-Datei der API herunterladen oder sie mit Maven installieren, indem Sie das folgende Repository und die folgende Abhängigkeit zur pom.xml-Datei Ihres Projekts hinzufügen:

Maven-Repository:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven-Dependency:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

Jetzt müssen Sie sich auf der GroupDocs-Website für ein kostenloses Testkonto anmelden oder ein Abonnement erwerben, um Ihren API-Schlüssel zu erhalten. Sobald Sie die Client-ID und das Client-Geheimnis haben, fügen Sie den folgenden Codeausschnitt zu einer Java-basierten Anwendung hinzu:

# Holen Sie sich nach der Registrierung Ihre client_id und client_secret von https://dashboard.groupdocs.cloud.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Seiten aus Word Dokumenten in Java mit exakten Seitenzahlen extrahieren

Nachdem wir nun unsere Umgebung eingerichtet haben, sehen wir uns an, wie Sie mit dem GroupDocs.Merger Cloud SDK für Java Seiten aus einem Word Dokument extrahieren. Hier sind die Schritte:

Laden Sie die Dateien hoch

Laden Sie zunächst das Word Dokument mithilfe des unten angegebenen Codebeispiels in die Cloud hoch:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Laden Sie die Datei mit Java in den Cloud-Speicher hoch
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.docx");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.docx", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Dadurch ist die hochgeladene Word-Datei im Dateienbereich Ihres Dashboards in der Cloud verfügbar.

Seiten aus Word Dokumenten in Java extrahieren

In diesem Abschnitt behandeln wir Schritte und einen Beispielcodeausschnitt zum Extrahieren von Seiten aus einem Word Dokument mit GroupDocs.Merger Cloud SDK für Java:

  • Importieren Sie zunächst die erforderlichen Klassen in Ihre Java-Datei.
  • Zweitens erstellen Sie eine Instanz der Klasse PagesApi.
  • Drittens erstellen Sie eine Instanz der Klasse FileInfo.
  • Legen Sie anschließend den Pfad der Quelleingabedatei fest.
  • Erstellen Sie nun eine Instanz der ExtractOptions() Klasse.
  • Definieren Sie dann die Extraktionsoptionen setFileInfo, setOutputPath und setPages-Sammlung im Array-Format.
  • Erstellen Sie nun eine Instanz der ExtractRequest() Klasse und übergeben Sie den ExtractOptions-Parameter.
  • Extrahieren Sie abschließend DOCX-Seiten, indem Sie die Methode extract() der PagesApi aufrufen und den Parameter ExtractRequest übergeben.

Der folgende Codeausschnitt zeigt, wie man Word Dokumentseiten mithilfe der REST-API in eine neue Datei in Java extrahiert:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Extrahieren Sie Seiten aus einem Word Dokument in Java mit genauen Seitenzahlen.
public class App {

	public static void main(String[] args) {

		// Erstellen Sie eine Instanz der Pages-API.			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Bereiten Sie die Einstellungen vor
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Ausgabedateipfad abrufen
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Laden Sie die Datei herunter

Das obige Codebeispiel speichert extrahierte Seiten von Word Dokumenten in der Cloud. Sie können es mit dem folgenden Codebeispiel herunterladen:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Laden Sie die Datei mit Java aus dem Cloud-Speicher herunter
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.docx", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Extrahieren Sie Seiten aus Word Dateien in Java mithilfe des Seitennummernbereichs

In diesem Abschnitt stellen wir Schritte und einen Beispielcodeausschnitt zum Extrahieren bestimmter Seiten aus einem Word Dokument anhand des genauen Seitenzahlenbereichs bereit:

  • Importieren Sie zunächst die erforderlichen Klassen in Ihre Java-Datei.
  • Zweitens erstellen Sie eine Instanz der Klasse PagesApi.
  • Drittens erstellen Sie eine Instanz der Klasse FileInfo.
  • Legen Sie anschließend den Pfad der Quelleingabedatei fest.
  • Erstellen Sie nun eine Instanz der ExtractOptions() Klasse.
  • Definieren Sie dann die Extraktionsoptionen setFileInfo, setOutputPath, setStartPageNumber und setEndPageNumber.
  • Als nächstes setzen Sie die Seitenoptionen setRangeMode auf EVENPAGES.
  • Erstellen Sie nun eine Instanz der ExtractRequest() Klasse und übergeben Sie den ExtractOptions-Parameter.
  • Extrahieren Sie abschließend Seiten, indem Sie die Methode extract() der PagesApi aufrufen und den Parameter ExtractRequest übergeben.

Der folgende Codeausschnitt zeigt, wie Seiten aus Word Dateien durch Anwenden von Seitenbereich und -modus mit Java extrahiert werden:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Extrahieren Sie Seiten aus einer Word-Datei in Java mithilfe des Seitenzahlenbereichs.
public class App {

	public static void main(String[] args) {
		
		// Erstellen Sie eine Instanz der Pages-API.
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Bereiten Sie die Einstellungen vor
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Ausgabedateipfad abrufen
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Kostenloser Online-Word Dokument-Extraktor

Wie extrahiere ich Word Dokumentseiten kostenlos? Bitte probieren Sie den Online-Word-Seitenextraktor aus, um bestimmte Seiten kostenlos aus Word Dokumenten zu extrahieren. Dieses Online-Tool zum Extrahieren von Word-Seiten wurde unter Verwendung der oben genannten Groupdocs.Merger Cloud-APIs entwickelt.

Fazit

Zusammenfassend lässt sich sagen, dass das GroupDocs.Merger Cloud SDK für Java eine großartige Wahl ist, die Entwicklern dabei helfen kann, Seiten aus Word Dokumenten online zu extrahieren. Folgendes haben Sie in diesem Artikel gelernt:

  • wie man mit Java Seiten aus Word Dokumenten nach Seitenzahl extrahiert;
  • Laden Sie das Word Dokument programmgesteuert in die Cloud hoch und laden Sie es herunter.
  • Extrahieren Sie Seiten aus Word DOCX in Java unter Verwendung des genauen Seitenzahlenbereichs.
  • und extrahieren Sie Seiten kostenlos aus Word mit einem Online-Tool zum Extrahieren von Word-Seiten.

Darüber hinaus stellen wir auch einen API-Referenzabschnitt zur Verfügung, mit dem Sie unsere APIs direkt über den Browser visualisieren und mit ihnen kommunizieren können. Der vollständige Quellcode des Java SDK ist auf Github frei verfügbar. Bitte überprüfen Sie das GroupDocs.Merger Cloud SDK für Java Beispiele hier.

Darüber hinaus empfehlen wir Ihnen, unserem Leitfaden „Erste Schritte“ zu folgen, um detaillierte Schritte und die API-Nutzung zu erfahren.

Schließlich schreiben wir weiterhin neue Blog-Beiträge zu verschiedenen Dokumentvorgängen mithilfe der REST-API. Bitte kontaktieren Sie uns für die regelmäßigen Updates.

Stelle eine Frage

Wenn Sie Fragen zum Extrahieren von Dokumentseiten haben, wenden Sie sich bitte an uns im Kostenlosen Support-Forum.

FAQs

Wie extrahiere ich Seiten aus einem Word Dokument online in Java?

Sie können Seiten aus einer Word-Datei mit GroupDocs.Merger Cloud SDK für Java extrahieren und Ihren Arbeitsablauf optimieren.

Kann ich bestimmte Seiten mithilfe der REST-API extrahieren?

Ja, Sie können die Seitenzahl in einem Array-Format angeben, um bestimmte Seiten mit GroupDocs.Merger Cloud SDK für Java zu extrahieren.

Welche Dateiformate werden vom GroupDocs.Merger Cloud SDK für Java unterstützt?

GroupDocs.Merger Cloud SDK für Java unterstützt eine breite Palette von Dateiformaten, darunter Word, Excel, JPG, PowerPoint, PDF, HTML und viele mehr.

Kann ich mit dem GroupDocs.Merger Cloud SDK für Java mehrere Seiten aus einer Word-Datei extrahieren?

Ja, Sie können mit GroupDocs.Merger Cloud SDK for Java mehrere Seiten aus einem Word Dokument extrahieren, indem Sie den Seitenbereich angeben, den Sie extrahieren möchten.

Siehe auch

Hier sind einige verwandte Artikel, die für Sie hilfreich sein könnten: