Wenn Sie mit PDF Dateien arbeiten, geraten Sie möglicherweise in eine Situation, in der Sie Seiten aus einer PDF-Datei extrahieren müssen. Das Extrahieren von Seiten aus einer PDF-Datei kann eine zeitaufwändige Aufgabe sein, insbesondere wenn Sie dies manuell tun oder große Dokumente bearbeiten müssen. Glücklicherweise können Sie mit Hilfe des GroupDocs.Merger Cloud SDK für Java ganz einfach Seiten aus einer PDF-Datei programmgesteuert extrahieren. In diesem Artikel erfahren Sie, wie Sie in Java Seiten aus PDFs extrahieren.
Die folgenden Themen sollen in diesem Artikel behandelt werden:
- Java PDF Pages Extractor REST API und SDK-Installation
- So extrahieren Sie PDF-Seiten anhand exakter Seitenzahlen in Java
- So extrahieren Sie Seiten aus PDFs nach Seitenbereichen mit Java
Java PDF Pages Extractor REST API und SDK-Installation
GroupDocs.Merger Cloud SDK für Java ist eine cloudbasierte API, die es Entwicklern ermöglicht, Seiten aus Dateien und anderen Dokumenttypen, einschließlich Word und Excel, zusammenzuführen, zu extrahieren, aufzuteilen, neu anzuordnen und zu entfernen , PowerPoint, HTML, PDF und viele mehr. Dieses leistungsstarke SDK ist einfach zu verwenden und kann in eine Java-basierte Anwendung integriert werden, um Dateimanipulationsaufgaben zu automatisieren.
Sie können entweder die JAR-Datei der API herunterladen oder sie mit Maven installieren, indem Sie das folgende Repository und die folgende Abhängigkeit zur pom.xml-Datei Ihres Projekts hinzufügen:
Maven-Repository:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Maven-Dependency:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-merger-cloud</artifactId>
<version>23.2</version>
<scope>compile</scope>
</dependency>
Jetzt müssen Sie sich auf der GroupDocs-Website für ein kostenloses Testkonto anmelden oder ein Abonnement erwerben, um Ihren API-Schlüssel zu erhalten. Sobald Sie die Client-ID und das Client-Geheimnis haben, fügen Sie den folgenden Codeausschnitt zu einer Java-basierten Anwendung hinzu:
# Holen Sie sich nach der Registrierung Ihre client_id und client_secret von https://dashboard.groupdocs.cloud.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
So extrahieren Sie PDF-Seiten anhand exakter Seitenzahlen in Java
Um Seiten aus einer PDF-Datei mit dem GroupDocs.Merger Cloud SDK für Java zu extrahieren, müssen Sie die folgenden Schritte ausführen:
- Hochladen der PDF Dateien in die Cloud
- Extrahieren PDF-Seiten mit Java
- Herunterladen des PDF Dokuments
Laden Sie die Dateien hoch
Laden Sie zunächst die PDF-Datei mithilfe des unten angegebenen Codebeispiels in die Cloud hoch:
package com.groupdocsdev.classes;
import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Laden Sie die Datei mit Java in den Cloud-Speicher hoch
public class App {
public static void main(String[] args) {
FileApi apiInstance = new FileApi(configuration);
try {
File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
FilesUploadResult response = apiInstance.uploadFile(request);
System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Dadurch ist die hochgeladene PDF-Datei im Dateienbereich Ihres Dashboards in der Cloud verfügbar.
Seiten aus PDF Dateien in Java extrahieren
Hier finden Sie eine Schritt-für-Schritt-Anleitung und ein Beispielcode-Snippet zum Extrahieren von Seiten aus einer PDF-Datei mit GroupDocs.Merger Cloud SDK für Java:
- Importieren Sie zunächst die erforderlichen Klassen in Ihre Java-Datei.
- Zweitens erstellen Sie eine Instanz der Klasse PagesApi.
- Drittens erstellen Sie eine Instanz der Klasse FileInfo.
- Legen Sie anschließend den Pfad der Quelleingabedatei fest.
- Erstellen Sie nun eine Instanz der ExtractOptions() Klasse.
- Definieren Sie dann die Extraktionsoptionen setFileInfo, setOutputPath und setPages-Sammlung im Array-Format.
- Erstellen Sie nun eine Instanz der ExtractRequest() Klasse und übergeben Sie den ExtractOptions-Parameter.
- Extrahieren Sie abschließend Seiten, indem Sie die Methode extract() der PagesApi aufrufen und den Parameter ExtractRequest übergeben.
Der folgende Codeausschnitt zeigt, wie man PDF Dateien in Java mithilfe der REST-API in einzelne Seiten aufteilt:
package com.groupdocsdev.classes;
import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// So extrahieren Sie PDF-Seiten anhand exakter Seitenzahlen in Java.
public class App {
public static void main(String[] args) {
// Erstellen Sie eine Instanz der Pages-API.
PagesApi apiInstance = new PagesApi(configuration);
try {
// Bereiten Sie die Einstellungen vor
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ExtractOptions options = new ExtractOptions();
options.setFileInfo(fileInfo);
options.setOutputPath("java-testing/output-sample-file.pdf");
options.setPages(Arrays.asList(3, 5, 7));
ExtractRequest request = new ExtractRequest(options);
DocumentResult response = apiInstance.extract(request);
// Ausgabedateipfad abrufen
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Laden Sie die Datei herunter
Das obige Codebeispiel speichert bestimmte PDF-Seiten in der Cloud. Sie können es mit dem folgenden Codebeispiel herunterladen:
package com.groupdocsdev.classes;
import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Laden Sie die Datei mit Java aus dem Cloud-Speicher herunter
public class App {
public static void main(String[] args) {
FileApi apiInstance = new FileApi(configuration);
try {
DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.pdf", MyStorage, null);
File response = apiInstance.downloadFile(request);
System.out.println("Expected response type is downloadFile: " + response.length());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
So extrahieren Sie Seiten aus PDF nach Seitenbereichen mit Java
In diesem Abschnitt behandeln wir eine Schritt-für-Schritt-Anleitung und ein Beispielcode-Snippet zum Speichern ausgewählter Seiten aus PDF mit Java durch Anwenden des Seitenbereichs:
- Importieren Sie zunächst die erforderlichen Klassen in Ihre Java-Datei.
- Zweitens erstellen Sie eine Instanz der Klasse PagesApi.
- Drittens erstellen Sie eine Instanz der Klasse FileInfo.
- Legen Sie anschließend den Pfad der Quelleingabedatei fest.
- Erstellen Sie nun eine Instanz der ExtractOptions() Klasse.
- Definieren Sie dann die Extraktionsoptionen setFileInfo, setOutputPath, setStartPageNumber und setEndPageNumber.
- Als nächstes setzen Sie die Seitenoptionen setRangeMode auf EVENPAGES.
- Erstellen Sie nun eine Instanz der ExtractRequest() Klasse und übergeben Sie den ExtractOptions-Parameter.
- Extrahieren Sie abschließend Seiten, indem Sie die Methode extract() der PagesApi aufrufen und den Parameter ExtractRequest übergeben.
Der folgende Codeausschnitt zeigt, wie PDF-Seiten durch Anwenden von Seitenbereich und -modus in Java extrahiert werden:
package com.groupdocsdev.classes;
import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// So extrahieren Sie Seiten aus PDF nach Seitenbereichen mit Java.
public class App {
public static void main(String[] args) {
// Erstellen Sie eine Instanz der Pages-API.
PagesApi apiInstance = new PagesApi(configuration);
try {
// Bereiten Sie die Einstellungen vor
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ExtractOptions options = new ExtractOptions();
options.setFileInfo(fileInfo);
options.setOutputPath("java-testing/output-sample-file.pdf");
options.setStartPageNumber(1);
options.setEndPageNumber(10);
options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);
ExtractRequest request = new ExtractRequest(options);
DocumentResult response = apiInstance.extract(request);
// Ausgabedateipfad abrufen
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Kostenloser Online-PDF-Seitenextraktor
Wie extrahiere ich PDF-Seiten kostenlos? Bitte probieren Sie den kostenlosen PDF-Seiten-Extraktor aus, um bestimmte Seiten kostenlos aus PDF zu extrahieren. Dieser Online-PDF-Seitenextraktor wurde unter Verwendung der oben genannten Groupdocs.Merger Cloud-APIs entwickelt.
Fazit
GroupDocs.Merger Cloud SDK für Java bietet eine einfache Möglichkeit, PDF-Seiten in Java in ein neues PDF zu extrahieren. Folgendes haben Sie in diesem Artikel gelernt:
- wie man PDF Dateien mit Java in mehrere Seiten nach Nummer aufteilt;
- Laden Sie die PDF-Datei programmgesteuert mit Java in der Cloud hoch und laden Sie sie herunter.
- Trennen Sie PDF Dateien in Java mithilfe von Seitenbereichen in einzelne Seiten.
- und extrahieren Sie Seiten kostenlos online aus PDF mit einem kostenlosen Online-PDF-Seitenextraktor.
Darüber hinaus stellen wir auch einen API-Referenzabschnitt zur Verfügung, mit dem Sie unsere APIs direkt über den Browser visualisieren und mit ihnen kommunizieren können. Der vollständige Quellcode des Java SDK ist auf Github frei verfügbar. Bitte überprüfen Sie das GroupDocs.Merger Cloud SDK für Java Beispiele hier.
Darüber hinaus empfehlen wir Ihnen, unserem Leitfaden „Erste Schritte“ zu folgen, um detaillierte Schritte und die API-Nutzung zu erfahren.
Schließlich schreiben wir weiterhin neue Blog-Beiträge zu verschiedenen Dokumentvorgängen mithilfe der REST-API. Bitte kontaktieren Sie uns für die regelmäßigen Updates.
Stelle eine Frage
Wenn Sie Fragen zur PDF-Seiten-Extraktor-API haben, können Sie uns diese gerne im Kostenlosen Support-Forum stellen.
FAQs
Wie extrahiere ich Seiten aus einer PDF-Datei in Java?
Sie können Seiten aus einer PDF-Datei mit GroupDocs.Merger Cloud SDK für Java extrahieren.
Ist es möglich, eine einzelne Seite aus PDF in Java zu exportieren?
Ja, Sie können PDF-Seiten programmgesteuert in Java mit GroupDocs.Merger Cloud SDK für Java in einzelne Dateien extrahieren.
Aus welchen Dateiformaten kann ich Seiten mit dem GroupDocs.Merger Cloud SDK für Java extrahieren?
Zusätzlich zu PDF Dateien kann GroupDocs.Merger Cloud SDK für Java Seiten aus Microsoft Word, Excel, PowerPoint, HTML und anderen Dateiformaten extrahieren.
Siehe auch
Hier sind einige verwandte Artikel, die für Sie hilfreich sein könnten:
- Teilen Sie Word Dokumente in Java in separate Dateien auf
- So führen Sie Word Dokumente (DOC, DOCX) in Java zusammen
- So teilen Sie PowerPoint PPT oder PPTX-Folien in Python
- Extrahieren Sie bestimmte Seiten aus PDF mit Python
- Extrahieren Sie Seiten aus Word Dokumenten mithilfe der Rest-API
- Führen Sie PowerPoint PPT/PPTX Dateien online mithilfe der REST-API zusammen
- So ändern Sie die Seitenausrichtung in einem Word Dokument mit Ruby
- So teilen Sie ein Word Dokument mithilfe von Node.js in separate Dateien auf