PDF(Portable Document Format) ist ein weit verbreitetes Dateiformat zum Teilen und Speichern von Dokumenten online. Es enthält häufig verschiedene Arten von Inhalten, darunter Text, Bilder, Tabellen und mehr. Das Extrahieren bestimmter Inhalte aus PDF Dateien, beispielsweise Bildern, kann ohne zuverlässige Tools oder eine Bibliothek eine anspruchsvolle Aufgabe sein. Ein solches Tool ist das GroupDocs.Parser Cloud SDK für Java, das eine nahtlose und effiziente Möglichkeit bietet, Bilder aus PDF Dateien zu extrahieren. In diesem Artikel zeigen wir, wie man mithilfe der REST-API Bilder aus PDF Dateien in Java extrahiert.
Die folgenden Themen sollen in diesem Artikel behandelt werden:
- Java REST API zum Trennen von Bildern aus PDF und SDK-Installation
- So extrahieren Sie alle Bilder aus PDF Dateien in Java mithilfe der REST-API
- Bestimmte Bilder aus PDF Dateien in Java mithilfe der Seitenzahl extrahieren
Java REST API zum Trennen von Bildern aus PDF und SDK-Installation
GroupDocs.Parser Cloud SDK für Java ist eine leistungsstarke und vielseitige Java-Bibliothek, die eine einfache und effiziente Möglichkeit bietet, Daten aus verschiedenen Dokumentformaten, einschließlich PDF Dateien, zu analysieren und zu extrahieren. Es bietet eine breite Palette von Funktionen zum Parsen von Dokumenten und ermöglicht Entwicklern das Extrahieren von Bildern, Text, Metadaten und anderen Inhalten. GroupDocs.Parser stellt außerdem C#.NET-, Java-, PHP-, Ruby und Python-SDKs als Mitglieder der Dokumentparser-Familie für die Cloud-APIs bereit.
Um zu beginnen, müssen Sie das GroupDocs.Parser Cloud SDK in Ihr Java-Projekt einbinden. Sie können entweder die JAR-Datei der API herunterladen oder sie mit Maven installieren, indem Sie das folgende Repository und die folgende Abhängigkeit zur pom.xml-Datei Ihres Projekts hinzufügen:
Maven-Repository:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Maven-Dependency:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>23.3</version>
<scope>compile</scope>
</dependency>
Als Nächstes müssen Sie sich auf der GroupDocs-Website für ein kostenloses Testkonto anmelden oder ein Abonnement erwerben und Ihren API-Schlüssel erhalten. Sobald Sie die Client-ID und das Client-Geheimnis haben, fügen Sie den folgenden Codeausschnitt zu einer Java-basierten Anwendung hinzu:
# Holen Sie sich nach der Registrierung Ihre client_id und client_secret von https://dashboard.groupdocs.cloud.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
So extrahieren Sie alle Bilder aus PDF Dateien in Java mithilfe der REST-API
Schreiben wir nun die Schritte und ein Beispielcode-Snippet zum Extrahieren von Bildern aus PDF Dateien mit GroupDocs.Parser Cloud SDK für Java:
- Importieren Sie zunächst die erforderlichen Klassen in Ihre Java-Datei.
- Zweitens erstellen Sie eine Instanz der Klasse ParseApi.
- Drittens erstellen Sie eine Instanz der Klasse FileInfo.
- Als nächstes legen Sie den Pfad zum Eingabe-PDF Dokument fest.
- Erstellen Sie dann eine Instanz der ImagesOptions() Klasse.
- Weisen Sie als Nächstes fileInfo der Bildoption setFileInfo zu.
- Erstellen Sie nun eine Instanz der ImagesRequest() Klasse und übergeben Sie den Parameter ImagesOptions.
- Abschließend erhalten Sie Ergebnisse, indem Sie die Methode ParseApi.images() aufrufen und den Parameter ImagesRequest übergeben.
Das folgende Codebeispiel zeigt, wie alle Bilder online in Java mithilfe der REST-API aus einer PDF-Datei extrahiert werden:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// So extrahieren Sie Bilder aus einer PDF-Datei in Java.
public class App {
public static void main(String[] args) {
// Erstellen Sie eine Instanz der Parse-API
ParseApi apiInstance = new ParseApi(configuration);
try {
// Bereiten Sie die Einstellungen vor
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Ausgabedateipfad abrufen
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Extrahieren Sie bestimmte Bilder aus PDF Dateien in Java mithilfe der Seitenzahl
In diesem Abschnitt stellen wir Schritte und einen Codeausschnitt zum programmgesteuerten Extrahieren bestimmter Bilder aus einer PDF-Datei in Java bereit:
- Importieren Sie zunächst die erforderlichen Klassen in Ihre Java-Datei.
- Zweitens erstellen Sie eine Instanz der Klasse ParseApi.
- Drittens erstellen Sie eine Instanz der Klasse FileInfo.
- Als nächstes legen Sie den Pfad zum Eingabe-PDF Dokument fest.
- Erstellen Sie dann eine Instanz der ImagesOptions() Klasse.
- Weisen Sie als Nächstes fileInfo der Bildoption setFileInfo zu.
- Geben Sie dann die Werte setStartPageNumber und setCountPagesToExtract an.
- Erstellen Sie nun eine Instanz der ImagesRequest() Klasse und übergeben Sie den Parameter ImagesOptions.
- Abschließend erhalten Sie Ergebnisse, indem Sie die Methode ParseApi.images() aufrufen und den Parameter ImagesRequest übergeben.
Das folgende Codebeispiel zeigt, wie Sie mithilfe der REST-API bestimmte Bilder aus einer PDF-Datei nach Seitenbereich in Java extrahieren:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// Extrahieren Sie Bilder online aus einer PDF-Datei nach Seitenbereich in Java.
public class App {
public static void main(String[] args) {
// Erstellen Sie eine Instanz der Parse-API
ParseApi apiInstance = new ParseApi(configuration);
try {
// Bereiten Sie die Einstellungen vor
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setStartPageNumber(1);
options.setCountPagesToExtract(2);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Ausgabedateipfad abrufen
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Kostenloser Online bilderextraktor
Was ist der beste Weg, Bilder kostenlos online aus PDFs zu extrahieren? Bitte versuchen Sie es mit einem Online-PDF-Dateiparser, um Bilder aus PDF Dateien zu extrahieren. Diese PDF-Parser-Software wird unter Verwendung der oben erwähnten Java-Parser-Bibliothek entwickelt.
Abschluss
Zusammenfassend bietet GroupDocs.Parser Cloud SDK für Java eine zuverlässige und effiziente Lösung zum einfachen Extrahieren von Bildern aus PDF Dateien. Folgendes haben Sie aus diesem Artikel gelernt:
- wie man alle Bilder programmgesteuert in Java mithilfe der REST-API aus PDF Dateien extrahiert;
- wie man mithilfe der REST-API bestimmte Bilder aus PDF Dokumenten in Java extrahiert;
- und Online bildextraktionstool zum Extrahieren von Bildern aus PDF Dokumenten.
Darüber hinaus können Sie mithilfe der Dokumentation mehr über die GroupDocs.Parser Cloud API erfahren. Wir bieten auch einen Abschnitt API-Referenz an, mit dem Sie unsere APIs direkt über den Browser visualisieren und mit ihnen interagieren können. Der vollständige Quellcode des Java SDK ist auf Github frei verfügbar.
Schließlich schreiben wir weiterhin neue Blogartikel in verschiedenen Dateiformaten und analysieren sie mithilfe der REST-API. Bitte kontaktieren Sie uns für die neuesten Updates.
Stelle eine Frage
Falls Sie Fragen zum Parsen von Dokumenten haben, können Sie uns gerne über unser Forum kontaktieren.
FAQs
Wie analysiere ich PDF Dateien mit Java?
Um Bilder, Text oder Metadaten zu extrahieren, müssen Sie zunächst das PDF Dokument mit GroupDocs.Parser Cloud SDK laden und analysieren. Dieser Prozess umfasst die Angabe des Dateipfads und den Aufruf der Parse-Methode zum Parsen von PDF Dateien.
Unterstützt das GroupDocs.Parser Cloud SDK für Java neben PDF auch andere Dateiformate?
Ja, neben PDF Dateien unterstützt GroupDocs.Parser Cloud SDK für Java auch die Extraktion von Bildern aus verschiedenen Dokumentformaten, darunter Word, Excel, PowerPoint, HTML und viele mehr.
Kann ich mit dem GroupDocs.Parser Cloud SDK für Java alle Bilder aus einer PDF-Datei extrahieren?
Ja, Sie können alle Bilder aus einer PDF-Datei mit dem GroupDocs.Parser Cloud SDK für Java extrahieren.
Siehe auch
Hier sind einige verwandte Artikel, die für Sie hilfreich sein könnten:
- Extrahieren Sie Bilder aus Word Dokumenten mit Java
- Dokumentparsing – Extrahieren Sie Text aus einer PDF-Datei in Java
- Extrahieren Sie Daten aus PDF mithilfe der REST-API in Node.js
- Analysieren Sie Word Dokumente mithilfe der REST-API in Python
- Extrahieren Sie bestimmte Daten aus PDF mit Python
- Extrahieren Sie Bilder aus PDF Dokumenten mit Python