
In diesem Artikel erfahren Sie, wie Sie programmgesteuert Bilder aus PDF Dateien mit Node.js und der leistungsstarken GroupDocs.Parser Cloud REST API extrahieren. Egal, ob Sie einen Inhaltsparser, ein Datenextraktionstool oder ein Dokumentenautomatisierungssystem erstellen, das Extrahieren von eingebetteten Bildern aus PDFs ist ein häufiges Bedürfnis. Diese Anleitung behandelt Installation, Nutzung und Codebeispiele für eine einfache Bilderextraktion.
Warum Bilder aus PDF extrahieren?
- Extrahieren Sie Logos, Infografiken und eingebettete Fotos aus PDFs.
- Automatisieren Sie die Dokumentendigitalisierung für die Archivierung und Datenverarbeitung.
- Erstellen Sie benutzerdefinierte PDF-Analysetools oder Pipeline für die Bilderkennung.
- REST-API-basierter Workflow — Keine Notwendigkeit für Desktop-Software.
In diesem Artikel werden wir die folgenden Themen behandeln:
- PDF-Verarbeitungs-API
- Extrahieren Sie Bilder aus PDF mit Node.js
- Extrahieren Sie Bilder aus PDF über cURL
- Online bilderextraktor
PDF-Verarbeitung API
GroupDocs.Parser Cloud SDK für Node.js ist eine leichtgewichtige und einfach zu integrierende API-Hülle, die Entwicklern ermöglicht, strukturierte Inhalte – wie Text, Bilder, Metadaten und Dokumentfelder – aus einer Vielzahl von Dateiformaten, einschließlich PDF, Word, Excel und mehr, zu extrahieren.
Voraussetzungen Installieren Sie das GroupDocs.Parser Cloud SDK für Node.js:
npm install groupdocs-parser-cloud
Erstellen Sie ein Konto im GroupDocs.Cloud Dashboard, um Ihre Client-ID und Ihren Client-Secret für die Authentifizierung zu erhalten. Für weitere Informationen besuchen Sie bitte diesen Artikel.
Extract Images from PDF using Node.js
Befolgen Sie diese Schritte, um Ihren eigenen Bilderextraktor aus PDF mit der Node.js API zu entwickeln:
Schritt 1: Konfiguration einrichten.
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
Schritt 2: PDF-Dateiinformationen und Bildextraktionsoptionen definieren. Initialisieren Sie ein Objekt der ImagesRequest Klasse und übergeben Sie die Instanz der ImagesOptions Klasse.
const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";
const options = new ImagesOptions();
options.fileInfo = fileInfo;
const request = new ImagesRequest(options);
Schritt 3: Bilder extrahieren. Rufen Sie die images Methode auf, um Bilder aus der PDF-Datei zu extrahieren.
parserApi.images(request).then((response) => {
console.log("Images extracted successfully.");
console.log(response.images);
}).catch((err) => {
console.error("Failed to extract images:", err);
});
// Für weitere Beispiele besuchen Sie bitte https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";
const options = new ImagesOptions();
options.fileInfo = fileInfo;
const request = new ImagesRequest(options);
parserApi.images(request).then((response) => {
console.log("Images extracted successfully.");
console.log(response.images);
}).catch((err) => {
console.error("Failed to extract images:", err);
});
Sie können die Ausgabe des obigen Codes in dem Bild unten sehen:

Bilder aus PDF über cURL extrahieren
Sie können auch Bilder mit der GroupDocs.Parser REST API und cURL extrahieren.
Schritt 1 – Zugriffstoken generieren:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Schritt 2 – Bilder über die REST-API extrahieren:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"Binder1.pdf\", \"StorageName\": \"internal\" }, \"OutputPath\": \"internal\", \"StartPageNumber\": 1, \"CountPagesToExtract\": 2}"
- Ersetzen Sie mit dem von Ihnen generierten.
Online Image Extractor
Wenn Sie nach einer No-Code-Lösung suchen, können Sie den kostenlosen Online- PDF Image Extractor verwenden, der von GroupDocs.Parser Cloud unterstützt wird.

Schlussfolgerung
Das GroupDocs.Parser Cloud SDK für Node.js macht das Extrahieren von Bildern aus PDF Dokumenten schnell, skalierbar und codefreundlich. Egal, ob Sie Automatisierungsskripte, Inhalts-Crawler oder bildbasierte Analysewerkzeuge erstellen, dieses REST-API bietet alles, was Sie benötigen, um Bilder programmgesteuert zu isolieren und zu exportieren.
Bereit, es in Ihren Arbeitsablauf zu integrieren? Starten Sie noch heute mit Ihrem ersten API-Aufruf!
📚 Zusätzliche Ressourcen
Häufig gestellte Fragen – FAQs
Wie extrahiere ich Bilder aus Word?
Sie können GroupDocs.Parser Cloud SDKs verwenden, um Bilder programmgesteuert aus PDF Dateien zu extrahieren. Bitte besuchen Sie diesen link für weitere Informationen.
Was ist das Preisgestaltungsmodell?
Wir bieten ein einfaches Pay-as-you-go-Preismodell an. Für weitere Informationen besuchen Sie bitte pricing guide.