Das Extrahieren von Bildern aus PDF Dokumenten ist eine häufige Anforderung beim Umgang mit Berichten, gescannten Dokumenten oder Präsentationsdateien, die eingebettete Visuals enthalten. Anstatt jedes Bild manuell zu speichern, können Sie den Extraktionsprozess mit dem GroupDocs.Parser Cloud SDK für .NET automatisieren.

In diesem Tutorial lernen Sie, wie Sie Bilder aus PDF Dateien mit C# .NET und der GroupDocs.Parser Cloud REST API extrahieren, einschließlich leicht verständlicher Codeausschnitte für eine schnelle Integration.

Warum Bilder aus PDF Dateien extrahieren?

Es gibt viele praktische Anwendungsfälle für die Automatisierung der PDF bilderfassung:

  • Retrieve logos, charts, and infographics from marketing or financial reports.
  • Fotos und Scans aus mehrseitigen PDFs extrahieren.
  • Erstellen Sie automatisierte Inhaltsextraktionspipelines für die Dokumentenanalyse.
  • Verarbeiten Sie große Mengen von PDFs ohne manuelle Mühe oder Desktop-Tools.

PDF Parsing API

GroupDocs.Parser Cloud SDK für .NET ist eine leichtgewichtige und einfach zu integrierende API-Hülle, die es Ihnen ermöglicht, strukturierte Inhalte wie Text, Bilder und andere Komponenten der PDF sowie anderer Dateiformate wie Word, Excel usw. zu extrahieren.

Voraussetzungen

Bevor Sie beginnen, stellen Sie sicher, dass Sie:

  • Ein GroupDocs Cloud Account, um Ihre Client-ID und Ihr Client-Secret zu erhalten.
  • .NET 6.0 oder neuer auf Ihrem System installiert.
  • Visual Studio oder deine bevorzugte IDE.

Installieren Sie die PDF-Parser-API

Sie können das SDK ganz einfach über NuGet mit dem folgenden Befehl installieren:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

Extrahieren von Bildern aus PDF mit C# .NET

Befolge diese einfachen Schritte, um alle Bilder programmatisch aus einer PDF-Datei zu extrahieren.

Schritt 1: Konfiguration einrichten.

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

Schritt 2: Geben Sie die Dateiinformationen an.

var fileInfo = new FileInfo
{
    FilePath = "sample.pdf"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

var request = new ImagesRequest(options);

Schritt 3: Bilder aus PDF extrahieren.

var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Image Path: {image.Path}");
}
// Für mehr Beispiele, bitte besuchen Sie https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

// specify the input PDF information
var fileInfo = new FileInfo
{
    FilePath = "input.pdf"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

// create Image Extract request
var request = new ImagesRequest(options);

// get all the images from PDF in response object
var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Extracted Image Path: {image.Path}");
}

Download PDF bilder über cURL

Alternativ können Sie auch Bilder mit der GroupDocs.Parser REST API und cURL-Befehlen extrahieren.

Schritt 1 – Zugriffstoken generieren:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Schritt 2 – Bilder über die REST-API extrahieren:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  \"FileInfo\": {    \"FilePath\": \"Binder1.pdf\",    \"StorageName\": \"internal\"  },  \"OutputPath\": \"internal\",  \"StartPageNumber\": 1,  \"CountPagesToExtract\": 2}"
  • Ersetzen Sie durch den, den Sie generiert haben.

Versuchen Sie den Online PDF bildextraktor

Möchten Sie es vor dem Codieren testen? Verwenden Sie den kostenlosen Online PDF Image Extractor, der von GroupDocs.Parser Cloud bereitgestellt wird – laden Sie eine PDF hoch und laden Sie die extrahierten Bilder sofort herunter.

kostenloser Bilderextraktor

Fazit

In diesem Handbuch haben wir behandelt, wie man:

  • Bilder aus PDF mit C# .NET REST API extrahieren.
  • Eingebettete Bilder automatisch herunterladen und verarbeiten.
  • Verwenden Sie die REST API oder cURL zur Integration.

Also, mit der Hilfe des GroupDocs.Parser Cloud SDK für .NET können Sie problemlos Automatisierungsworkflows zur Extraktion von PDF-Inhalten erstellen, ohne auf Software von Drittanbietern oder manuelle Schritte angewiesen zu sein.

📚 Zusätzliche Ressourcen

Häufig gestellte Fragen – FAQs

How do I extract images from Word?

Sie können GroupDocs.Parser Cloud SDKs verwenden, um Bilder programmgesteuert aus Word Dateien zu extrahieren.

Was ist das Preismodell?

Wir bieten ein einfaches Pay-as-you-go-Preismodell an. Für weitere Informationen besuchen Sie bitte pricing guide.

Bieten Sie eine kostenlose Testversion an?

Ja. Mit einem kostenlosen Testkonto können Sie 150 API-Aufrufe pro Monat kostenlos tätigen und unsere APIs ohne Einschränkungen evaluieren. Für weitere Informationen besuchen Sie bitte Free Trial.

Verwandte Artikel