Ekstrakcja obrazów z PDF dokumentów jest powszechnym wymogiem przy pracy z raportami, zeskanowanymi dokumentami lub plikami prezentacyjnymi, które zawierają wbudowane wizualizacje. Zamiast ręcznie zapisywać każdy obraz, możesz zautomatyzować proces ekstrakcji za pomocą GroupDocs.Parser Cloud SDK dla .NET.
W tym samouczku nauczysz się, jak wyodrębnić obrazy z plików PDF przy użyciu C# .NET oraz GroupDocs.Parser Cloud REST API, a także łatwych do naśladowania fragmentów kodu do szybkiej integracji.
- Dlaczego wyodrębniać obrazy z plików PDF?
- API do parzenia PDFów
- Wyodrębnij obrazy z PDF za pomocą C# .NET
- Pobierz obrazy PDF za pomocą cURL
- Spróbuj internetowego ekstraktora obrazów PDF
Dlaczego wyodrębniać obrazy z plików PDF?
Istnieje wiele praktycznych zastosowań dla automatyzacji ekstrakcji obrazów z plików PDF:
- Retrieve logos, charts, and infographics from marketing or financial reports.
- Wyodrębnij zdjęcia i skany z wielostronicowych plików PDF.
- Zbuduj zautomatyzowane pipeline’y do ekstrakcji treści dla analizy dokumentów.
- Przetwarzaj duże partie plików PDF bez ręcznego wysiłku lub narzędzi na pulpicie.
API do analizy PDF
GroupDocs.Parser Cloud SDK for .NET jest lekkim i łatwym do zintegrowania opakowaniem API, które pozwala na ekstrakcję ustrukturyzowanej treści - takiej jak tekst, obrazy i inne komponenty PDF, jak również innych formatów plików, w tym Word, Excel itp.
Wymagania wstępne
Zanim zaczniesz, upewnij się, że masz:
- Konto GroupDocs Cloud Account do uzyskania swojego identyfikatora klienta i tajnego klucza klienta.
- Zainstalowane .NET 6.0 lub nowsze na twoim systemie.
- Visual Studio lub ulubione IDE.
Zainstaluj API do analizy PDF
Możesz łatwo zainstalować SDK z NuGet, używając poniższego polecenia:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
Extract Images from PDF using C# .NET
Postępuj zgodnie z tymi prostymi krokami, aby programowo wyodrębnić wszystkie obrazy z pliku PDF.
Krok 1: Ustaw konfigurację.
var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);
Krok 2: Określ informacje o pliku.
var fileInfo = new FileInfo
{
FilePath = "sample.pdf"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
var request = new ImagesRequest(options);
Krok 3: Wyodrębnij obrazy z PDF.
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
Console.WriteLine($"Image Path: {image.Path}");
}
// For more examplese, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);
// specify the input PDF information
var fileInfo = new FileInfo
{
FilePath = "input.pdf"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
// utwórz żądanie wyodrębnienia obrazu
var request = new ImagesRequest(options);
// get all the images from PDF in response object
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
Console.WriteLine($"Extracted Image Path: {image.Path}");
}
Pobierz obrazy PDF za pomocą cURL
Alternatywnie, możesz również wyodrębniać obrazy za pomocą GroupDocs.Parser REST API i poleceń cURL.
Krok 1 – Wygeneruj token dostępu:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Krok 2 – Wyodrębnij obrazy za pomocą interfejsu API REST:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"Binder1.pdf\", \"StorageName\": \"internal\" }, \"OutputPath\": \"internal\", \"StartPageNumber\": 1, \"CountPagesToExtract\": 2}"
- Zamień na ten, który wygenerowałeś.
Spróbuj Online PDF Image Extractor
Chcesz to przetestować przed kodowaniem? Użyj darmowego Online PDF Image Extractor zasilanego przez GroupDocs.Parser Cloud — prześlij PDF i natychmiast pobierz wyodrębnione obrazy.

Wnioski
W tym przewodniku omówiliśmy, jak:
- Ekstrakcja obrazów z PDF za pomocą C# .NET REST API.
- Pobierz i przetwórz wbudowane obrazy automatycznie.
- Użyj REST API lub cURL do integracji.
Więc, z pomocą GroupDocs.Parser Cloud SDK dla .NET, możesz łatwo tworzyć przepływy automatyzacji do ekstrakcji treści PDF bez potrzeby używania oprogramowania firm trzecich lub ręcznych kroków.
📚 Dodatkowe zasoby
Często Zadawane Pytania – FAQ
How do I extract images from Word?
Możesz użyć GroupDocs.Parser Cloud SDKs, aby programowo wyodrębnić obrazy z plików Word.
Jaki jest model cenowy?
Oferujemy pojedynczy model płatności za użytkowanie. Aby uzyskać więcej informacji, proszę odwiedzić pricing guide.
Czy oferujecie darmowy okres próbny?
Tak. Z darmowym kontem próbnym możesz wykonywać 150 wywołań API miesięcznie za darmo i oceniać nasze API bez ograniczeń. Aby uzyskać więcej informacji, odwiedź Free Trial .