Ekstrakcja obrazów z PDF dokumentów jest powszechnym wymogiem przy pracy z raportami, zeskanowanymi dokumentami lub plikami prezentacyjnymi, które zawierają wbudowane wizualizacje. Zamiast ręcznie zapisywać każdy obraz, możesz zautomatyzować proces ekstrakcji za pomocą GroupDocs.Parser Cloud SDK dla .NET.

W tym samouczku nauczysz się, jak wyodrębnić obrazy z plików PDF przy użyciu C# .NET oraz GroupDocs.Parser Cloud REST API, a także łatwych do naśladowania fragmentów kodu do szybkiej integracji.

Dlaczego wyodrębniać obrazy z plików PDF?

Istnieje wiele praktycznych zastosowań dla automatyzacji ekstrakcji obrazów z plików PDF:

  • Retrieve logos, charts, and infographics from marketing or financial reports.
  • Wyodrębnij zdjęcia i skany z wielostronicowych plików PDF.
  • Zbuduj zautomatyzowane pipeline’y do ekstrakcji treści dla analizy dokumentów.
  • Przetwarzaj duże partie plików PDF bez ręcznego wysiłku lub narzędzi na pulpicie.

API do analizy PDF

GroupDocs.Parser Cloud SDK for .NET jest lekkim i łatwym do zintegrowania opakowaniem API, które pozwala na ekstrakcję ustrukturyzowanej treści - takiej jak tekst, obrazy i inne komponenty PDF, jak również innych formatów plików, w tym Word, Excel itp.

Wymagania wstępne

Zanim zaczniesz, upewnij się, że masz:

  • Konto GroupDocs Cloud Account do uzyskania swojego identyfikatora klienta i tajnego klucza klienta.
  • Zainstalowane .NET 6.0 lub nowsze na twoim systemie.
  • Visual Studio lub ulubione IDE.

Zainstaluj API do analizy PDF

Możesz łatwo zainstalować SDK z NuGet, używając poniższego polecenia:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

Extract Images from PDF using C# .NET

Postępuj zgodnie z tymi prostymi krokami, aby programowo wyodrębnić wszystkie obrazy z pliku PDF.

Krok 1: Ustaw konfigurację.

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

Krok 2: Określ informacje o pliku.

var fileInfo = new FileInfo
{
    FilePath = "sample.pdf"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

var request = new ImagesRequest(options);

Krok 3: Wyodrębnij obrazy z PDF.

var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Image Path: {image.Path}");
}
// For more examplese, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

// specify the input PDF information
var fileInfo = new FileInfo
{
    FilePath = "input.pdf"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

// utwórz żądanie wyodrębnienia obrazu
var request = new ImagesRequest(options);

// get all the images from PDF in response object
var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Extracted Image Path: {image.Path}");
}

Pobierz obrazy PDF za pomocą cURL

Alternatywnie, możesz również wyodrębniać obrazy za pomocą GroupDocs.Parser REST API i poleceń cURL.

Krok 1 – Wygeneruj token dostępu:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Krok 2 – Wyodrębnij obrazy za pomocą interfejsu API REST:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  \"FileInfo\": {    \"FilePath\": \"Binder1.pdf\",    \"StorageName\": \"internal\"  },  \"OutputPath\": \"internal\",  \"StartPageNumber\": 1,  \"CountPagesToExtract\": 2}"
  • Zamień na ten, który wygenerowałeś.

Spróbuj Online PDF Image Extractor

Chcesz to przetestować przed kodowaniem? Użyj darmowego Online PDF Image Extractor zasilanego przez GroupDocs.Parser Cloud — prześlij PDF i natychmiast pobierz wyodrębnione obrazy.

bezpłatny wykrywacz obrazów

Wnioski

W tym przewodniku omówiliśmy, jak:

  • Ekstrakcja obrazów z PDF za pomocą C# .NET REST API.
  • Pobierz i przetwórz wbudowane obrazy automatycznie.
  • Użyj REST API lub cURL do integracji.

Więc, z pomocą GroupDocs.Parser Cloud SDK dla .NET, możesz łatwo tworzyć przepływy automatyzacji do ekstrakcji treści PDF bez potrzeby używania oprogramowania firm trzecich lub ręcznych kroków.

📚 Dodatkowe zasoby

Często Zadawane Pytania – FAQ

How do I extract images from Word?

Możesz użyć GroupDocs.Parser Cloud SDKs, aby programowo wyodrębnić obrazy z plików Word.

Jaki jest model cenowy?

Oferujemy pojedynczy model płatności za użytkowanie. Aby uzyskać więcej informacji, proszę odwiedzić pricing guide.

Czy oferujecie darmowy okres próbny?

Tak. Z darmowym kontem próbnym możesz wykonywać 150 wywołań API miesięcznie za darmo i oceniać nasze API bez ograniczeń. Aby uzyskać więcej informacji, odwiedź Free Trial .

Powiązane artykuły