
W tym artykule dowiesz się, jak programowo wyodrębniać obrazy z PDF za pomocą Node.js i potężnego interfejsu API GroupDocs.Parser Cloud REST. Niezależnie od tego, czy tworzysz parser treści, narzędzie do ekstrakcji danych, czy system automatyzacji dokumentów, wyodrębnianie osadzonych obrazów z plików PDF jest powszechnym wymogiem. Ten przewodnik obejmuje instalację, użycie i fragmenty kodu dla łatwego wyodrębniania obrazów.
Dlaczego wydobywać obrazy z PDF?
- Wyodrębnij logo, infografiki i osadzone zdjęcia z plików PDF.
- Zautomatyzuj digitalizację dokumentów do archiwizacji i przetwarzania danych.
- Zbuduj niestandardowe analizatory PDF lub przepływy rozpoznawania obrazów.
- REST API-based workflow — No need for desktop software.
W tym artykule omówimy następujące tematy:
- API przetwarzania PDF
- Wyodrębnij obrazy z PDF za pomocą Node.js
- Wyodrębnij obrazy z PDF za pomocą cURL
- Online Image Extractor
API przetwarzania PDF
GroupDocs.Parser Cloud SDK for Node.js jest lekkim i łatwym do zintegrowania opakowaniem API, które pozwala programistom na ekstrakcję strukturalnych treści — takich jak tekst, obrazy, metadane i pola dokumentów — z różnych formatów plików, w tym PDF, Word, Excel i innych.
Warunki wstępne Zainstaluj SDK GroupDocs.Parser Cloud dla Node.js:
npm install groupdocs-parser-cloud
Utwórz konto na GroupDocs.Cloud Dashboard, aby uzyskać swój identyfikator klienta i tajny klucz klienta do uwierzytelnienia. Po więcej informacji odwiedź ten artykuł.
Extract Images from PDF using Node.js
Postępuj zgodnie z tymi krokami, aby opracować własny ekstraktor obrazów z PDF przy użyciu API Node.js:
Krok 1: Skonfiguruj ustawienia.
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
Krok 2: Zdefiniuj informacje o pliku PDF i opcje ekstrakcji obrazu. Zainicjalizuj obiekt klasy ImagesRequest i przekaż instancję klasy ImagesOptions.
const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";
const options = new ImagesOptions();
options.fileInfo = fileInfo;
const request = new ImagesRequest(options);
Krok 3: Wyodrębnij obrazy. Wywołaj metodę images, aby wyodrębnić obrazy z pliku PDF.
parserApi.images(request).then((response) => {
console.log("Images extracted successfully.");
console.log(response.images);
}).catch((err) => {
console.error("Failed to extract images:", err);
});
// For more examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";
const options = new ImagesOptions();
options.fileInfo = fileInfo;
const request = new ImagesRequest(options);
parserApi.images(request).then((response) => {
console.log("Images extracted successfully.");
console.log(response.images);
}).catch((err) => {
console.error("Failed to extract images:", err);
});
Możesz zobaczyć wynik powyższego przykładu kodu na poniższym obrazku:

Extract Images from PDF via cURL
Możesz także wyodrębniać obrazy za pomocą interfejsu API GroupDocs.Parser REST i cURL.
Krok 1 – Wygeneruj token dostępu:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Krok 2 – Wyciągnij obrazy za pomocą REST API:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"Binder1.pdf\", \"StorageName\": \"internal\" }, \"OutputPath\": \"internal\", \"StartPageNumber\": 1, \"CountPagesToExtract\": 2}"
- Zastąp tym, który wygenerowałeś.
Online Image Extractor
Jeśli szukasz rozwiązania bez kodu, możesz skorzystać z darmowego narzędzia online PDF Image Extractor obsługiwanego przez GroupDocs.Parser Cloud.

Wniosek
Grupa GroupDocs.Parser Cloud SDK dla Node.js sprawia, że ekstrakcja obrazów z dokumentów PDF jest szybka, skalowalna i przyjazna dla kodu. Niezależnie od tego, czy tworzysz skrypty automatyzacji, zbieracze treści, czy narzędzia analizy oparte na obrazach, to API REST oferuje wszystko, co potrzebujesz, aby programowo izolować i eksportować obrazy.
Gotowy, aby zintegrować to w swoim workflow? Rozpocznij dzisiaj od swojego pierwszego wywołania API!
📚 Dodatkowe zasoby
Najczęściej Zadawane Pytania – FAQ
Jak wyodrębnić obrazy z Worda?
Możesz użyć GroupDocs.Parser Cloud SDKs, aby programowo wyodrębnić obrazy z plików PDF. Proszę odwiedzić ten link po więcej szczegółów.
Jaki jest model cenowy?
Oferujemy model cenowy “płać w miarę korzystania”. Aby uzyskać więcej informacji, odwiedź pricing guide.