Extract Images from PDF in Node.js - Image Extractor

W tym artykule dowiesz się, jak programowo wyodrębniać obrazy z PDF za pomocą Node.js i potężnego interfejsu API GroupDocs.Parser Cloud REST. Niezależnie od tego, czy tworzysz parser treści, narzędzie do ekstrakcji danych, czy system automatyzacji dokumentów, wyodrębnianie osadzonych obrazów z plików PDF jest powszechnym wymogiem. Ten przewodnik obejmuje instalację, użycie i fragmenty kodu dla łatwego wyodrębniania obrazów.

Dlaczego wydobywać obrazy z PDF?

  • Wyodrębnij logo, infografiki i osadzone zdjęcia z plików PDF.
  • Zautomatyzuj digitalizację dokumentów do archiwizacji i przetwarzania danych.
  • Zbuduj niestandardowe analizatory PDF lub przepływy rozpoznawania obrazów.
  • REST API-based workflow — No need for desktop software.

W tym artykule omówimy następujące tematy:

API przetwarzania PDF

GroupDocs.Parser Cloud SDK for Node.js jest lekkim i łatwym do zintegrowania opakowaniem API, które pozwala programistom na ekstrakcję strukturalnych treści — takich jak tekst, obrazy, metadane i pola dokumentów — z różnych formatów plików, w tym PDF, Word, Excel i innych.

Warunki wstępne Zainstaluj SDK GroupDocs.Parser Cloud dla Node.js:

npm install groupdocs-parser-cloud

Utwórz konto na GroupDocs.Cloud Dashboard, aby uzyskać swój identyfikator klienta i tajny klucz klienta do uwierzytelnienia. Po więcej informacji odwiedź ten artykuł.

Extract Images from PDF using Node.js

Postępuj zgodnie z tymi krokami, aby opracować własny ekstraktor obrazów z PDF przy użyciu API Node.js:

Krok 1: Skonfiguruj ustawienia.

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

Krok 2: Zdefiniuj informacje o pliku PDF i opcje ekstrakcji obrazu. Zainicjalizuj obiekt klasy ImagesRequest i przekaż instancję klasy ImagesOptions.

const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

Krok 3: Wyodrębnij obrazy. Wywołaj metodę images, aby wyodrębnić obrazy z pliku PDF.

parserApi.images(request).then((response) => {
    console.log("Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});
// For more examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

parserApi.images(request).then((response) => {
    console.log("Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});

Możesz zobaczyć wynik powyższego przykładu kodu na poniższym obrazku:

wyodrębnianie plików graficznych

Extract Images from PDF via cURL

Możesz także wyodrębniać obrazy za pomocą interfejsu API GroupDocs.Parser REST i cURL.

Krok 1 – Wygeneruj token dostępu:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Krok 2 – Wyciągnij obrazy za pomocą REST API:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  \"FileInfo\": {    \"FilePath\": \"Binder1.pdf\",    \"StorageName\": \"internal\"  },  \"OutputPath\": \"internal\",  \"StartPageNumber\": 1,  \"CountPagesToExtract\": 2}"
  • Zastąp tym, który wygenerowałeś.

Online Image Extractor

Jeśli szukasz rozwiązania bez kodu, możesz skorzystać z darmowego narzędzia online PDF Image Extractor obsługiwanego przez GroupDocs.Parser Cloud.

Ekstraktor obrazów online

Wniosek

Grupa GroupDocs.Parser Cloud SDK dla Node.js sprawia, że ekstrakcja obrazów z dokumentów PDF jest szybka, skalowalna i przyjazna dla kodu. Niezależnie od tego, czy tworzysz skrypty automatyzacji, zbieracze treści, czy narzędzia analizy oparte na obrazach, to API REST oferuje wszystko, co potrzebujesz, aby programowo izolować i eksportować obrazy.

Gotowy, aby zintegrować to w swoim workflow? Rozpocznij dzisiaj od swojego pierwszego wywołania API!

📚 Dodatkowe zasoby

Najczęściej Zadawane Pytania – FAQ

Jak wyodrębnić obrazy z Worda?

Możesz użyć GroupDocs.Parser Cloud SDKs, aby programowo wyodrębnić obrazy z plików PDF. Proszę odwiedzić ten link po więcej szczegółów.

Jaki jest model cenowy?

Oferujemy model cenowy “płać w miarę korzystania”. Aby uzyskać więcej informacji, odwiedź pricing guide.

Artykuły powiązane