Витягти зображення з PDF в Node.js - Витягувач зображень

У цій статті ви дізнаєтеся, як програмно витягувати зображення з PDF файлів, використовуючи Node.js та потужний REST API GroupDocs.Parser Cloud. Незалежно від того, чи розробляєте ви парсер контенту, інструмент витягання даних або систему автоматизації документів, витягування вбудованих зображень з PDF є поширеним вимогами. Цей посібник охоплює установку, використання та фрагменти коду для простого витягання зображень.

Чому витягувати зображення з PDF?

  • Витягніть логотипи, інфографіку та вбудовані фотографії з PDF-файлів.
  • Автоматизуйте цифрову документацію для архівування та обробки даних.
  • Створіть власні аналізатори PDF або конвеєри розпізнавання зображень.
  • REST API-орієнтований робочий процес — Немає потреби в настільному програмному забезпеченні.

В цій статті ми будемо розглядати наступні теми:

API обробки PDF

GroupDocs.Parser Cloud SDK for Node.js є легким та простим у інтеграції API-обгорткою, яка дозволяє розробникам витягувати структурований вміст—такий як текст, зображення, метадані та поля документів—з широкого спектру формати файлів, включаючи PDF, Word, Excel та інше.

Передумови Встановіть GroupDocs.Parser Cloud SDK для Node.js:

npm install groupdocs-parser-cloud

Створіть обліковий запис на GroupDocs.Cloud Dashboard, щоб отримати свій Client ID та Client Secret для аутентифікації. Для отримання додаткової інформації, будь ласка, відвідайте цю статтю.

Витягнення зображень з PDF за допомогою Node.js

Слідкуйте за цими кроками, щоб розробити власний екстрактор зображень з PDF, використовуючи API Node.js:

Крок 1: Налаштуйте конфігурацію.

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

Крок 2: Визначте інформацію про файл PDF та параметри витягування зображень. Ініціалізуйте об’єкт класу ImagesRequest і передайте екземпляр класу ImagesOptions.

const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

Крок 3: Витягти зображення. Використовуйте метод images для витягнення зображень з PDF-файлу.

parserApi.images(request).then((response) => {
    console.log("Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});
// Для отримання додаткових прикладів, будь ласка, відвідайте https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

parserApi.images(request).then((response) => {
    console.log("Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});

Ви можете побачити вихідні дані наведеного вище зразка коду на зображенні нижче:

файл витягувач зображень

Витягти зображення з PDF за допомогою cURL

Ви також можете витягувати зображення за допомогою GroupDocs.Parser REST API та cURL.

Крок 1 – Згенерувати токен доступу:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Крок 2 – Витяг зображень через REST API:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  \"FileInfo\": {    \"FilePath\": \"Binder1.pdf\",    \"StorageName\": \"internal\"  },  \"OutputPath\": \"internal\",  \"StartPageNumber\": 1,  \"CountPagesToExtract\": 2}"
  • Замініть на той, який ви згенерували.

Онлайн Витяг зображень

Якщо ви шукаєте безкодове рішення, ви можете скористатися безкоштовним онлайн PDF Image Extractor, що працює на базі GroupDocs.Parser Cloud.

Онлайн витягувач зображень

Висновок

GroupDocs.Parser Cloud SDK для Node.js робить процес витягування зображень з PDF документів швидким, масштабованим і зручним для коду. Чи то ви створюєте автоматизаційні сценарії, контентні краулери чи інструменти для аналітики на основі зображень, цей REST API пропонує все, що вам потрібно, щоб ізолювати та експортувати зображення програмно.

Готові інтегрувати це у свій робочий процес? Розпочніть з вашого першого API виклику сьогодні!

📚 Додаткові ресурси

Часто задавані питання – FAQs

How do I extract images from Word?

Ви можете використовувати GroupDocs.Parser Cloud SDKs, щоб витягти зображення з PDF-файлів програмно. Будь ласка, відвідайте це link для отримання додаткової інформації.

Яка модель ціноутворення?

Ми пропонуємо єдину модель оплати за фактом використання. Для отримання додаткової інформації, будь ласка, відвідайте pricing guide.

Пов`язані статті