Витягти зображення PowerPoint з документа Word - Витягач зображень

Якщо у вас є вимога видобувати вбудовані зображення з документів Word для архівування, автоматизації або розпізнавання зображень? Тоді наш Node.js REST API пропонує надійне та хмарне рішення для видобутку зображень з .doc та .docx файлів без необхідності встановленого Microsoft Word.

Витягування зображень може знадобитися, якщо нам потрібно:

  • Захоплюйте графіки, діаграми та фотогрфії, вбудовані в звіти.
  • Автоматизуйте витягування з відсканованих документів або шаблонів.
  • Створіть набори зображень з документальних репозиторіїв.
  • Preprocess content for OCR or AI tasks.

Давайте детальніше розглянемо наступні теми:

API для вилучення зображень з документів Word

GroupDocs.Parser Cloud SDK for Node.js - це рішення на основі REST, що пропонує можливості для аналізу документів MS Word для маніпуляцій із вмістом. Це рішення не лише для документів Word, але також підтримує вилучення вмісту з майже всіх загальновживаних форматів бізнес-документів, включаючи (PPTX, Excel, PDF, ZIP тощо).

Передумови

  • Зареєструйтесь на GroupDocs Cloud Dashboard.
  • Отримайте свій Client ID та Client Secret.
  • Встановіть SDK на основі REST:
npm install groupdocs-parser-cloud
  • Для отримання додаткової інформації про облікові дані клієнта, будь ласка, відвідайте цю article.

Як видобути зображення з Word за допомогою Node.js

Слідкуйте за цими кроками, щоб розробити простий і надійний додаток для витягування зображень з документа MS Word, використовуючи API Node.js:

Крок 1: Ініціалізувати Конфігурацію.

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

Крок 2: Налаштуйте інформацію про файл та параметри зображення. Ініціалізуйте об’єкт класу ImagesRequest та передайте екземпляр класу ImagesOptions.

const fileInfo = new FileInfo();
// path to your PowerPoint file
fileInfo.filePath = "input.docx";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

Крок 3: Видобуток зображень з документа Word. Викликайте метод images для витягування зображень з документу Word онлайн.

parserApi.images(request).then((response) => {
    console.log("The Word document Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});
// Для отримання додаткових прикладів, будь ласка, відвідайте https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";

const options = new TextOptions();
options.fileInfo = fileInfo;

const request = new TextRequest(options);

parserApi.images(request).then((response) => {
  console.log("The Word document Images extracted successfully.");
  console.log(response.images);
}).catch(err => {
    console.error("Failed to extract images:", err);
});

Ви можете побачити результат вище наведеного зразка коду на зображенні нижче:

Попередній перегляд витягання зображень з документа Word за допомогою API Node.js

Екстракція зображень з Word за допомогою cURL

Якщо ви надаєте перевагу командному рядку для витягування зображень з документів Word за допомогою команд cURL, тоді GroupDocs.Parser Cloud підтримує ці можливості. Давайте детальніше розглянемо цю функцію, щоб спростити вимогу щодо отримання зображень з документа Word за допомогою команд cURL.

Крок 1 – Згенерувати токен доступу:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Крок 2 – Витягти зображення з файлу Word:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  
        \"FileInfo\": {
            \"FilePath\": \"input.docx\",
            \"StorageName\": \"internal\"
            },
            \"OutputPath\": \"internal\",
            \"StartPageNumber\": 1,
            \"CountPagesToExtract\": 2
    }"
  • 🔐 Замініть на той, що ви згенерували.
  • У випадку, якщо вам потрібно вилучити зображення з усього документа, просто ігноруйте параметри StartPageNumber та CountPagesToExtract.

Спробуйте безкоштовний онлайн-екстрактор зображень з тексту

Якщо ви віддаєте перевагу підходу з графічним інтерфейсом для витягування зображень з документа Word, то ви можете розглянути можливість використання нашого безкоштовного онлайн Word Document Image Extractor, який працює на платформі GroupDocs.Parser Cloud.

Безкоштовний екстрактор зображень

Висновок

З GroupDocs.Parser Cloud SDK для Node.js витягування зображень з файлів Word стає швидким і масштабованим. Чи потрібно вам обробляти контракти, звіти чи відскановані форми — цей API дає вам повний контроль над витягуванням зображень з документів Word.

📚 Додаткові ресурси

Поширені запитання – FAQs

Can I extract images from specific pages in a Word document?

  • Так. Ви можете визначити параметри StartPageNumber та CountPagesToExtract.

Чи витягуються зображення в оригінальному форматі та роздільній здатності?

  • Так. API повертає вбудовані зображення такими, якими вони є в документі.

Чи потрібно мені встановлювати Microsoft Word?

  • Ні. Це рішення на основі хмари і працює незалежно від MS Office.

Чи є безкоштовний пробний період?

  • Так. Ви можете отримати 150 безкоштовних API викликів на місяць з обліковим записом для пробного використання. Для отримання додаткової інформації, будь ласка, відвідайте pricing guide.

Схожі статті