Документи Word часто містять багаті візуальні елементи, такі як логотипи, діаграми та зображення продуктів, які вам може знадобитися повторно використовувати або аналізувати окремо. Ручне збереження кожного зображення з .doc або .docx файлу може бути повільним і схильним до помилок — особливо при обробці великих документів або автоматизованих робочих процесів.

Отже, в цій статті ми збираємося дізнатися деталі про те, як ми можемо програмно витягувати зображення з документів Word, використовуючи кілька простих викликів API. Наша SDK на основі REST працює повністю в хмарі — без необхідності мати Microsoft Word або зовнішні бібліотеки — що робить її ідеальною для автоматизації, інтеграції та масштабованих додатків.

Помітні особливості видобутку зображень

  • Архівація візуальних документів у централізовану медіатеку
  • Обробка вбудованої графіки для робочих процесів машинного навчання або OCR
  • Повторне використання активів компанії з звітів та контрактів
  • Міграція візуальних даних між системами документів

Давайте детальніше розглянемо наступні теми:

API обробки документів Word

GroupDocs.Parser Cloud SDK for .NET є нашим нагородженим REST на базі API, який пропонує можливості маніпуляції з великою різноманітністю форматів файлів, включаючи Word Document, PPTX, Excel, PDF, ZIP тощо. Відповідно до наших вимог, API спрощує ці випадки, дозволяючи вам читати, витягувати та зберігати зображення безпосередньо з файлів .doc і .docx у ваших C# додатках.

Передумови

  • Зареєструйтесь на GroupDocs Cloud Dashboard.
  • Отримайте свій Client ID та Client Secret. Для отримання додаткової інформації, будь ласка, відвідайте цю article.
  • Встановіть SDK на основі REST:
  • Встановіть .NET 6.0 або пізніше і Visual Studio.

Встановіть SDK з NuGet Packages:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
  • Для отримання додаткової інформації про облікові дані клієнта,

Як видобути зображення з Word у C#

Слідуйте простому трьохетапному процесу нижче, щоб витягти зображення з документа Word за допомогою C# та GroupDocs.Parser Cloud REST API.

Крок 1: Ініціалізуйте конфігурацію API

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

Крок 2: Встановіть шлях до файлу та параметри вилучення Ініціалізуйте об’єкт ImagesRequest, передавши екземпляр класу ImagesOptions як аргумент.

var fileInfo = new FileInfo
{
    FilePath = "sample.docx"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

var request = new ImagesRequest(options);

Крок 3: Отримати зображення документів. Викликати images API для витягнення зображень з документа Word.

var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    // write the name of image extracted from word document
    Console.WriteLine($"Image found at: {image.Path}");
}
// Для отримання додаткової інформації, будь ласка, відвідайте https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

// specify the input Word document information
var fileInfo = new FileInfo
{
    FilePath = "sample.docx"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

// Створіть об'єкт ImagesRequest
var request = new ImagesRequest(options);

// Call the API to extract images from Word document
var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Image found at: {image.Path}");
}

Завантажте зображення з документа Word за допомогою cURL

Якщо ви віддаєте перевагу видобутку зображень без фрагменту коду, спробуйте викликати GroupDocs.Parser Cloud за допомогою команд cURL з терміналу командного рядка або пакетних файлів.

Крок 1 – Згенерувати JWTAccess Token:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Крок 2 – Витягти зображення:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  
        \"FileInfo\": {
            \"FilePath\": \"input.docx\",
            \"StorageName\": \"internal\"
            },
            \"OutputPath\": \"internal\",
            \"StartPageNumber\": 1,
            \"CountPagesToExtract\": 2
    }"
  • Замініть на той, який ви створили.
  • Якщо ви надаєте перевагу витягувати зображення з усіх сторінок, пропустіть параметри StartPageNumber та CountPagesToExtract.

Free Word Document Images Extractor

Якщо ви не налаштували своє середовище і хочете перевірити можливості GroupDocs.Parser Cloud API, тоді ви можете розглянути можливість спробувати наш безкоштовний онлайн Word Image Extractor додаток.

Безкоштовний екстрактор зображень

Summary

GroupDocs.Parser Cloud SDK для .NET є надійним рішенням для вилучення вмісту, розбору документів та автоматизації робочих процесів, які включають Word, PDF, Excel та інші формати. Спробуйте використати наше REST API сьогодні!

Додаткова література

Часто задавані питання – FAQs

Can I extract images from specific pages in a Word document?

  • Так. Ви можете визначити параметри StartPageNumber та CountPagesToExtract.

Чи зберігає API роздільну здатність зображень?

  • Так. API повертає вбудовані зображення в подібній якості та роздільній здатності, як вони були вбудовані у документ Word.

Чи потрібен Microsoft Word для виконання цієї операції?

  • Ні. Це хмарне рішення, яке працює незалежно від MS Office.

Чи є безкоштовний пробний період?

  • Так. Ви можете отримати 150 безкоштовних викликів API на місяць з обліковим записом для випробувань. Для отримання додаткової інформації, будь ласка, відвідайте pricing guide.

Спов’язані навчання