Документы Word часто содержат богатые визуальные элементы, такие как логотипы, графики и изображения продуктов, которые вам может потребоваться повторно использовать или анализировать отдельно. Ручное сохранение каждого изображения из .doc или .docx файла может быть медленным и подверженным ошибкам — особенно при работе с большими объемами документов или автоматизированными рабочими процессами.

Таким образом, в этой статье мы собираемся узнать детали о том, как мы можем программно извлекать изображения из документов Word с помощью нескольких простых вызовов API. Наш REST-ориентированный SDK полностью работает в облаке — без необходимости в Microsoft Word или внешних библиотеках — что делает его идеальным для автоматизации, интеграции и масштабируемых приложений.

Основные особенности извлечения изображений

  • Архивирование визуальных документов в централизованную медиатеку
  • Обработка встроенной графики для рабочих процессов машинного обучения или оптического распознавания символов (OCR)
  • Повторное использование активов компании из отчетов и контрактов
  • Миграция визуальных данных между системами документов

Давайте рассмотрим следующие темы более подробно:

API обработки документов Word

GroupDocs.Parser Cloud SDK for .NET — это наша отмеченная наградами REST базированная API, предлагающая возможность манипулировать большим разнообразием форматов файлов, включая документы Word, PPTX, Excel, PDF, ZIP и т.д. В соответствии с нашими требованиями API упрощает эти случаи использования, позволяя вам читать, извлекать и сохранять изображения непосредственно из файлов .doc и .docx в ваших C# приложениях.

Предварительные требования

  • Зарегистрируйтесь в GroupDocs Cloud Dashboard.
  • Получите свой идентификатор клиента и секрет клиента. Для получения дополнительных данных, пожалуйста, посетите этой article.
  • Установите SDK на основе REST:
  • Установите .NET 6.0 или более позднюю версию и Visual Studio.

Установите SDK из пакетов NuGet:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
  • Для получения дополнительной информации о клиентских учетных данных,

Как извлечь изображения из Word на C#

Следуйте простому трехступенчатому процессу ниже, чтобы извлечь изображения из документа Word с помощью C# и GroupDocs.Parser Cloud REST API.

Шаг 1: Инициализировать конфигурацию API

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

Шаг 2: Установите путь к файлу и параметры извлечения Инициализируйте объект объекта ImagesRequest, где мы передаем экземпляр класса ImagesOptions в качестве аргумента.

var fileInfo = new FileInfo
{
    FilePath = "sample.docx"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

var request = new ImagesRequest(options);

Шаг 3: Извлечение изображений документов. Вызовите images API для извлечения изображений из документа Word.

var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    // write the name of image extracted from word document
    Console.WriteLine($"Image found at: {image.Path}");
}
// Для получения дополнительной информации посетите https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

// уточните информацию о документе Word
var fileInfo = new FileInfo
{
    FilePath = "sample.docx"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

// Создайте объект ImagesRequest
var request = new ImagesRequest(options);

// Вызовите API для извлечения изображений из документа Word
var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Image found at: {image.Path}");
}

Скачать изображения из Word документа с использованием cURL

Если вашим предпочтением является извлечение изображений без фрагмента кода, попробуйте вызвать GroupDocs.Parser Cloud с помощью команд cURL из терминала командной строки или пакетных файлов.

Шаг 1 – Сгенерируйте JWTAccess Token:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Шаг 2 – Извлечение изображений:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  
        \"FileInfo\": {
            \"FilePath\": \"input.docx\",
            \"StorageName\": \"internal\"
            },
            \"OutputPath\": \"internal\",
            \"StartPageNumber\": 1,
            \"CountPagesToExtract\": 2
    }"
  • Замените на тот, который вы сгенерировали.
  • Если вы предпочитаете извлечь изображения со всех страниц, то пропустите параметры StartPageNumber и CountPagesToExtract.

Free Word Document Images Extractor

Если у вас не настроено окружение и вы хотите протестировать возможности API GroupDocs.Parser Cloud, то вы можете рассмотреть возможность использования нашего бесплатного онлайн извлекателя изображений из Word.

Бесплатный извлекатель изображений

Резюме

GroupDocs.Parser Cloud SDK для .NET — это надежное решение для извлечения контента, парсинга документов и автоматизации рабочих процессов, связанных с форматами Word, PDF, Excel и другими. Попробуйте использовать наш REST API сегодня!

Дополнительное чтение

Часто задаваемые вопросы – FAQs

Can I extract images from specific pages in a Word document?

  • Да. Вы можете определить параметры StartPageNumber и CountPagesToExtract.

API сохраняет разрешение изображений?

  • Да. API возвращает встроенные изображения в качестве и разрешении, подобном тому, в котором они были встроены в документ Word.

Требуется ли Microsoft Word для выполнения этой операции?

  • Нет. Это облачное решение и работает независимо от MS Office.

Есть ли бесплатная пробная версия?

  • Да. Вы можете получить 150 бесплатных вызовов API в месяц с тестовой учетной записью. Для получения дополнительной информации, пожалуйста, посетите pricing guide.

Связанные учебные пособия