Во многих сценариях файлы DOCX/DOC могут содержать огромные текстовые и визуальные данные. Если вам нужно извлечь все изображения из файла Word и отделить изображения от текстовых данных, вы можете использовать облачные API SDK и REST на базе GroupDocs.Parser. Фактически, вы можете создать экстрактор файлов изображений на JavaScript, используя методы, предоставляемые GroupDocs.Parser Cloud SDKs для Node.js. Итак, давайте продолжим и рассмотрим, как извлекать изображения из Word в Node.js. Кроме того, мы рассмотрим шаги и фрагмент кода для реализации этой функциональности.
Будут рассмотрены следующие моменты:
- Установка программного обеспечения для обработки текстов
- Извлечение изображений из Word в Node.js
- Онлайн-экстрактор изображений
Установка программного обеспечения для обработки текстов
Шаг установки любой библиотеки играет жизненно важную роль в быстрой разработке приложений. К счастью, процесс установки GroupDocs.Parser Cloud SDK для Node.js аналогичен установке любого модуля Node.js с помощью npm install MODULENAME. Итак, запустите следующую команду, чтобы установить эту многофункциональную библиотеку извлечения файлов изображений:
npm install groupdocs-parser-cloud
На следующем этапе мы настроим эту библиотеку с нашим проектом Node.js. Для этой цели мы получим учетные данные API (идентификатор клиента, секрет клиента) из нашего облака API панель управления.
Пожалуйста, посетите это руководство, если у вас возникнут какие-либо трудности с получением учетных данных API.
Извлечение изображений из Word в Node.js
У нас есть исходный файл DOC/DOCX на нашей информационной панели API Cloud, который вы можете загрузить вручную или программно, вызвав метод UploadFile.
Следующие шаги демонстрируют, как извлечь изображения из Word в Node.js:
- Получите groupdocs-parser-cloud в своем проекте.
- Создайте экземпляр класса Configuration с идентификатором клиента и секретом клиента.
- Вызовите метод fromConfig и передайте объект класса Configuration.
- Создайте объект класса FileInfo и определите путь к исходному файлу DOCX.
- Определите параметры изображения, создав экземпляр класса ImagesOptions.
- Инициализируйте объект класса ImagesRequest и передайте экземпляр класса ImagesOptions.
- Вызовите метод images для извлечения изображений из документа Word.
Скопируйте и вставьте следующий фрагмент кода, чтобы создать собственное программное обеспечение для обработки текстов:
// Получите groupdocs-parser-cloud в своем проекте.
const groupdocs_parser_cloud = require("groupdocs-parser-cloud");
// Определите свои учетные данные API.
let clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
let clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
// Создайте экземпляр класса Configuration с идентификатором клиента и секретом клиента.
const configuration = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
// Вызовите метод fromConfig и передайте объект класса Configuration.
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);
// Создайте объект класса FileInfo и определите путь к исходному файлу DOCX.
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.docx";
// Определите параметры изображения, создав экземпляр класса ImagesOptions.
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;
// Инициализируйте объект класса ImagesRequest и передайте экземпляр класса ImagesOptions.
let request = new groupdocs_parser_cloud.ImagesRequest(options);
// Вызовите метод images для извлечения изображений из документа Word.
parseApi.images(request)
.then((result)=>{
// Показать результаты
let images = result.images;
images.forEach(image => {
console.log("Image path in storage: " + image.path);
console.log("Download url: " + image.downloadUrl);
console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});
})
Вы можете увидеть вывод приведенного выше примера кода на изображении ниже:
Онлайн-экстрактор изображений
Вы можете в полной мере использовать этот онлайн инструмент для извлечения изображений из файлов Word. Прежде всего, он также поддерживается GroupDocs.Parser Cloud SDK. Кроме того, он основан на Интернете и предлагает надежные функции преобразования и манипулирования, поскольку он бесплатен и не требует создания учетной записи или подписки.
Заключение
В конце концов, мы можем смело рассмотреть GroupDocs.Parser Cloud SDK для разработки программного обеспечения для обработки текста. Его довольно легко установить и настроить, и вы можете вызывать огромное количество методов. Кроме того, существует онлайн экстрактор изображений для реализации этой функциональности онлайн. Пожалуйста, посетите документацию и репозиторий GitHub для дальнейшего изучения. Кроме того, не стесняйтесь посетить Руководство по началу работы, чтобы начать разработку.
Наконец, groupdocs.cloud пишет новые статьи. Поэтому, пожалуйста, оставайтесь на связи для получения регулярных обновлений.
Помощь доступна
Вы можете сообщить нам о своих вопросах или пожеланиях на нашем форуме.
Часто задаваемые вопросы – Часто задаваемые вопросы
Как извлечь изображения из Word?
Вы можете использовать GroupDocs.Parser Cloud SDK для программного извлечения изображений из файлов DOCX/DOC. Пожалуйста, посетите эту ссылку для получения более подробной информации.