Синтаксичний аналізатор документів Word – вилучення зображень із файлу Word Online на Java

Синтаксичний аналіз документів є критичним завданням у багатьох галузях, де потрібне вилучення даних із різних форматів документів. Під час роботи з документами Word вилучення зображень може бути особливо корисним у таких випадках, як аналіз вмісту, розпізнавання зображень або візуалізація даних. Вилучення зображень вручну з великих документів Word може зайняти багато часу. Таким чином, автоматизація процесу вилучення зображень може заощадити ваш час і зусилля. У цій статті ми продемонструємо, як видобувати зображення з документів Word програмним шляхом у Java.

У цій статті будуть розглянуті такі теми:

Java REST API для вилучення зображень із документів Word і встановлення SDK

GroupDocs.Parser Cloud SDK for Java — це потужна бібліотека Java, яка забезпечує простий і ефективний спосіб аналізу й вилучення даних із різних форматів документів, у тому числі документів Word. Він пропонує широкий спектр функцій для аналізу документів, дозволяючи розробникам видобувати зображення, текст, метадані тощо. GroupDocs.Parser також надає C#.NET, Java, PHP, Ruby та Python SDK як члени сімейства парсерів документів для Cloud API.

Щоб почати, вам потрібно включити GroupDocs.Parser Cloud SDK у свій проект Java. Ви можете завантажити JAR-файл API або встановити його за допомогою Maven, додавши таке сховище та залежність у файл pom.xml вашого проекту:

Репозиторій Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Залежність Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Далі вам потрібно зареєструватися для безкоштовного пробного облікового запису або придбати план підписки на веб-сайті GroupDocs і отримати ключ API. Отримавши ідентифікатор клієнта та секрет клієнта, додайте наведений нижче фрагмент коду до програми на основі Java:

# Отримайте свій client_id і client_secret на https://dashboard.groupdocs.cloud після реєстрації.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Як витягнути всі зображення з документів Word у Java за допомогою REST API

Щоб отримати зображення з документів Word у Java за допомогою GroupDocs.Parser Cloud SDK, виконайте такі дії та приклад фрагмента коду:

  • По-перше, імпортуйте необхідні класи у свій файл Java.
  • По-друге, створіть екземпляр класу ParseApi.
  • По-третє, створіть екземпляр класу FileInfo.
  • Далі встановіть шлях до вхідного документа Word.
  • Потім створіть екземпляр класу ImagesOptions().
  • Далі призначте fileInfo параметру зображення setFileInfo.
  • Тепер створіть екземпляр класу ImagesRequest() і передайте параметр ImagesOptions.
  • Нарешті, отримуйте результати, викликавши метод ParseApi.images() і передавши параметр ImagesRequest.

У наведеному нижче прикладі коду показано, як витягнути всі зображення з документа Word онлайн у Java за допомогою REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Як витягти зображення з документа Word на Java.
public class App {

	public static void main(String[] args) {
		
		// Створіть примірник API аналізу
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Підготуйте налаштування
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Отримати вихідний шлях до файлу
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Витягніть певні зображення з файлу Word у Java за допомогою номера сторінки

У цьому розділі ми напишемо кроки та приклад фрагмента коду для програмного видобування певних зображень із документа Word на Java:

  • По-перше, імпортуйте необхідні класи у свій файл Java.
  • По-друге, створіть екземпляр класу ParseApi.
  • По-третє, створіть екземпляр класу FileInfo.
  • Далі встановіть шлях до файлу Word як вхідні дані.
  • Потім створіть екземпляр класу ImagesOptions().
  • Далі призначте fileInfo параметру зображення setFileInfo.
  • Потім укажіть значення setStartPageNumber і setCountPagesToExtract.
  • Тепер створіть екземпляр класу ImagesRequest() і передайте параметр ImagesOptions.
  • Нарешті, отримуйте результати, викликавши метод ParseApi.images() і передавши параметр ImagesRequest.

У наведеному нижче прикладі коду показано, як видобувати певні зображення з файлу Word за діапазоном сторінок у Java за допомогою REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Видобувайте зображення з файлу Word онлайн за діапазоном сторінок у Java.
public class App {

	public static void main(String[] args) {
		
		// Створіть екземпляр Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Підготуйте налаштування
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Отримати вихідний шлях до файлу
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Безкоштовний онлайн-екстрактор зображень

Який найкращий спосіб безкоштовно видобувати зображення з Word онлайн? Будь ласка, спробуйте онлайн-аналізатор документів Word, щоб отримати зображення з Word. Цей інструмент аналізатора Word розроблено з використанням згаданої вище бібліотеки аналізатора Java.

Висновок

Підсумовуючи, GroupDocs.Parser Cloud SDK є чудовим рішенням для отримання зображень із документів Word, заощаджуючи час і зусилля, забезпечуючи точні результати. Ось що ви дізналися з цієї статті:

  • як витягти всі зображення з Word DOCX програмним шляхом у Java за допомогою REST API;
  • як видобувати певні зображення з документів Word у Java за допомогою REST API;
  • і онлайн-інструмент для вилучення зображень із документів Word.

Крім того, ви можете дізнатися більше про GroupDocs.Parser Cloud API за допомогою документації. Ми також надаємо розділ API Reference, який дозволяє візуалізувати наші API та взаємодіяти з ними безпосередньо через браузер. Повний вихідний код Java SDK є у вільному доступі на Github.

Нарешті, ми продовжуємо писати нові статті в блозі про різні формати файлів і аналізувати їх за допомогою REST API. Тому зв’яжіться з нами, щоб отримати останні оновлення.

Задайте питання

Якщо у вас виникли запитання щодо того, як отримати зображення з документів, зв’яжіться з нами через форум.

поширені запитання

Як розібрати документи Word у Java?

Щоб отримати зображення або текст, спочатку потрібно завантажити та проаналізувати документ Word за допомогою GroupDocs.Parser Cloud SDK. Цей процес передбачає вказівку шляху до файлу та виклик методу Parse для аналізу документів.

Чи може GroupDocs.Parser Cloud SDK видобувати зображення з інших форматів документів?

Так, GroupDocs.Parser Cloud SDK for Java підтримує видобування зображень із різних форматів документів, зокрема Word, PDF, Excel, PowerPoint тощо.

Чи може GroupDocs.Parser Cloud SDK отримати кілька зображень з одного документа Word?

Так, SDK може витягувати кілька зображень з одного документа Word, надаючи вам усі зображення, які містяться в документі.

Чи зберігає GroupDocs.Parser Cloud SDK вихідну якість зображення під час процесу вилучення?

Так, GroupDocs.Parser Cloud SDK для Java зберігає вихідну якість зображення під час вилучення зображень із документів Word.

Дивись також

Ось деякі пов’язані статті, які можуть бути вам корисними: