Word 문서 파서 – Java의 Word 파일 온라인에서 이미지 추출

문서 구문 분석은 다양한 문서 형식에서 데이터를 추출해야 하는 많은 산업에서 중요한 작업입니다. Word 문서로 작업할 때 이미지 추출은 콘텐츠 분석, 이미지 인식 또는 데이터 시각화와 같은 경우에 특히 유용할 수 있습니다. 큰 Word 문서에서 이미지를 수동으로 추출하는 데는 시간이 많이 걸릴 수 있습니다. 따라서 이미지 추출 프로세스를 자동화하면 시간과 노력을 절약할 수 있습니다. 이 기사에서는 Java에서 프로그래밍 방식으로 Word 문서에서 이미지를 추출하는 방법을 보여줍니다.

이 문서에서는 다음 항목을 다룹니다.

Word 문서 및 SDK 설치에서 이미지를 추출하는 Java REST API

GroupDocs.Parser Cloud SDK for Java는 Word 문서를 포함하여 다양한 문서 형식에서 데이터를 구문 분석하고 추출하는 간단하고 효율적인 방법을 제공하는 강력한 Java 라이브러리입니다. 문서 구문 분석을 위한 다양한 기능을 제공하므로 개발자가 이미지, 텍스트, 메타데이터 등을 추출할 수 있습니다. GroupDocs.Parser는 또한 C#.NET, Java, PHP, Ruby 및 Python SDK를 Cloud API용 문서 파서 제품군 구성원으로 제공합니다.

시작하려면 Java 프로젝트에 GroupDocs.Parser Cloud SDK를 포함해야 합니다. API의 JAR 파일을 다운로드하거나 프로젝트의 pom.xml 파일에 다음 리포지토리 및 종속성을 추가하여 Maven을 사용하여 설치할 수 있습니다.

메이븐 저장소:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

메이븐 종속성:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

다음으로 무료 평가판 계정에 가입하거나 GroupDocs 웹사이트에서 구독 요금제를 구매하고 API 키를 가져옵니다. 클라이언트 ID와 클라이언트 암호가 있으면 Java 기반 애플리케이션에 아래 코드 스니펫을 추가합니다.

# 등록 후 https://dashboard.groupdocs.cloud에서 client_id 및 client_secret을 가져옵니다.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

REST API를 사용하여 Java의 Word 문서에서 모든 이미지를 추출하는 방법

GroupDocs.Parser Cloud SDK를 사용하여 Java의 Word 문서에서 이미지를 추출하려면 다음 단계와 예제 코드 스니펫을 따르십시오.

  • 먼저 필요한 클래스를 Java 파일로 가져옵니다.
  • 둘째, ParseApi 클래스의 인스턴스를 만듭니다.
  • 셋째, FileInfo 클래스의 인스턴스를 생성합니다.
  • 다음으로 입력 Word 문서의 경로를 설정합니다.
  • 그런 다음 ImagesOptions() 클래스의 인스턴스를 만듭니다.
  • 다음으로 setFileInfo 이미지 옵션에 fileInfo를 할당합니다.
  • 이제 ImagesRequest() 클래스의 인스턴스를 만들고 ImagesOptions 매개 변수를 전달합니다.
  • 마지막으로 ParseApi.images() 메서드를 호출하고 ImagesRequest 매개변수를 전달하여 결과를 얻습니다.

다음 코드 샘플은 REST API를 사용하여 Java에서 온라인으로 Word 문서의 모든 이미지를 추출하는 방법을 보여줍니다.

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Java의 Word 문서에서 이미지를 추출하는 방법.
public class App {

	public static void main(String[] args) {
		
		// Parse API의 인스턴스 생성
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// 설정 준비
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// 출력 파일 경로 가져오기
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

페이지 번호를 사용하여 Java의 Word 파일에서 특정 이미지 추출

이 섹션에서는 Java에서 프로그래밍 방식으로 Word 문서에서 특정 이미지를 추출하기 위한 단계와 예제 코드 스니펫을 작성합니다.

  • 먼저 필요한 클래스를 Java 파일로 가져옵니다.
  • 둘째, ParseApi 클래스의 인스턴스를 만듭니다.
  • 셋째, FileInfo 클래스의 인스턴스를 생성합니다.
  • 그런 다음 Word 파일의 경로를 입력으로 설정합니다.
  • 그런 다음 ImagesOptions() 클래스의 인스턴스를 만듭니다.
  • 다음으로 setFileInfo 이미지 옵션에 fileInfo를 할당합니다.
  • 그런 다음 setStartPageNumber 및 setCountPagesToExtract 값을 제공합니다.
  • 이제 ImagesRequest() 클래스의 인스턴스를 만들고 ImagesOptions 매개 변수를 전달합니다.
  • 마지막으로 ParseApi.images() 메서드를 호출하고 ImagesRequest 매개변수를 전달하여 결과를 얻습니다.

다음 코드 샘플은 REST API를 사용하여 Java의 페이지 범위별로 Word 파일에서 특정 이미지를 추출하는 방법을 보여줍니다.

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Java의 페이지 범위별로 Word 파일에서 온라인으로 이미지를 추출합니다.
public class App {

	public static void main(String[] args) {
		
		// Parse API의 인스턴스 생성
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// 설정 준비
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// 출력 파일 경로 가져오기
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

무료 온라인 이미지 추출기

Word 온라인에서 무료로 이미지를 추출하는 가장 좋은 방법은 무엇입니까? Word에서 이미지를 추출하려면 온라인 Word 문서 파서를 사용해 보십시오. 이 Word Parser 도구는 위에서 언급한 Java 파서 라이브러리를 사용하여 개발되었습니다.

결론

결론적으로 GroupDocs.Parser Cloud SDK는 Word 문서에서 이미지를 추출하여 정확한 결과를 보장하면서 시간과 노력을 절약할 수 있는 탁월한 솔루션입니다. 이 기사에서 배운 내용은 다음과 같습니다.

  • REST API를 사용하여 Java에서 프로그래밍 방식으로 Word DOCX에서 모든 이미지를 추출하는 방법
  • REST API를 사용하여 Java의 Word 문서에서 특정 이미지를 추출하는 방법
  • Word 문서에서 이미지를 추출하는 온라인 이미지 추출 도구.

또한 문서를 사용하여 GroupDocs.Parser Cloud API에 대해 자세히 알아볼 수 있습니다. 또한 브라우저를 통해 직접 API를 시각화하고 상호 작용할 수 있는 API 참조 섹션을 제공합니다. Java SDK의 전체 소스 코드는 Github에서 무료로 사용할 수 있습니다.

마지막으로 우리는 계속해서 다른 파일 형식으로 새 블로그 기사를 작성하고 REST API를 사용하여 구문 분석합니다. 따라서 최신 업데이트에 대해 문의하십시오.

질문하기

문서에서 이미지를 추출하는 방법에 대해 질문이 있는 경우 포럼을 통해 언제든지 문의하십시오.

FAQ

Java에서 Word 문서를 어떻게 구문 분석합니까?

이미지나 텍스트를 추출하려면 먼저 GroupDocs.Parser Cloud SDK를 사용하여 Word 문서를 로드하고 구문 분석해야 합니다. 이 프로세스에는 파일 경로를 지정하고 Parse 메서드를 호출하여 문서를 구문 분석하는 작업이 포함됩니다.

GroupDocs.Parser Cloud SDK는 다른 문서 형식에서 이미지를 추출할 수 있습니까?

예, Java용 GroupDocs.Parser Cloud SDK는 Word, PDF, Excel, PowerPoint 등을 비롯한 다양한 문서 형식에서 이미지 추출을 지원합니다.

GroupDocs.Parser Cloud SDK는 단일 Word 문서에서 여러 이미지를 추출할 수 있습니까?

예, SDK는 단일 Word 문서에서 여러 이미지를 추출하여 문서에 포함된 모든 이미지를 제공할 수 있습니다.

GroupDocs.Parser Cloud SDK는 추출 프로세스 중에 원본 이미지 품질을 유지합니까?

예, Java용 GroupDocs.Parser Cloud SDK는 Word 문서에서 이미지를 추출하는 동안 원본 이미지 품질을 유지합니다.

또한보십시오

다음은 도움이 될 수 있는 몇 가지 관련 문서입니다.