
문서 파싱은 다양한 문서 형식에서 데이터 추출이 필요한 많은 산업에서 중요한 작업입니다. Word 문서에서 작업할 때, 콘텐츠 분석, 이미지 인식 또는 데이터 시각화와 같은 경우에 이미지를 추출하는 것이 특히 유용할 수 있습니다. 대규모 Word 문서에서 이미지를 수동으로 추출하는 것은 시간이 많이 소요될 수 있습니다. 따라서 이미지 추출 프로세스를 자동화하면 시간과 노력을 절약할 수 있습니다. 이 기사에서는 Java에서 프로그래밍 방식으로 Word 문서에서 이미지를 추출하는 방법을 보여줄 것입니다.
이 문서에서는 다음 주제를 다룰 것입니다:
- 자바 REST API로 Word 문서에서 이미지 추출 및 SDK 설치
- How to Extract All Images from Word Documents in Java using REST API
- Word 파일에서 페이지 번호를 사용하여 특정 이미지 추출하기
Java REST API to Extract Images from Word Documents and SDK Installation
GroupDocs.Parser Cloud SDK for Java는 다양한 문서 형식에서 데이터를 파싱하고 추출하는 간단하고 효율적인 방법을 제공하는 강력한 Java 라이브러리입니다. 이 라이브러리는 개발자가 이미지, 텍스트, 메타데이터 등을 추출할 수 있도록 문서 파싱을 위한 다양한 기능을 제공합니다. GroupDocs.Parser는 또한 Cloud API를 위한 문서 파서 가족 구성원으로 C#.NET, Java, PHP, Ruby 및 Python SDK를 제공합니다.
시작하려면, Java 프로젝트에 GroupDocs.Parser Cloud SDK를 포함시켜야 합니다. API의 JAR 파일을 다운로드 하거나, 다음 리포지토리와 종속성을 프로젝트의 pom.xml 파일에 추가하여 Maven을 사용하여 설치할 수 있습니다:
Maven 저장소:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Maven Dependency:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>23.3</version>
<scope>compile</scope>
</dependency>
다음으로, sign up 무료 체험 계정을 만들거나 purchase a subscription plan GroupDocs 웹사이트에서 get your API key를 받아야 합니다. Client Id와 Client Secret을 얻은 후, 아래의 코드 스니펫을 Java 기반 애플리케이션에 추가하세요:
# https://dashboard.groupdocs.cloud 에서 등록 후 clientid 및 clientsecret을 가져오세요.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Java에서 REST API를 사용하여 Word 문서에서 모든 이미지를 추출하는 방법
Word 문서에서 이미지를 추출하기 위해 Java의 GroupDocs.Parser Cloud SDK를 사용하는 방법은 다음 단계 및 예제 코드 스니펫을 따르십시오:
- 먼저, 필요한 클래스를 Java 파일에 import 하세요.
- 둘째, ParseApi 클래스의 인스턴스를 생성합니다.
- 셋째, FileInfo 클래스의 인스턴스를 생성합니다.
- 다음으로 입력 Word 문서에 대한 경로를 설정합니다.
- 그런 다음, ImagesOptions() 클래스의 인스턴스를 생성합니다.
- 다음으로, fileInfo를 setFileInfo 이미지 옵션에 할당합니다.
- Now, create an instance of the ImagesRequest() class and pass the ImagesOptions parameter.
- 마지막으로, ParseApi.images() 메서드를 호출하고 ImagesRequest 매개변수를 전달하여 결과를 가져옵니다.
다음 코드 샘플은 REST API를 사용하여 Java에서 온라인으로 Word 문서에서 모든 이미지를 추출하는 방법을 보여줍니다:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// Word 문서에서 이미지를 추출하는 방법은 Java에서.
public class App {
public static void main(String[] args) {
// Parse API의 인스턴스를 생성하십시오.
ParseApi apiInstance = new ParseApi(configuration);
try {
// 설정을 준비하세요.
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.docx");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// 출력 파일 경로 가져오기
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Word 파일에서 페이지 번호를 사용하여 특정 이미지를 추출하는 방법
이 섹션에서는 Java에서 프로그래밍 방식으로 Word 문서에서 특정 이미지를 추출하는 단계와 예제 코드 스니펫을 작성할 것입니다:
- 먼저, 필요한 클래스를 Java 파일에 import 하세요.
- 둘째로, ParseApi 클래스의 인스턴스를 생성합니다.
- 셋째로, FileInfo 클래스의 인스턴스를 만드세요.
- 다음으로 Word 파일의 경로를 입력으로 설정하세요.
- 그런 다음, ImagesOptions() 클래스의 인스턴스를 생성합니다.
- 다음으로, fileInfo를 setFileInfo 이미지 옵션에 할당합니다.
- 그럼, setStartPageNumber과 setCountPagesToExtract 값을 제공합니다.
- Now, create an instance of the ImagesRequest() class and pass the ImagesOptions parameter.
- 마지막으로, ParseApi.images() 메서드를 호출하고 ImagesRequest 매개변수를 전달하여 결과를 얻으세요.
다음 코드 샘플은 REST API를 사용하여 Java에서 페이지 범위별로 Word 파일에서 특정 이미지를 추출하는 방법을 보여줍니다:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// 워드 파일에서 온라인으로 페이지 범위별로 이미지를 추출하는 방법.
public class App {
public static void main(String[] args) {
// Parse API 인스턴스를 생성하십시오.
ParseApi apiInstance = new ParseApi(configuration);
try {
// 설정을 준비하세요.
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.docx");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setStartPageNumber(1);
options.setCountPagesToExtract(2);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// 출력 파일 경로 가져오기
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
무료 온라인 이미지 추출기
Word 온라인에서 이미지를 무료로 추출하는 가장 좋은 방법은 무엇인가요? 이미지를 추출하기 위해 온라인 Word 문서 파서를 사용해 보세요. 이 Word 파서 도구는 위에서 언급한 Java 파서 라이브러리를 사용하여 개발되었습니다.
결론
결론적으로, GroupDocs.Parser Cloud SDK는 Word 문서에서 이미지를 추출하는 데 있어 훌륭한 솔루션으로, 시간과 노력을 절약하며 정확한 결과를 보장합니다. 다음은 이 기사에서 배운 내용입니다:
- how to extract all images from Word DOCX programmatically in Java using REST API;
- how to extract specific images from Word documents in Java using REST API;
- and online image extraction tool to extract images from Word documents.
추가적으로, documentation을 통해 GroupDocs.Parser Cloud API에 대해 더 알아볼 수 있습니다. 또한 API Reference 섹션을 제공하여 브라우저를 통해 우리의 API를 직접 시각화하고 상호작용할 수 있습니다. Java SDK의 전체 소스 코드는 Github에서 자유롭게 제공됩니다.
Finally, we keep writing new blog articles on different file formats and parsing them using REST API. So, please get in touch for the latest updates.
Ask a question
문서에서 이미지를 추출하는 방법에 대한 문의가 있으시면, 언제든지 forum을 통해 저희에게 연락해 주시기 바랍니다.
자주 묻는 질문들
Word 문서를 Java에서 어떻게 파싱하나요?
이미지나 텍스트를 추출하려면 먼저 GroupDocs.Parser Cloud SDK를 사용하여 Word 문서를 로드하고 구문 분석해야 합니다. 이 프로세스는 파일 경로를 지정하고 문서를 구문 분석하기 위해 Parse 메서드를 호출하는 것을 포함합니다.
GroupDocs.Parser Cloud SDK는 다른 문서 형식에서 이미지를 추출할 수 있나요?
네, GroupDocs.Parser Cloud SDK for Java는 Word, PDF, Excel, PowerPoint 등 다양한 문서 형식에서 이미지 추출을 지원합니다.
GroupDocs.Parser Cloud SDK는 단일 Word 문서에서 여러 이미지를 추출할 수 있습니까?
네, SDK는 단일 Word 문서에서 여러 이미지를 추출할 수 있으며, 문서 내에 포함된 모든 이미지를 제공합니다.
GroupDocs.Parser Cloud SDK는 추출 과정에서 원본 이미지 품질을 유지하나요?
네, GroupDocs.Parser Cloud SDK for Java는 Word 문서에서 이미지를 추출하는 동안 원본 이미지 품질을 유지합니다.
See Also
다음은 도움이 될 수 있는 관련 기사입니다: