PDF 파일 파서 – Java에서 온라인으로 PDF 파일의 이미지 추출

PDF(Portable Document Format)는 문서를 온라인으로 공유하고 보존하기 위해 널리 사용되는 파일 형식입니다. 여기에는 종종 텍스트, 이미지, 표 등을 비롯한 다양한 유형의 콘텐츠가 포함됩니다. 이미지와 같은 PDF 파일에서 특정 콘텐츠를 추출하는 것은 신뢰할 수 있는 도구나 라이브러리 없이 어려운 작업이 될 수 있습니다. 이러한 도구 중 하나는 Java용 GroupDocs.Parser Cloud SDK로, PDF 파일에서 이미지를 원활하고 효율적으로 추출할 수 있는 방법을 제공합니다. 이 기사에서는 REST API를 사용하여 Java의 PDF 파일에서 이미지를 추출하는 방법을 보여줍니다.

이 문서에서는 다음 항목을 다룹니다.

PDF 및 SDK 설치에서 이미지를 분리하는 Java REST API

GroupDocs.Parser Cloud SDK for Java는 PDF 파일을 포함하여 다양한 문서 형식에서 데이터를 구문 분석하고 추출하는 간단하고 효율적인 방법을 제공하는 강력하고 다재다능한 Java 라이브러리입니다. 문서 구문 분석을 위한 다양한 기능을 제공하여 개발자가 이미지, 텍스트, 메타데이터 및 기타 콘텐츠를 추출할 수 있도록 합니다. GroupDocs.Parser는 또한 C#.NET, Java, PHP, Ruby 및 Python SDK를 Cloud API용 문서 파서 제품군 구성원으로 제공합니다.

시작하려면 Java 프로젝트에 GroupDocs.Parser Cloud SDK를 포함해야 합니다. API의 JAR 파일을 다운로드하거나 프로젝트의 pom.xml 파일에 다음 리포지토리 및 종속성을 추가하여 Maven을 사용하여 설치할 수 있습니다.

메이븐 저장소:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

메이븐 종속성:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

다음으로 무료 평가판 계정에 가입하거나 GroupDocs 웹사이트에서 구독 요금제를 구매하고 API 키를 받으세요. 클라이언트 ID와 클라이언트 암호가 있으면 Java 기반 애플리케이션에 아래 코드 스니펫을 추가합니다.

# 등록 후 https://dashboard.groupdocs.cloud에서 client_id 및 client_secret을 가져옵니다.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

REST API를 사용하여 Java에서 PDF 파일의 모든 이미지를 추출하는 방법

이제 Java용 GroupDocs.Parser Cloud SDK를 사용하여 PDF 파일에서 이미지를 추출하는 단계와 예제 코드 스니펫을 작성해 보겠습니다.

  • 먼저 필요한 클래스를 Java 파일로 가져옵니다.
  • 둘째, ParseApi 클래스의 인스턴스를 만듭니다.
  • 셋째, FileInfo 클래스의 인스턴스를 생성합니다.
  • 다음으로 입력 PDF 문서의 경로를 설정합니다.
  • 그런 다음 ImagesOptions() 클래스의 인스턴스를 만듭니다.
  • 다음으로 setFileInfo 이미지 옵션에 fileInfo를 할당합니다.
  • 이제 ImagesRequest() 클래스의 인스턴스를 만들고 ImagesOptions 매개 변수를 전달합니다.
  • 마지막으로 ParseApi.images() 메서드를 호출하고 ImagesRequest 매개변수를 전달하여 결과를 얻습니다.

다음 코드 샘플은 REST API를 사용하여 Java에서 온라인으로 PDF 파일의 모든 이미지를 추출하는 방법을 보여줍니다.

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Java의 PDF 파일에서 이미지를 추출하는 방법.
public class App {

	public static void main(String[] args) {
		
		// Parse API의 인스턴스 생성
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// 설정 준비
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// 출력 파일 경로 가져오기
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

페이지 번호를 사용하여 Java의 PDF 파일에서 특정 이미지 추출

이 섹션에서는 Java에서 프로그래밍 방식으로 PDF 파일에서 특정 이미지를 추출하기 위한 단계와 코드 스니펫을 제공합니다.

  • 먼저 필요한 클래스를 Java 파일로 가져옵니다.
  • 둘째, ParseApi 클래스의 인스턴스를 만듭니다.
  • 셋째, FileInfo 클래스의 인스턴스를 생성합니다.
  • 다음으로 입력 PDF 문서의 경로를 설정합니다.
  • 그런 다음 ImagesOptions() 클래스의 인스턴스를 만듭니다.
  • 다음으로 setFileInfo 이미지 옵션에 fileInfo를 할당합니다.
  • 그런 다음 setStartPageNumber 및 setCountPagesToExtract 값을 제공합니다.
  • 이제 ImagesRequest() 클래스의 인스턴스를 만들고 ImagesOptions 매개 변수를 전달합니다.
  • 마지막으로 ParseApi.images() 메서드를 호출하고 ImagesRequest 매개변수를 전달하여 결과를 얻습니다.

다음 코드 샘플은 REST API를 사용하여 Java의 페이지 범위별로 PDF 파일에서 특정 이미지를 추출하는 방법을 보여줍니다.

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Java의 페이지 범위별로 PDF 파일에서 온라인으로 이미지를 추출합니다.
public class App {

	public static void main(String[] args) {
		
		// Parse API의 인스턴스 생성
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// 설정 준비
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// 출력 파일 경로 가져오기
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

무료 온라인 이미지 추출기

온라인에서 무료로 PDF에서 이미지를 추출하는 가장 좋은 방법은 무엇입니까? PDF 파일에서 이미지를 추출하려면 온라인 PDF 파일 파서를 사용해 보십시오. 이 PDF 파서 소프트웨어는 위에서 언급한 파서 라이브러리와 같이 Java를 사용하여 개발되었습니다.

결론

결론적으로 Java용 GroupDocs.Parser Cloud SDK는 PDF 파일에서 이미지를 쉽게 추출할 수 있는 안정적이고 효율적인 솔루션을 제공합니다. 이 기사에서 배운 내용은 다음과 같습니다.

  • REST API를 사용하여 Java에서 프로그래밍 방식으로 PDF 파일에서 모든 이미지를 추출하는 방법
  • REST API를 사용하여 Java의 PDF 문서에서 특정 이미지를 추출하는 방법
  • PDF 문서에서 이미지를 추출하는 온라인 이미지 추출 도구.

또한 문서를 사용하여 GroupDocs.Parser Cloud API에 대해 자세히 알아볼 수 있습니다. 또한 브라우저를 통해 직접 API를 시각화하고 상호 작용할 수 있는 API 참조 섹션을 제공합니다. Java SDK의 전체 소스 코드는 Github에서 무료로 사용할 수 있습니다.

마지막으로 우리는 계속해서 다른 파일 형식으로 새 블로그 기사를 작성하고 REST API를 사용하여 구문 분석합니다. 따라서 최신 업데이트에 대해 문의하십시오.

질문하기

문서를 파싱하는 방법에 대해 질문이 있는 경우 포럼을 통해 언제든지 문의하십시오.

FAQ

Java를 사용하여 PDF 파일을 어떻게 구문 분석합니까?

이미지, 텍스트 또는 메타데이터를 추출하려면 먼저 GroupDocs.Parser Cloud SDK를 사용하여 PDF 문서를 로드하고 구문 분석해야 합니다. 이 프로세스에는 파일 경로를 지정하고 Parse 메서드를 호출하여 PDF 파일을 구문 분석하는 작업이 포함됩니다.

GroupDocs.Parser Cloud SDK for Java는 PDF 외에 다른 파일 형식을 지원합니까?

예, PDF 파일 외에도 Java용 GroupDocs.Parser Cloud SDK는 Word, Excel, PowerPoint, HTML 등을 포함한 다양한 문서 형식에서 이미지 추출을 지원합니다.

GroupDocs.Parser Cloud SDK for Java를 사용하여 PDF 파일에서 모든 이미지를 추출할 수 있습니까?

예, GroupDocs.Parser Cloud SDK for Java를 사용하여 PDF 파일에서 모든 이미지를 추출할 수 있습니다.

또한보십시오

다음은 도움이 될 수 있는 몇 가지 관련 문서입니다.