PDF 파일 파서 – Java에서 PDF 파일에서 이미지를 온라인으로 추출하기

PDF(Portable Document Format)은 온라인에서 문서를 공유하고 보존하기 위해 널리 사용되는 파일 형식입니다. 이 형식은 종종 텍스트, 이미지, 표 등 다양한 유형의 콘텐츠를 포함합니다. PDF 파일에서 특정 콘텐츠, 예를 들어 이미지를 추출하는 것은 신뢰할 수 있는 도구나 라이브러리가 없으면 어려운 작업이 될 수 있습니다. 이러한 도구 중 하나가 Java용 GroupDocs.Parser Cloud SDK로, PDF 파일에서 이미지를 추출하는 매끄럽고 효율적인 방법을 제공합니다. 이 기사에서는 REST API를 사용하여 Java에서 PDF 파일에서 이미지를 추출하는 방법을 보여줄 것입니다.

이 기사에서는 다음 주제를 다룰 것입니다:

Java REST API to Separate Images from PDF and SDK Installation

GroupDocs.Parser Cloud SDK for Java는 PDF 파일을 포함한 다양한 document formats에서 데이터를 구문 분석하고 추출하는 간단하고 효율적인 방법을 제공하는 강력하고 다재다능한 Java 라이브러리입니다. 이 라이브러리는 문서 구문 분석을 위한 광범위한 기능을 제공하여 개발자가 이미지, 텍스트, 메타데이터 및 기타 콘텐츠를 추출할 수 있도록 합니다. GroupDocs.Parser는 또한 C#.NET, Java, PHP, Ruby 및 Python SDK를 document parser family members로 제공하여 Cloud API를 지원합니다.

시작하려면 Java 프로젝트에 GroupDocs.Parser Cloud SDK를 포함해야 합니다. API의 JAR 파일을 다운로드 하거나 Maven을 사용하여 프로젝트의 pom.xml 파일에 다음 저장소와 종속성을 추가하여 설치할 수 있습니다:

Maven Repository:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven 종속성:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

다음으로, sign up 을 위해 무료 체험 계정을 만들거나 purchase a subscription plan 을 통해 GroupDocs 웹사이트에서 구독 계획을 구매하고 get your API key 를 받으세요. Client Id와 Client Secret을 얻으면, 아래 코드 조각을 Java 기반 애플리케이션에 추가하세요:

# 등록 후 https://dashboard.groupdocs.cloud 에서 clientid 및 clientsecret을 가져오세요.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

PDF 파일에서 모든 이미지를 추출하는 방법을 Java로 REST API를 사용하여

이제 GroupDocs.Parser Cloud SDK for Java를 사용하여 PDF 파일에서 이미지를 추출하는 단계와 예제 코드 스니펫을 작성해 보겠습니다:

  • 먼저, 필요한 클래스를 Java 파일에 가져옵니다.
  • 둘째, ParseApi 클래스의 인스턴스를 생성합니다.
  • 셋째, FileInfo 클래스의 인스턴스를 만드세요.
  • 다음으로, 입력 PDF 문서의 경로를 설정합니다.
  • 그럼, ImagesOptions() 클래스의 인스턴스를 생성하세요.
  • 다음으로 fileInfo를 setFileInfo 이미지 옵션에 할당합니다.
  • 이제 ImagesRequest() 클래스의 인스턴스를 생성하고 ImagesOptions 매개변수를 전달하세요.
  • 마지막으로, ParseApi.images() 메서드를 호출하여 ImagesRequest 매개변수를 전달하여 결과를 얻습니다.

다음 코드 샘플은 REST API를 사용하여 Java에서 PDF 파일에서 모든 이미지를 온라인으로 추출하는 방법을 보여줍니다:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// PDF 파일에서 이미지를 추출하는 방법은 Java에서.
public class App {

	public static void main(String[] args) {
		
		// Parse API의 인스턴스를 만듭니다.
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// 설정을 준비하세요
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// 출력 파일 경로 가져오기
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

PDF 파일에서 특정 이미지를 페이지 번호를 사용하여 Java로 추출하기

이 섹션에서는 Java에서 PDF 파일에서 특정 이미지를 프로그래밍적으로 추출하기 위한 단계 및 코드 스니펫을 제공할 것입니다:

  • 먼저, 필요한 클래스를 Java 파일에 가져옵니다.
  • 둘째로, ParseApi 클래스의 인스턴스를 생성합니다.
  • 셋째, FileInfo 클래스의 인스턴스를 생성합니다.
  • 다음으로, 입력 PDF 문서의 경로를 설정합니다.
  • 그럼, ImagesOptions() 클래스의 인스턴스를 생성하세요.
  • 다음으로 fileInfo를 setFileInfo 이미지 옵션에 할당합니다.
  • 그럼 setStartPageNumber 및 setCountPagesToExtract 값을 제공하십시오.
  • 이제 ImagesRequest() 클래스의 인스턴스를 생성하고 ImagesOptions 매개변수를 전달하세요.
  • 마지막으로, ParseApi.images() 메서드를 호출하고 ImagesRequest 매개변수를 전달하여 결과를 가져옵니다.

다음 코드 샘플은 REST API를 사용하여 Java에서 페이지 범위에 따라 PDF 파일에서 특정 이미지를 추출하는 방법을 보여줍니다:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// PDF 파일에서 페이지 범위별로 이미지를 추출하는 방법을 Java로 온라인에서 수행합니다.
public class App {

	public static void main(String[] args) {
		
		// Parse API의 인스턴스를 생성하십시오.
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// 설정을 준비하세요.
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// 출력 파일 경로 가져오기
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

무료 온라인 이미지 추출기

PDF 파일에서 이미지를 무료로 온라인에서 추출하는 가장 좋은 방법은 무엇인가요? PDF 파일에서 이미지를 추출하려면 온라인 PDF File parser 를 사용해 보세요. 이 PDF Parser 소프트웨어는 위에서 언급한 파서 라이브러리를 사용하여 Java로 개발되었습니다.

결론

결론적으로, GroupDocs.Parser Cloud SDK for Java는 PDF 파일에서 이미지를 쉽게 추출할 수 있는 신뢰할 수 있으며 효율적인 솔루션을 제공합니다. 다음은 이 기사에서 배운 내용입니다:

  • How to extract all images from PDF files programmatically in Java using REST API;
  • PDF 문서에서 특정 이미지를 추출하는 방법 Java로 REST API를 사용하여;
  • 온라인 이미지 추출 도구로 PDF 문서에서 이미지를 추출할 수 있습니다.

Additionally, you can learn more about GroupDocs.Parser Cloud API using the documentation. We also provide an API Reference section that lets you visualize and interact with our APIs directly through the browser. Java SDK`s complete source code is freely available on Github.

Finally, we keep writing new blog articles on different file formats and parsing them using REST API. So, please get in touch for the latest updates.

Ask a question

문서를 파싱하는 방법에 대한 질문이 있는 경우, 언제든지 저희에게 forum을 통해 문의해 주십시오.

자주 묻는 질문

How do I parse PDF files using Java?

이미지, 텍스트 또는 메타데이터를 추출하려면 먼저 GroupDocs.Parser Cloud SDK를 사용하여 PDF 문서를 로드하고 파싱해야 합니다. 이 과정에는 파일 경로를 지정하고 Parse 메서드를 호출하여 PDF 파일을 파싱하는 것이 포함됩니다.

GroupDocs.Parser Cloud SDK for Java는 PDF 이외의 다른 파일 형식을 지원하나요?

네, PDF 파일 외에도, GroupDocs.Parser Cloud SDK for Java 는 Word, Excel, PowerPoint, HTML 등 다양한 문서 형식에서 이미지 추출을 지원합니다.

저는 GroupDocs.Parser Cloud SDK for Java를 사용하여 PDF 파일에서 모든 이미지를 추출할 수 있습니까?

네, GroupDocs.Parser Cloud SDK for Java를 사용하여 PDF 파일에서 모든 이미지를 추출할 수 있습니다.

See Also

다음은 도움이 될 수 있는 관련 기사입니다: