Java에서 PDF 페이지를 추출하는 방법

Java의 PDF에서 페이지 추출 - 온라인에서 PDF 페이지 분리.

PDF 파일로 작업하는 경우 PDF 파일에서 페이지를 추출해야 하는 상황에 처할 수 있습니다. PDF 파일에서 페이지를 추출하는 것은 특히 수동으로 수행하거나 대용량 문서를 처리해야 하는 경우 시간이 많이 걸리는 작업이 될 수 있습니다. 다행스럽게도 Java용 GroupDocs.Merger Cloud SDK 덕분에 PDF 파일에서 프로그래밍 방식으로 페이지를 쉽게 추출할 수 있습니다. 이 기사에서는 Java에서 PDF에서 페이지를 추출하는 방법을 살펴봅니다.

이 문서에서는 다음 항목을 다룹니다.

Java PDF 페이지 추출기 REST API 및 SDK 설치

GroupDocs.Merger Cloud SDK for Java는 개발자가 파일 및 다른 유형의 문서(Word, Excel 포함)에서 페이지를 병합, 추출, 분할, 재정렬 및 제거할 수 있는 클라우드 기반 API입니다. , PowerPoint, HTML, PDF 등. 이 강력한 SDK는 사용하기 쉽고 Java 기반 애플리케이션에 통합되어 파일 조작 작업을 자동화할 수 있습니다.

API의 JAR 파일을 다운로드하거나 프로젝트의 pom.xml 파일에 다음 리포지토리 및 종속성을 추가하여 Maven을 사용하여 설치할 수 있습니다.

메이븐 저장소:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

메이븐 종속성:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

이제 무료 평가판 계정에 가입하거나 GroupDocs 웹사이트에서 가입 요금제를 구매하여 API 키를 가져옵니다. 클라이언트 ID와 클라이언트 암호가 있으면 Java 기반 애플리케이션에 아래 코드 스니펫을 추가합니다.

# 등록 후 https://dashboard.groupdocs.cloud에서 client_id 및 client_secret을 가져옵니다.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Java에서 정확한 페이지 번호로 PDF 페이지를 추출하는 방법

Java용 GroupDocs.Merger Cloud SDK를 사용하여 PDF 파일에서 페이지를 추출하려면 다음 단계를 따라야 합니다.

파일 업로드

먼저 아래 제공된 코드 예제를 사용하여 PDF 파일을 클라우드에 업로드합니다.

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Java를 사용하여 Cloud Storage에 파일 업로드
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

결과적으로 업로드된 PDF 파일은 클라우드 대시보드의 파일 섹션에서 사용할 수 있습니다.

Java의 PDF 파일에서 페이지 추출

다음은 Java용 GroupDocs.Merger Cloud SDK를 사용하여 PDF 파일에서 페이지를 추출하는 방법에 대한 단계별 가이드 및 예제 코드 스니펫입니다.

  • 먼저 필요한 클래스를 Java 파일로 가져옵니다.
  • 둘째, PagesApi 클래스의 인스턴스를 생성합니다.
  • 셋째, FileInfo 클래스의 인스턴스를 생성합니다.
  • 그런 다음 소스 입력 파일 경로를 설정합니다.
  • 이제 ExtractOptions() 클래스의 인스턴스를 만듭니다.
  • 그런 다음 추출 옵션 setFileInfo, setOutputPath 및 setPages 컬렉션을 배열 형식으로 정의합니다.
  • 이제 ExtractRequest() 클래스의 인스턴스를 만들고 ExtractOptions 매개 변수를 전달합니다.
  • 마지막으로 PagesApi의 extract() 메서드를 호출하고 ExtractRequest 매개변수를 전달하여 페이지를 추출합니다.

다음 코드 스니펫은 REST API를 사용하여 PDF 파일을 Java의 개별 페이지로 분리하는 방법을 보여줍니다.

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Java에서 정확한 페이지 번호로 PDF 페이지를 추출하는 방법.
public class App {

	public static void main(String[] args) {

		// 페이지 API의 인스턴스를 만듭니다.			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// 설정 준비
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.pdf");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// 출력 파일 경로 가져오기
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

파일 다운로드

위의 코드 샘플은 PDF의 특정 페이지를 클라우드에 저장합니다. 다음 코드 샘플을 사용하여 다운로드할 수 있습니다.

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Java를 사용하여 Cloud Storage에서 파일 다운로드
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.pdf", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Java를 사용하여 페이지 범위별로 PDF에서 페이지를 추출하는 방법

이 섹션에서는 페이지 범위를 적용하여 Java를 사용하여 PDF에서 선택한 페이지를 저장하는 단계별 가이드와 예제 코드 스니펫을 다룹니다.

  • 먼저 필요한 클래스를 Java 파일로 가져옵니다.
  • 둘째, PagesApi 클래스의 인스턴스를 생성합니다.
  • 셋째, FileInfo 클래스의 인스턴스를 생성합니다.
  • 그런 다음 소스 입력 파일 경로를 설정합니다.
  • 이제 ExtractOptions() 클래스의 인스턴스를 만듭니다.
  • 그런 다음 추출 옵션 setFileInfo, setOutputPath, setStartPageNumber 및 setEndPageNumber를 정의하십시오.
  • 다음으로 페이지 옵션 setRangeMode를 EVENPAGES로 설정합니다.
  • 이제 ExtractRequest() 클래스의 인스턴스를 만들고 ExtractOptions 매개 변수를 전달합니다.
  • 마지막으로 PagesApi의 extract() 메서드를 호출하고 ExtractRequest 매개변수를 전달하여 페이지를 추출합니다.

다음 코드 스니펫은 Java에서 페이지 범위 및 모드를 적용하여 PDF 페이지를 추출하는 방법을 보여줍니다.

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Java를 사용하여 페이지 범위별로 PDF에서 페이지를 추출하는 방법.
public class App {

	public static void main(String[] args) {
		
		// 페이지 API의 인스턴스를 만듭니다.		
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// 설정 준비
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.pdf");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// 출력 파일 경로 가져오기
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

무료 온라인 PDF 페이지 추출기

PDF 페이지를 무료로 추출하는 방법은 무엇입니까? 무료로 PDF에서 특정 페이지를 추출하려면 무료 PDF 페이지 추출기를 사용해 보십시오. 이 온라인 PDF 페이지 추출기는 위에서 언급한 Groupdocs.Merger Cloud API를 사용하여 개발되었습니다.

결론

GroupDocs.Merger Cloud SDK for Java는 PDF 페이지를 Java에서 새 PDF로 추출하는 쉬운 방법을 제공합니다. 이 문서에서 배운 내용은 다음과 같습니다.

  • Java를 사용하여 PDF 파일을 번호별로 여러 페이지로 분리하는 방법
  • 프로그래밍 방식으로 클라우드에서 Java를 사용하여 PDF 파일을 업로드하고 다운로드합니다.
  • 페이지 범위를 사용하여 PDF를 Java의 개별 페이지로 분리합니다.
  • 온라인에서 무료 PDF 페이지 추출기를 사용하여 온라인에서 무료로 PDF에서 페이지를 추출합니다.

또한 브라우저를 통해 직접 API를 시각화하고 통신할 수 있는 API 참조 섹션도 제공합니다. Java SDK의 전체 소스 코드는 Github에서 무료로 사용할 수 있습니다. GroupDocs.Merger Cloud SDK for Java예제를 확인하십시오.

또한 자세한 단계 및 API 사용에 대해서는 시작 가이드를 따르는 것이 좋습니다.

마지막으로 REST API를 사용하여 다양한 문서 작업에 대한 새 블로그 게시물을 계속 작성합니다. 따라서 정기적인 업데이트를 위해 연락해 주십시오.

질문하기

PDF 페이지 추출기 API에 대해 질문이 있는 경우 무료 지원 포럼에서 언제든지 문의하십시오.

FAQ

Java에서 PDF 파일의 페이지를 어떻게 추출합니까?

GroupDocs.Merger Cloud SDK for Java를 사용하여 PDF 파일에서 페이지를 추출할 수 있습니다.

Java의 PDF에서 단일 페이지를 내보낼 수 있습니까?

예, GroupDocs.Merger Cloud SDK for Java를 사용하여 Java에서 프로그래밍 방식으로 PDF 페이지를 단일 파일로 추출할 수 있습니다.

Java용 GroupDocs.Merger Cloud SDK를 사용하여 페이지를 추출할 수 있는 파일 형식은 무엇입니까?

PDF 파일 외에도 Java용 GroupDocs.Merger Cloud SDK는 Microsoft Word, Excel, PowerPoint, HTML 및 기타 파일 형식에서 페이지를 추출할 수 있습니다.

또한보십시오

다음은 도움이 될 수 있는 몇 가지 관련 문서입니다.