Node.js를 사용하여 PDF 파일에서 이미지 추출

PDF 문서는 이미지와 텍스트를 포함한 내용을 그대로 보존합니다. 경우에 따라 PDF 곡예사 파일에서 이미지를 추출하여 재사용해야 할 수도 있습니다. 클라우드에서 프로그래밍 방식으로 PDF 문서에 포함된 특정 페이지에서 모든 이미지 또는 이미지를 쉽게 추출할 수 있습니다. 이 기사에서는 Node.js에서 REST API를 사용하여 PDF 파일에서 이미지를 추출하는 방법을 배웁니다.

이 기사에서 pdf에서 사진을 추출하기 위해 다음 주제를 다룹니다.

이미지 추출기 REST API 및 Node.js SDK

PDF 문서에서 이미지를 추출하기 위해 GroupDocs.Parser Cloud의 Node.js SDK API를 사용합니다. 모든 인기 있는 문서 형식에서 템플릿으로 텍스트, 이미지를 추출하고 데이터를 구문 분석할 수 있습니다. 콘솔에서 다음 명령을 사용하여 설치하십시오.

npm install groupdocs-parser-cloud

언급된 단계를 따르기 전에 대시보드에서 클라이언트 ID와 암호를 가져오십시오. ID와 시크릿이 있으면 아래와 같이 코드를 추가합니다.

// 이 코드 예제는 클라이언트 ID와 암호를 코드에 추가하는 방법을 보여줍니다.
global.clientId = '659fe7da-715b-4744-a0f7-cf469a392b73';
global.clientSecret = 'b377c36cfa28fa69960ebac6b6e36421';
global.myStorage = "";

const configuration = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
configuration.apiBaseUrl = "https://api.groupdocs.cloud";

Node.js에서 REST API를 사용하여 PDF에서 이미지 추출

아래에 언급된 간단한 단계에 따라 PDF 문서에서 이미지를 추출할 수 있습니다.

문서 업로드

먼저 아래 제공된 코드 샘플을 사용하여 이미지가 포함된 PDF 문서를 클라우드에 업로드합니다.

// 이 코드 예제는 PDF를 node.js의 클라우드에 업로드하는 방법을 보여줍니다. 
// FileApi 구성
let fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);

// 입력 파일 경로
let resourcesFolder = 'C:\\Files\\Parser\\sample.pdf';
fs.readFile(resourcesFolder, (err, fileStream) => {
  // 파일 요청 업로드
  let request = new groupdocs_parser_cloud.UploadFileRequest("sample.pdf", fileStream, myStorage);
  // 파일 업로드
  fileApi.uploadFile(request);
});

결과적으로 업로드된 PDF 파일은 클라우드 대시보드의 파일 섹션에서 사용할 수 있습니다. 이 파일은 pdf에서 이미지를 추출하는 데 사용할 수 있습니다.

Node.js의 PDF 파일에서 모든 이미지 추출

이제 아래 단계에 따라 프로그래밍 방식으로 업로드된 PDF 파일에서 모든 이미지를 추출합니다.

  • 먼저 ParseApi의 인스턴스를 만듭니다.
  • 다음으로 업로드된 PDF 파일 경로를 제공합니다.
  • 그런 다음 ImageOptions를 정의하고 파일을 할당합니다.
  • 그런 다음 ImageOptions를 인수로 사용하여 ImagesRequest를 생성합니다.
  • 마지막으로 images() 메서드를 호출하여 이미지를 추출합니다.

다음 코드 샘플은 Node.js에서 REST API를 사용하여 PDF 파일에서 모든 이미지를 추출하는 방법을 보여줍니다.

// 이 코드 예제는 Node.js의 PDF에서 모든 이미지를 추출하는 방법을 보여줍니다.
//API 초기화
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);

// 입력 파일 경로
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.pdf";

// 이미지 옵션 정의
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;

// 이미지 요청
let request = new groupdocs_parser_cloud.ImagesRequest(options);

// 이미지 추출
let result = await parseApi.images(request);

// 결과 보여줘
let images = result.images;
images.forEach(image => {
  console.log("Image path in storage: " + image.path);
  console.log("Download url: " + image.downloadUrl);
  console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});
Node.js에서 REST API를 사용하여 PDF에서 이미지 추출

Node.js에서 REST API를 사용하여 PDF에서 이미지 추출

추출된 이미지 다운로드

위의 코드 샘플은 추출된 이미지를 클라우드에 저장합니다. 아래 제공된 코드 샘플을 사용하여 이러한 이미지를 다운로드할 수 있습니다.

// 이 코드 예제는 Node.js를 사용하여 클라우드에서 이미지를 다운로드하는 방법을 보여줍니다.
// 필요한 API 인스턴스 구성
var folderApi = groupdocs_parser_cloud.FolderApi.fromConfig(configuration);
var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);

// 파일 목록 요청 가져오기
var filesListRequest = new groupdocs_parser_cloud.GetFilesListRequest("parser/images/sample_pdf/", myStorage);

// 파일 목록 가져오기
var filesList = await folderApi.getFilesList(filesListRequest);

for (var count = 0; count < filesList.value.length; count++) {
  // 파일 요청 다운로드
  let request = new groupdocs_parser_cloud.DownloadFileRequest(filesList.value[count].path, myStorage);

  // 파일 다운로드
  let response = await fileApi.downloadFile(request);

  // 파일을 디스크의 폴더에 저장
  fs.writeFile("C:\\Files\\parser\\images\\" + filesList.value[count].name, response, "binary", function (err) { });
  console.log(response);
}

PDF 파일에서 이미지를 내보낸 다음 클라우드에서 다운로드하는 방법입니다.

Node.js의 PDF 문서에서 페이지 번호로 이미지 저장

아래 단계에 따라 전체 문서 대신 PDF 특정 페이지에서 이미지를 내보낼 수 있습니다.

  • 먼저 ParseApi의 인스턴스를 만듭니다.
  • 다음으로 업로드된 PDF 파일 경로를 제공합니다.
  • 그런 다음 ImageOptions를 정의하고 파일을 할당합니다.
  • 이미지를 추출할 시작 페이지 번호와 총 페이지 수를 설정합니다.
  • 그런 다음 ImageOptions를 인수로 사용하여 ImagesRequest를 생성합니다.
  • 마지막으로 images() 메서드를 호출하여 이미지를 추출합니다.

다음 코드 샘플은 Node.js의 REST API를 사용하여 PDF 문서에서 페이지 번호별로 pdf 파일에서 그림을 추출하는 방법을 보여줍니다. 추출된 이미지를 다운로드하려면 앞에서 언급한 단계를 따르십시오.

// 이 코드 예제는 Node.js에서 PDF의 특정 페이지에서 이미지를 추출하는 방법을 보여줍니다.
//API 초기화
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);

// 입력 파일 경로
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.pdf";

// 이미지 옵션 정의
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;
options.startPageNumber = 1;      // Start page number
options.countPagesToExtract = 1;  // Total pages

// 이미지 요청
let request = new groupdocs_parser_cloud.ImagesRequest(options);

// 이미지 추출
let result = await parseApi.images(request);

// 결과 보여줘
let pages = result.pages;
pages.forEach(page => {
  console.log("Page index: " + page.pageIndex);
  page.images.forEach(image => {
    console.log("Download url: " + image.downloadUrl);
    console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
  });
});

Node.js에서 PDF로 첨부된 문서에서 이미지 추출

아래 단계에 따라 PDF 파일의 첨부 파일로 사용할 수 있는 컨테이너 내부의 문서에서 이미지를 추출할 수도 있습니다.

  • 먼저 ParseApi의 인스턴스를 만듭니다.
  • 다음으로 업로드된 PDF 파일 경로를 제공합니다.
  • 그런 다음 ImageOptions를 정의하고 파일을 할당합니다.
  • 다음으로 ContainerItemInfo를 정의하고 내부 문서의 상대 경로를 제공합니다.
  • 그런 다음 ImageOptions를 인수로 사용하여 ImagesRequest를 생성합니다.
  • 마지막으로 images() 메서드를 호출하여 이미지를 추출합니다.

다음 코드 샘플은 Node.js에서 REST API를 사용하여 PDF 문서 내의 문서에서 이미지를 추출하는 방법을 보여줍니다. 추출된 이미지를 다운로드하려면 앞에서 언급한 단계를 따르십시오.

// 이 코드 예제는 Node.js의 PDF에 첨부된 문서에서 이미지를 추출하는 방법을 보여줍니다.
// API 초기화
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);

// 입력 파일 경로
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "PDF_with_Attachment.pdf";
fileInfo.password = "password";

// 이미지 옵션 정의
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;

// 컨테이너 항목
options.ContainerItemInfo = new groupdocs_parser_cloud.ContainerItemInfo();
options.ContainerItemInfo.relativePath = "template-document.pdf";

// 이미지 요청
let request = new groupdocs_parser_cloud.ImagesRequest(options);

// 이미지 추출
let result = await parseApi.images(request);

// 결과 보여줘
let images = result.images;
images.forEach(image => {
  console.log("Image path: " + image.path);
  console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});

온라인 시도

PDF에서 이미지를 무료로 추출하는 방법은 무엇입니까? 위의 API를 사용하여 개발된 다음 무료 온라인 PDF 구문 분석 도구를 사용하여 온라인에서 PDF 이미지를 추출해 보십시오. https://products.groupdocs.app/parser/pdf

결론

이 문서에서는 다음 방법을 배웠습니다.

  • 클라우드에서 Node.js를 사용하여 PDF 파일에서 이미지를 추출합니다.
  • 프로그래밍 방식으로 PDF 파일을 클라우드에 업로드합니다.
  • 클라우드에서 추출된 이미지를 다운로드합니다.

또한 문서를 사용하여 GroupDocs.Parser Cloud API에 대해 자세히 알아볼 수 있습니다. 또한 브라우저를 통해 직접 API를 시각화하고 상호 작용할 수 있는 API 참조 섹션을 제공합니다. 모호한 점이 있으면 언제든지 포럼에 문의해 주십시오.

또한보십시오