PDF 문서는 이미지와 텍스트를 포함한 내용을 그대로 보존합니다. 경우에 따라 PDF 곡예사 파일에서 이미지를 추출하여 재사용해야 할 수도 있습니다. 클라우드에서 프로그래밍 방식으로 PDF 문서에 포함된 특정 페이지에서 모든 이미지 또는 이미지를 쉽게 추출할 수 있습니다. 이 기사에서는 Node.js에서 REST API를 사용하여 PDF 파일에서 이미지를 추출하는 방법을 배웁니다.
이 기사에서 pdf에서 사진을 추출하기 위해 다음 주제를 다룹니다.
- 이미지 추출기 REST API 및 Node.js SDK
- Node.js에서 REST API를 사용하여 PDF에서 이미지 추출
- Node.js의 PDF 문서에서 페이지 번호로 이미지 저장
- Node.js에서 PDF로 첨부된 문서에서 이미지 추출
이미지 추출기 REST API 및 Node.js SDK
PDF 문서에서 이미지를 추출하기 위해 GroupDocs.Parser Cloud의 Node.js SDK API를 사용합니다. 모든 인기 있는 문서 형식에서 템플릿으로 텍스트, 이미지를 추출하고 데이터를 구문 분석할 수 있습니다. 콘솔에서 다음 명령을 사용하여 설치하십시오.
npm install groupdocs-parser-cloud
언급된 단계를 따르기 전에 대시보드에서 클라이언트 ID와 암호를 가져오십시오. ID와 시크릿이 있으면 아래와 같이 코드를 추가합니다.
// 이 코드 예제는 클라이언트 ID와 암호를 코드에 추가하는 방법을 보여줍니다.
global.clientId = '659fe7da-715b-4744-a0f7-cf469a392b73';
global.clientSecret = 'b377c36cfa28fa69960ebac6b6e36421';
global.myStorage = "";
const configuration = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
configuration.apiBaseUrl = "https://api.groupdocs.cloud";
Node.js에서 REST API를 사용하여 PDF에서 이미지 추출
아래에 언급된 간단한 단계에 따라 PDF 문서에서 이미지를 추출할 수 있습니다.
- 업로드 PDF 파일을 클라우드로
- PDF 파일에서 이미지 추출
- 다운로드the extracted images
문서 업로드
먼저 아래 제공된 코드 샘플을 사용하여 이미지가 포함된 PDF 문서를 클라우드에 업로드합니다.
// 이 코드 예제는 PDF를 node.js의 클라우드에 업로드하는 방법을 보여줍니다.
// FileApi 구성
let fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);
// 입력 파일 경로
let resourcesFolder = 'C:\\Files\\Parser\\sample.pdf';
fs.readFile(resourcesFolder, (err, fileStream) => {
// 파일 요청 업로드
let request = new groupdocs_parser_cloud.UploadFileRequest("sample.pdf", fileStream, myStorage);
// 파일 업로드
fileApi.uploadFile(request);
});
결과적으로 업로드된 PDF 파일은 클라우드 대시보드의 파일 섹션에서 사용할 수 있습니다. 이 파일은 pdf에서 이미지를 추출하는 데 사용할 수 있습니다.
Node.js의 PDF 파일에서 모든 이미지 추출
이제 아래 단계에 따라 프로그래밍 방식으로 업로드된 PDF 파일에서 모든 이미지를 추출합니다.
- 먼저 ParseApi의 인스턴스를 만듭니다.
- 다음으로 업로드된 PDF 파일 경로를 제공합니다.
- 그런 다음 ImageOptions를 정의하고 파일을 할당합니다.
- 그런 다음 ImageOptions를 인수로 사용하여 ImagesRequest를 생성합니다.
- 마지막으로 images() 메서드를 호출하여 이미지를 추출합니다.
다음 코드 샘플은 Node.js에서 REST API를 사용하여 PDF 파일에서 모든 이미지를 추출하는 방법을 보여줍니다.
// 이 코드 예제는 Node.js의 PDF에서 모든 이미지를 추출하는 방법을 보여줍니다.
//API 초기화
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);
// 입력 파일 경로
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.pdf";
// 이미지 옵션 정의
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;
// 이미지 요청
let request = new groupdocs_parser_cloud.ImagesRequest(options);
// 이미지 추출
let result = await parseApi.images(request);
// 결과 보여줘
let images = result.images;
images.forEach(image => {
console.log("Image path in storage: " + image.path);
console.log("Download url: " + image.downloadUrl);
console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});
추출된 이미지 다운로드
위의 코드 샘플은 추출된 이미지를 클라우드에 저장합니다. 아래 제공된 코드 샘플을 사용하여 이러한 이미지를 다운로드할 수 있습니다.
// 이 코드 예제는 Node.js를 사용하여 클라우드에서 이미지를 다운로드하는 방법을 보여줍니다.
// 필요한 API 인스턴스 구성
var folderApi = groupdocs_parser_cloud.FolderApi.fromConfig(configuration);
var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);
// 파일 목록 요청 가져오기
var filesListRequest = new groupdocs_parser_cloud.GetFilesListRequest("parser/images/sample_pdf/", myStorage);
// 파일 목록 가져오기
var filesList = await folderApi.getFilesList(filesListRequest);
for (var count = 0; count < filesList.value.length; count++) {
// 파일 요청 다운로드
let request = new groupdocs_parser_cloud.DownloadFileRequest(filesList.value[count].path, myStorage);
// 파일 다운로드
let response = await fileApi.downloadFile(request);
// 파일을 디스크의 폴더에 저장
fs.writeFile("C:\\Files\\parser\\images\\" + filesList.value[count].name, response, "binary", function (err) { });
console.log(response);
}
PDF 파일에서 이미지를 내보낸 다음 클라우드에서 다운로드하는 방법입니다.
Node.js의 PDF 문서에서 페이지 번호로 이미지 저장
아래 단계에 따라 전체 문서 대신 PDF 특정 페이지에서 이미지를 내보낼 수 있습니다.
- 먼저 ParseApi의 인스턴스를 만듭니다.
- 다음으로 업로드된 PDF 파일 경로를 제공합니다.
- 그런 다음 ImageOptions를 정의하고 파일을 할당합니다.
- 이미지를 추출할 시작 페이지 번호와 총 페이지 수를 설정합니다.
- 그런 다음 ImageOptions를 인수로 사용하여 ImagesRequest를 생성합니다.
- 마지막으로 images() 메서드를 호출하여 이미지를 추출합니다.
다음 코드 샘플은 Node.js의 REST API를 사용하여 PDF 문서에서 페이지 번호별로 pdf 파일에서 그림을 추출하는 방법을 보여줍니다. 추출된 이미지를 다운로드하려면 앞에서 언급한 단계를 따르십시오.
// 이 코드 예제는 Node.js에서 PDF의 특정 페이지에서 이미지를 추출하는 방법을 보여줍니다.
//API 초기화
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);
// 입력 파일 경로
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.pdf";
// 이미지 옵션 정의
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;
options.startPageNumber = 1; // Start page number
options.countPagesToExtract = 1; // Total pages
// 이미지 요청
let request = new groupdocs_parser_cloud.ImagesRequest(options);
// 이미지 추출
let result = await parseApi.images(request);
// 결과 보여줘
let pages = result.pages;
pages.forEach(page => {
console.log("Page index: " + page.pageIndex);
page.images.forEach(image => {
console.log("Download url: " + image.downloadUrl);
console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});
});
Node.js에서 PDF로 첨부된 문서에서 이미지 추출
아래 단계에 따라 PDF 파일의 첨부 파일로 사용할 수 있는 컨테이너 내부의 문서에서 이미지를 추출할 수도 있습니다.
- 먼저 ParseApi의 인스턴스를 만듭니다.
- 다음으로 업로드된 PDF 파일 경로를 제공합니다.
- 그런 다음 ImageOptions를 정의하고 파일을 할당합니다.
- 다음으로 ContainerItemInfo를 정의하고 내부 문서의 상대 경로를 제공합니다.
- 그런 다음 ImageOptions를 인수로 사용하여 ImagesRequest를 생성합니다.
- 마지막으로 images() 메서드를 호출하여 이미지를 추출합니다.
다음 코드 샘플은 Node.js에서 REST API를 사용하여 PDF 문서 내의 문서에서 이미지를 추출하는 방법을 보여줍니다. 추출된 이미지를 다운로드하려면 앞에서 언급한 단계를 따르십시오.
// 이 코드 예제는 Node.js의 PDF에 첨부된 문서에서 이미지를 추출하는 방법을 보여줍니다.
// API 초기화
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);
// 입력 파일 경로
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "PDF_with_Attachment.pdf";
fileInfo.password = "password";
// 이미지 옵션 정의
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;
// 컨테이너 항목
options.ContainerItemInfo = new groupdocs_parser_cloud.ContainerItemInfo();
options.ContainerItemInfo.relativePath = "template-document.pdf";
// 이미지 요청
let request = new groupdocs_parser_cloud.ImagesRequest(options);
// 이미지 추출
let result = await parseApi.images(request);
// 결과 보여줘
let images = result.images;
images.forEach(image => {
console.log("Image path: " + image.path);
console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});
온라인 시도
PDF에서 이미지를 무료로 추출하는 방법은 무엇입니까? 위의 API를 사용하여 개발된 다음 무료 온라인 PDF 구문 분석 도구를 사용하여 온라인에서 PDF 이미지를 추출해 보십시오. https://products.groupdocs.app/parser/pdf
결론
이 문서에서는 다음 방법을 배웠습니다.
- 클라우드에서 Node.js를 사용하여 PDF 파일에서 이미지를 추출합니다.
- 프로그래밍 방식으로 PDF 파일을 클라우드에 업로드합니다.
- 클라우드에서 추출된 이미지를 다운로드합니다.
또한 문서를 사용하여 GroupDocs.Parser Cloud API에 대해 자세히 알아볼 수 있습니다. 또한 브라우저를 통해 직접 API를 시각화하고 상호 작용할 수 있는 API 참조 섹션을 제공합니다. 모호한 점이 있으면 언제든지 포럼에 문의해 주십시오.