이미지를 PDF 문서에서 추출하는 것은 보고서, 스캔한 문서 또는 임베디드 비주얼을 포함하는 프레젠테이션 파일을 다룰 때 일반적인 요구 사항입니다. 각 이미지를 수동으로 저장하는 대신, .NET용 GroupDocs.Parser Cloud SDK를 사용하여 추출 프로세스를 자동화할 수 있습니다.

이 튜토리얼에서는 C# .NET 및 GroupDocs.Parser Cloud REST API를 사용하여 PDF 파일에서 이미지를 추출하는 방법에 대해 배우게 됩니다. 신속한 통합을 위한 따라 하기 쉬운 코드 스니펫도 포함되어 있습니다.

PDF 파일에서 이미지 추출하는 이유는 무엇인가요?

PDF 이미지 추출 자동화를 위한 많은 실제 사용 사례가 있습니다:

  • 로고, 차트 및 인포그래픽을 마케팅 또는 재무 보고서에서 검색합니다.
  • 다중 페이지 PDF에서 사진과 스캔을 추출합니다.
  • 문서 분석을 위한 자동화된 콘텐츠 추출 파이프라인을 구축하세요.
  • 수동 노력이나 데스크톱 도구 없이 대량의 PDF 파일을 처리하세요.

PDF 파싱 API

GroupDocs.Parser Cloud SDK for .NET는 텍스트, 이미지 및 PDF의 다른 구성 요소와 Word, Excel 등과 같은 다른 파일 형식을 추출할 수 있는 경량화되고 통합하기 쉬운 API 래퍼입니다.

전제 조건

시작하기 전에 다음을 확인하세요:

  • A GroupDocs Cloud Account를 만들어서 클라이언트 ID와 클라이언트 시크릿을 받으세요.
  • .NET 6.0 이상이 시스템에 설치되어야 합니다.
  • 비주얼 스튜디오 또는 선호하는 IDE.

PDF 파서 API 설치

SDK를 아래 명령어를 사용하여 NuGet에서 쉽게 설치할 수 있습니다:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

PDF에서 이미지 추출하기 C# .NET

다음 간단한 단계를 따라 PDF 파일에서 모든 이미지를 프로그래밍 방식으로 추출하세요.

1단계: 구성 설정.

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

단계 2: 파일 정보 지정.

var fileInfo = new FileInfo
{
    FilePath = "sample.pdf"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

var request = new ImagesRequest(options);

3단계: PDF에서 이미지 추출.

var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Image Path: {image.Path}");
}
// 더 많은 예시를 보려면 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet 를 방문해 주세요.

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

// specify the input PDF information
var fileInfo = new FileInfo
{
    FilePath = "input.pdf"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

// 이미지 추출 요청 생성
var request = new ImagesRequest(options);

// PDF에서 응답 객체의 모든 이미지를 가져옵니다.
var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Extracted Image Path: {image.Path}");
}

PDF 이미지 cURL을 통해 다운로드

대신 GroupDocs.Parser REST API와 cURL 명령을 사용하여 이미지를 추출할 수도 있습니다.

Step 1 – 액세스 토큰 생성:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Step 2 – REST API를 통해 이미지 추출:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  \"FileInfo\": {    \"FilePath\": \"Binder1.pdf\",    \"StorageName\": \"internal\"  },  \"OutputPath\": \"internal\",  \"StartPageNumber\": 1,  \"CountPagesToExtract\": 2}"
  • 을(를) 생성한 것으로 교체하세요.

온라인 PDF 이미지 추출기 사용해 보세요

코딩하기 전에 테스트해보고 싶나요? 무료 Online PDF Image Extractor를 사용해보세요. GroupDocs.Parser Cloud가 지원하며, PDF를 업로드하고 즉시 추출된 이미지를 다운로드할 수 있습니다.

무료 이미지 추출기

결론

이 가이드에서는 다음과 같은 내용에 대해 다루었습니다:

  • C# .NET REST API를 사용하여 PDF에서 이미지 추출.
  • 자동으로 임베디드 이미지를 다운로드하고 처리합니다.
  • REST API 또는 cURL을 사용하여 통합하십시오.

그래서, .NET용 GroupDocs.Parser Cloud SDK의 도움으로, 타사 소프트웨어나 수동 단계 없이 PDF 콘텐츠 추출을 위한 자동화 워크플로를 쉽게 구축할 수 있습니다.

📚 추가 자료

자주 묻는 질문 – FAQs

Word에서 이미지를 추출하려면 어떻게 해야 하나요?

Word 파일에서 이미지를 프로그래밍 방식으로 추출하려면 GroupDocs.Parser Cloud SDKs를 사용할 수 있습니다.

가격 모델은 무엇인가요?

우리는 단일 사용량 기반 요금 모델을 제공합니다. 추가 정보는 pricing guide를 방문해 주세요.

무료 체험을 제공하나요?

네. 무료 체험 계정을 사용하면 매달 150회의 API 호출을 무료로 할 수 있으며, 제한 없이 API를 평가할 수 있습니다. 자세한 내용은 Free Trial을 방문하시기 바랍니다.

관련 기사