画像を PDF 文書から抽出することは、レポート、スキャンした文書、または埋め込まれたビジュアルを含むプレゼンテーションファイルを扱う際の一般的な要求です。各画像を手動で保存する代わりに、GroupDocs.Parser Cloud SDK for .NETを使用して抽出プロセスを自動化することができます。

このチュートリアルでは、C# .NET と GroupDocs.Parser Cloud REST API を使用して PDF ファイルから画像を抽出する方法を学び、迅速な統合のための簡単に従えるコードスニペットを提供します。

PDFファイルから画像を抽出する理由は何ですか?

PDF 画像抽出の自動化には多くの実用的なユースケースがあります:

  • マーケティングまたは財務報告からロゴ、チャート、インフォグラフィックを取得します。
  • マルチページPDFから写真やスキャンを抽出します。
  • 文書分析のための自動化されたコンテンツ抽出パイプラインを構築します。
  • 手動での作業やデスクトップツールなしで、大規模なPDFバッチを処理します。

PDF パース API

GroupDocs.Parser Cloud SDK for .NET は、テキスト、画像、PDFの他のコンポーネントやWord、Excelなどの他のファイル形式を含む構造化されたコンテンツを抽出できる軽量で統合が簡単なAPIラッパーです。

前提条件

始める前に、次のことを確認してください:

  • A GroupDocs Cloud Account を取得して、クライアントIDとクライアントシークレットを入手してください。
  • あなたのシステムに .NET 6.0 以降がインストールされていること。
  • Visual Studio またはお好みの IDE。

PDFパーサーAPIをインストールしてください。

NuGetを使用して、以下のコマンドでSDKを簡単にインストールできます:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

PDFからC# .NETを使用して画像を抽出する

これらの簡単な手順に従って、PDFファイルからプログラム的にすべての画像を抽出します。

ステップ 1: 設定を行います。

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

ステップ 2: ファイル情報を指定します。

var fileInfo = new FileInfo
{
    FilePath = "sample.pdf"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

var request = new ImagesRequest(options);

ステップ 3: PDF から画像を抽出します。

var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Image Path: {image.Path}");
}
// For more examplese, please visit [https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet](https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet)

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

// specify the input PDF information
var fileInfo = new FileInfo
{
    FilePath = "input.pdf"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

// 画像抽出リクエストを作成する
var request = new ImagesRequest(options);

// PDFからすべての画像をレスポンスオブジェクトに取得します。
var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Extracted Image Path: {image.Path}");
}

PDF 画像を cURL でダウンロードする

Alternatively, you can also extract images using GroupDocs.Parser REST API and cURL commands.

ステップ 1 – アクセストークンを生成する:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

ステップ 2 – REST API 経由で画像を抽出する:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  \"FileInfo\": {    \"FilePath\": \"Binder1.pdf\",    \"StorageName\": \"internal\"  },  \"OutputPath\": \"internal\",  \"StartPageNumber\": 1,  \"CountPagesToExtract\": 2}"
  • をあなたが生成したものに置き換えてください。

Online PDF画像抽出ツールを試してください

コーディングの前にテストしたいですか?無料の Online PDF Image Extractor を使用してください。GroupDocs.Parser Cloud によって提供されており、PDF をアップロードして抽出した画像を即座にダウンロードできます。

フリーイメージエクストラクター

結論

このガイドでは、次のことについて説明しました:

  • C# .NET REST API を使用して PDF から画像を抽出します。
  • 自動的に埋め込まれた画像をダウンロードして処理します。
  • REST API または cURL を使用して統合します。

なので、.NET用のGroupDocs.Parser Cloud SDKの助けを借りれば、サードパーティソフトウェアや手動のステップを必要とせずに、PDFコンテンツ抽出のための自動化ワークフローを簡単に構築できます。

📚 追加リソース

よくある質問 – FAQs

Wordから画像を抽出するにはどうすればよいですか?

Wordファイルからプログラムmatically画像を抽出するために GroupDocs.Parser Cloud SDKs を使用できます。

価格モデルとは何ですか?

私たちは、使った分だけ支払う単一の料金モデルを提供しています。詳細については、 pricing guide をご覧ください。

無料トライアルは提供していますか?

はい。無料トライアルアカウントを使用すると、毎月150回のAPIコールを無料で行い、制限なしでAPIを評価できます。詳細については、 Free Trial をご覧ください。

関連する記事