PDF 文件中提取圖像是一個常見的需求,尤其是在處理包含嵌入視覺效果的報告、掃描文件或演示文稿檔案時。您可以使用 GroupDocs.Parser Cloud SDK for .NET 自動化提取過程,而不必手動保存每個圖像。

在本教程中,您將學習如何使用 C# .NET 和 GroupDocs.Parser Cloud REST API 從 PDF 文件中提取圖像,並提供易於遵循的代碼片段以便快速整合。

為什麼要從 PDF 檔案中提取圖像?

有許多自動化PDF圖像提取的實際應用案例:

  • Retrieve logos, charts, and infographics from marketing or financial reports.
  • 提取多頁PDF中的照片和掃描件。
  • 建立自動內容提取管道以進行文檔分析。
  • 無需手動操作或桌面工具,處理大量批量 PDF 文件。

PDF 解析 API

GroupDocs.Parser Cloud SDK for .NET 是一個輕量且易於整合的 API 包裝器,允許您提取結構化內容——例如文本、圖像以及 PDF 以及其他文件格式(包括 Word、Excel 等)的其他組件。

先決條件

在開始之前,請確保您已經:

  • 一個 GroupDocs Cloud Account 以獲取您的 Client ID 和 Client Secret。
  • 在您的系統上安裝 .NET 6.0 或更高版本。
  • Visual Studio 或您喜歡的 IDE。

安裝 PDF 解析器 API

您可以輕鬆地使用下面的命令從 NuGet 安裝 SDK:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

從 PDF 中提取圖片使用 C# .NET

遵循以下簡單步驟以程式化方式從 PDF 文件中提取所有圖像。

步驟 1:設置配置。

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

步驟 2:指定檔案資訊。

var fileInfo = new FileInfo
{
    FilePath = "sample.pdf"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

var request = new ImagesRequest(options);

步驟 3:從 PDF 中提取圖片。

var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Image Path: {image.Path}");
}
// For more examplese, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

// specify the input PDF information
var fileInfo = new FileInfo
{
    FilePath = "input.pdf"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

// 創建影像提取請求
var request = new ImagesRequest(options);

// 從 PDF 中獲取所有圖片到回應物件中
var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Extracted Image Path: {image.Path}");
}

透過 cURL 下載 PDF 圖像

或者,您也可以使用 GroupDocs.Parser REST API 和 cURL 命令來提取圖像。

步驟 1 – 生成訪問令牌:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

步驟 2 – 通過 REST API 提取圖像:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  \"FileInfo\": {    \"FilePath\": \"Binder1.pdf\",    \"StorageName\": \"internal\"  },  \"OutputPath\": \"internal\",  \"StartPageNumber\": 1,  \"CountPagesToExtract\": 2}"
  • 將 替換為您生成的令牌。

試試在線 PDF 圖像提取器

想在編碼前測試一下嗎?使用由 GroupDocs.Parser Cloud 提供的免費 Online PDF Image Extractor — 上傳 PDF 並立即下載提取的圖像。

免費圖片提取器

結論

在本指南中,我們涵蓋了如何:

  • 使用 C# .NET REST API 從 PDF 中提取圖像。
  • 自動下載和處理嵌入的圖片。
  • 使用 REST API 或 cURL 進行整合。

因此,借助 GroupDocs.Parser Cloud SDK for .NET,您可以輕鬆構建 PDF 內容提取的自動化工作流程,而不需要第三方軟體或手動步驟。

📚 其他資源

常見問題 – FAQs

如何從 Word 文件中提取圖片?

您可以使用 GroupDocs.Parser Cloud SDKs 以程式化方式從 Word 文件中提取圖像。

什麼是定價模型?

我們提供單一的按需付費定價模式。如需更多資訊,請訪問 pricing guide

您提供免費試用嗎?

是的。使用免費試用帳戶,您每月可以免費進行 150 次 API 調用,並在不受限制的情況下評估我們的 API。要獲取更多信息,請訪問 Free Trial

相關文章