Word 文檔通常包含豐富的視覺元素,例如標誌、圖表和產品圖片,您可能需要單獨重用或分析這些元素。手動從 .doc.docx 文件中保存每個圖片可能很慢且容易出錯—尤其是在處理大量文檔或自動化工作流程時。

因此,在這篇文章中,我們將學習如何通過幾個簡單的 API 調用以程式化的方式從 Word 文件中提取圖像的詳細信息。我們的基於 REST 的 SDK 完全在雲端運行——無需 Microsoft Word 或外部庫——使其非常適合自動化、集成和可擴展應用程序。

影像擷取的顯著特徵

  • 將文件視覺內容存檔到一個集中媒體庫中
  • 處理機器學習或光學字符識別工作流程的嵌入式圖形
  • 重複使用公司資產來自報告和合同
  • 在文件系統之間移轉視覺資料

我們來更詳細地探索以下主題:

Word Document Processing API

The GroupDocs.Parser Cloud SDK for .NET 是我們獲獎的基於 REST 的 API,提供操縱各種文件格式的能力,包括 Word 文件、PPTXExcelPDFZIP 等等。根據我們的需求,該 API 通過讓您從 C# 應用程序中的 .doc.docx 文件直接讀取、提取和保存圖片,簡化了這些用例。

先決條件

  • GroupDocs Cloud Dashboard 註冊。
  • 獲取您的客戶 ID 和客戶秘鑰。欲了解更多詳情,請訪問這篇 article
  • 安裝基於 REST 的 SDK:
  • 安裝 .NET 6.0 或更高版本以及 Visual Studio。

從 NuGet 套件安裝 SDK:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
  • 有關客戶憑證的更多資訊,

如何在 C# 中從 Word 中提取圖像

請按照以下簡單的三步驟過程,使用 C# 和 GroupDocs.Parser Cloud REST API 從 Word 文件中提取圖像。

步驟 1:初始化 API 配置

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

步驟 2:設置檔案路徑和提取選項 初始化 ImagesRequest 物件,並將 ImagesOptions 類別的實例作為參數傳遞。

var fileInfo = new FileInfo
{
    FilePath = "sample.docx"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

var request = new ImagesRequest(options);

步驟 3:檢索文檔圖像。 調用 images API 以從 Word 文檔中提取圖像。

var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    // write the name of image extracted from word document
    Console.WriteLine($"Image found at: {image.Path}");
}
// 欲知更多信息,請訪問 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

// 指定輸入的 Word 文件資訊
var fileInfo = new FileInfo
{
    FilePath = "sample.docx"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

// 創建 ImagesRequest 物件
var request = new ImagesRequest(options);

// 呼叫 API 以從 Word 文件中提取圖像
var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Image found at: {image.Path}");
}

使用 cURL 下載 Word 文檔圖片

如果您的偏好是無需代碼片段的圖像提取,那麼可以嘗試在命令行終端或批處理文件中使用 cURL 命令調用 GroupDocs.Parser Cloud

步驟 1 – 生成 JWT 访问令牌:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

步驟 2 – 提取圖片:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  
        \"FileInfo\": {
            \"FilePath\": \"input.docx\",
            \"StorageName\": \"internal\"
            },
            \"OutputPath\": \"internal\",
            \"StartPageNumber\": 1,
            \"CountPagesToExtract\": 2
    }"
  • 將 替換為您生成的令牌。
  • 如果您希望從所有頁面提取圖像,則可以跳過 StartPageNumberCountPagesToExtract 參數。

免費 Word 文檔圖片提取器

如果您還沒有設置好環境並想測試 GroupDocs.Parser Cloud API 的功能,那麼您可以考慮嘗試我們的免費 online Word Image Extractor 應用程式。

免費圖片提取器

摘要

The GroupDocs.Parser Cloud SDK for .NET 是一個可靠的解決方案,用於內容提取、文檔解析和涉及 Word、PDF、Excel 和其他格式的自動化工作流程。今天就試試我們的 REST API !

進一步閱讀

常見問題 – FAQs

我可以從 Word 文件的特定頁面提取圖片嗎?

  • 是的。您可以定義 StartPageNumberCountPagesToExtract 參數。

API 是否保留圖像解析度?

  • 是的。API 返回的嵌入圖像具有與它們在 Word 文檔中嵌入時相似的質量和解析度。

是否需要 Microsoft Word 來執行此操作?

  • 不。這是一個基於雲端的解決方案,獨立於 MS Office 運作。

是否有免費試用版?

  • 是的。您可以使用試用帳戶每月獲得 150 次免費 API 呼叫。如需更多資訊,請訪問 pricing guide

相關教程