Word 文檔通常包含豐富的視覺元素,例如標誌、圖表和產品圖片,您可能需要單獨重用或分析這些元素。手動從 .doc 或 .docx 文件中保存每個圖片可能很慢且容易出錯—尤其是在處理大量文檔或自動化工作流程時。
因此,在這篇文章中,我們將學習如何通過幾個簡單的 API 調用以程式化的方式從 Word 文件中提取圖像的詳細信息。我們的基於 REST 的 SDK 完全在雲端運行——無需 Microsoft Word 或外部庫——使其非常適合自動化、集成和可擴展應用程序。
影像擷取的顯著特徵
- 將文件視覺內容存檔到一個集中媒體庫中
- 處理機器學習或光學字符識別工作流程的嵌入式圖形
- 重複使用公司資產來自報告和合同
- 在文件系統之間移轉視覺資料
我們來更詳細地探索以下主題:
Word Document Processing API
The GroupDocs.Parser Cloud SDK for .NET 是我們獲獎的基於 REST 的 API,提供操縱各種文件格式的能力,包括 Word 文件、PPTX、Excel、PDF、ZIP 等等。根據我們的需求,該 API 通過讓您從 C# 應用程序中的 .doc
和 .docx
文件直接讀取、提取和保存圖片,簡化了這些用例。
先決條件
- 在 GroupDocs Cloud Dashboard 註冊。
- 獲取您的客戶 ID 和客戶秘鑰。欲了解更多詳情,請訪問這篇 article。
- 安裝基於 REST 的 SDK:
- 安裝 .NET 6.0 或更高版本以及 Visual Studio。
從 NuGet 套件安裝 SDK:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
- 有關客戶憑證的更多資訊,
如何在 C# 中從 Word 中提取圖像
請按照以下簡單的三步驟過程,使用 C# 和 GroupDocs.Parser Cloud REST API 從 Word 文件中提取圖像。
步驟 1:初始化 API 配置
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
步驟 2:設置檔案路徑和提取選項 初始化 ImagesRequest 物件,並將 ImagesOptions 類別的實例作為參數傳遞。
var fileInfo = new FileInfo
{
FilePath = "sample.docx"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
var request = new ImagesRequest(options);
步驟 3:檢索文檔圖像。 調用 images API 以從 Word 文檔中提取圖像。
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
// write the name of image extracted from word document
Console.WriteLine($"Image found at: {image.Path}");
}
// 欲知更多信息,請訪問 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
// 指定輸入的 Word 文件資訊
var fileInfo = new FileInfo
{
FilePath = "sample.docx"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
// 創建 ImagesRequest 物件
var request = new ImagesRequest(options);
// 呼叫 API 以從 Word 文件中提取圖像
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
Console.WriteLine($"Image found at: {image.Path}");
}
使用 cURL 下載 Word 文檔圖片
如果您的偏好是無需代碼片段的圖像提取,那麼可以嘗試在命令行終端或批處理文件中使用 cURL 命令調用 GroupDocs.Parser Cloud。
步驟 1 – 生成 JWT 访问令牌:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
步驟 2 – 提取圖片:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{
\"FileInfo\": {
\"FilePath\": \"input.docx\",
\"StorageName\": \"internal\"
},
\"OutputPath\": \"internal\",
\"StartPageNumber\": 1,
\"CountPagesToExtract\": 2
}"
- 將 替換為您生成的令牌。
- 如果您希望從所有頁面提取圖像,則可以跳過
StartPageNumber
和CountPagesToExtract
參數。
免費 Word 文檔圖片提取器
如果您還沒有設置好環境並想測試 GroupDocs.Parser Cloud API 的功能,那麼您可以考慮嘗試我們的免費 online Word Image Extractor 應用程式。

摘要
The GroupDocs.Parser Cloud SDK for .NET 是一個可靠的解決方案,用於內容提取、文檔解析和涉及 Word、PDF、Excel 和其他格式的自動化工作流程。今天就試試我們的 REST API !
進一步閱讀
常見問題 – FAQs
我可以從 Word 文件的特定頁面提取圖片嗎?
- 是的。您可以定義
StartPageNumber
和CountPagesToExtract
參數。
API 是否保留圖像解析度?
- 是的。API 返回的嵌入圖像具有與它們在 Word 文檔中嵌入時相似的質量和解析度。
是否需要 Microsoft Word 來執行此操作?
- 不。這是一個基於雲端的解決方案,獨立於 MS Office 運作。
是否有免費試用版?
- 是的。您可以使用試用帳戶每月獲得 150 次免費 API 呼叫。如需更多資訊,請訪問 pricing guide。