將 Word 文檔 (DOC,DOCX) 轉換為文本格式是在數據提取、索引或自動化工作流程中的常見需求。在 .NET Cloud SDK 的幫助下,您可以輕鬆從 Word 文檔中提取文本,以便進行自然語言處理、內容分析或存儲大量文本數據,而無需依賴 Microsoft Word。
Word to Text Conversion API
GroupDocs.Parser Cloud SDK for .NET 提供強大的工具來解析、提取和將 Word 文件轉換為文本格式。它支持 DOC、DOCX 和其他流行的文檔格式,為開發者提供了一種快速的方式在 .NET 應用中構建文檔到文本或 docx 到 txt 的轉換器。
前提條件
- 在 GroupDocs Cloud Dashboard 註冊。
- 獲取您的客戶端 ID 和客戶端密鑰。欲了解更多信息,請訪問 這篇文章。
- 安裝 .NET 6.0 或更高版本以及 Visual Studio。
- 從 NuGet 套件安裝 SDK:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
將 DOCX 轉換為 TXT 使用 C#
這是一個簡單的範例,演示如何使用 GroupDocs.Parser Cloud SDK for .NET 將 DOCX 轉換為 TXT 或從 Word 文件中提取文本。
1.: 初始化 API 配置
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
2.: 呼叫解析方法以提取文檔的文本內容。 初始化一個 ImagesRequest 物件,並將 ImagesOptions 類別的實例作為參數傳遞。
var response = parserApi.Parse(new ParseRequest("sample.docx"));
3.: 將提取的文本儲存為本地的 .txt 檔案,以便進一步處理。
File.WriteAllText("output.txt", response.Text);
- 💡 您還可以通過在 ParseOptions 參數中設置過濾器來從特定頁面或段落中提取文本。
// 如需更多範例,請訪問 [https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet](https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet)
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);
// Load input Word document
using (var fileStream = OpenRead("input.docx"))
{
// upload the input Word document to cloud storage
var uploadRequest = new Requests.UploadFileRequest("sample.docx", fileStream);
fileApi.UploadFile(uploadRequest);
}
var options = new TextOptions
{
FileInfo = new FileInfo { FilePath = "sample.docx" }
};
var request = new TextRequest(options);
// extract text from input Word document
var response = parseApi.Text(request);
Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);
從 Word 提取文本 via cURL
如果您偏好命令行操作,您可以通過 cURL 直接使用 REST API 將 DOC 或 DOCX 轉換為在線文本。
步驟 1:獲取訪問令牌:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
步驟 2: 將 DOCX 轉換為 TXT:
curl -X POST "https://api.groupdocs.cloud/v1.0/parser/{inputFile}/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "{outputFile}.txt"
將 {inputFile} 替換為您的 Word 文件名稱,並將 {outputFile} 替換為您希望保存到本地的 TXT 文件名稱。
免費 DOCX 轉 TXT 在線轉換器
如果您想快速嘗試 Word to text conversion online,請查看免費的 DOCX 轉 TXT 轉換器。它允許您上傳並立即在瀏覽器中將任何 Word 檔案轉換為文本格式 — 無需安裝或編碼。

摘要
我們已經探索了我們的 .NET Cloud SDK 提供了一個可靠的基於雲的解決方案,用於從 Word 文檔中提取文本並將其轉換為 TXT 格式。它簡化了數據提取、內容分析以及與 企業文件處理系統。
為什麼使用 GroupDocs.Parser Cloud?
- 支持 DOC 和 DOCX 格式。
- 輕鬆與 .NET 應用程式整合。
- 100% 雲端運行 — 無需 Microsoft Word。
- 生成可供數據處理或存儲的乾淨 TXT 輸出。
常見問題 (FAQs)
- Can I convert DOCX to TXT using C#?
- 是的。該 SDK 允許您直接以 TXT 格式提取和保存 Word 文件中的文本。
- 它是否同時支持 DOC 及 DOCX 文件?
- 是的。這兩種文件格式均完全支持轉換和文本提取。
- 不需要 Microsoft Word 進行這次轉換嗎?
- 不。轉換完全在 GroupDocs Cloud 平台上執行。
- 我可以選擇特定的部分或頁面進行提取嗎?
- 是的。您可以定義頁面範圍或區域以進行部分文本提取。
