將 Word 文檔 (DOCDOCX) 轉換為文本格式是在數據提取、索引或自動化工作流程中的常見需求。在 .NET Cloud SDK 的幫助下,您可以輕鬆從 Word 文檔中提取文本,以便進行自然語言處理、內容分析或存儲大量文本數據,而無需依賴 Microsoft Word。

Word to Text Conversion API

GroupDocs.Parser Cloud SDK for .NET 提供強大的工具來解析、提取和將 Word 文件轉換為文本格式。它支持 DOC、DOCX 和其他流行的文檔格式,為開發者提供了一種快速的方式在 .NET 應用中構建文檔到文本或 docx 到 txt 的轉換器。

前提條件

  • GroupDocs Cloud Dashboard 註冊。
  • 獲取您的客戶端 ID 和客戶端密鑰。欲了解更多信息,請訪問 這篇文章
  • 安裝 .NET 6.0 或更高版本以及 Visual Studio。
  • 從 NuGet 套件安裝 SDK:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

將 DOCX 轉換為 TXT 使用 C#

這是一個簡單的範例,演示如何使用 GroupDocs.Parser Cloud SDK for .NET 將 DOCX 轉換為 TXT 或從 Word 文件中提取文本。

1.: 初始化 API 配置

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

2.: 呼叫解析方法以提取文檔的文本內容。 初始化一個 ImagesRequest 物件,並將 ImagesOptions 類別的實例作為參數傳遞。

var response = parserApi.Parse(new ParseRequest("sample.docx"));

3.: 將提取的文本儲存為本地的 .txt 檔案,以便進一步處理。

File.WriteAllText("output.txt", response.Text);
  • 💡 您還可以通過在 ParseOptions 參數中設置過濾器來從特定頁面或段落中提取文本。
// 如需更多範例,請訪問 [https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet](https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet)

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// Load input Word document
using (var fileStream = OpenRead("input.docx"))
{
    // upload the input Word document to cloud storage
    var uploadRequest = new Requests.UploadFileRequest("sample.docx", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "sample.docx" }
};

var request = new TextRequest(options);
// extract text from input Word document
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

從 Word 提取文本 via cURL

如果您偏好命令行操作,您可以通過 cURL 直接使用 REST API 將 DOC 或 DOCX 轉換為在線文本。

步驟 1:獲取訪問令牌:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

步驟 2: 將 DOCX 轉換為 TXT:

curl -X POST "https://api.groupdocs.cloud/v1.0/parser/{inputFile}/text" \
  -H "accept: application/json" \
  -H "authorization: Bearer {ACCESS_TOKEN}" \
  -o "{outputFile}.txt"

{inputFile} 替換為您的 Word 文件名稱,並將 {outputFile} 替換為您希望保存到本地的 TXT 文件名稱。

免費 DOCX 轉 TXT 在線轉換器

如果您想快速嘗試 Word to text conversion online,請查看免費的 DOCX 轉 TXT 轉換器。它允許您上傳並立即在瀏覽器中將任何 Word 檔案轉換為文本格式 — 無需安裝或編碼。

免費圖片提取器

摘要

我們已經探索了我們的 .NET Cloud SDK 提供了一個可靠的基於雲的解決方案,用於從 Word 文檔中提取文本並將其轉換為 TXT 格式。它簡化了數據提取、內容分析以及與 企業文件處理系統。

為什麼使用 GroupDocs.Parser Cloud?

  • 支持 DOC 和 DOCX 格式。
  • 輕鬆與 .NET 應用程式整合。
  • 100% 雲端運行 — 無需 Microsoft Word。
  • 生成可供數據處理或存儲的乾淨 TXT 輸出。

常見問題 (FAQs)

  1. Can I convert DOCX to TXT using C#?
  • 是的。該 SDK 允許您直接以 TXT 格式提取和保存 Word 文件中的文本。
  1. 它是否同時支持 DOC 及 DOCX 文件?
  • 是的。這兩種文件格式均完全支持轉換和文本提取。
  1. 不需要 Microsoft Word 進行這次轉換嗎?
  • 不。轉換完全在 GroupDocs Cloud 平台上執行。
  1. 我可以選擇特定的部分或頁面進行提取嗎?
  • 是的。您可以定義頁面範圍或區域以進行部分文本提取。

有用的連結

相關文章