Перетворення документів Word (DOC, DOCX) у текстовий формат є звичайною вимогою в екстракції даних, індексуванні або автоматизованих робочих процесах. За допомогою .NET Cloud SDK ви можете легко витягувати текст з документів Word для обробки природної мови, аналізу вмісту або зберігання великих текстових даних без залежності від Microsoft Word.
- API конвертації Word в текст
- Конвертувати DOCX в TXT за допомогою C#
- Витягти текст з Word за допомогою cURL
API конвертації слова в текст
GroupDocs.Parser Cloud SDK for .NET пропонує потужні інструменти для парсингу, витягування та конвертації документів Word у текстовий формат. Він підтримує DOC, DOCX та інші популярні формати документів, надаючи розробникам швидкий спосіб створити конвертери документу в текст або docx в txt у застосунках .NET.
Передумови
- Зареєструйтесь на GroupDocs Cloud Dashboard.
- Отримайте свій ідентифікатор клієнта та секрет клієнта. Для отримання додаткової інформації, будь ласка, відвідайте this article.
- Встановіть .NET 6.0 або новішу версію та Visual Studio.
- Встановіть SDK з NuGet пакунків:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
Перетворення DOCX у TXT за допомогою C#
Ось простий приклад, що демонструє, як конвертувати DOCX у TXT або витягати текст з документів Word за допомогою GroupDocs.Parser Cloud SDK для .NET.
1.: Ініціалізуйте конфігурацію API
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
2.: Викликайте метод Parse, щоб витягти текстовий вміст документа. Ініціалізуйте об’єкт з об’єкту ImagesRequest, де ми передаємо екземпляр класу ImagesOptions як аргумент.
var response = parserApi.Parse(new ParseRequest("sample.docx"));
3.: Збережіть витягнений текст як файл .txt локально для подальшої обробки.
File.WriteAllText("output.txt", response.Text);
- 💡 Ви також можете витягувати текст з певних сторінок або абзаців, встановивши фільтри в параметрі ParseOptions.
// Для подальших прикладів, будь ласка, відвідайте https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);
// Load input Word document
using (var fileStream = OpenRead("input.docx"))
{
// upload the input Word document to cloud storage
var uploadRequest = new Requests.UploadFileRequest("sample.docx", fileStream);
fileApi.UploadFile(uploadRequest);
}
var options = new TextOptions
{
FileInfo = new FileInfo { FilePath = "sample.docx" }
};
var request = new TextRequest(options);
// extract text from input Word document
var response = parseApi.Text(request);
Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);
Витягти текст з Word за допомогою cURL
Якщо ви надаєте перевагу операціям з командного рядка, ви можете безпосередньо використовувати REST API через cURL для перетворення DOC або DOCX в текст онлайн.
Крок 1: Отримати токен доступу:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Крок 2: Перетворення DOCX в TXT:
curl -X POST "https://api.groupdocs.cloud/v1.0/parser/{inputFile}/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "{outputFile}.txt"
Замініть {inputFile} на ім’я вашого файлу Word, а {outputFile} на бажане ім’я TXT-файлу для збереження локально.
Безкоштовний конвертер DOCX в TXT онлайн
Якщо ви хочете швидко спробувати перетворення Word в текст онлайн, ознайомтеся з безкоштовним конвертером DOCX в TXT. Він дозволяє вам завантажити та миттєво конвертувати будь-який файл Word у текстовий формат безпосередньо у вашому браузері — без установки або програмування.

Резюме
Ми вивчили, що наш .NET Cloud SDK надає надійне, хмарне рішення для витягування тексту з документів Word та перетворення їх у формат TXT. Це спрощує витягування даних, аналіз контенту та інтеграцію з системи обробки документів підприємств.
Чому використовувати GroupDocs.Parser Cloud?
- Підтримує формати DOC і DOCX.
- Легке інтегрування з .NET додатками.
- 100% Хмарний — Microsoft Word не потрібен.
- Generate clean TXT output ready for data processing or storage.
Часто задавані питання (FAQ)
- Can I convert DOCX to TXT using C#?
- Так. SDK дозволяє вам витягувати та зберігати текст з документів Word безпосередньо в форматі TXT.
- Чи підтримує він файли DOC, а також DOCX?
- Так. Обидва формати файлів повністю підтримуються для конвертації та витягування тексту.
- Is Microsoft Word required for this conversion?
- Ні. Конверсія виконується повністю на платформі GroupDocs Cloud.
- Чи можу я вибрати конкретні розділи або сторінки для витягування?
- Так. Ви можете визначити діапазони сторінок або області для часткового витягування тексту.
