Перетворення документів Word (DOC, DOCX) у текстовий формат є звичайною вимогою в екстракції даних, індексуванні або автоматизованих робочих процесах. За допомогою .NET Cloud SDK ви можете легко витягувати текст з документів Word для обробки природної мови, аналізу вмісту або зберігання великих текстових даних без залежності від Microsoft Word.

API конвертації слова в текст

GroupDocs.Parser Cloud SDK for .NET пропонує потужні інструменти для парсингу, витягування та конвертації документів Word у текстовий формат. Він підтримує DOC, DOCX та інші популярні формати документів, надаючи розробникам швидкий спосіб створити конвертери документу в текст або docx в txt у застосунках .NET.

Передумови

  • Зареєструйтесь на GroupDocs Cloud Dashboard.
  • Отримайте свій ідентифікатор клієнта та секрет клієнта. Для отримання додаткової інформації, будь ласка, відвідайте this article.
  • Встановіть .NET 6.0 або новішу версію та Visual Studio.
  • Встановіть SDK з NuGet пакунків:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

Перетворення DOCX у TXT за допомогою C#

Ось простий приклад, що демонструє, як конвертувати DOCX у TXT або витягати текст з документів Word за допомогою GroupDocs.Parser Cloud SDK для .NET.

1.: Ініціалізуйте конфігурацію API

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

2.: Викликайте метод Parse, щоб витягти текстовий вміст документа. Ініціалізуйте об’єкт з об’єкту ImagesRequest, де ми передаємо екземпляр класу ImagesOptions як аргумент.

var response = parserApi.Parse(new ParseRequest("sample.docx"));

3.: Збережіть витягнений текст як файл .txt локально для подальшої обробки.

File.WriteAllText("output.txt", response.Text);
  • 💡 Ви також можете витягувати текст з певних сторінок або абзаців, встановивши фільтри в параметрі ParseOptions.
// Для подальших прикладів, будь ласка, відвідайте https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// Load input Word document
using (var fileStream = OpenRead("input.docx"))
{
    // upload the input Word document to cloud storage
    var uploadRequest = new Requests.UploadFileRequest("sample.docx", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "sample.docx" }
};

var request = new TextRequest(options);
// extract text from input Word document
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

Витягти текст з Word за допомогою cURL

Якщо ви надаєте перевагу операціям з командного рядка, ви можете безпосередньо використовувати REST API через cURL для перетворення DOC або DOCX в текст онлайн.

Крок 1: Отримати токен доступу:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Крок 2: Перетворення DOCX в TXT:

curl -X POST "https://api.groupdocs.cloud/v1.0/parser/{inputFile}/text" \
  -H "accept: application/json" \
  -H "authorization: Bearer {ACCESS_TOKEN}" \
  -o "{outputFile}.txt"

Замініть {inputFile} на ім’я вашого файлу Word, а {outputFile} на бажане ім’я TXT-файлу для збереження локально.

Безкоштовний конвертер DOCX в TXT онлайн

Якщо ви хочете швидко спробувати перетворення Word в текст онлайн, ознайомтеся з безкоштовним конвертером DOCX в TXT. Він дозволяє вам завантажити та миттєво конвертувати будь-який файл Word у текстовий формат безпосередньо у вашому браузері — без установки або програмування.

Безкоштовний екстрактор зображень

Резюме

Ми вивчили, що наш .NET Cloud SDK надає надійне, хмарне рішення для витягування тексту з документів Word та перетворення їх у формат TXT. Це спрощує витягування даних, аналіз контенту та інтеграцію з системи обробки документів підприємств.

Чому використовувати GroupDocs.Parser Cloud?

  • Підтримує формати DOC і DOCX.
  • Легке інтегрування з .NET додатками.
  • 100% Хмарний — Microsoft Word не потрібен.
  • Generate clean TXT output ready for data processing or storage.

Часто задавані питання (FAQ)

  1. Can I convert DOCX to TXT using C#?
  • Так. SDK дозволяє вам витягувати та зберігати текст з документів Word безпосередньо в форматі TXT.
  1. Чи підтримує він файли DOC, а також DOCX?
  • Так. Обидва формати файлів повністю підтримуються для конвертації та витягування тексту.
  1. Is Microsoft Word required for this conversion?
  • Ні. Конверсія виконується повністю на платформі GroupDocs Cloud.
  1. Чи можу я вибрати конкретні розділи або сторінки для витягування?
  • Так. Ви можете визначити діапазони сторінок або області для часткового витягування тексту.

Корисні посилання

Схожі статті