XML(Расширяемый язык разметки) широко используется для хранения и передачи структурированных данных между системами. Во многих бизнес-приложениях необходимо извлекать текст из XML-файлов для доступа к фактическому содержимому или его обработки. В этой статье мы исследуем, как извлекать текст из XML с помощью .NET Cloud SDK, который предоставляет простое решение на основе REST для программного извлечения и загрузки текста XML.
- Почему извлекать текст из XML в .NET?
- XML Processing API
- Извлечение текста из XML в C#
- Получить текст из XML с помощью команд cURL
- Бесплатный онлайн-извлекатель текста XML
Почему извлекать текст из XML в .NET?
Извлечение текста из XML файлов позволяет разработчикам читать, обрабатывать и анализировать структурированную информацию, хранящуюся в XML документах. С помощью .NET REST API вы можете легко извлечь текст из XML файлов, анализировать содержимое или интегрировать извлечение данных из XML в другие системы автоматизации.
Распространенные варианты использования включают:
- Парсинг XML конфигурационных файлов или журналов.
- Извлечение текста из документов на основе XML (RSS, счета, отчеты).
- Миграция содержимого XML в другие форматы данных или базы данных.
XML Processing API
GroupDocs.Parser Cloud SDK for .NET является мощным API для парсинга документов, который позволяет извлекать текст, метаданные и структурированное содержимое из различных типов файлов, включая XML. Вы можете легко интегрировать его в любое приложение .NET или ASP.NET.
Установите его через диспетчер пакетов NuGet:
Install-Package GroupDocs.Parser-Cloud
Затем получите свой Client ID и Client Secret из GroupDocs Cloud Dashboard, чтобы аутентифицировать API вызовы.
Извлечение текста из XML в C#
Вот как вы можете извлечь текст из XML-файла, используя фрагмент кода C# .NET.
Шаг 1: Инициализировать API
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-XXXXXX", "XXXXXXXXXXXX");
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";
var parseApi = new ParseApi(configuration);
Шаг 2: Загрузить XML файл в облако
using (var fileStream = System.IO.File.OpenRead("input.xml"))
{
// upload the input XML to the cloud storage
var uploadRequest = new Requests.UploadFileRequest("input.xml", fileStream);
fileApi.UploadFile(uploadRequest);
}
Шаг 3: Извлечь весь текст из XML
var request = new TextRequest(options);
// extract text from XML
var response = parseApi.Text(request);
// Для дальнейших примеров, пожалуйста, посетите https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-XXXXXX", "XXXXXXXXXXXX");
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";
// create instance of ParseA[pi
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);
// Загрузить файл XML ввода
using (var fileStream = System.IO.File.OpenRead("input.xml"))
{
// загрузите входной XML в облачное хранилище
var uploadRequest = new Requests.UploadFileRequest("input.xml", fileStream);
fileApi.UploadFile(uploadRequest);
}
var options = new TextOptions
{
FileInfo = new FileInfo { FilePath = "input.xml" }
};
var request = new TextRequest(options);
// извлечь текст из XML
var response = parseApi.Text(request);
Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);
Это извлечет текст из XML и выведет извлеченное содержимое непосредственно в консоль. Вы также можете загрузить текст XML или сохранить его локально по мере необходимости.

Предварительный просмотр извлечения текста из XML-файла с использованием .NET REST API.
Получение текста из XML с помощью команд cURL
Вы также можете выполнить ту же задачу, чтобы извлечь текст из XML-файла, используя GroupDocs.Parser Cloud и команду cURL:
Шаг 1: - Получить токен JWT: Первый шаг заключается в получении JWT токена доступа на основе учетных данных клиента.
curl -v -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Шаг 2: - Извлечь текст из XML файла:
curl -v -X POST "https://api.groupdocs.cloud/v2.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"sample.xml\" } }"
Эта команда отправляет запрос на извлечение всего текста из вашего XML-документа (XML уже доступен в облачном хранилище).
Бесплатный онлайн-извлекатель текста XML
Хотите попробовать это без написания кода? Используйте бесплатный Online XML Text Extractor, разработанный GroupDocs.Parser Cloud. Вы можете загрузить XML-файл и мгновенно скачать текст XML.

Бесплатное онлайн-приложение для извлечения текста из XML на базе GroupDocs.Parser Cloud.
Часто задаваемые вопросы (ЧЗВ)
Q1: Могу ли я извлечь только определенные узлы или теги из XML файла? Да. SDK поддерживает расширенные опции для извлечения конкретных элементов, узлов или текста из XML-файлов с использованием функций структурированного извлечения данных.
Q2: Могу ли я извлекать текст из XML-файлов, хранящихся в Интернете? Абсолютно. Вы можете указывать URL-адреса или использовать файлы из облачного хранилища напрямую.
Q3: Насколько безопасна извлечение текста XML в GroupDocs Cloud? Все API запросы используют шифрование HTTPS, и ваши файлы остаются конфиденциальными в вашей среде облачного хранения.
Q4: Can I get text from large XML files? Да. SDK эффективно обрабатывает большие и сложные XML файлы с помощью облачной обработки.
Q5: Я не хочу загружать свои конфиденциальные файлы никуда? Каковы мои варианты? GroupDocs.Parser Cloud также доступен как образ Docker, который можно использовать для self-host сервиса. Или вы можете создать свои собственные сервисы, используя GroupDocs.Parser High-code APIs.
Заключение
Извлечение текста из XML-документов является важным процессом для приложений, работающих со структурированными данными. С помощью GroupDocs.Parser Cloud SDK для .NET разработчики могут легко извлекать текст из XML-файлов, получать XML-текст программным образом и даже загружать XML-текст для дальнейшей обработки. Этот облачный API упрощает парсинг данных, делая ваши приложения более интеллектуальными и автоматизированными.
Начните свою бесплатную пробную версию сегодня на GroupDocs.Parser Cloud и испытайте легкость извлечения текста из XML-файлов!
