XML(Расширяемый язык разметки) широко используется для хранения и передачи структурированных данных между системами. Во многих бизнес-приложениях необходимо извлекать текст из XML-файлов для доступа к фактическому содержимому или его обработки. В этой статье мы исследуем, как извлекать текст из XML с помощью .NET Cloud SDK, который предоставляет простое решение на основе REST для программного извлечения и загрузки текста XML.


Почему извлекать текст из XML в .NET?

Извлечение текста из XML файлов позволяет разработчикам читать, обрабатывать и анализировать структурированную информацию, хранящуюся в XML документах. С помощью .NET REST API вы можете легко извлечь текст из XML файлов, анализировать содержимое или интегрировать извлечение данных из XML в другие системы автоматизации.

Распространенные варианты использования включают:

  • Парсинг XML конфигурационных файлов или журналов.
  • Извлечение текста из документов на основе XML (RSS, счета, отчеты).
  • Миграция содержимого XML в другие форматы данных или базы данных.

XML Processing API

GroupDocs.Parser Cloud SDK for .NET является мощным API для парсинга документов, который позволяет извлекать текст, метаданные и структурированное содержимое из различных типов файлов, включая XML. Вы можете легко интегрировать его в любое приложение .NET или ASP.NET.

Установите его через диспетчер пакетов NuGet:

Install-Package GroupDocs.Parser-Cloud

Затем получите свой Client ID и Client Secret из GroupDocs Cloud Dashboard, чтобы аутентифицировать API вызовы.


Извлечение текста из XML в C#

Вот как вы можете извлечь текст из XML-файла, используя фрагмент кода C# .NET.

Шаг 1: Инициализировать API

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-XXXXXX", "XXXXXXXXXXXX");
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

var parseApi = new ParseApi(configuration);

Шаг 2: Загрузить XML файл в облако

using (var fileStream = System.IO.File.OpenRead("input.xml"))
{
    // upload the input XML to the cloud storage
    var uploadRequest = new Requests.UploadFileRequest("input.xml", fileStream);
    fileApi.UploadFile(uploadRequest);
}

Шаг 3: Извлечь весь текст из XML

var request = new TextRequest(options);
// extract text from XML
var response = parseApi.Text(request);
// Для дальнейших примеров, пожалуйста, посетите https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-XXXXXX", "XXXXXXXXXXXX");
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

// create instance of ParseA[pi
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// Загрузить файл XML ввода
using (var fileStream = System.IO.File.OpenRead("input.xml"))
{
    // загрузите входной XML в облачное хранилище
    var uploadRequest = new Requests.UploadFileRequest("input.xml", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "input.xml" }
};

var request = new TextRequest(options);
// извлечь текст из XML
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

Это извлечет текст из XML и выведет извлеченное содержимое непосредственно в консоль. Вы также можете загрузить текст XML или сохранить его локально по мере необходимости.

Получить текст XML в C#

Предварительный просмотр извлечения текста из XML-файла с использованием .NET REST API.


Получение текста из XML с помощью команд cURL

Вы также можете выполнить ту же задачу, чтобы извлечь текст из XML-файла, используя GroupDocs.Parser Cloud и команду cURL:

Шаг 1: - Получить токен JWT: Первый шаг заключается в получении JWT токена доступа на основе учетных данных клиента.

curl -v -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Шаг 2: - Извлечь текст из XML файла:

curl -v -X POST "https://api.groupdocs.cloud/v2.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"sample.xml\" } }"

Эта команда отправляет запрос на извлечение всего текста из вашего XML-документа (XML уже доступен в облачном хранилище).


Бесплатный онлайн-извлекатель текста XML

Хотите попробовать это без написания кода? Используйте бесплатный Online XML Text Extractor, разработанный GroupDocs.Parser Cloud. Вы можете загрузить XML-файл и мгновенно скачать текст XML.

Извлечение текста из XML онлайн

Бесплатное онлайн-приложение для извлечения текста из XML на базе GroupDocs.Parser Cloud.


Часто задаваемые вопросы (ЧЗВ)

Q1: Могу ли я извлечь только определенные узлы или теги из XML файла? Да. SDK поддерживает расширенные опции для извлечения конкретных элементов, узлов или текста из XML-файлов с использованием функций структурированного извлечения данных.

Q2: Могу ли я извлекать текст из XML-файлов, хранящихся в Интернете? Абсолютно. Вы можете указывать URL-адреса или использовать файлы из облачного хранилища напрямую.

Q3: Насколько безопасна извлечение текста XML в GroupDocs Cloud? Все API запросы используют шифрование HTTPS, и ваши файлы остаются конфиденциальными в вашей среде облачного хранения.

Q4: Can I get text from large XML files? Да. SDK эффективно обрабатывает большие и сложные XML файлы с помощью облачной обработки.

Q5: Я не хочу загружать свои конфиденциальные файлы никуда? Каковы мои варианты? GroupDocs.Parser Cloud также доступен как образ Docker, который можно использовать для self-host сервиса. Или вы можете создать свои собственные сервисы, используя GroupDocs.Parser High-code APIs.


Заключение

Извлечение текста из XML-документов является важным процессом для приложений, работающих со структурированными данными. С помощью GroupDocs.Parser Cloud SDK для .NET разработчики могут легко извлекать текст из XML-файлов, получать XML-текст программным образом и даже загружать XML-текст для дальнейшей обработки. Этот облачный API упрощает парсинг данных, делая ваши приложения более интеллектуальными и автоматизированными.

Начните свою бесплатную пробную версию сегодня на GroupDocs.Parser Cloud и испытайте легкость извлечения текста из XML-файлов!


Связанные статьи