XML(Extensible Markup Language) широко використовується для зберігання та передачі структурованих даних між системами. У багатьох бізнес-додатках виникає необхідність вилучати текст з XML-файлів для доступу або обробки фактичного вмісту. У цій статті ми розглянемо, як отримати текст з XML, використовуючи .NET Cloud SDK, який надає просте рішення на основі REST для програмного вилучення та завантаження XML-тексту.


Why Extract Text from XML in .NET?

Витягування тексту з XML файлів дозволяє розробникам читати, обробляти та аналізувати структуровану інформацію, збережену в XML-документах. З .NET REST API ви можете легко витягувати текст з XML файлів, аналізувати вміст або інтегрувати витягування XML даних в інші автоматизовані системи.

Загальні випадки використання включають:

  • Парсинг XML конфігураційних файлів або журналів.
  • Витягування тексту з документів на основі XML (RSS, рахунки, звіти).
  • Міграція XML-контенту в інші формати даних або бази даних.

XML Processing API

GroupDocs.Parser Cloud SDK for .NET є потужним API для аналізу документів, який дозволяє вам видобувати текст, метадані та структурований контент з різних типів файлів, включаючи XML. Ви можете легко інтегрувати його в будь-який додаток .NET або ASP.NET.

Встановіть його через менеджер пакетів NuGet:

Install-Package GroupDocs.Parser-Cloud

Тоді отримайте свій Client ID та Client Secret з GroupDocs Cloud Dashboard, щоб автентифікувати виклики API.


Витягти текст з XML в C#

Ось як ви можете витягти текст з XML файлу, використовуючи фрагмент коду C# .NET.

Крок 1: Ініціалізувати API

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-XXXXXX", "XXXXXXXXXXXX");
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

var parseApi = new ParseApi(configuration);

Крок 2: Завантажте XML файл у хмару

using (var fileStream = System.IO.File.OpenRead("input.xml"))
{
    // upload the input XML to the cloud storage
    var uploadRequest = new Requests.UploadFileRequest("input.xml", fileStream);
    fileApi.UploadFile(uploadRequest);
}

Крок 3: Витягти весь текст з XML

var request = new TextRequest(options);
// extract text from XML
var response = parseApi.Text(request);
// Для подальших прикладів, будь ласка, відвідайте https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-XXXXXX", "XXXXXXXXXXXX");
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

// create instance of ParseA[pi
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// Завантажити вхідний XML файл
using (var fileStream = System.IO.File.OpenRead("input.xml"))
{
    // upload the input XML to the cloud storage
    var uploadRequest = new Requests.UploadFileRequest("input.xml", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "input.xml" }
};

var request = new TextRequest(options);
// extract text from XML
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

Це отримуватиме текст з XML і виводитиме витягнутий контент безпосередньо в консоль. Ви також можете завантажити XML-текст або зберегти його локально за потреби.

Отримати XML текст в C#

Попередній перегляд витягування тексту з файлу XML за допомогою .NET REST API.


Get Text from XML using cURL Commands

Ви також можете виконати таке ж завдання, щоб витягти текст з XML файлу, використовуючи GroupDocs.Parser Cloud та команду cURL:

Крок 1: - Отримати JWT токен: Першим кроком є отримання JWT токена доступу на основі облікових даних клієнта.

curl -v -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Крок 2: - Витягти текст з XML файлу:

curl -v -X POST "https://api.groupdocs.cloud/v2.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"sample.xml\" } }"

Ця команда надсилає запит для витягування всього тексту з вашого XML-документа (XML вже доступний у Cloud Storage).


Безкоштовний онлайн екстрактор тексту XML

Хочете спробувати це без написання коду? Використовуйте безкоштовний Online XML Text Extractor, розроблений компанією GroupDocs.Parser Cloud. Ви можете завантажити XML-файл і миттєво завантажити текст XML.

Витягти текст з XML онлайн

Безкоштовний онлайн додаток для вилучення тексту з XML, працюючий на основі GroupDocs.Parser Cloud.


Часто задавані питання (FAQs)

Q1: Чи можу я вилучити лише конкретні вузли або теги з XML-файлу? Так. SDK підтримує розширені параметри для витягування конкретних елементів, вузлів або тексту з XML-файлів з використанням функцій структурованого витягування даних.

Q2: Can I extract text from XML files stored online? Абсолютно. Ви можете вказати URL-адреси або використовувати файли з хмарного зберігання безпосередньо.

Q3: Наскільки безпечне вилучення тексту з XML у GroupDocs Cloud? Усі запити API використовують шифрування HTTPS, і ваші файли залишаються приватними у вашому середовищі хмарного зберігання.

Q4: Can I get text from large XML files? Так. SDK ефективно обробляє великі та складні XML файли з використанням обробки на базі хмари.

Q5: Я не хочу завантажувати свої конфіденційні файли будь-куди? Які в мене варіанти? GroupDocs.Parser Cloud також доступний як образ Docker, який можна використовувати для self-host цього сервісу. Або ви можете створити свої власні сервіси за допомогою GroupDocs.Parser High-code APIs.


Висновок

Витягування тексту з XML-документів є важливим процесом для додатків, що працюють зі структурованими даними. За допомогою GroupDocs.Parser Cloud SDK для .NET розробники можуть легко витягувати текст з XML-файлів, отримувати текст XML програмно, а також завантажувати текст XML для подальшої обробки. Цей хмарний API спрощує обробку даних, роблячи ваші додатки більш інтелектуальними та автоматизованими.

Почніть свій безкоштовний пробний період сьогодні на GroupDocs.Parser Cloud та насолоджуйтеся простим витягуванням тексту з XML файлів!


Схожі статті