XML(可扩展标记语言)广泛用于在系统之间存储和传输结构化数据。在许多业务应用中,提取 XML 文件中的文本以访问或处理实际内容是必要的。在本文中,我们将探讨如何使用 .NET Cloud SDK 从 XML 中获取文本,该 SDK 提供了一种基于 REST 的简单解决方案,以编程方式提取和下载 XML 文本。


为什么要在 .NET 中从 XML 中提取文本?

从 XML 文件中提取文本使开发人员能够读取、处理和分析存储在 XML 文档中的结构化信息。使用 .NET REST API,您可以轻松地从 XML 文件中提取文本,分析内容或将 XML 数据提取集成到其他自动化系统中。

常见用例包括:

  • 解析 XML 配置文件或日志。
  • 从基于XML的文档中提取文本(RSS、发票、报告)。
  • 将 XML 内容迁移到其他数据格式或数据库。

XML 处理API

GroupDocs.Parser Cloud SDK for .NET 是一个强大的文档解析 API,允许您从各种文件类型中提取文本、元数据和结构化内容,包括 XML。您可以轻松地将其集成到任何 .NET 或 ASP.NET 应用程序中。

通过 NuGet 包管理器安装它:

Install-Package GroupDocs.Parser-Cloud

然后,从 GroupDocs Cloud Dashboard 获取您的客户 ID 和客户密钥,以验证 API 调用。


从 XML 中提取文本的 C# 代码

这里是您如何使用 C# .NET 代码片段从 XML 文件中提取文本的方法。

步骤 1:初始化 API

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-XXXXXX", "XXXXXXXXXXXX");
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

var parseApi = new ParseApi(configuration);

步骤 2:将 XML 文件上传到云端

using (var fileStream = System.IO.File.OpenRead("input.xml"))
{
    // upload the input XML to the cloud storage
    var uploadRequest = new Requests.UploadFileRequest("input.xml", fileStream);
    fileApi.UploadFile(uploadRequest);
}

步骤 3:从 XML 中提取所有文本

var request = new TextRequest(options);
// extract text from XML
var response = parseApi.Text(request);
// 要查看更多示例,请访问 [https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet](https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet)

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-XXXXXX", "XXXXXXXXXXXX");
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

// create instance of ParseA[pi
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// 加载输入 XML 文件
using (var fileStream = System.IO.File.OpenRead("input.xml"))
{
    // 将输入的 XML 上传到云存储
    var uploadRequest = new Requests.UploadFileRequest("input.xml", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "input.xml" }
};

var request = new TextRequest(options);
// extract text from XML
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

这将从 XML 中获取文本,并将提取的内容直接打印到控制台。您还可以根据需要下载 XML 文本或将其保存到本地。

在 C# 中获取 XML 文本

使用 .NET REST API 从 XML 文件提取文本的预览。


从 XML 中获取文本的 cURL 命令

您还可以使用 GroupDocs.Parser Cloud 和 cURL 命令执行相同的任务,从 XML 文件中提取文本:

步骤 1: - 获取 JWT 令牌: 第一步是根据客户端凭证获取JWT访问令牌。

curl -v -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

步骤 2: - 从 XML 文件中提取文本:

curl -v -X POST "https://api.groupdocs.cloud/v2.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"sample.xml\" } }"

该命令发送请求以从您的 XML 文档中提取所有文本(该 XML 已在 Cloud Storage 中可用)。


免费在线 XML 文本提取器

想尝试在不编写代码的情况下进行吗?使用由 GroupDocs.Parser Cloud 提供支持的免费 Online XML Text Extractor。您可以上传一个 XML 文件并立即下载 XML 文本。

从 XML 在线提取文本

由 GroupDocs.Parser Cloud 提供支持的免费在线 XML 文本提取应用程序。


常见问题解答 (FAQs)

Q1: 我可以从XML文件中提取特定的节点或标签吗? 是的。SDK 支持高级选项,以使用结构化数据提取功能从 XML 文件中提取特定元素、节点或文本。

Q2: 我可以从在线存储的 XML 文件中提取文本吗? 绝对可以。您可以直接指定 URL 或使用云存储中的文件。

Q3: GroupDocs Cloud 中的 XML 文本提取有多安全? 所有 API 请求都使用 HTTPS 加密,您的文件在云存储环境中保持私密。

Q4: 我可以从大型 XML 文件中获取文本吗? 是的。该 SDK 高效地处理大型和复杂的 XML 文件,使用基于云的处理。

Q5: 我不想把我的机密文件上传到任何地方,我有哪些选项? GroupDocs.Parser Cloud 也可以作为 Docker 镜像使用,可以用来 self-host 服务。或者您可以使用 GroupDocs.Parser High-code APIs 构建自己的服务。


结论

从 XML 文档中提取文本是处理结构化数据的应用程序的一项重要过程。借助 GroupDocs.Parser Cloud SDK for .NET,开发人员可以轻松地从 XML 文件中提取文本,以编程方式获取 XML 文本,甚至下载 XML 文本以进行进一步处理。这个基于云的 API 简化了数据解析,使您的应用程序更加智能和自动化。

今天在 GroupDocs.Parser Cloud 开始您的免费试用,体验从 XML 文件中轻松提取文本的乐趣!


相关的文章