XML(可扩展标记语言)广泛用于在系统之间存储和传输结构化数据。在许多业务应用中,提取 XML 文件中的文本以访问或处理实际内容是必要的。在本文中,我们将探讨如何使用 .NET Cloud SDK 从 XML 中获取文本,该 SDK 提供了一种基于 REST 的简单解决方案,以编程方式提取和下载 XML 文本。
为什么要在 .NET 中从 XML 中提取文本?
从 XML 文件中提取文本使开发人员能够读取、处理和分析存储在 XML 文档中的结构化信息。使用 .NET REST API,您可以轻松地从 XML 文件中提取文本,分析内容或将 XML 数据提取集成到其他自动化系统中。
常见用例包括:
- 解析 XML 配置文件或日志。
- 从基于XML的文档中提取文本(RSS、发票、报告)。
- 将 XML 内容迁移到其他数据格式或数据库。
XML 处理API
GroupDocs.Parser Cloud SDK for .NET 是一个强大的文档解析 API,允许您从各种文件类型中提取文本、元数据和结构化内容,包括 XML。您可以轻松地将其集成到任何 .NET 或 ASP.NET 应用程序中。
通过 NuGet 包管理器安装它:
Install-Package GroupDocs.Parser-Cloud
然后,从 GroupDocs Cloud Dashboard 获取您的客户 ID 和客户密钥,以验证 API 调用。
从 XML 中提取文本的 C# 代码
这里是您如何使用 C# .NET 代码片段从 XML 文件中提取文本的方法。
步骤 1:初始化 API
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-XXXXXX", "XXXXXXXXXXXX");
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";
var parseApi = new ParseApi(configuration);
步骤 2:将 XML 文件上传到云端
using (var fileStream = System.IO.File.OpenRead("input.xml"))
{
// upload the input XML to the cloud storage
var uploadRequest = new Requests.UploadFileRequest("input.xml", fileStream);
fileApi.UploadFile(uploadRequest);
}
步骤 3:从 XML 中提取所有文本
var request = new TextRequest(options);
// extract text from XML
var response = parseApi.Text(request);
// 要查看更多示例,请访问 [https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet](https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet)
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-XXXXXX", "XXXXXXXXXXXX");
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";
// create instance of ParseA[pi
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);
// 加载输入 XML 文件
using (var fileStream = System.IO.File.OpenRead("input.xml"))
{
// 将输入的 XML 上传到云存储
var uploadRequest = new Requests.UploadFileRequest("input.xml", fileStream);
fileApi.UploadFile(uploadRequest);
}
var options = new TextOptions
{
FileInfo = new FileInfo { FilePath = "input.xml" }
};
var request = new TextRequest(options);
// extract text from XML
var response = parseApi.Text(request);
Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);
这将从 XML 中获取文本,并将提取的内容直接打印到控制台。您还可以根据需要下载 XML 文本或将其保存到本地。

使用 .NET REST API 从 XML 文件提取文本的预览。
从 XML 中获取文本的 cURL 命令
您还可以使用 GroupDocs.Parser Cloud 和 cURL 命令执行相同的任务,从 XML 文件中提取文本:
步骤 1: - 获取 JWT 令牌: 第一步是根据客户端凭证获取JWT访问令牌。
curl -v -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
步骤 2: - 从 XML 文件中提取文本:
curl -v -X POST "https://api.groupdocs.cloud/v2.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"sample.xml\" } }"
该命令发送请求以从您的 XML 文档中提取所有文本(该 XML 已在 Cloud Storage 中可用)。
免费在线 XML 文本提取器
想尝试在不编写代码的情况下进行吗?使用由 GroupDocs.Parser Cloud 提供支持的免费 Online XML Text Extractor。您可以上传一个 XML 文件并立即下载 XML 文本。

由 GroupDocs.Parser Cloud 提供支持的免费在线 XML 文本提取应用程序。
常见问题解答 (FAQs)
Q1: 我可以从XML文件中提取特定的节点或标签吗? 是的。SDK 支持高级选项,以使用结构化数据提取功能从 XML 文件中提取特定元素、节点或文本。
Q2: 我可以从在线存储的 XML 文件中提取文本吗? 绝对可以。您可以直接指定 URL 或使用云存储中的文件。
Q3: GroupDocs Cloud 中的 XML 文本提取有多安全? 所有 API 请求都使用 HTTPS 加密,您的文件在云存储环境中保持私密。
Q4: 我可以从大型 XML 文件中获取文本吗? 是的。该 SDK 高效地处理大型和复杂的 XML 文件,使用基于云的处理。
Q5: 我不想把我的机密文件上传到任何地方,我有哪些选项? GroupDocs.Parser Cloud 也可以作为 Docker 镜像使用,可以用来 self-host 服务。或者您可以使用 GroupDocs.Parser High-code APIs 构建自己的服务。
结论
从 XML 文档中提取文本是处理结构化数据的应用程序的一项重要过程。借助 GroupDocs.Parser Cloud SDK for .NET,开发人员可以轻松地从 XML 文件中提取文本,以编程方式获取 XML 文本,甚至下载 XML 文本以进行进一步处理。这个基于云的 API 简化了数据解析,使您的应用程序更加智能和自动化。
今天在 GroupDocs.Parser Cloud 开始您的免费试用,体验从 XML 文件中轻松提取文本的乐趣!
