XML(Extensible Markup Language) は、システム間で構造化データを保存および転送するために広く使用されています。多くのビジネスアプリケーションでは、実際のコンテンツにアクセスまたは処理するために、XMLファイルからテキストを抽出する必要があります。この記事では、XMLテキストをプログラムで抽出してダウンロードするシンプルなRESTベースのソリューションを提供する .NET Cloud SDK を使用して、XMLからテキストを取得する方法を探ります。
- XMLからテキストを抽出する理由は何ですか?
- XML 処理 API
- [XMLからテキストを抽出するには、C#で以下のようにクラスを使用することができます。
using System;
using System.Xml;
class Program
{
static void Main()
{
XmlDocument xmlDoc = new XmlDocument();
xmlDoc.Load("sample.xml");
XmlNodeList nodeList = xmlDoc.GetElementsByTagName("YourTagName");
foreach (XmlNode node in nodeList)
{
Console.WriteLine(node.InnerText);
}
}
}
このコードでは、sample.xmlというXMLファイルから特定のタグを持つノードを取得し、そのテキストをコンソールに出力します。YourTagNameを必要に応じて置き換えてください。](#extract-text-csharp)
XMLからテキストを抽出する理由は何ですか?
XMLファイルからテキストを抽出することで、開発者はXMLドキュメントに格納された構造化情報を読み取り、処理し、分析することができます。 .NET REST APIを使用すると、XMLファイルからテキストを簡単に抽出し、内容を分析したり、他の自動化システムにXMLデータ抽出を統合したりすることができます。
一般的な使用例には次のようなものがあります:
- XML構成ファイルやログの解析。
- XMLベースのドキュメント(RSS、請求書、レポート)からテキストを抽出する。
- XMLコンテンツを他のデータフォーマットやデータベースに移行すること。
XML 処理 API
GroupDocs.Parser Cloud SDK for .NET は、XMLを含むさまざまなファイルタイプからテキスト、メタデータ、および構造化されたコンテンツを抽出する強力なドキュメント解析APIです。これを任意の .NET または ASP.NET アプリケーションに簡単に統合できます。
NuGet パッケージマネージャーを通じてインストールします:
Install-Package GroupDocs.Parser-Cloud
その後、API呼び出しを認証するために、GroupDocs Cloud DashboardからクライアントIDとクライアントシークレットを取得してください。
XMLからテキストを抽出する C#
XMLファイルからテキストを抽出する方法は以下の通りです。C# .NETのコードスニペットを使用します。
ステップ 1: APIを初期化する
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-XXXXXX", "XXXXXXXXXXXX");
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";
var parseApi = new ParseApi(configuration);
ステップ 2: XML ファイルをクラウドにアップロードする
using (var fileStream = System.IO.File.OpenRead("input.xml"))
{
// upload the input XML to the cloud storage
var uploadRequest = new Requests.UploadFileRequest("input.xml", fileStream);
fileApi.UploadFile(uploadRequest);
}
ステップ 3: XML からすべてのテキストを抽出する
var request = new TextRequest(options);
// extract text from XML
var response = parseApi.Text(request);
// さらなる例については、 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet を訪問してください。
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-XXXXXX", "XXXXXXXXXXXX");
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";
// create instance of ParseA[pi
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);
// 入力XMLファイルをロードする
using (var fileStream = System.IO.File.OpenRead("input.xml"))
{
// クラウドストレージに入力XMLをアップロードしてください。
var uploadRequest = new Requests.UploadFileRequest("input.xml", fileStream);
fileApi.UploadFile(uploadRequest);
}
var options = new TextOptions
{
FileInfo = new FileInfo { FilePath = "input.xml" }
};
var request = new TextRequest(options);
// extract text from XML
var response = parseApi.Text(request);
Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);
この内容はXMLからテキストを取得し、抽出されたコンテンツをコンソールに直接出力します。また、必要に応じてXMLテキストをダウンロードしたり、ローカルに保存したりすることもできます。

XMLファイルからのテキスト抽出の.NET REST APIを使用したプレビュー。
XMLからcURLコマンドを使用してテキストを取得する
XMLファイルからテキストを抽出するために、GroupDocs.Parser CloudとcURLコマンドを使用して同じタスクを実行することもできます:
ステップ 1: - JWT トークンを取得する: 最初のステップは、クライアント認証情報に基づいてJWTアクセストークンを取得することです。
curl -v -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
ステップ 2: - XML ファイルからテキストを抽出する:
curl -v -X POST "https://api.groupdocs.cloud/v2.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"sample.xml\" } }"
このコマンドは、XML ドキュメントからすべてのテキストを抽出するリクエストを送信します(XML はすでに Cloud Storage にあります)。
無料オンラインXMLテキスト抽出ツール
コードを書かずに試してみたいですか?無料の Online XML Text Extractor を使用してください。これは GroupDocs.Parser Cloud によって提供されています。XML ファイルをアップロードすると、瞬時に XML テキストをダウンロードできます。

GroupDocs.Parser Cloudによって提供される無料のオンラインXMLテキスト抽出アプリ。
よくある質問 (FAQs)
Q1: XMLファイルから特定のノードやタグのみを抽出できますか? はい。SDKは、構造化データ抽出機能を使用して、XMLファイルから特定の要素、ノード、またはテキストを抽出するための高度なオプションをサポートしています。
Q2: オンラインに保存されたXMLファイルからテキストを抽出できますか? 絶対に。あなたはURLを指定するか、クラウドストレージからファイルを直接使用することができます。
Q3: GroupDocs Cloud における XML テキスト抽出のセキュリティはどのくらいですか? すべてのAPIリクエストはHTTPS暗号化を使用し、あなたのファイルはクラウドストレージ環境内でプライベートに保たれます。
Q4: 大きなXMLファイルからテキストを取得できますか? はい。SDKは、クラウドベースの処理を使用して、大規模で複雑なXMLファイルを効率的に処理します。
Q5: 私は機密ファイルをどこにもアップロードしたくありません。私の選択肢は何ですか? GroupDocs.Parser Cloudは、サービスを self-host するために使用できるDockerイメージとしても利用可能です。または、 GroupDocs.Parser High-code APIs を使用して独自のサービスを構築することもできます。
結論
XMLドキュメントからテキストを抽出することは、構造化データを扱うアプリケーションにとって重要なプロセスです。GroupDocs.Parser Cloud SDK for .NETを使用すると、開発者はXMLファイルから簡単にテキストを抽出し、プログラム的にXMLテキストを取得し、さらに処理のためにXMLテキストをダウンロードすることができます。このクラウドベースのAPIはデータ解析を簡素化し、アプリケーションをよりインテリジェントで自動化されたものにします。
今日は GroupDocs.Parser Cloud で無料トライアルを開始し、XMLファイルからの簡単なテキスト抽出を体験してください!
