Java DOM 解析器 - 使用 Java 從 XML 文檔中提取文本。

在當今的數字時代,從 XML(可擴展標記語言)文檔中提取數據在各個行業和應用程序中發揮著重要作用。 XML 是一種流行的標記語言,用於以分層格式存儲和組織結構化數據。從XML文檔中提取信息對於企業對數據進行數據分析和信息檢索操作是必不可少的。在本文中,我們將探討如何使用 GroupDocs.Parser Cloud SDK for Java 從 Java 中的 XML 文檔中提取文本。

本文應涵蓋以下主題:

Java REST API 解析 XML 文件和 SDK 安裝

GroupDocs.Parser Cloud SDK for Java 是一種功能強大、用戶友好且全面的解決方案,可輕鬆從各種文檔格式(包括 XML)中提取文本。借助其全面的 API,您可以輕鬆地從 50 多種文檔格式 中提取文本、元數據、圖像和其他信息。 SDK 可以集成到基於 Java 的應用程序中,以簡化您的開發過程並提高生產力。

您可以 下載 API 的 JAR 文件或使用 Maven 安裝它,方法是將以下存儲庫和依賴項添加到項目的 pom.xml 文件中:

Maven 存儲庫:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven 依賴項:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

現在,您需要在 GroupDocs 網站上註冊 免費試用帳戶或購買訂閱計劃獲取您的 API 密鑰。獲得客戶端 ID 和客戶端密碼後,將以下代碼片段添加到基於 Java 的應用程序中:

# 註冊後從 https://dashboard.groupdocs.cloud 獲取你的 client_id 和 client_secret。

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

如何使用 REST API 從 Java 中的 XML 文件中提取所有文本

要使用 GroupDocs.Parser Cloud SDK for Java 從 Java 中的 XML 文檔中提取文本,請執行以下步驟:

  • 上傳 XML文件到雲端
  • Extract 使用 Java 從 XML 中提取文本

上傳文件

首先,使用下面給出的代碼示例將 XML 文檔上傳到雲端:

package com.groupdocsdev.classes;

import java.io.File;

import com.groupdocs.cloud.parser.api.FileApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.UploadFileRequest;

// 使用Java上傳文件到雲存儲
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.xml");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.xml", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

因此,上傳的 XML 文件將在雲上儀表板的 文件部分 中可用。

使用 Java 解析 XML 文件

以下是演示如何使用 GroupDocs.Parser Cloud SDK for Java 從 Java XML 文檔中提取文本的步驟和示例代碼片段:

  • 首先,將所需的類導入到您的 Java 文件中。
  • 其次,創建 ParseApi 類的一個實例。
  • 第三,創建 FileInfo 類的一個實例。
  • 接下來,將 XML 文件的路徑設置為輸入。
  • 然後,創建 TextOptions() 類的一個實例。
  • 接下來,將 fileInfo 分配給 setFileInfo 方法。
  • 現在,創建 TextRequest() 類的實例並傳遞 TextOptions 參數。
  • 最後,通過調用 ParseApi.text() 方法並傳遞 TextRequest 參數來獲取結果。

以下代碼示例顯示瞭如何使用 REST API 在 Java 中提取文本和解析 XML 文檔:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.TextRequest;

// 如何從 Java 中的 XML 文件中提取文本。
public class App {

	public static void main(String[] args) {
		
		// 創建 Parse API 的實例
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// 準備設置
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.xml");
			TextOptions options = new TextOptions();
			options.setFileInfo(fileInfo);

			TextRequest request = new TextRequest(options);
			TextResult response = apiInstance.text(request);

			// 獲取輸出文件路徑
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

您可以在下圖中看到輸出:

Java 從 XML 文檔中提取文本

在 Java 中從 XML 文檔中提取文本

免費在線 XML 解析器

免費在線從 XML 中提取文本的最佳方法是什麼?請嘗試使用在線 XML 解析器軟件 來抓取 XML 文件。此 XML 解析器工具是使用上述 Java 解析器庫開發的。

結論

總之,開發人員可以使用 GroupDocs.Parser Cloud SDK for Java 簡化數據提取過程並有效地訪問 XML 文檔中的數據。以下是您從本文中學到的內容:

  • 如何使用 REST API 從 Java 中的 XML 文檔中提取所有文本;
  • 使用 Java 以編程方式將 XML 文件上傳到雲;
  • 和在線 XML 提取工具來解析 XML 文檔。

此外,您可以使用 文檔 了解有關 GroupDocs.Parser Cloud API 的更多信息。我們還提供了一個 API 參考 部分,讓您可以直接通過瀏覽器可視化我們的 API 並與之交互。 Java SDK 的完整源代碼可在 Github 上免費獲得。

最後,我們繼續撰寫關於不同文件格式的新博客文章,並使用 REST API 進行解析。因此,請聯繫以獲取最新更新。

問一個問題

如果您對 XML 數據解析器有任何疑問或困惑,請隨時通過我們的 論壇 與我們聯繫。

常見問題

如何使用 Java 從 XML 文件中提取所有文本?

您首先初始化 ParserApi 類並使用 GroupDocs.Parser Cloud SDK for Java 設置我們的 API 憑據。然後,創建一個 ExtractOptions 對象並使用 FileInfo 指定 XML 文檔文件。最後,調用 extract 方法,傳入選項,並使用 getText 方法檢索提取的文本。

如何使用 Java 解析 XML 文檔?

您可以在 Java 應用程序中使用 GroupDocs.Parser Cloud SDK for Java 解析 XML 文件。這個功能強大的 SDK 提供了一種從 Java 中的 XML 文件中提取數據的高效而直接的方法。

也可以看看

以下是一些您可能會覺得有用的相關文章: