從 XML 中提取文本,在 Python 中使用 REST API。

XML(eXtensible Markup Language) 是一種流行的數據格式,用於存儲和交換結構化的信息。它廣泛應用於各個領域,包括網頁開發、數據存儲和數據傳輸。從 XML 文件中提取文本對於許多原因來說至關重要。它使我們能夠訪問和操作 XML 文件中包含的實際數據。通過提取文本,我們可以執行各種操作,如數據分析、數據轉換和數據整合。在本文中,我們將探討如何使用 REST API 在 Python 中從 XML 中提取文本。

本文將涵蓋以下主題:

Python REST API to Parse XML Document and SDK Installation

GroupDocs.Parser Cloud SDK for Python 是一個強大的工具,可以簡化從 XML 和其他檔案格式中提取文本的過程。它提供了廣泛的功能,包括文檔解析、文本提取、元數據提取等等。憑藉其直觀的 API,開發人員可以輕鬆地將文本提取功能整合到他們的 Python 應用中。它還支持 C# .NET、Java、PHP、Ruby 和 Node.js SDK 作為其 document parser family members 供雲端 API 使用。該 SDK 可以集成到基於 Python 的應用中,以簡化您的開發流程並提升生產力。

在您的 Python 項目中使用 pip 安裝 GroupDocs.Parser Cloud (package installer for Python),使用以下命令在控制台中提取 XML 中的信息:

pip install groupdocs_parser_cloud

現在,請從 dashboard 獲取您的客戶端 ID 和客戶端密鑰,並按如下所示添加代碼:

# 匯入 groupdocs parser SDK
import groupdocs_parser_cloud

# 從 https://dashboard.groupdocs.cloud 免費註冊後獲取 appsid 和 appkey。
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# 獲取文件 API 配置。
configuration = groupdocs_parser_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

提取 XML 文件中的所有文本在 Python 中使用 REST API

要使用 Python 的 GroupDocs.Parser Cloud SDK 從 XML 文件中提取文本,請按照以下步驟操作:

  • Upload 將 XML 檔案上傳到雲端
  • Extract 從 XML 以 Python 提取所有文本

上傳文件

首先,使用下面給出的代碼範例將 XML 文檔上傳到雲端:

# 創建文件 API 的實例
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)

# 呼叫上傳檔案請求
request = groupdocs_parser_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# 將檔案上傳至雲端
response = file_api.upload_file(request)
print(response.uploaded)

因此,上傳的 XML 文件將在雲端的 [files section][https://dashboard.groupdocs.cloud/files] 中可用。

提取 XML 數據中的所有文本使用 Python

在本節中,我們將編寫步驟和一個示例代碼片段,演示如何使用 GroupDocs.Parser Cloud SDK for Python 從 XML 文檔中提取文本:

  • 首先,創建 ParseApi 類的實例。
  • 其次,創建 TextOptions() 類的實例。
  • 第三,創建一個 FileInfo 類的實例。
  • And, assign it to the text options fileInfo method.
  • 接下來,將 XML 文件的路徑設置為輸入。
  • 現在,創建一個 TextRequest() 類的實例並傳遞 TextOptions 參數。
  • 最後,透過呼叫 ParseApi.text() 方法並傳遞 TextRequest 參數來獲取結果。

以下代碼範例顯示了如何使用 REST API 以 Python 從 XML 文件中提取文字:

# 如何使用 REST API 在 Python 中提取 XML 中的文本
try:
  # api initialization
  parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)

  # 定義文本選項
  options = groupdocs_parser_cloud.TextOptions()
  options.file_info = groupdocs_parser_cloud.FileInfo()
  options.file_info.file_path = "python-testing/input-sample-file.xml"

  request = groupdocs_parser_cloud.TextRequest(options)
  result = parseApi.text(request)

  print("Successfully extracted text: " + result.text)
except groupdocs_parser_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

您可以在下面的圖像中看到輸出:

Python 從 XML 文件中提取文本

Extract all Text from XML data using Python.

免費的在線文檔解析器

如何免費在線提取XML中的文本?請嘗試一個 online XML parser software 來從XML文件中提取數據。這個XML解析工具是使用上述提到的Python解析庫開發的。

結論

總結來說,從 XML 文件中提取文本是處理 XML 數據時的一個基本任務。 Python 與 GroupDocs.Parser Cloud SDK 的結合,提供了一個可靠且高效的解決方案,用於從 XML 文件中提取文本。以下是你從這篇文章中學到的內容:

  • 如何使用 REST API 在 Python 中從 XML 文件中提取所有文本。
  • Programmatically upload an XML file to the cloud using Python.
  • 在線 XML 數據提取軟件,用於解析 XML 文檔。

除此之外,您還可以通過 文檔 了解更多有關 GroupDocs.Parser Cloud API 的信息。我們還提供了一個 API 參考 部分,讓您能夠直接通過瀏覽器可視化和互動我們的 API。Python SDK 的完整源代碼可在 Github 免費獲得。

最後,我們繼續撰寫有關不同檔案格式和使用 REST API 解析的新部落格文章。因此,請與我們聯絡以獲取最新更新。

Ask a question

如果您對 XML 文件解析器有任何疑問或困惑,請隨時通過我們的 forum 聯繫我們。

常見問題解答

為什麼我們需要從 XML 文件中提取文本?

從 XML 文件中提取文本使我們能夠訪問和操作 XML 文檔中包含的實際數據。

How can I extract text from XML files using Python?

您可以使用 GroupDocs.Parser Cloud SDK for Python 從 XML 文件中提取文本,該 SDK 提供強大的文本提取功能。

是否可以使用 GroupDocs.Parser Cloud SDK for Python 從 XML 文件中提取元數據?

是的,GroupDocs.Parser Cloud SDK for Python 支持從 XML 文件中提取元數據。您可以檢索元數據信息,如作者、創建日期、修改日期等。

Can I extract images embedded in XML files using GroupDocs.Parser Cloud SDK for Python?

是的,GroupDocs.Parser Cloud SDK for Python 允許您提取嵌入在 XML 檔案中的圖像並將其轉換為不同的格式。

See Also

這裡有一些相關的文章,您可能會覺得有幫助: