
XML(eXtensible Markup Language) 是一種流行的數據格式,用於存儲和交換結構化的信息。它廣泛應用於各個領域,包括網頁開發、數據存儲和數據傳輸。從 XML 文件中提取文本對於許多原因來說至關重要。它使我們能夠訪問和操作 XML 文件中包含的實際數據。通過提取文本,我們可以執行各種操作,如數據分析、數據轉換和數據整合。在本文中,我們將探討如何使用 REST API 在 Python 中從 XML 中提取文本。
本文將涵蓋以下主題:
Python REST API to Parse XML Document and SDK Installation
GroupDocs.Parser Cloud SDK for Python 是一個強大的工具,可以簡化從 XML 和其他檔案格式中提取文本的過程。它提供了廣泛的功能,包括文檔解析、文本提取、元數據提取等等。憑藉其直觀的 API,開發人員可以輕鬆地將文本提取功能整合到他們的 Python 應用中。它還支持 C# .NET、Java、PHP、Ruby 和 Node.js SDK 作為其 document parser family members 供雲端 API 使用。該 SDK 可以集成到基於 Python 的應用中,以簡化您的開發流程並提升生產力。
在您的 Python 項目中使用 pip 安裝 GroupDocs.Parser Cloud (package installer for Python),使用以下命令在控制台中提取 XML 中的信息:
pip install groupdocs_parser_cloud
現在,請從 dashboard 獲取您的客戶端 ID 和客戶端密鑰,並按如下所示添加代碼:
# 匯入 groupdocs parser SDK
import groupdocs_parser_cloud
# 從 https://dashboard.groupdocs.cloud 免費註冊後獲取 appsid 和 appkey。
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# 獲取文件 API 配置。
configuration = groupdocs_parser_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"
提取 XML 文件中的所有文本在 Python 中使用 REST API
要使用 Python 的 GroupDocs.Parser Cloud SDK 從 XML 文件中提取文本,請按照以下步驟操作:
上傳文件
首先,使用下面給出的代碼範例將 XML 文檔上傳到雲端:
# 創建文件 API 的實例
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
# 呼叫上傳檔案請求
request = groupdocs_parser_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)
# 將檔案上傳至雲端
response = file_api.upload_file(request)
print(response.uploaded)
因此,上傳的 XML 文件將在雲端的 [files section][https://dashboard.groupdocs.cloud/files] 中可用。
提取 XML 數據中的所有文本使用 Python
在本節中,我們將編寫步驟和一個示例代碼片段,演示如何使用 GroupDocs.Parser Cloud SDK for Python 從 XML 文檔中提取文本:
- 首先,創建 ParseApi 類的實例。
- 其次,創建 TextOptions() 類的實例。
- 第三,創建一個 FileInfo 類的實例。
- And, assign it to the text options fileInfo method.
- 接下來,將 XML 文件的路徑設置為輸入。
- 現在,創建一個 TextRequest() 類的實例並傳遞 TextOptions 參數。
- 最後,透過呼叫 ParseApi.text() 方法並傳遞 TextRequest 參數來獲取結果。
以下代碼範例顯示了如何使用 REST API 以 Python 從 XML 文件中提取文字:
# 如何使用 REST API 在 Python 中提取 XML 中的文本
try:
# api initialization
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# 定義文本選項
options = groupdocs_parser_cloud.TextOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "python-testing/input-sample-file.xml"
request = groupdocs_parser_cloud.TextRequest(options)
result = parseApi.text(request)
print("Successfully extracted text: " + result.text)
except groupdocs_parser_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
您可以在下面的圖像中看到輸出:

Extract all Text from XML data using Python.
免費的在線文檔解析器
如何免費在線提取XML中的文本?請嘗試一個 online XML parser software 來從XML文件中提取數據。這個XML解析工具是使用上述提到的Python解析庫開發的。
結論
總結來說,從 XML 文件中提取文本是處理 XML 數據時的一個基本任務。 Python 與 GroupDocs.Parser Cloud SDK 的結合,提供了一個可靠且高效的解決方案,用於從 XML 文件中提取文本。以下是你從這篇文章中學到的內容:
- 如何使用 REST API 在 Python 中從 XML 文件中提取所有文本。
- Programmatically upload an XML file to the cloud using Python.
- 在線 XML 數據提取軟件,用於解析 XML 文檔。
除此之外,您還可以通過 文檔 了解更多有關 GroupDocs.Parser Cloud API 的信息。我們還提供了一個 API 參考 部分,讓您能夠直接通過瀏覽器可視化和互動我們的 API。Python SDK 的完整源代碼可在 Github 免費獲得。
最後,我們繼續撰寫有關不同檔案格式和使用 REST API 解析的新部落格文章。因此,請與我們聯絡以獲取最新更新。
Ask a question
如果您對 XML 文件解析器有任何疑問或困惑,請隨時通過我們的 forum 聯繫我們。
常見問題解答
為什麼我們需要從 XML 文件中提取文本?
從 XML 文件中提取文本使我們能夠訪問和操作 XML 文檔中包含的實際數據。
How can I extract text from XML files using Python?
您可以使用 GroupDocs.Parser Cloud SDK for Python 從 XML 文件中提取文本,該 SDK 提供強大的文本提取功能。
是否可以使用 GroupDocs.Parser Cloud SDK for Python 從 XML 文件中提取元數據?
是的,GroupDocs.Parser Cloud SDK for Python 支持從 XML 文件中提取元數據。您可以檢索元數據信息,如作者、創建日期、修改日期等。
Can I extract images embedded in XML files using GroupDocs.Parser Cloud SDK for Python?
是的,GroupDocs.Parser Cloud SDK for Python 允許您提取嵌入在 XML 檔案中的圖像並將其轉換為不同的格式。
See Also
這裡有一些相關的文章,您可能會覺得有幫助: