Extract Text from XML in Python using REST API.

XML(eXtensible Markup Language) ist ein beliebtes Datenformat zum Speichern und Austauschen strukturierter Informationen. Es wird in verschiedenen Bereichen häufig verwendet, darunter Webentwicklung, Datenspeicherung und Datenübertragung. Das Extrahieren von Text aus XML Dateien ist aus vielen Gründen entscheidend. Es ermöglicht uns, auf die tatsächlichen Daten in XML Dokumenten zuzugreifen und sie zu bearbeiten. Durch das Extrahieren von Text können wir verschiedene Operationen durchführen, wie Datenanalyse, Datenumwandlung und Datenintegration. In diesem Artikel werden wir untersuchen, wie man Text aus XML in Python mithilfe von REST API extrahiert.

Die folgenden Themen sollen in diesem Artikel behandelt werden:

Python REST API zum Parsen von XML Dokumenten und SDK-Installation

GroupDocs.Parser Cloud SDK für Python ist ein leistungsstarkes Werkzeug, das die Extraktion von Text aus XML und anderen Dateiformaten vereinfacht. Es bietet eine Vielzahl von Funktionen, darunter Dokumentenparsing, Textextraktion, Metadatenextraktion und vieles mehr. Mit seiner intuitiven API können Entwickler die Textextraktionsfähigkeiten leicht in ihre Python-Anwendungen integrieren. Es unterstützt auch C# .NET, Java, PHP, Ruby und Node.js SDKs als seine Dokumentenparser-Familienmitglieder für die Cloud-API. Das SDK kann in eine auf Python basierende Anwendung integriert werden, um Ihren Entwicklungsprozess zu vereinfachen und die Produktivität zu steigern.

Install GroupDocs.Parser Cloud in Ihr Python-Projekt mit pip (package installer for Python) unter Verwendung des folgenden Befehls in der Konsole, um Informationen aus XML zu extrahieren:

pip install groupdocs_parser_cloud

Jetzt holen Sie sich bitte Ihre Client-ID und Ihren Client-Secret von dem dashboard und fügen Sie den Code wie unten gezeigt hinzu:

# Importieren Sie das GroupDocs-Parser-SDK
import groupdocs_parser_cloud

# Holen Sie sich appsid und appkey von https://dashboard.groupdocs.cloud nach der kostenlosen Registrierung.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Get File API-Konfigurationen.
configuration = groupdocs_parser_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Extract All Text from XML File in Python using REST API

Um Text aus XML Dokumenten in Python mit dem GroupDocs.Parser Cloud SDK für Python zu extrahieren, folgen Sie diesen Schritten:

Laden Sie die Datei hoch

Zuerst laden Sie das XML Dokument mit dem unten angegebenen Codebeispiel in die Cloud hoch:

# Erstellen Sie eine Instanz der Datei-API
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)

# Call upload file request
request = groupdocs_parser_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# Lade die Datei in die Cloud hoch
response = file_api.upload_file(request)
print(response.uploaded)

Als Ergebnis wird die hochgeladene XML-Datei im [files section][https://dashboard.groupdocs.cloud/files] Ihres Dashboards in der Cloud verfügbar sein.

Extract all Text from XML data using Python

In diesem Abschnitt werden wir die Schritte und einen Beispielcode-Abschnitt schreiben, der zeigt, wie man Text aus einem XML Dokument in Python unter Verwendung des GroupDocs.Parser Cloud SDK für Python extrahiert:

  • Zuerst erstellen Sie eine Instanz der ParseApi Klasse.
  • Zweitens, erstellen Sie eine Instanz der TextOptions() Klasse.
  • Drittens, erstellen Sie eine Instanz der FileInfo Klasse.
  • Und weisen Sie es der Textoptionen-Dateiinfo-Methode zu.
  • Als Nächstes legen Sie den Pfad zur XML-Datei als Eingabe fest.
  • Jetzt erstellen Sie eine Instanz der TextRequest() Klasse und übergeben Sie den TextOptions Parameter.
  • Schließlich erhalten Sie Ergebnisse, indem Sie die ParseApi.text() Methode aufrufen und den TextRequest-Parameter übergeben.

Der folgende Codeausschnitt zeigt, wie man Text aus einem XML Dokument in Python mithilfe der REST-API extrahiert:

# How to Extract Text from XML in Python using REST API
try:
  # api Initialisierung
  parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)

  # define text options
  options = groupdocs_parser_cloud.TextOptions()
  options.file_info = groupdocs_parser_cloud.FileInfo()
  options.file_info.file_path = "python-testing/input-sample-file.xml"

  request = groupdocs_parser_cloud.TextRequest(options)
  result = parseApi.text(request)

  print("Successfully extracted text: " + result.text)
except groupdocs_parser_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Sie können die Ausgabe im Bild unten sehen:

Python Text aus XML-Datei extrahieren

Extract all Text from XML data using Python.

Kostenloser Online Dokumentenparser

Wie man kostenlos online Text aus XML extrahiert? Bitte versuchen Sie eine online XML Parser Software, um Daten aus XML Dateien zu extrahieren. Dieses XML Parser-Tool wurde mit der oben genannten Python Parser-Bibliothek entwickelt.

Schlussfolgerung

Zusammenfassend lässt sich sagen, dass das Extrahieren von Text aus XML Dateien eine grundlegende Aufgabe beim Arbeiten mit XML-Daten ist. Python, in Verbindung mit dem GroupDocs.Parser Cloud SDK, bietet eine zuverlässige und effiziente Lösung zum Extrahieren von Text aus XML Dateien. Folgendes haben Sie aus diesem Artikel gelernt:

  • How to extract all text from XML documents in Python using REST API.
  • Programmatically upload an XML file to the cloud using Python.
  • Online XML-Datenextraktionssoftware zum Parsen von XML Dokumenten.

Außerdem können Sie mehr über die GroupDocs.Parser Cloud API in der Dokumentation erfahren. Wir bieten auch einen API Referenz Abschnitt an, der es Ihnen ermöglicht, unsere APIs direkt über den Browser zu visualisieren und zu interagieren. Der vollständige Quellcode des Python SDK ist frei verfügbar auf Github.

Finally, wir schreiben weiterhin neue Blogartikel über verschiedene Dateiformate und die Analyse mit REST API. Bitte kontaktieren Sie uns für die neuesten Updates.

Ask a question

Falls Sie Fragen oder Verwirrung zum XML Dokumentparser haben, können Sie uns gerne über unser forum kontaktieren.

FAQs

Why do we need to extract text from XML files?

Das Extrahieren von Text aus XML Dateien ermöglicht es uns, auf die tatsächlichen Daten zuzugreifen und diese zu manipulieren, die in den XML Dokumenten enthalten sind.

How can I extract text from XML files using Python?

Sie können Text aus XML Dateien mit GroupDocs.Parser Cloud SDK for Python extrahieren, das leistungsstarke Textextraktionsfunktionen bietet.

Is it possible to extract metadata from XML files using GroupDocs.Parser Cloud SDK for Python?

Ja, GroupDocs.Parser Cloud SDK für Python unterstützt das Extrahieren von Metadaten aus XML Dateien. Sie können Metainformationen wie Autor, Erstellungsdatum, Änderungsdatum und mehr abrufen.

Can I extract images embedded in XML files using GroupDocs.Parser Cloud SDK for Python?

Ja, GroupDocs.Parser Cloud SDK für Python ermöglicht es Ihnen, Bilder, die in XML Dateien eingebettet sind, zu extrahieren und sie in verschiedene Formate zu konvertieren.

Siehe auch

Hier sind einige verwandte Artikel, die Sie möglicherweise hilfreich finden: