Java DOM Parser – Extrahieren Sie Text aus XML Dokumenten mit Java.

Im heutigen digitalen Zeitalter spielt die Datenextraktion aus XML Dokumenten (eXtensible Markup Language) in verschiedenen Branchen und Anwendungen eine wichtige Rolle. XML ist eine beliebte Auszeichnungssprache, die zum Speichern und Organisieren strukturierter Daten in einem hierarchischen Format verwendet wird. Das Extrahieren von Informationen aus XML Dokumenten ist für Unternehmen unerlässlich, um Datenanalyse und Informationsabrufvorgänge für die Daten durchzuführen. In diesem Artikel erfahren Sie, wie Sie mithilfe des GroupDocs.Parser Cloud SDK für Java Text aus XML Dokumenten in Java extrahieren.

Die folgenden Themen sollen in diesem Artikel behandelt werden:

Java REST API zum Parsen von XML Dateien und SDK-Installation

GroupDocs.Parser Cloud SDK für Java ist eine leistungsstarke, benutzerfreundliche und umfassende Lösung zum mühelosen Extrahieren von Text aus verschiedenen Dokumentformaten, einschließlich XML. Mit seinen umfassenden APIs können Sie problemlos Text, Metadaten, Bilder und andere Informationen aus über 50 Dokumentformaten extrahieren. Das SDK kann in eine Java-basierte Anwendung integriert werden, um Ihren Entwicklungsprozess zu vereinfachen und die Produktivität zu steigern.

Sie können entweder die JAR-Datei der API herunterladen oder sie mit Maven installieren, indem Sie das folgende Repository und die folgende Abhängigkeit zur pom.xml-Datei Ihres Projekts hinzufügen:

Maven-Repository:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven-Dependency:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Jetzt müssen Sie sich auf der GroupDocs-Website für ein kostenloses Testkonto anmelden oder ein Abonnement erwerben und Ihren API-Schlüssel erhalten. Sobald Sie die Client-ID und das Client-Geheimnis haben, fügen Sie den folgenden Codeausschnitt zu einer Java-basierten Anwendung hinzu:

# Holen Sie sich nach der Registrierung Ihre client_id und client_secret von https://dashboard.groupdocs.cloud.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

So extrahieren Sie den gesamten Text aus XML Dateien in Java mithilfe der REST-API

Führen Sie die folgenden Schritte aus, um Text aus XML Dokumenten in Java mithilfe des GroupDocs.Parser Cloud SDK für Java zu extrahieren:

Laden Sie die Datei hoch

Laden Sie zunächst das XML Dokument mithilfe des unten angegebenen Codebeispiels in die Cloud hoch:

package com.groupdocsdev.classes;

import java.io.File;

import com.groupdocs.cloud.parser.api.FileApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.UploadFileRequest;

// Laden Sie die Datei mit Java in den Cloud-Speicher hoch
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.xml");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.xml", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Dadurch ist die hochgeladene XML-Datei im Dateienbereich Ihres Dashboards in der Cloud verfügbar.

XML-Datei mit Java analysieren

Hier sind die Schritte und ein Beispielcode-Snippet, das zeigt, wie man mit GroupDocs.Parser Cloud SDK für Java Text aus einem XML Dokument in Java extrahiert:

  • Importieren Sie zunächst die erforderlichen Klassen in Ihre Java-Datei.
  • Zweitens erstellen Sie eine Instanz der Klasse ParseApi.
  • Drittens erstellen Sie eine Instanz der Klasse FileInfo.
  • Als nächstes legen Sie den Pfad zur XML-Datei als Eingabe fest.
  • Erstellen Sie dann eine Instanz der TextOptions() Klasse.
  • Als nächstes weisen Sie fileInfo der setFileInfo-Methode zu.
  • Erstellen Sie nun eine Instanz der TextRequest() Klasse und übergeben Sie den TextOptions-Parameter.
  • Abschließend erhalten Sie Ergebnisse, indem Sie die Methode ParseApi.text() aufrufen und den Parameter TextRequest übergeben.

Das folgende Codebeispiel zeigt, wie Sie mithilfe der REST-API Text extrahieren und ein XML Dokument in Java analysieren:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.TextRequest;

// So extrahieren Sie Text aus einer XML-Datei in Java.
public class App {

	public static void main(String[] args) {
		
		// Erstellen Sie eine Instanz der Parse-API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Bereiten Sie die Einstellungen vor
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.xml");
			TextOptions options = new TextOptions();
			options.setFileInfo(fileInfo);

			TextRequest request = new TextRequest(options);
			TextResult response = apiInstance.text(request);

			// Ausgabedateipfad abrufen
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Sie können die Ausgabe im Bild unten sehen:

Java extrahiert Text aus XML Dokumenten

Extrahieren Sie Text aus einem XML Dokument in Java

Kostenloser Online-XML-Parser

Was ist der beste Weg, Text kostenlos online aus XML zu extrahieren? Bitte versuchen Sie es mit einer Online-XML-Parser-Software, um XML Dateien zu extrahieren. Dieses XML-Parser-Tool wurde unter Verwendung der oben genannten Java-Parser-Bibliothek entwickelt.

Abschluss

Zusammenfassend lässt sich sagen, dass Entwickler mit dem GroupDocs.Parser Cloud SDK für Java den Datenextraktionsprozess vereinfachen und effizient auf die Daten in XML Dokumenten zugreifen können. Folgendes haben Sie aus diesem Artikel gelernt:

  • wie man den gesamten Text aus XML Dokumenten in Java mithilfe der REST-API extrahiert;
  • Laden Sie eine XML-Datei mithilfe von Java programmgesteuert in die Cloud hoch.
  • und Online-XML-Extraktionstool zum Parsen von XML Dokumenten.

Außerdem können Sie mithilfe der Dokumentation mehr über die GroupDocs.Parser Cloud API erfahren. Wir bieten auch einen Abschnitt API-Referenz an, mit dem Sie unsere APIs direkt über den Browser visualisieren und mit ihnen interagieren können. Der vollständige Quellcode des Java SDK ist auf Github frei verfügbar.

Schließlich schreiben wir weiterhin neue Blog-Artikel zu verschiedenen Dateiformaten und analysieren sie mithilfe der REST-API. Bitte kontaktieren Sie uns für die neuesten Updates.

Stelle eine Frage

Falls Sie Fragen oder Unklarheiten zum XML-Datenparser haben, können Sie uns gerne über unser Forum kontaktieren.

FAQs

Wie extrahiere ich mit Java den gesamten Text aus einer XML-Datei?

Sie initialisieren zunächst die ParserApi Klasse und legen unsere API-Anmeldeinformationen mit GroupDocs.Parser Cloud SDK für Java fest. Erstellen Sie dann ein ExtractOptions Objekt und geben Sie die XML Dokumentdatei mit FileInfo an. Rufen Sie abschließend die Methode „extrahieren“ auf, übergeben Sie die Optionen und rufen Sie den extrahierten Text mithilfe der Methode „getText“ ab.

Wie analysiere ich XML Dokumente mit Java?

Sie können eine XML-Datei mit GroupDocs.Parser Cloud SDK for Java in Ihren Java-Anwendungen analysieren. Dieses leistungsstarke SDK bietet eine effiziente und unkomplizierte Möglichkeit, Daten aus XML Dateien in Java zu extrahieren.

Siehe auch

Hier sind einige verwandte Artikel, die für Sie hilfreich sein könnten: