Java DOM Parser - Estrai testo da documenti XML utilizzando Java.

Nell’era digitale odierna, l’estrazione dei dati dai documenti XML(eXtensible Markup Language) svolge un ruolo importante in vari settori e applicazioni. XML è un popolare linguaggio di markup utilizzato per archiviare e organizzare dati strutturati in un formato gerarchico. L’estrazione di informazioni da documenti XML è essenziale per le aziende per eseguire analisi dei dati e operazioni di recupero delle informazioni sui dati. In questo articolo, esploreremo come estrarre testo da documenti XML in Java utilizzando GroupDocs.Parser Cloud SDK per Java.

In questo articolo saranno trattati i seguenti argomenti:

API REST Java per l’analisi del file XML e dell’installazione dell’SDK

GroupDocs.Parser Cloud SDK for Java è una soluzione potente, facile da usare e completa per estrarre facilmente testo da vari formati di documenti, incluso XML. Con le sue API complete, puoi estrarre facilmente testo, metadati, immagini e altre informazioni da oltre 50 formati di documenti. L’SDK può essere integrato in un’applicazione basata su Java per semplificare il processo di sviluppo e migliorare la produttività.

Puoi scaricare il file JAR dell’API o installarlo utilizzando Maven aggiungendo il seguente repository e dipendenza nel file pom.xml del tuo progetto:

Repository esperto:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dipendenza Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Ora devi iscriverti per un account di prova gratuito o acquistare un piano di abbonamento sul sito web di GroupDocs e ottenere la tua chiave API. Dopo aver ottenuto l’ID client e il segreto client, aggiungi lo snippet di codice seguente a un’applicazione basata su Java:

# Ottieni il tuo client_id e client_secret da https://dashboard.groupdocs.cloud dopo la registrazione.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Come estrarre tutto il testo dai file XML in Java utilizzando l’API REST

Per estrarre testo da documenti XML in Java utilizzando GroupDocs.Parser Cloud SDK for Java, attenersi alla seguente procedura:

  • Carica il file XML nel cloud
  • Estrai testo da XML utilizzando Java

Carica il file

Innanzitutto, carica il documento XML nel cloud utilizzando l’esempio di codice fornito di seguito:

package com.groupdocsdev.classes;

import java.io.File;

import com.groupdocs.cloud.parser.api.FileApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.UploadFileRequest;

// Carica il file su Cloud Storage utilizzando Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.xml");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.xml", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Di conseguenza, il file XML caricato sarà disponibile nella sezione file della dashboard sul cloud.

Analizza il file XML utilizzando Java

Di seguito sono riportati i passaggi e un frammento di codice di esempio che dimostra come estrarre il testo da un documento XML in Java utilizzando GroupDocs.Parser Cloud SDK per Java:

  • Innanzitutto, importa le classi richieste nel tuo file Java.
  • In secondo luogo, creare un’istanza della classe ParseApi.
  • In terzo luogo, crea un’istanza della classe FileInfo.
  • Successivamente, imposta il percorso del file XML come input.
  • Quindi, crea un’istanza della classe TextOptions().
  • Successivamente, assegna fileInfo al metodo setFileInfo.
  • Creare ora un’istanza della classe TextRequest() e passare il parametro TextOptions.
  • Infine, ottieni i risultati chiamando il metodo ParseApi.text() e passando il parametro TextRequest.

Il seguente esempio di codice mostra come estrarre il testo e analizzare un documento XML in Java utilizzando l’API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.TextRequest;

// Come estrarre il testo da un file XML in Java.
public class App {

	public static void main(String[] args) {
		
		// Crea un'istanza dell'API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Preparare le impostazioni
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.xml");
			TextOptions options = new TextOptions();
			options.setFileInfo(fileInfo);

			TextRequest request = new TextRequest(options);
			TextResult response = apiInstance.text(request);

			// Ottieni il percorso del file di output
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Puoi vedere l’output nell’immagine qui sotto:

Java Estrai testo da documenti XML

Estrarre il testo dal documento XML in Java

Analizzatore XML online gratuito

Qual è il modo migliore per estrarre testo da XML online gratuitamente? Prova un software di parser XML online per eseguire lo scraping dei file XML. Questo strumento XML Parser è sviluppato utilizzando la suddetta libreria di parser Java.

Conclusione

In conclusione, gli sviluppatori possono semplificare il processo di estrazione dei dati e accedere in modo efficiente ai dati all’interno dei documenti XML con GroupDocs.Parser Cloud SDK per Java. Quanto segue è ciò che hai imparato da questo articolo:

  • come estrarre tutto il testo dai documenti XML in Java utilizzando l’API REST;
  • caricare in modo programmatico un file XML nel cloud utilizzando Java;
  • e strumento di estrazione XML online per analizzare i documenti XML.

Inoltre, puoi saperne di più su GroupDocs.Parser Cloud API utilizzando la documentazione. Forniamo anche una sezione Riferimento API che ti consente di visualizzare e interagire con le nostre API direttamente attraverso il browser. Il codice sorgente completo di Java SDK è disponibile gratuitamente su GitHub.

Infine, continuiamo a scrivere nuovi articoli di blog su diversi formati di file e l’analisi utilizzando l’API REST. Quindi, ti preghiamo di contattarci per gli ultimi aggiornamenti.

Fai una domanda

In caso di domande o dubbi sul parser di dati XML, non esitate a contattarci tramite il nostro forum.

Domande frequenti

Come estraggo tutto il testo da un file XML usando Java?

Devi prima inizializzare la classe ParserApi e impostare le nostre credenziali API utilizzando GroupDocs.Parser Cloud SDK for Java. Quindi, crea un oggetto ExtractOptions e specifica il file del documento XML utilizzando FileInfo. Infine, chiama il metodo extract, passa le opzioni e recupera il testo estratto utilizzando il metodo getText.

Come si analizzano i documenti XML utilizzando Java?

Puoi analizzare un file XML utilizzando GroupDocs.Parser Cloud SDK for Java nelle tue applicazioni Java. Questo potente SDK fornisce un modo efficiente e diretto per estrarre i dati dai file XML in Java.

Guarda anche

Ecco alcuni articoli correlati che potresti trovare utili: