Nell’era digitale odierna, l’estrazione dei dati dai documenti XML(eXtensible Markup Language) svolge un ruolo importante in vari settori e applicazioni. XML è un popolare linguaggio di markup utilizzato per archiviare e organizzare dati strutturati in un formato gerarchico. L’estrazione di informazioni da documenti XML è essenziale per le aziende per eseguire analisi dei dati e operazioni di recupero delle informazioni sui dati. In questo articolo, esploreremo come estrarre testo da documenti XML in Java utilizzando GroupDocs.Parser Cloud SDK per Java.
In questo articolo saranno trattati i seguenti argomenti:
- API REST Java per analizzare il file XML e l’installazione dell’SDK
- Come estrarre tutto il testo dai file XML in Java utilizzando l’API REST
API REST Java per l’analisi del file XML e dell’installazione dell’SDK
GroupDocs.Parser Cloud SDK for Java è una soluzione potente, facile da usare e completa per estrarre facilmente testo da vari formati di documenti, incluso XML. Con le sue API complete, puoi estrarre facilmente testo, metadati, immagini e altre informazioni da oltre 50 formati di documenti. L’SDK può essere integrato in un’applicazione basata su Java per semplificare il processo di sviluppo e migliorare la produttività.
Puoi scaricare il file JAR dell’API o installarlo utilizzando Maven aggiungendo il seguente repository e dipendenza nel file pom.xml del tuo progetto:
Repository esperto:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Dipendenza Maven:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>23.3</version>
<scope>compile</scope>
</dependency>
Ora devi iscriverti per un account di prova gratuito o acquistare un piano di abbonamento sul sito web di GroupDocs e ottenere la tua chiave API. Dopo aver ottenuto l’ID client e il segreto client, aggiungi lo snippet di codice seguente a un’applicazione basata su Java:
# Ottieni il tuo client_id e client_secret da https://dashboard.groupdocs.cloud dopo la registrazione.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Come estrarre tutto il testo dai file XML in Java utilizzando l’API REST
Per estrarre testo da documenti XML in Java utilizzando GroupDocs.Parser Cloud SDK for Java, attenersi alla seguente procedura:
Carica il file
Innanzitutto, carica il documento XML nel cloud utilizzando l’esempio di codice fornito di seguito:
package com.groupdocsdev.classes;
import java.io.File;
import com.groupdocs.cloud.parser.api.FileApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.UploadFileRequest;
// Carica il file su Cloud Storage utilizzando Java
public class App {
public static void main(String[] args) {
FileApi apiInstance = new FileApi(configuration);
try {
File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.xml");
UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.xml", fileStream, MyStorage);
FilesUploadResult response = apiInstance.uploadFile(request);
System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Di conseguenza, il file XML caricato sarà disponibile nella sezione file della dashboard sul cloud.
Analizza il file XML utilizzando Java
Di seguito sono riportati i passaggi e un frammento di codice di esempio che dimostra come estrarre il testo da un documento XML in Java utilizzando GroupDocs.Parser Cloud SDK per Java:
- Innanzitutto, importa le classi richieste nel tuo file Java.
- In secondo luogo, creare un’istanza della classe ParseApi.
- In terzo luogo, crea un’istanza della classe FileInfo.
- Successivamente, imposta il percorso del file XML come input.
- Quindi, crea un’istanza della classe TextOptions().
- Successivamente, assegna fileInfo al metodo setFileInfo.
- Creare ora un’istanza della classe TextRequest() e passare il parametro TextOptions.
- Infine, ottieni i risultati chiamando il metodo ParseApi.text() e passando il parametro TextRequest.
Il seguente esempio di codice mostra come estrarre il testo e analizzare un documento XML in Java utilizzando l’API REST:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.TextRequest;
// Come estrarre il testo da un file XML in Java.
public class App {
public static void main(String[] args) {
// Crea un'istanza dell'API Parse
ParseApi apiInstance = new ParseApi(configuration);
try {
// Preparare le impostazioni
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.xml");
TextOptions options = new TextOptions();
options.setFileInfo(fileInfo);
TextRequest request = new TextRequest(options);
TextResult response = apiInstance.text(request);
// Ottieni il percorso del file di output
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Puoi vedere l’output nell’immagine qui sotto:
Analizzatore XML online gratuito
Qual è il modo migliore per estrarre testo da XML online gratuitamente? Prova un software di parser XML online per eseguire lo scraping dei file XML. Questo strumento XML Parser è sviluppato utilizzando la suddetta libreria di parser Java.
Conclusione
In conclusione, gli sviluppatori possono semplificare il processo di estrazione dei dati e accedere in modo efficiente ai dati all’interno dei documenti XML con GroupDocs.Parser Cloud SDK per Java. Quanto segue è ciò che hai imparato da questo articolo:
- come estrarre tutto il testo dai documenti XML in Java utilizzando l’API REST;
- caricare in modo programmatico un file XML nel cloud utilizzando Java;
- e strumento di estrazione XML online per analizzare i documenti XML.
Inoltre, puoi saperne di più su GroupDocs.Parser Cloud API utilizzando la documentazione. Forniamo anche una sezione Riferimento API che ti consente di visualizzare e interagire con le nostre API direttamente attraverso il browser. Il codice sorgente completo di Java SDK è disponibile gratuitamente su GitHub.
Infine, continuiamo a scrivere nuovi articoli di blog su diversi formati di file e l’analisi utilizzando l’API REST. Quindi, ti preghiamo di contattarci per gli ultimi aggiornamenti.
Fai una domanda
In caso di domande o dubbi sul parser di dati XML, non esitate a contattarci tramite il nostro forum.
Domande frequenti
Come estraggo tutto il testo da un file XML usando Java?
Devi prima inizializzare la classe ParserApi e impostare le nostre credenziali API utilizzando GroupDocs.Parser Cloud SDK for Java. Quindi, crea un oggetto ExtractOptions e specifica il file del documento XML utilizzando FileInfo. Infine, chiama il metodo extract, passa le opzioni e recupera il testo estratto utilizzando il metodo getText.
Come si analizzano i documenti XML utilizzando Java?
Puoi analizzare un file XML utilizzando GroupDocs.Parser Cloud SDK for Java nelle tue applicazioni Java. Questo potente SDK fornisce un modo efficiente e diretto per estrarre i dati dai file XML in Java.
Guarda anche
Ecco alcuni articoli correlati che potresti trovare utili:
- Estrai immagini da file PDF in Java utilizzando l’API REST
- Analisi del documento: estrai il testo dal file PDF in Java
- Estrai dati da PDF utilizzando l’API REST in Node.js
- Analizza i documenti di Word utilizzando l’API REST in Python
- Estrai dati specifici da PDF usando Python
- Estrai immagini da documenti PDF usando Python
- Come estrarre testo da PDF usando Python
- Estrai immagini da documenti Word usando Java