Java DOM Parser - Extrayez du texte à partir de documents XML à l'aide de Java.

À l’ère numérique d’aujourd’hui, l’extraction de données à partir de documents XML(eXtensible Markup Language) joue un rôle important dans diverses industries et applications. XML est un langage de balisage populaire utilisé pour stocker et organiser des données structurées dans un format hiérarchique. L’extraction d’informations à partir de documents XML est essentielle pour que les entreprises effectuent des opérations d’analyse de données et de recherche d’informations sur les données. Dans cet article, nous allons explorer comment extraire du texte de documents XML en Java à l’aide du SDK Cloud GroupDocs.Parser pour Java.

Les sujets suivants seront traités dans cet article :

API REST Java pour analyser le fichier XML et l’installation du SDK

GroupDocs.Parser Cloud SDK for Java est une solution puissante, conviviale et complète pour extraire sans effort du texte à partir de divers formats de documents, y compris XML. Grâce à ses API complètes, vous pouvez facilement extraire du texte, des métadonnées, des images et d’autres informations à partir de plus de 50 formats de documents. Le SDK peut être intégré dans une application basée sur Java pour simplifier votre processus de développement et améliorer la productivité.

Vous pouvez soit télécharger le fichier JAR de l’API, soit l’installer à l’aide de Maven en ajoutant le référentiel et la dépendance suivants dans le fichier pom.xml de votre projet :

Référentiel Maven :

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dépendance Maven :

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Maintenant, vous devez vous inscrire pour un compte d’essai gratuit ou acheter un plan d’abonnement sur le site Web de GroupDocs et obtenir votre clé API. Une fois que vous avez l’ID client et le secret client, ajoutez l’extrait de code ci-dessous à une application basée sur Java :

# Obtenez votre client_id et client_secret depuis https://dashboard.groupdocs.cloud après l'inscription.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Comment extraire tout le texte de fichiers XML en Java à l’aide de l’API REST

Pour extraire du texte de documents XML en Java à l’aide du SDK Cloud GroupDocs.Parser pour Java, procédez comme suit :

Télécharger le fichier

Tout d’abord, chargez le document XML dans le cloud à l’aide de l’exemple de code ci-dessous :

package com.groupdocsdev.classes;

import java.io.File;

import com.groupdocs.cloud.parser.api.FileApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.UploadFileRequest;

// Télécharger le fichier sur le Cloud Storage à l'aide de Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.xml");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.xml", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Par conséquent, le fichier XML téléchargé sera disponible dans la section des fichiers de votre tableau de bord sur le cloud.

Analyser le fichier XML à l’aide de Java

Voici les étapes et un exemple d’extrait de code qui montre comment extraire du texte d’un document XML en Java à l’aide du SDK Cloud GroupDocs.Parser pour Java :

  • Tout d’abord, importez les classes requises dans votre fichier Java.
  • Deuxièmement, créez une instance de la classe ParseApi.
  • Troisièmement, créez une instance de la classe FileInfo.
  • Ensuite, définissez le chemin d’accès au fichier XML en tant qu’entrée.
  • Ensuite, créez une instance de la classe TextOptions().
  • Ensuite, affectez fileInfo à la méthode setFileInfo.
  • Maintenant, créez une instance de la classe TextRequest() et passez le paramètre TextOptions.
  • Enfin, obtenez des résultats en appelant la méthode ParseApi.text() et en transmettant le paramètre TextRequest.

L’exemple de code suivant montre comment extraire du texte et analyser un document XML en Java à l’aide de l’API REST :

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.TextRequest;

// Comment extraire du texte d'un fichier XML en Java.
public class App {

	public static void main(String[] args) {
		
		// Créer une instance de l'API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Préparer les paramètres
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.xml");
			TextOptions options = new TextOptions();
			options.setFileInfo(fileInfo);

			TextRequest request = new TextRequest(options);
			TextResult response = apiInstance.text(request);

			// Obtenir le chemin du fichier de sortie
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Vous pouvez voir la sortie dans l’image ci-dessous :

Java Extraire du texte à partir de documents XML

Extraire le texte d’un document XML en Java

Analyseur XML en ligne gratuit

Quel est le meilleur moyen d’extraire gratuitement du texte à partir de XML en ligne ? Veuillez essayer un logiciel d’analyse XML en ligne pour récupérer les fichiers XML. Cet outil d’analyseur XML est développé à l’aide de la bibliothèque d’analyseur Java mentionnée ci-dessus.

Conclusion

En conclusion, les développeurs peuvent simplifier le processus d’extraction de données et accéder efficacement aux données dans les documents XML avec GroupDocs.Parser Cloud SDK pour Java. Voici ce que vous avez appris de cet article :

  • comment extraire tout le texte des documents XML en Java à l’aide de l’API REST ;
  • télécharger par programmation un fichier XML dans le cloud à l’aide de Java ;
  • et un outil d’extraction XML en ligne pour analyser les documents XML.

En outre, vous pouvez en savoir plus sur l’API GroupDocs.Parser Cloud à l’aide de la documentation. Nous fournissons également une section API Reference qui vous permet de visualiser et d’interagir avec nos API directement via le navigateur. Le code source complet de Java SDK est disponible gratuitement sur Github.

Enfin, nous continuons à écrire de nouveaux articles de blog sur différents formats de fichiers et à analyser à l’aide de l’API REST. Alors, s’il vous plaît contactez-nous pour les dernières mises à jour.

poser une question

En cas de questions ou de confusion concernant l’analyseur de données XML, n’hésitez pas à nous contacter via notre forum.

FAQ

Comment puis-je extraire tout le texte d’un fichier XML à l’aide de Java ?

Vous initialisez d’abord la classe ParserApi et définissez nos identifiants d’API à l’aide de GroupDocs.Parser Cloud SDK for Java. Ensuite, créez un objet ExtractOptions et spécifiez le fichier de document XML à l’aide de FileInfo. Enfin, appelez la méthode extract, transmettez les options et récupérez le texte extrait à l’aide de la méthode getText.

Comment analyser des documents XML à l’aide de Java ?

Vous pouvez analyser un fichier XML à l’aide de GroupDocs.Parser Cloud SDK for Java dans vos applications Java. Ce puissant SDK fournit un moyen efficace et simple d’extraire des données à partir de fichiers XML en Java.

Voir également

Voici quelques articles connexes qui pourraient vous être utiles :