Java DOM Parser - Extraia texto de documentos XML usando Java.

Na era digital de hoje, a extração de dados de documentos XML(eXtensible Markup Language) desempenha um papel importante em vários setores e aplicações. XML é uma linguagem de marcação popular usada para armazenar e organizar dados estruturados em um formato hierárquico. A extração de informações de documentos XML é essencial para as empresas realizarem operações de análise e recuperação de informações nos dados. Neste artigo, exploraremos como extrair texto de documentos XML em Java usando GroupDocs.Parser Cloud SDK para Java.

Os seguintes tópicos serão abordados neste artigo:

Java REST API para analisar o arquivo XML e a instalação do SDK

GroupDocs.Parser Cloud SDK for Java é uma solução poderosa, fácil de usar e abrangente para extrair texto de vários formatos de documento sem esforço, incluindo XML. Com suas APIs abrangentes, você pode facilmente extrair texto, metadados, imagens e outras informações de mais de 50 formatos de documento. O SDK pode ser integrado a um aplicativo baseado em Java para simplificar seu processo de desenvolvimento e aumentar a produtividade.

Você pode baixar o arquivo JAR da API ou instalá-lo usando o Maven adicionando o seguinte repositório e dependência ao arquivo pom.xml do seu projeto:

Repositório Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dependência do Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Agora, você precisa inscrever-se para uma conta de avaliação gratuita ou comprar um plano de assinatura no site do GroupDocs e obter sua chave de API. Depois de obter o ID do cliente e o segredo do cliente, adicione o trecho de código abaixo a um aplicativo baseado em Java:

# Obtenha seu client_id e client_secret em https://dashboard.groupdocs.cloud após o registro.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Como extrair todo o texto de arquivos XML em Java usando a API REST

Para extrair texto de documentos XML em Java usando GroupDocs.Parser Cloud SDK para Java, siga estas etapas:

  • Upload o arquivo XML para a nuvem
  • Extrair texto de XML usando Java

Carregar o arquivo

Em primeiro lugar, carregue o documento XML na nuvem usando o exemplo de código abaixo:

package com.groupdocsdev.classes;

import java.io.File;

import com.groupdocs.cloud.parser.api.FileApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.UploadFileRequest;

// Carregar arquivo para o Cloud Storage usando Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.xml");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.xml", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Como resultado, o arquivo XML carregado estará disponível na seção de arquivos do seu painel na nuvem.

Analisar arquivo XML usando Java

Aqui estão as etapas e um trecho de código de exemplo que demonstra como extrair texto de um documento XML em Java usando GroupDocs.Parser Cloud SDK for Java:

  • Em primeiro lugar, importe as classes necessárias para o seu arquivo Java.
  • Em segundo lugar, crie uma instância da classe ParseApi.
  • Em terceiro lugar, crie uma instância da classe FileInfo.
  • Em seguida, defina o caminho para o arquivo XML como entrada.
  • Em seguida, crie uma instância da classe TextOptions().
  • Em seguida, atribua fileInfo ao método setFileInfo.
  • Agora, crie uma instância da classe TextRequest() e passe o parâmetro TextOptions.
  • Por fim, obtenha os resultados chamando o método ParseApi.text() e passando o parâmetro TextRequest.

O exemplo de código a seguir mostra como extrair texto e analisar um documento XML em Java usando a API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.TextRequest;

// Como extrair texto de um arquivo XML em Java.
public class App {

	public static void main(String[] args) {
		
		// Crie uma instância da API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Prepare as configurações
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.xml");
			TextOptions options = new TextOptions();
			options.setFileInfo(fileInfo);

			TextRequest request = new TextRequest(options);
			TextResult response = apiInstance.text(request);

			// Obter caminho do arquivo de saída
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Você pode ver a saída na imagem abaixo:

Java Extrair texto de documentos XML

Extrair texto de documento XML em Java

Analisador de XML on-line gratuito

Qual é a melhor maneira de extrair texto de XML online gratuitamente? Tente um software analisador de XML on-line para extrair arquivos XML. Esta ferramenta XML Parser é desenvolvida usando a biblioteca Java parser mencionada acima.

Conclusão

Em conclusão, os desenvolvedores podem simplificar o processo de extração de dados e acessar com eficiência os dados em documentos XML com GroupDocs.Parser Cloud SDK para Java. O seguinte é o que você aprendeu com este artigo:

  • como extrair todo o texto de documentos XML em Java usando REST API;
  • fazer upload programaticamente de um arquivo XML para a nuvem usando Java;
  • e ferramenta de extração XML online para analisar documentos XML.

Além disso, você pode aprender mais sobre GroupDocs.Parser Cloud API usando a documentação. Também fornecemos uma seção Referência de API que permite visualizar e interagir com nossas APIs diretamente pelo navegador. O código-fonte completo do Java SDK está disponível gratuitamente no Github.

Por fim, continuamos escrevendo novos artigos de blog em diferentes formatos de arquivo e analisando usando a API REST. Portanto, entre em contato para obter as atualizações mais recentes.

Faça uma pergunta

Caso você tenha alguma dúvida ou confusão sobre o analisador de dados XML, sinta-se à vontade para nos contatar através do nosso fórum.

perguntas frequentes

Como faço para extrair todo o texto de um arquivo XML usando Java?

Você primeiro inicializa a classe ParserApi e define nossas credenciais de API usando GroupDocs.Parser Cloud SDK for Java. Em seguida, crie um objeto ExtractOptions e especifique o arquivo de documento XML usando FileInfo. Por fim, chame o método extract, passe as opções e recupere o texto extraído usando o método getText.

Como faço para analisar documentos XML usando Java?

Você pode analisar um arquivo XML usando GroupDocs.Parser Cloud SDK for Java em seus aplicativos Java. Este poderoso SDK fornece uma maneira eficiente e direta de extrair dados de arquivos XML em Java.

Veja também

Aqui estão alguns artigos relacionados que podem ser úteis: