Na era digital de hoje, a extração de dados de documentos XML(eXtensible Markup Language) desempenha um papel importante em vários setores e aplicações. XML é uma linguagem de marcação popular usada para armazenar e organizar dados estruturados em um formato hierárquico. A extração de informações de documentos XML é essencial para as empresas realizarem operações de análise e recuperação de informações nos dados. Neste artigo, exploraremos como extrair texto de documentos XML em Java usando GroupDocs.Parser Cloud SDK para Java.
Os seguintes tópicos serão abordados neste artigo:
- Java REST API para analisar o arquivo XML e a instalação do SDK
- Como extrair todo o texto de arquivos XML em Java usando a API REST
Java REST API para analisar o arquivo XML e a instalação do SDK
GroupDocs.Parser Cloud SDK for Java é uma solução poderosa, fácil de usar e abrangente para extrair texto de vários formatos de documento sem esforço, incluindo XML. Com suas APIs abrangentes, você pode facilmente extrair texto, metadados, imagens e outras informações de mais de 50 formatos de documento. O SDK pode ser integrado a um aplicativo baseado em Java para simplificar seu processo de desenvolvimento e aumentar a produtividade.
Você pode baixar o arquivo JAR da API ou instalá-lo usando o Maven adicionando o seguinte repositório e dependência ao arquivo pom.xml do seu projeto:
Repositório Maven:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Dependência do Maven:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>23.3</version>
<scope>compile</scope>
</dependency>
Agora, você precisa inscrever-se para uma conta de avaliação gratuita ou comprar um plano de assinatura no site do GroupDocs e obter sua chave de API. Depois de obter o ID do cliente e o segredo do cliente, adicione o trecho de código abaixo a um aplicativo baseado em Java:
# Obtenha seu client_id e client_secret em https://dashboard.groupdocs.cloud após o registro.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Como extrair todo o texto de arquivos XML em Java usando a API REST
Para extrair texto de documentos XML em Java usando GroupDocs.Parser Cloud SDK para Java, siga estas etapas:
Carregar o arquivo
Em primeiro lugar, carregue o documento XML na nuvem usando o exemplo de código abaixo:
package com.groupdocsdev.classes;
import java.io.File;
import com.groupdocs.cloud.parser.api.FileApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.UploadFileRequest;
// Carregar arquivo para o Cloud Storage usando Java
public class App {
public static void main(String[] args) {
FileApi apiInstance = new FileApi(configuration);
try {
File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.xml");
UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.xml", fileStream, MyStorage);
FilesUploadResult response = apiInstance.uploadFile(request);
System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Como resultado, o arquivo XML carregado estará disponível na seção de arquivos do seu painel na nuvem.
Analisar arquivo XML usando Java
Aqui estão as etapas e um trecho de código de exemplo que demonstra como extrair texto de um documento XML em Java usando GroupDocs.Parser Cloud SDK for Java:
- Em primeiro lugar, importe as classes necessárias para o seu arquivo Java.
- Em segundo lugar, crie uma instância da classe ParseApi.
- Em terceiro lugar, crie uma instância da classe FileInfo.
- Em seguida, defina o caminho para o arquivo XML como entrada.
- Em seguida, crie uma instância da classe TextOptions().
- Em seguida, atribua fileInfo ao método setFileInfo.
- Agora, crie uma instância da classe TextRequest() e passe o parâmetro TextOptions.
- Por fim, obtenha os resultados chamando o método ParseApi.text() e passando o parâmetro TextRequest.
O exemplo de código a seguir mostra como extrair texto e analisar um documento XML em Java usando a API REST:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.TextRequest;
// Como extrair texto de um arquivo XML em Java.
public class App {
public static void main(String[] args) {
// Crie uma instância da API Parse
ParseApi apiInstance = new ParseApi(configuration);
try {
// Prepare as configurações
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.xml");
TextOptions options = new TextOptions();
options.setFileInfo(fileInfo);
TextRequest request = new TextRequest(options);
TextResult response = apiInstance.text(request);
// Obter caminho do arquivo de saída
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Você pode ver a saída na imagem abaixo:
Analisador de XML on-line gratuito
Qual é a melhor maneira de extrair texto de XML online gratuitamente? Tente um software analisador de XML on-line para extrair arquivos XML. Esta ferramenta XML Parser é desenvolvida usando a biblioteca Java parser mencionada acima.
Conclusão
Em conclusão, os desenvolvedores podem simplificar o processo de extração de dados e acessar com eficiência os dados em documentos XML com GroupDocs.Parser Cloud SDK para Java. O seguinte é o que você aprendeu com este artigo:
- como extrair todo o texto de documentos XML em Java usando REST API;
- fazer upload programaticamente de um arquivo XML para a nuvem usando Java;
- e ferramenta de extração XML online para analisar documentos XML.
Além disso, você pode aprender mais sobre GroupDocs.Parser Cloud API usando a documentação. Também fornecemos uma seção Referência de API que permite visualizar e interagir com nossas APIs diretamente pelo navegador. O código-fonte completo do Java SDK está disponível gratuitamente no Github.
Por fim, continuamos escrevendo novos artigos de blog em diferentes formatos de arquivo e analisando usando a API REST. Portanto, entre em contato para obter as atualizações mais recentes.
Faça uma pergunta
Caso você tenha alguma dúvida ou confusão sobre o analisador de dados XML, sinta-se à vontade para nos contatar através do nosso fórum.
perguntas frequentes
Como faço para extrair todo o texto de um arquivo XML usando Java?
Você primeiro inicializa a classe ParserApi e define nossas credenciais de API usando GroupDocs.Parser Cloud SDK for Java. Em seguida, crie um objeto ExtractOptions e especifique o arquivo de documento XML usando FileInfo. Por fim, chame o método extract, passe as opções e recupere o texto extraído usando o método getText.
Como faço para analisar documentos XML usando Java?
Você pode analisar um arquivo XML usando GroupDocs.Parser Cloud SDK for Java em seus aplicativos Java. Este poderoso SDK fornece uma maneira eficiente e direta de extrair dados de arquivos XML em Java.
Veja também
Aqui estão alguns artigos relacionados que podem ser úteis:
- Extraia imagens de arquivos PDF em Java usando a API REST
- Análise de Documento – Extrair Texto de Arquivo PDF em Java
- Extrair dados de PDF usando API REST em Node.js
- Analisar documentos do Word usando a API REST em Python
- Extrair dados específicos de PDF usando Python
- Extrair imagens de documentos PDF usando Python
- Como extrair texto de PDF usando Python
- Extrair imagens de documentos do Word usando Java