Converta PDF em texto em Java com GroupDocs.Conversion Cloud REST API.

Como converter PDF para arquivo de texto programaticamente em Java

PDF ou Portable Document Format é um formato popular para compartilhar documentos, mas pode ser difícil trabalhar com PDFs quando se trata de editar ou extrair texto. É aqui que você precisa converter documentos PDF em arquivos texto. Converter PDFs em arquivos de texto pode tornar o texto mais acessível, editável e pesquisável. Nesta postagem do blog, apresentaremos como converter PDF em arquivo de texto programaticamente em Java usando a API REST.

Os seguintes tópicos serão abordados neste tutorial:

Java PDF em API REST de conversão de texto - Instalação do SDK

Para converter documentos PDF em arquivos de texto, usarei o GroupDocs.Conversion Cloud SDK for Java. É uma solução de API REST independente de plataforma para conversão de documentos e imagens sem depender de nenhum software de terceiros. Ele também permite que você converta mais de 50 tipos de documentos e imagens de qualquer formato de arquivo suportado para qualquer formato que você precisar. Você pode converter rapidamente documentos de um formato para outro, como Word, PDF, PowerPoint, Excel, HTML, CAD, imagens raster, etc.

Você pode baixar o arquivo JAR da API ou instalar usando as configurações do Maven. Adicione o repositório e a dependência ao arquivo POM.xml do seu projeto. Abaixo estão as instruções para o Maven:

Repositório Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dependência do Maven:

 <dependency>
    <groupId>com.groupdocs</groupId
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>23.4</version>
    <scope>compile</scope>
</dependency>

Depois de integrar o GroupDocs.Conversion Cloud SDK em seu projeto Java, Inscreva-se para obter uma conta. Colete seu Client ID e Client Secret no dashboard antes de começar a seguir as etapas e os exemplos de código disponíveis. Além disso, é importante verificar a documentação da API e os limites de uso antes de usá-la. Por favor, digite o código mostrado abaixo depois de ter seu ID e segredo:

# Obtenha seu client_id e client_secret em https://dashboard.groupdocs.cloud após o registro gratuito.

String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Como converter documento PDF para arquivo TXT em Java usando REST API

A seguir estão as etapas para converter um PDF em um documento de texto, conforme mencionado abaixo:

Carregar o arquivo

Em primeiro lugar, carregue o documento PDF para o armazenamento em nuvem usando o trecho de código fornecido abaixo:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Carregar arquivo para armazenamento em nuvem usando Java
public class App {

  public static void main(String[] args) {
        
    // Crie uma instância da API de conversão          
    FileApi apiInstance = new FileApi(configuration);
    try {
      File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
      UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
      FilesUploadResult response = apiInstance.uploadFile(request);
      System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

Como resultado, o arquivo PDF carregado estará disponível na seção de arquivos do seu painel na nuvem.

Converter PDF em formato de texto em Java

Esta seção é sobre como converter um documento PDF em um arquivo de texto programaticamente em Java seguindo as etapas abaixo:

  • Em primeiro lugar, crie uma instância da classe ConvertApi.
  • Em segundo lugar, crie uma instância da classe ConvertSettings.
  • Em seguida, forneça o nome do armazenamento em nuvem.
  • Defina o caminho do arquivo PDF de entrada e o formato do arquivo de saída como “txt”.
  • Em seguida, crie uma instância da classe TxtConvertOptions.
  • Opcionalmente, defina várias opções de conversão como setFromPage, setPagesCount, etc.
  • Agora, defina as opções de conversão e o caminho do arquivo de saída usando a instância ConvertSettings.
  • Depois disso, crie a instância da classe ConvertDocumentRequest e passe o parâmetro ConvertSettings.
  • Por fim, chame o método convert\document() e passe o parâmetro ConvertDocumentRequest.

O trecho de código a seguir mostra como converter arquivo PDF em arquivo de texto em Java usando a API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Como converter documento PDF para arquivo TXT em Java usando a API REST
public class App {

  public static void main(String[] args) {
    
    // Crie uma instância da API de conversão
    ConvertApi apiInstance = new ConvertApi(configuration);
          
    try {
       
      // Preparar configurações de conversão
      ConvertSettings settings = new ConvertSettings();
      settings.setStorageName(MyStorage);
      settings.setFilePath("java-testing/input-sample-file.pdf");
      settings.setFormat("txt");
      
      TxtConvertOptions convertOptions = new TxtConvertOptions();
      convertOptions.setFromPage(3);
      convertOptions.setPagesCount(5);
        
      settings.setConvertOptions(convertOptions);
      settings.setOutputPath("java-testing/output-sample-file.txt");
    
      // converter para o formato especificado
      List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
      System.out.println("Document converted successfully: " + response);
      
    } catch (ApiException e) {
      System.err.println("Exception while calling Java API: ");
      e.printStackTrace();
    }
  }
}
Java converte PDF em arquivo de texto programaticamente em

Converta PDF para arquivo de texto programaticamente em Java.

Baixe o arquivo convertido

O exemplo de código acima salvará o arquivo de texto convertido na nuvem. Você pode baixá-lo usando o seguinte trecho de código:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Baixe o arquivo do armazenamento em nuvem em Java
public class App {

  public static void main(String[] args) {
        
    // Crie uma instância da API de conversão          
    FileApi apiInstance = new FileApi(configuration);
    try {
      DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
      File response = apiInstance.downloadFile(request);
      System.err.println("Expected response type is File: " + response.length());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

Conversor de PDF para Texto Online Gratuito

Como converter PDF para arquivos de texto online gratuitamente? Experimente um conversor online de PDF para texto para criar um arquivo de texto a partir de um documento PDF gratuitamente. Este conversor é desenvolvido usando o PDF acima mencionado em API de formato de texto.

convert pdf to text online

Conclusão

Isso nos leva ao final desta postagem no blog. O seguinte é o que você aprendeu com este artigo:

  • como converter PDFs programaticamente em arquivos de texto em Java usando GroupDocs.Conversion Cloud REST API;
  • carregue programaticamente o arquivo PDF para a nuvem e, em seguida, baixe o arquivo de texto convertido da nuvem;
  • e converta online PDF para texto usando um conversor de texto PDF gratuito.

Além disso, GroupDocs.Conversion Cloud REST API é uma ferramenta poderosa e fácil de usar para converter PDFs em arquivos de texto em Java. Ele também fornece uma seção Referência de API que permite visualizar e se comunicar com nossas APIs diretamente pelo navegador. O código-fonte completo do Java SDK está disponível gratuitamente no Github. Verifique o GroupDocs.Conversion Cloud SDK para Java Exemplos aqui.

Além disso, recomendamos que você consulte nosso Guia de primeiros passos.

Por fim, continuamos escrevendo novos artigos de blog sobre diferentes conversões de formatos de arquivo usando a API REST. Portanto, entre em contato para atualizações regulares.

Faça uma pergunta

Para qualquer dúvida sobre o conversor de PDF para texto, sinta-se à vontade para nos contatar no suporte gratuito fórum.

perguntas frequentes

Como configuro a API GroupDocs.Conversion Cloud REST em Java?

Para configurar a API GroupDocs.Conversion Cloud REST em Java, você precisará inscrever-se para uma conta, obter uma chave de API e, em seguida, integrar a API em seu projeto Java usando o SDK fornecido .

Posso converter vários documentos PDF em arquivos de texto de uma só vez?

Sim, você pode converter vários PDFs em arquivos de texto de uma só vez usando GroupDocs.Conversion Cloud REST API passando uma matriz de caminhos de arquivo ou URLs.

Posso converter PDF protegido por senha em arquivos de texto?

Sim, você pode converter PDFs protegidos por senha em arquivos de texto usando GroupDocs.Conversion Cloud REST API passando a senha como um parâmetro na solicitação da API.

Como converter PDF para texto online gratuitamente?

Conversor de documento PDF online para texto permite que você converta PDF para texto gratuitamente. Por favor, siga as instruções passo a passo fornecidas abaixo para a conversão:

  • Abra conversor gratuito de PDF para arquivo de texto online
  • Clique dentro da área de soltar arquivo para carregar um arquivo PDF ou arraste e solte um arquivo PDF.
  • Clique no botão Converter agora, o conversor online gratuito de PDF para texto transformará o PDF em um arquivo de texto.
  • O link de download do arquivo de texto de saída estará disponível instantaneamente após a conversão do arquivo PDF em texto.

Qual é a melhor maneira de converter um PDF em um arquivo de texto em Java?

A melhor maneira de converter um PDF em um arquivo de texto em Java é usar uma biblioteca ou API projetada especificamente para essa finalidade, como GroupDocs.Conversion Cloud REST API.

Como converter PDF em texto no Windows?

Visite este link para baixar um conversor offline de PDF para arquivo de texto para Windows. Este conversor de documento PDF para arquivo de texto pode ser usado para converter PDF em texto no Windows rapidamente, com um único clique.

Veja também

Se você quiser aprender sobre tópicos relacionados, recomendamos que você visite os seguintes artigos: