Convierta PDF a texto en Java con GroupDocs.Conversion Cloud REST API.

Cómo convertir PDF a archivo de texto mediante programación en Java

PDF o formato de documento portátil es un formato popular para compartir documentos, pero puede ser difícil trabajar con archivos PDF cuando se trata de editar o extraer texto. Aquí es donde necesita convertir documentos PDF a archivos texto. La conversión de archivos PDF a archivos de texto puede hacer que el texto sea más accesible, editable y buscable. En esta publicación de blog, presentaremos cómo convertir PDF a archivo de texto mediante programación en Java utilizando la API REST.

En este tutorial se tratarán los siguientes temas:

API REST de conversión de PDF a texto de Java: instalación de SDK

Para convertir documentos PDF en archivos de texto, usaré GroupDocs.Conversion Cloud SDK for Java. Es una solución API REST independiente de la plataforma para la conversión de documentos e imágenes sin depender de ningún software de terceros. También le permite convertir más de 50 tipos de documentos e imágenes de cualquier formato de archivo compatible a cualquier formato que necesite. Puede convertir rápidamente documentos de un formato a otro como Word, PDF, PowerPoint, Excel, HTML, CAD, imágenes rasterizadas, etc.

Puede descargar el archivo JAR de la API o instalarlo usando las configuraciones de Maven. Agregue repositorio y dependencia al archivo POM.xml de su proyecto. A continuación se muestran las instrucciones para Maven:

Repositorio Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dependencia Maven:

 <dependency>
    <groupId>com.groupdocs</groupId
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>23.4</version>
    <scope>compile</scope>
</dependency>

Después de integrar GroupDocs.Conversion Cloud SDK en su proyecto Java, regístrese para obtener una cuenta. Recopile su ID de cliente y Secreto de cliente del panel de control antes de comenzar a seguir los pasos y los ejemplos de código disponibles. Además, es importante consultar la documentación de la API y los límites de uso antes de usarla. Ingrese el código que se muestra a continuación una vez que tenga su identificación y secreto:

# Obtenga su client_id y client_secret de https://dashboard.groupdocs.cloud después del registro gratuito.

String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Cómo convertir un documento PDF a un archivo TXT en Java usando la API REST

Los siguientes son los pasos para convertir un PDF a un documento de texto como se menciona a continuación:

Sube el archivo

En primer lugar, cargue el documento PDF en el almacenamiento en la nube utilizando el fragmento de código que se indica a continuación:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Subir archivo al almacenamiento en la nube usando Java
public class App {

  public static void main(String[] args) {
        
    // Crear una instancia de la API de conversión          
    FileApi apiInstance = new FileApi(configuration);
    try {
      File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
      UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
      FilesUploadResult response = apiInstance.uploadFile(request);
      System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

Como resultado, el archivo PDF cargado estará disponible en la sección de archivos de su tablero en la nube.

Convierta PDF a formato de texto en Java

Esta sección trata sobre cómo convertir un documento PDF en un archivo de texto mediante programación en Java siguiendo los pasos a continuación:

  • En primer lugar, cree una instancia de la clase ConvertApi.
  • En segundo lugar, cree una instancia de la clase ConvertSettings.
  • A continuación, proporcione el nombre de almacenamiento en la nube.
  • Establezca la ruta del archivo PDF de entrada y el formato del archivo de salida como “txt”.
  • Luego, cree una instancia de la clase TxtConvertOptions.
  • Opcionalmente, configure varias opciones de conversión como setFromPage, setPagesCount, etc.
  • Ahora, configure las opciones de conversión y la ruta del archivo de salida usando la instancia ConvertSettings.
  • Después de eso, cree la instancia de la clase ConvertDocumentRequest y pase el parámetro ConvertSettings.
  • Finalmente, llame al método convert\document() y pase el parámetro ConvertDocumentRequest.

El siguiente fragmento de código muestra cómo convertir un archivo PDF a un archivo de texto en Java utilizando la API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Cómo convertir un documento PDF a un archivo TXT en Java usando la API REST
public class App {

  public static void main(String[] args) {
    
    // Crear una instancia de la API de conversión
    ConvertApi apiInstance = new ConvertApi(configuration);
          
    try {
       
      // Preparar la configuración de conversión
      ConvertSettings settings = new ConvertSettings();
      settings.setStorageName(MyStorage);
      settings.setFilePath("java-testing/input-sample-file.pdf");
      settings.setFormat("txt");
      
      TxtConvertOptions convertOptions = new TxtConvertOptions();
      convertOptions.setFromPage(3);
      convertOptions.setPagesCount(5);
        
      settings.setConvertOptions(convertOptions);
      settings.setOutputPath("java-testing/output-sample-file.txt");
    
      // convertir al formato especificado
      List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
      System.out.println("Document converted successfully: " + response);
      
    } catch (ApiException e) {
      System.err.println("Exception while calling Java API: ");
      e.printStackTrace();
    }
  }
}
Java convierte PDF a archivo de texto mediante programación en

Convierta PDF a archivo de texto mediante programación en Java.

Descargar el archivo convertido

El ejemplo de código anterior guardará el archivo de texto convertido en la nube. Puede descargarlo utilizando el siguiente fragmento de código:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Descargar archivo desde el almacenamiento en la nube en Java
public class App {

  public static void main(String[] args) {
        
    // Crear una instancia de la API de conversión          
    FileApi apiInstance = new FileApi(configuration);
    try {
      DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
      File response = apiInstance.downloadFile(request);
      System.err.println("Expected response type is File: " + response.length());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

Convertidor de PDF a texto en línea gratuito

¿Cómo convertir PDF a archivos de texto en línea de forma gratuita? Pruebe un conversor de PDF a texto en línea para crear un archivo de texto a partir de un documento PDF de forma gratuita. Este convertidor se desarrolla utilizando la API de formato PDF a texto mencionada anteriormente.

convert pdf to text online

Conclusión

Esto nos lleva al final de esta publicación de blog. Lo siguiente es lo que has aprendido de este artículo:

  • cómo convertir archivos PDF a archivos de texto mediante programación en Java usando GroupDocs.Conversion Cloud REST API;
  • cargue mediante programación el archivo PDF en la nube y luego descargue el archivo de texto convertido de la nube;
  • y convertir en línea PDF a texto usando un convertidor de texto PDF gratuito.

Además, GroupDocs.Conversion Cloud REST API es una herramienta poderosa y fácil de usar para convertir archivos PDF a archivos de texto en Java. También proporciona una sección Referencia de API que le permite visualizar y comunicarse con nuestras API directamente a través del navegador. El código fuente completo de Java SDK está disponible gratuitamente en Github. Consulte GroupDocs.Conversion Cloud SDK para Java Ejemplos aquí.

Además, le recomendamos que consulte nuestra Guía de introducción.

Finalmente, seguimos escribiendo nuevos artículos de blog sobre conversiones de diferentes formatos de archivo utilizando la API REST. Por lo tanto, póngase en contacto para recibir actualizaciones periódicas.

Hacer una pregunta

Para cualquier consulta sobre el convertidor de PDF a texto, no dude en contactarnos en el [foro] de soporte gratuito 22.

preguntas frecuentes

¿Cómo configuro la API REST de GroupDocs.Conversion Cloud en Java?

Para configurar la API REST de GroupDocs.Conversion Cloud en Java, deberá registrarse para obtener una cuenta, obtener una clave de API y luego integrar la API en su proyecto Java utilizando el SDK proporcionado .

¿Puedo convertir varios documentos PDF en archivos de texto a la vez?

Sí, puede convertir varios archivos PDF en archivos de texto a la vez usando GroupDocs.Conversion Cloud REST API al pasar una matriz de rutas de archivo o URL.

¿Puedo convertir archivos PDF protegidos con contraseña en archivos de texto?

Sí, puede convertir archivos PDF protegidos con contraseña en archivos de texto usando GroupDocs.Conversion Cloud REST API al pasar la contraseña como un parámetro en la solicitud de API.

¿Cómo convertir PDF a texto en línea gratis?

Conversor de documentos PDF a texto en línea le permite convertir PDF a texto de forma gratuita. Siga las instrucciones paso a paso que se dan a continuación para la conversión:

  • Abrir conversor de archivos PDF a texto gratuito en línea
  • Haga clic dentro del área de colocación de archivos para cargar un archivo PDF o arrastre y suelte un archivo PDF.
  • Haga clic en el botón Convertir ahora, el convertidor de PDF a texto en línea gratuito transformará el PDF en un archivo de texto.
  • El enlace de descarga del archivo de texto de salida estará disponible instantáneamente después de convertir el archivo PDF a texto.

¿Cuál es la mejor manera de convertir un PDF a un archivo de texto en Java?

La mejor manera de convertir un PDF a un archivo de texto en Java es usar una biblioteca o API diseñada específicamente para este propósito, como GroupDocs.Conversion Cloud REST API.

¿Cómo convertir PDF a texto en Windows?

Visite este enlace para descargar un convertidor de archivos PDF a texto sin conexión para Windows. Este convertidor de documentos PDF a archivos de texto se puede usar para convertir PDF a texto en Windows rápidamente, con un solo clic.

Ver también

Si quieres informarte sobre temas relacionados te recomendamos visitar los siguientes artículos: