Convertissez un PDF en texte en Java avec l'API REST GroupDocs.Conversion Cloud.

Comment convertir un PDF en fichier texte par programmation en Java

PDF ou Portable Document Format est un format populaire pour le partage de documents, mais il peut être difficile de travailler avec des PDF lorsqu’il s’agit d’éditer ou d’extraire du texte. C’est ici que vous devez convertir des documents PDF en fichiers texte. La conversion de fichiers PDF en fichiers texte peut rendre le texte plus accessible, modifiable et consultable. Dans cet article de blog, nous expliquerons comment convertir un fichier PDF en fichier texte par programmation en Java à l’aide de l’API REST.

Les sujets suivants seront abordés dans ce didacticiel :

Java PDF en API REST de conversion de texte - Installation du SDK

Pour convertir des documents PDF en fichiers texte, j’utiliserai GroupDocs.Conversion Cloud SDK for Java. Il s’agit d’une solution API REST indépendante de la plate-forme pour la conversion de documents et d’images sans dépendre d’un logiciel tiers. Il vous permet également de convertir plus de 50 types de documents et d’images de n’importe quel format de fichier pris en charge vers n’importe quel format dont vous avez besoin. Vous pouvez rapidement convertir des documents d’un format à un autre comme Word, PDF, PowerPoint, Excel, HTML, CAO, images raster, etc.

Vous pouvez télécharger le fichier JAR de l’API ou l’installer à l’aide des configurations Maven. Ajoutez un référentiel et une dépendance au fichier POM.xml de votre projet. Voici les instructions pour Maven :

Référentiel Maven :

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dépendance Maven :

 <dependency>
    <groupId>com.groupdocs</groupId
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>23.4</version>
    <scope>compile</scope>
</dependency>

Après avoir intégré le SDK GroupDocs.Conversion Cloud dans votre projet Java, Inscrivez-vous pour un compte. Collectez votre ID client et votre secret client à partir du tableau de bord avant de commencer à suivre les étapes et les exemples de code disponibles. De plus, il est important de vérifier la documentation de l’API et les limites d’utilisation avant de l’utiliser. Veuillez entrer le code ci-dessous une fois que vous avez votre identifiant et votre secret :

# Obtenez votre client_id et client_secret sur https://dashboard.groupdocs.cloud après une inscription gratuite.

String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Comment convertir un document PDF en fichier TXT en Java à l’aide de l’API REST

Voici les étapes pour convertir un PDF en un document texte comme mentionné ci-dessous :

Télécharger le fichier

Tout d’abord, téléchargez le document PDF sur le stockage cloud en utilisant l’extrait de code comme indiqué ci-dessous :

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Importer un fichier dans Cloud Storage à l'aide de Java
public class App {

  public static void main(String[] args) {
        
    // Créer une instance de l'API de conversion          
    FileApi apiInstance = new FileApi(configuration);
    try {
      File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
      UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
      FilesUploadResult response = apiInstance.uploadFile(request);
      System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

Par conséquent, le fichier PDF téléchargé sera disponible dans la section des fichiers de votre tableau de bord sur le cloud.

Convertir un PDF en format texte en Java

Cette section explique comment convertir un document PDF en fichier texte par programmation en Java en suivant les étapes ci-dessous :

  • Tout d’abord, créez une instance de la classe ConvertApi.
  • Deuxièmement, créez une instance de la classe ConvertSettings.
  • Ensuite, indiquez le nom du stockage cloud.
  • Définissez le chemin du fichier PDF d’entrée et le format du fichier de sortie sur “txt”.
  • Ensuite, créez une instance de la classe TxtConvertOptions.
  • En option, définissez diverses options de conversion telles que setFromPage, setPagesCount, etc.
  • Maintenant, définissez les options de conversion et le chemin du fichier de sortie à l’aide de l’instance ConvertSettings.
  • Après cela, créez une instance de classe ConvertDocumentRequest et passez le paramètre ConvertSettings.
  • Enfin, appelez la méthode convert\document() et passez le paramètre ConvertDocumentRequest.

L’extrait de code suivant montre comment convertir un fichier PDF en fichier texte en Java à l’aide de l’API REST :

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Comment convertir un document PDF en fichier TXT en Java à l'aide de l'API REST
public class App {

  public static void main(String[] args) {
    
    // Créer une instance de l'API de conversion
    ConvertApi apiInstance = new ConvertApi(configuration);
          
    try {
       
      // Préparer les paramètres de conversion
      ConvertSettings settings = new ConvertSettings();
      settings.setStorageName(MyStorage);
      settings.setFilePath("java-testing/input-sample-file.pdf");
      settings.setFormat("txt");
      
      TxtConvertOptions convertOptions = new TxtConvertOptions();
      convertOptions.setFromPage(3);
      convertOptions.setPagesCount(5);
        
      settings.setConvertOptions(convertOptions);
      settings.setOutputPath("java-testing/output-sample-file.txt");
    
      // convertir au format spécifié
      List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
      System.out.println("Document converted successfully: " + response);
      
    } catch (ApiException e) {
      System.err.println("Exception while calling Java API: ");
      e.printStackTrace();
    }
  }
}
Java convertir PDF en fichier texte par programmation dans

Convertir un PDF en fichier texte par programmation en Java.

Télécharger le fichier converti

L’exemple de code ci-dessus enregistrera le fichier texte converti dans le cloud. Vous pouvez le télécharger à l’aide de l’extrait de code suivant :

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Télécharger le fichier à partir du Cloud Storage en Java
public class App {

  public static void main(String[] args) {
        
    // Créer une instance de l'API de conversion          
    FileApi apiInstance = new FileApi(configuration);
    try {
      DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
      File response = apiInstance.downloadFile(request);
      System.err.println("Expected response type is File: " + response.length());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

Convertisseur gratuit de PDF en texte en ligne

Comment convertir gratuitement des PDF en fichiers texte en ligne ? Veuillez essayer un convertisseur de PDF en texte en ligne pour créer gratuitement un fichier texte à partir d’un document PDF. Ce convertisseur est développé à l’aide de l’API de format PDF en texte mentionnée ci-dessus.

convert pdf to text online

Conclusion

Cela nous amène à la fin de cet article de blog. Voici ce que vous avez appris de cet article :

  • comment convertir par programmation des fichiers PDF en fichiers texte en Java à l’aide de l’API REST GroupDocs.Conversion Cloud ;
  • télécharger par programmation le fichier PDF dans le cloud, puis télécharger le fichier texte converti à partir du cloud ;
  • et convertir en ligne un PDF en texte à l’aide d’un convertisseur de texte PDF gratuit.

De plus, l’API GroupDocs.Conversion Cloud REST est un outil puissant et facile à utiliser pour convertir des PDF en fichiers texte en Java. Il fournit également une section API Reference qui vous permet de visualiser et de communiquer avec nos API directement via le navigateur. Le code source complet de Java SDK est disponible gratuitement sur Github. Veuillez consulter le SDK GroupDocs.Conversion Cloud pour Java Exemples ici.

De plus, nous vous encourageons à consulter notre Guide de démarrage.

Enfin, nous continuons à écrire de nouveaux articles de blog sur les conversions de différents formats de fichiers à l’aide de l’API REST. Alors, s’il vous plaît contactez-nous pour des mises à jour régulières.

poser une question

Pour toute question sur le convertisseur PDF en texte, n’hésitez pas à nous contacter sur le support gratuit forum.

FAQ

Comment configurer l’API REST GroupDocs.Conversion Cloud en Java ?

Pour configurer l’API REST GroupDocs.Conversion Cloud en Java, vous devrez vous inscrire pour un compte, obtenir une clé API, puis intégrer l’API dans votre projet Java à l’aide du SDK fourni .

Puis-je convertir plusieurs documents PDF en fichiers texte à la fois ?

Oui, vous pouvez convertir plusieurs fichiers PDF en fichiers texte à la fois à l’aide de l’API REST GroupDocs.Conversion Cloud en transmettant un tableau de chemins de fichiers ou d’URL.

Puis-je convertir un PDF protégé par mot de passe en fichiers texte ?

Oui, vous pouvez convertir des PDF protégés par mot de passe en fichiers texte à l’aide de l’API REST GroupDocs.Conversion Cloud en transmettant le mot de passe en tant que paramètre dans la demande d’API.

Comment convertir gratuitement un PDF en texte en ligne ?

Convertisseur de document PDF en texte en ligne vous permet de convertir gratuitement un PDF en texte. Veuillez suivre les instructions étape par étape données ci-dessous pour la conversion :

  • Ouvrez convertisseur de fichiers PDF en texte gratuit en ligne
  • Cliquez à l’intérieur de la zone de dépôt de fichier pour télécharger un fichier PDF ou faites glisser et déposez un fichier PDF.
  • Cliquez sur le bouton Convertir maintenant, le convertisseur PDF en texte en ligne gratuit transformera le PDF en fichier texte.
  • Le lien de téléchargement du fichier texte de sortie sera disponible instantanément après la conversion du fichier PDF en texte.

Quelle est la meilleure façon de convertir un PDF en fichier texte en Java ?

La meilleure façon de convertir un PDF en fichier texte en Java consiste à utiliser une bibliothèque ou API spécialement conçue à cet effet, telle que l’API REST GroupDocs.Conversion Cloud.

Comment convertir un PDF en texte sous Windows ?

Veuillez visiter ce lien pour télécharger un convertisseur de fichier PDF en texte hors ligne pour Windows. Ce convertisseur de document PDF en fichier texte peut être utilisé pour convertir rapidement un PDF en texte sur Windows, en un seul clic.

Voir également

Si vous souhaitez en savoir plus sur des sujets connexes, nous vous recommandons de consulter les articles suivants :