Convertir un PDF en texte par programme à l'aide de l'API REST dans Ruby

Convertir un PDF en texte par programme à l’aide de l’API REST dans Ruby

PDF est un format de fichier de document qui contient du texte, des données, etc. et qui est indépendant du système d’exploitation. Un fichier TXT est un document texte standard avec l’extension .TXT qui contient du texte brut sous forme de lignes. Il peut être ouvert et modifié dans n’importe quel outil d’édition de texte ou de traitement de texte. Dans certains cas, vous devrez peut-être convertir un document PDF en fichier texte par programmation. Dans cet article, vous apprendrez comment convertir un fichier PDF en fichier texte par programme à l’aide de l’API REST dans Ruby.

Les sujets suivants seront traités dans cet article :

API REST de conversion PDF en texte et SDK Ruby

Pour convertir un fichier PDF en fichier TXT, nous utiliserons le Ruby SDK of GroupDocs.Conversion Cloud API. Vous pouvez l’installer à l’aide de la commande suivante dans la console rails :

gem install groupdocs_conversion_cloud

Veuillez obtenir votre ID client et votre secret à partir du tableau de bord de GroupDocs avant de suivre les étapes mentionnées ci-dessous. Une fois que vous avez votre ID client et votre secret client, ajoutez-les dans le code d’application ruby comme indiqué ci-dessous :

# Obtenez votre client_id et client_secret sur https://dashboard.groupdocs.cloud après une inscription gratuite.
# Chargez la gemme dans votre application ruby pour http://api.groupdocs.cloud

require 'groupdocs_conversion_cloud'
@client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

Convertir un fichier PDF en fichier texte à l’aide de l’API REST dans Ruby

Vous pouvez convertir un fichier PDF en fichier texte en suivant les étapes simples indiquées ci-dessous. Apprenons à convertir un document PDF en fichier texte par programme en suivant les étapes ci-dessous :

  • Tout d’abord, créez une instance de ConvertApi.
  • Créer une instance de ConvertSettings
  • Définissez le chemin du document PDF d’entrée et le format de sortie sur “pdf”
  • Créer une instance de PdfLoadOptions
  • Définir le mot de passe pour le fichier pdf
  • Ensuite, fournissez les paramètres d’options de chargement
  • Indiquez le chemin du fichier de sortie “pdf-to-text”
  • Créer ConvertDocumentRequest avec ConvertSettings
  • Enfin, appelez la méthode ConvertApi.convertDocument() avec ConvertDocumentRequest.

L’exemple de code suivant montre comment convertir un document PDF en fichier TEXT à l’aide de l’API REST dans Ruby :

# Comment convertir un PDF en fichier TXT.
# Créer une instance d'API
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# Initialiser les paramètres de conversion
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

settings.load_options = loadOptions
settings.output_path = "pdf-to-text"

# Convertir à l'aide du convertisseur PDF en TEXTE
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf document to text file.")

L’exemple de code ci-dessus enregistrera le fichier TEXT converti sur le cloud.

Convertir des pages spécifiques de PDF en TEXTE en Ruby

Vous pouvez convertir des pages spécifiques d’un document PDF en fichier texte par programmation en suivant les étapes ci-dessous :

  • Tout d’abord, créez une instance de ConvertApi.
  • Ensuite, créez une instance de ConvertSettings
  • Définissez le chemin du document PDF d’entrée et le format de sortie sur “pdf”
  • Ensuite, créez une instance de PdfLoadOptions
  • Définir le mot de passe pour le fichier pdf
  • Créer une instance de TxtConvertOptions
  • Fournissez les numéros de page dans un tableau séparé par des virgules pour convertir
  • Ensuite, fournissez l’objet de paramètres loadOptions
  • Affecter convertOptions à l’objet de paramètres
  • Indiquez le chemin du fichier de sortie “pdf-to-text”
  • Créer ConvertDocumentRequest avec ConvertSettings
  • Enfin, appelez la méthode ConvertApi.convertDocument() avec ConvertDocumentRequest.

L’exemple de code suivant montre comment convertir des pages spécifiques de PDF en texte à l’aide de l’API REST dans Ruby :

# Convertir des pages spécifiques de PDF en fichier TEXT
# Créer les instances d'API nécessaires
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# Initialiser les paramètres de conversion
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

convertOptions = GroupDocsConversionCloud::TxtConvertOptions.new
convertOptions.pages = [2, 3]

settings.load_options = loadOptions
settings.convert_options = convertOptions
settings.output_path = "pdf-to-text"

# Convertir des pages spécifiques de PDF en TXT
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf to text file.")

Convertisseur TXT en PDF en ligne gratuit

Comment convertir un PDF en fichier texte en ligne ? Convertissez PDF en TXT en ligne gratuitement en utilisant notre meilleur convertisseur pdf en TXT gratuit. Ce convertisseur gratuit de pdf en texte a été développé à l’aide de l’API de conversion de pdf en texte ci-dessus.

Résumé

Dans cet article, nous avons appris à :

  • comment convertir un pdf en fichier texte en utilisant ruby ;
  • comment convertir des pages spécifiques de pdf en texte en ruby ;

Vous pouvez en savoir plus sur l’API de conversion de fichiers GroupDocs.Conversion à l’aide de la documentation. Nous fournissons également une section API Reference qui vous permet de visualiser et de communiquer avec nos API directement via le navigateur.

poser une question

Si vous avez des questions sur le convertisseur PDF en texte, n’hésitez pas à nous les poser sur le Forum d’assistance gratuit.

Voir également