Convierta PDF a texto mediante programación usando REST API en Ruby

Convierta PDF a texto mediante programación usando REST API en Ruby

PDF es un formato de archivo de documento que contiene texto, datos, etc. y es independiente del sistema operativo. Un archivo TXT es un documento de texto estándar con extensión .TXT que contiene texto sin formato en forma de líneas. Se puede abrir y editar en cualquier herramienta de edición o procesamiento de texto. En ciertos casos, es posible que deba convertir un documento PDF en un archivo de texto mediante programación. En este artículo, aprenderá cómo convertir PDF a archivo de texto mediante programación utilizando la API REST en Ruby.

En este artículo se tratarán los siguientes temas:

API REST de conversión de PDF a TEXTO y SDK de Ruby

Para convertir archivos PDF a TXT, usaremos Ruby SDK of GroupDocs.Conversion Cloud API. Puede instalarlo usando el siguiente comando en la consola de Rails:

gem install groupdocs_conversion_cloud

Por favor, obtenga su ID de cliente y secreto del panel de control de GroupDocs antes de seguir los pasos mencionados a continuación. Una vez que tenga su ID de cliente y Secreto de cliente, agréguelos en el código de la aplicación Ruby como se muestra a continuación:

# Obtenga su client_id y client_secret de https://dashboard.groupdocs.cloud después del registro gratuito.
# Cargue la gema en su aplicación Ruby para http://api.groupdocs.cloud

require 'groupdocs_conversion_cloud'
@client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

Convierta PDF a archivo de TEXTO usando REST API en Ruby

Puede convertir un archivo PDF a un archivo de texto siguiendo los sencillos pasos que se indican a continuación. Aprendamos cómo convertir un documento PDF a un archivo de texto mediante programación siguiendo los pasos que se indican a continuación:

  • En primer lugar, cree una instancia de ConvertApi.
  • Cree una instancia de ConvertSettings
  • Establezca la ruta del documento PDF de entrada y el formato de salida como “pdf”
  • Cree una instancia de PdfLoadOptions
  • Establecer la contraseña para el archivo pdf
  • Luego, proporcione la configuración de opciones de carga
  • Proporcione la ruta del archivo de salida “pdf-to-text”
  • Crear ConvertDocumentRequest con ConvertSettings
  • Finalmente, llame al método ConvertApi.convertDocument() con ConvertDocumentRequest.

El siguiente ejemplo de código muestra cómo convertir un documento PDF a un archivo de TEXTO usando la API REST en Ruby:

# Cómo convertir archivos PDF a TXT.
# Crear instancia de API
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# Inicializar la configuración de conversión
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

settings.load_options = loadOptions
settings.output_path = "pdf-to-text"

# Convierta usando el convertidor de PDF a TEXTO
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf document to text file.")

El código de muestra anterior guardará el archivo de TEXTO convertido en la nube.

Convierta páginas específicas de PDF a TEXTO en Ruby

Puede convertir páginas específicas de un documento PDF a un archivo de texto mediante programación siguiendo los pasos que se detallan a continuación:

  • En primer lugar, cree una instancia de ConvertApi.
  • A continuación, cree una instancia de ConvertSettings
  • Establezca la ruta del documento PDF de entrada y el formato de salida como “pdf”
  • Luego, cree una instancia de PdfLoadOptions
  • Establecer la contraseña para el archivo pdf
  • Crear una instancia de TxtConvertOptions
  • Proporcione números de página en una matriz separada por comas para convertir
  • Luego, proporcione el objeto de configuración loadOptions
  • Asignar convertOptions al objeto de configuración
  • Proporcione la ruta del archivo de salida “pdf-to-text”
  • Crear ConvertDocumentRequest con ConvertSettings
  • Finalmente, llame al método ConvertApi.convertDocument() con ConvertDocumentRequest.

El siguiente ejemplo de código muestra cómo convertir páginas específicas de PDF a texto usando la API REST en Ruby:

# Convierta páginas específicas de PDF a archivo de TEXTO
# Crear las instancias de API necesarias
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# Inicializar la configuración de conversión
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

convertOptions = GroupDocsConversionCloud::TxtConvertOptions.new
convertOptions.pages = [2, 3]

settings.load_options = loadOptions
settings.convert_options = convertOptions
settings.output_path = "pdf-to-text"

# Convierte páginas específicas de PDF a TXT
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf to text file.")

Convertidor de TXT a PDF en línea gratuito

¿Cómo convertir PDF a archivo de texto en línea? Convierta PDF a TXT en línea gratis usando nuestro mejor convertidor de pdf a TXT gratis. Este convertidor gratuito de pdf a texto se desarrolló utilizando la API de conversión de pdf a texto anterior.

Resumiendo

En este artículo, hemos aprendido a:

  • cómo convertir pdf a archivo de texto usando ruby;
  • cómo convertir páginas específicas de pdf a texto en ruby;

Puede obtener más información sobre la API del convertidor de archivos GroupDocs.Conversion utilizando la documentación. También proporcionamos una sección Referencia de API que le permite visualizar y comunicarse con nuestras API directamente a través del navegador.

Hacer una pregunta

Si tiene alguna consulta sobre el convertidor de PDF a texto, no dude en consultarnos en el Foro de soporte gratuito.

Ver también