PDF es un formato de archivo de documento que contiene texto, datos, etc. y es independiente del sistema operativo. Un archivo TXT es un documento de texto estándar con extensión .TXT que contiene texto sin formato en forma de líneas. Se puede abrir y editar en cualquier herramienta de edición o procesamiento de texto. En ciertos casos, es posible que deba convertir un documento PDF en un archivo de texto mediante programación. En este artículo, aprenderá cómo convertir PDF a archivo de texto mediante programación utilizando la API REST en Ruby.
En este artículo se tratarán los siguientes temas:
- API REST de conversión de PDF a TEXTO y SDK de Ruby
- Convierta PDF a archivo de TEXTO usando REST API en Ruby
- Convierta páginas específicas de PDF a TEXTO en Ruby
- Convertidor de TXT a PDF gratuito en línea
API REST de conversión de PDF a TEXTO y SDK de Ruby
Para convertir archivos PDF a TXT, usaremos Ruby SDK of GroupDocs.Conversion Cloud API. Puede instalarlo usando el siguiente comando en la consola de Rails:
gem install groupdocs_conversion_cloud
Por favor, obtenga su ID de cliente y secreto del panel de control de GroupDocs antes de seguir los pasos mencionados a continuación. Una vez que tenga su ID de cliente y Secreto de cliente, agréguelos en el código de la aplicación Ruby como se muestra a continuación:
# Obtenga su client_id y client_secret de https://dashboard.groupdocs.cloud después del registro gratuito.
# Cargue la gema en su aplicación Ruby para http://api.groupdocs.cloud
require 'groupdocs_conversion_cloud'
@client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
Convierta PDF a archivo de TEXTO usando REST API en Ruby
Puede convertir un archivo PDF a un archivo de texto siguiendo los sencillos pasos que se indican a continuación. Aprendamos cómo convertir un documento PDF a un archivo de texto mediante programación siguiendo los pasos que se indican a continuación:
- En primer lugar, cree una instancia de ConvertApi.
- Cree una instancia de ConvertSettings
- Establezca la ruta del documento PDF de entrada y el formato de salida como “pdf”
- Cree una instancia de PdfLoadOptions
- Establecer la contraseña para el archivo pdf
- Luego, proporcione la configuración de opciones de carga
- Proporcione la ruta del archivo de salida “pdf-to-text”
- Crear ConvertDocumentRequest con ConvertSettings
- Finalmente, llame al método ConvertApi.convertDocument() con ConvertDocumentRequest.
El siguiente ejemplo de código muestra cómo convertir un documento PDF a un archivo de TEXTO usando la API REST en Ruby:
# Cómo convertir archivos PDF a TXT.
# Crear instancia de API
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)
# Inicializar la configuración de conversión
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"
loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"
settings.load_options = loadOptions
settings.output_path = "pdf-to-text"
# Convierta usando el convertidor de PDF a TEXTO
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf document to text file.")
El código de muestra anterior guardará el archivo de TEXTO convertido en la nube.
Convierta páginas específicas de PDF a TEXTO en Ruby
Puede convertir páginas específicas de un documento PDF a un archivo de texto mediante programación siguiendo los pasos que se detallan a continuación:
- En primer lugar, cree una instancia de ConvertApi.
- A continuación, cree una instancia de ConvertSettings
- Establezca la ruta del documento PDF de entrada y el formato de salida como “pdf”
- Luego, cree una instancia de PdfLoadOptions
- Establecer la contraseña para el archivo pdf
- Crear una instancia de TxtConvertOptions
- Proporcione números de página en una matriz separada por comas para convertir
- Luego, proporcione el objeto de configuración loadOptions
- Asignar convertOptions al objeto de configuración
- Proporcione la ruta del archivo de salida “pdf-to-text”
- Crear ConvertDocumentRequest con ConvertSettings
- Finalmente, llame al método ConvertApi.convertDocument() con ConvertDocumentRequest.
El siguiente ejemplo de código muestra cómo convertir páginas específicas de PDF a texto usando la API REST en Ruby:
# Convierta páginas específicas de PDF a archivo de TEXTO
# Crear las instancias de API necesarias
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)
# Inicializar la configuración de conversión
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"
loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"
convertOptions = GroupDocsConversionCloud::TxtConvertOptions.new
convertOptions.pages = [2, 3]
settings.load_options = loadOptions
settings.convert_options = convertOptions
settings.output_path = "pdf-to-text"
# Convierte páginas específicas de PDF a TXT
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf to text file.")
Convertidor de TXT a PDF en línea gratuito
¿Cómo convertir PDF a archivo de texto en línea? Convierta PDF a TXT en línea gratis usando nuestro mejor convertidor de pdf a TXT gratis. Este convertidor gratuito de pdf a texto se desarrolló utilizando la API de conversión de pdf a texto anterior.
Resumiendo
En este artículo, hemos aprendido a:
- cómo convertir pdf a archivo de texto usando ruby;
- cómo convertir páginas específicas de pdf a texto en ruby;
Puede obtener más información sobre la API del convertidor de archivos GroupDocs.Conversion utilizando la documentación. También proporcionamos una sección Referencia de API que le permite visualizar y comunicarse con nuestras API directamente a través del navegador.
Hacer una pregunta
Si tiene alguna consulta sobre el convertidor de PDF a texto, no dude en consultarnos en el Foro de soporte gratuito.