Преобразование PDF в текст программно с использованием REST API в Ruby

Преобразование PDF в текст программно с использованием REST API в Ruby

PDF — это формат файла документа, который содержит текст, данные и т. д. и не зависит от операционной системы. Файл TXT — это стандартный текстовый документ с расширением .TXT, который содержит обычный текст в виде строк. Его можно открыть и отредактировать в любом текстовом редакторе или текстовом редакторе. В некоторых случаях вам может потребоваться программно преобразовать PDF-документ в текстовый файл. В этой статье вы узнаете, как программно преобразовать PDF в текстовый файл с помощью REST API в Ruby.

В этой статье должны быть раскрыты следующие темы:

Преобразование PDF в текст REST API и Ruby SDK

Для преобразования PDF в файл TXT мы будем использовать Ruby SDK of GroupDocs.Conversion Cloud API. Вы можете установить его, используя следующую команду в консоли rails:

gem install groupdocs_conversion_cloud

Пожалуйста, получите свой идентификатор клиента и секрет из GroupDocs Dashboard, прежде чем выполнять указанные ниже шаги. Получив идентификатор клиента и секрет клиента, добавьте их в код приложения ruby, как показано ниже:

# Получите свой client_id и client_secret с https://dashboard.groupdocs.cloud после бесплатной регистрации.
# Загрузите драгоценный камень в свое приложение ruby для http://api.groupdocs.cloud.

require 'groupdocs_conversion_cloud'
@client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

Преобразование PDF в текстовый файл с помощью REST API в Ruby

Вы можете преобразовать файл PDF в текстовый файл, выполнив простые шаги, указанные ниже. Давайте узнаем, как программно конвертировать PDF-документ в текстовый файл, выполнив следующие действия:

  • Во-первых, создайте экземпляр ConvertApi.
  • Создайте экземпляр ConvertSettings
  • Установите путь к входному PDF-документу и выходной формат как «pdf».
  • Создайте экземпляр PdfLoadOptions
  • Установите пароль для pdf-файла
  • Затем укажите параметры загрузки.
  • Укажите путь к выходному файлу «pdf-to-text».
  • Создайте ConvertDocumentRequest с ConvertSettings
  • Наконец, вызовите метод ConvertApi.convertDocument() с ConvertDocumentRequest.

В следующем примере кода показано, как преобразовать PDF-документ в текстовый файл с помощью REST API в Ruby:

# Как конвертировать PDF в TXT файл.
# Создать экземпляр API
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# Инициализировать настройки преобразования
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

settings.load_options = loadOptions
settings.output_path = "pdf-to-text"

# Преобразование с помощью конвертера PDF в TEXT
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf document to text file.")

Приведенный выше пример кода сохранит преобразованный файл TEXT в облаке.

Преобразование определенных страниц PDF в текст в Ruby

Вы можете программно преобразовать определенные страницы документа PDF в текстовый файл, выполнив следующие действия:

  • Во-первых, создайте экземпляр ConvertApi.
  • Затем создайте экземпляр ConvertSettings
  • Установите путь к входному PDF-документу и выходной формат как «pdf».
  • Затем создайте экземпляр PdfLoadOptions.
  • Установите пароль для pdf-файла
  • Создайте экземпляр TxtConvertOptions
  • Укажите номера страниц в массиве, разделенном запятыми, для преобразования
  • Затем предоставьте объект настроек loadOptions
  • Назначить convertOptions объекту настроек
  • Укажите путь к выходному файлу «pdf-to-text».
  • Создайте ConvertDocumentRequest с ConvertSettings
  • Наконец, вызовите метод ConvertApi.convertDocument() с ConvertDocumentRequest.

В следующем примере кода показано, как преобразовать определенные страницы из PDF в текст с помощью REST API в Ruby:

# Преобразование определенных страниц PDF в текстовый файл
# Создайте необходимые экземпляры API
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# Инициализировать настройки преобразования
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

convertOptions = GroupDocsConversionCloud::TxtConvertOptions.new
convertOptions.pages = [2, 3]

settings.load_options = loadOptions
settings.convert_options = convertOptions
settings.output_path = "pdf-to-text"

# Преобразование определенных страниц PDF в TXT
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf to text file.")

Бесплатный онлайн-конвертер TXT в PDF

Как конвертировать PDF в текстовый файл онлайн? Конвертируйте PDF в TXT онлайн бесплатно с помощью нашего лучшего бесплатного конвертера pdf в TXT. Этот бесплатный конвертер PDF в текст был разработан с использованием вышеуказанного API конвертации PDF в текст.

Подведение итогов

В этой статье мы узнали, как:

  • как конвертировать pdf в текстовый файл с помощью ruby;
  • как преобразовать определенные страницы pdf в текст на рубине;

Вы можете узнать больше об API конвертера файлов GroupDocs.Conversion, используя документацию. Мы также предоставляем раздел Справочник по API, который позволяет вам визуализировать и взаимодействовать с нашими API напрямую через браузер.

Задайте вопрос

Если у вас есть какие-либо вопросы о конвертере PDF в текст, задайте их нам на Форуме бесплатной поддержки.

Смотрите также