Програмно конвертуйте PDF у текст за допомогою REST API у Ruby

Програмно конвертуйте PDF у текст за допомогою REST API у Ruby

PDF – це формат файлу документа, який містить текст, дані тощо та не залежить від операційної системи. Файл TXT — це стандартний текстовий документ із розширенням .TXT, який містить звичайний текст у вигляді рядків. Його можна відкривати та редагувати в будь-якому інструменті редагування тексту чи обробки тексту. У деяких випадках вам може знадобитися програмно перетворити PDF-документ на текстовий файл. У цій статті ви дізнаєтесь, як програмно конвертувати PDF у текстовий файл за допомогою REST API у Ruby.

У цій статті будуть розглянуті такі теми:

PDF to TEXT Conversion REST API та Ruby SDK

Для перетворення PDF у файл TXT ми будемо використовувати Ruby SDK API GroupDocs.Conversion Cloud. Ви можете встановити його за допомогою такої команди в консолі rails:

gem install groupdocs_conversion_cloud

Будь ласка, отримайте свій ідентифікатор клієнта та секретну інформацію з GroupDocs інформаційна панель, перш ніж виконувати наведені нижче дії. Отримавши ідентифікатор клієнта та секрет клієнта, додайте їх у код програми Ruby, як показано нижче:

# Отримайте свій client_id і client_secret на https://dashboard.groupdocs.cloud після безкоштовної реєстрації.
# Завантажте камінь у свою програму ruby для http://api.groupdocs.cloud

require 'groupdocs_conversion_cloud'
@client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

Перетворюйте PDF у ТЕКСТОВИЙ файл за допомогою REST API у Ruby

Ви можете конвертувати файл PDF у текстовий файл, дотримуючись простих кроків, наведених нижче. Давайте дізнаємося, як програмно конвертувати PDF-документ у текстовий файл, виконавши наведені нижче дії.

  • По-перше, створіть екземпляр ConvertApi.
  • Створіть екземпляр ConvertSettings
  • Встановіть шлях вхідного PDF-документа та вихідний формат як “pdf”
  • Створіть екземпляр PdfLoadOptions
  • Встановити пароль для файлу pdf
  • Потім надайте параметри завантаження
  • Укажіть шлях вихідного файлу “pdf-to-text”
  • Створіть ConvertDocumentRequest за допомогою ConvertSettings
  • Нарешті, викличте метод ConvertApi.convertDocument() за допомогою ConvertDocumentRequest.

У наведеному нижче прикладі коду показано, як конвертувати PDF-документ у ТЕКСТОВИЙ файл за допомогою REST API у Ruby:

# Як конвертувати файл PDF у файл TXT.
# Створіть екземпляр API
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# Ініціалізація параметрів перетворення
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

settings.load_options = loadOptions
settings.output_path = "pdf-to-text"

# Конвертуйте за допомогою конвертера PDF у TEXT
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf document to text file.")

Наведений вище приклад коду збереже перетворений файл TEXT у хмарі.

Перетворення окремих сторінок PDF-файлу на ТЕКСТ у Ruby

Ви можете програмно перетворити певні сторінки PDF-документа на текстовий файл, виконавши наведені нижче дії.

  • По-перше, створіть екземпляр ConvertApi.
  • Далі створіть екземпляр ConvertSettings
  • Установіть шлях вхідного PDF-документа та вихідний формат як «pdf»
  • Потім створіть екземпляр PdfLoadOptions
  • Встановити пароль для файлу pdf
  • Створіть екземпляр TxtConvertOptions
  • Для перетворення введіть номери сторінок у масиві, розділеному комами
  • Потім надайте об’єкт налаштувань loadOptions
  • Призначте convertOptions об’єкту налаштувань
  • Укажіть вихідний шлях файлу «pdf-to-text»
  • Створіть ConvertDocumentRequest за допомогою ConvertSettings
  • Нарешті, викличте метод ConvertApi.convertDocument() за допомогою ConvertDocumentRequest.

У наведеному нижче прикладі коду показано, як конвертувати певні сторінки з PDF у текстовий за допомогою REST API у Ruby:

# Перетворення певних сторінок PDF-файлу на текстовий файл
# Створіть необхідні екземпляри API
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# Ініціалізація параметрів перетворення
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

convertOptions = GroupDocsConversionCloud::TxtConvertOptions.new
convertOptions.pages = [2, 3]

settings.load_options = loadOptions
settings.convert_options = convertOptions
settings.output_path = "pdf-to-text"

# Перетворіть окремі сторінки PDF-файлу на TXT
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf to text file.")

Безкоштовний онлайн-конвертер TXT у PDF

Як конвертувати PDF у текстовий файл онлайн? Конвертуйте PDF у TXT онлайн безкоштовно за допомогою нашого найкращого безкоштовного конвертера з PDF у TXT. Цей безкоштовний конвертер PDF-тексту було розроблено з використанням наведеного вище API конвертації PDF-тексту.

Підводячи підсумки

У цій статті ми дізналися, як:

  • як конвертувати pdf в текстовий файл за допомогою ruby;
  • як конвертувати певні сторінки pdf в текст у рубіні;

Ви можете дізнатися більше про API конвертера файлів GroupDocs.Conversion, використовуючи документацію. Ми також надаємо розділ API Reference, який дозволяє візуалізувати наші API та спілкуватися з ними безпосередньо через браузер.

Задайте питання

Якщо у вас виникли запитання щодо конвертера PDF-текст, надішліть їх на безкоштовному форумі підтримки.

Дивись також