在 Ruby 中使用 REST API 以編程方式將 PDF 轉換為文本

在 Ruby 中使用 REST API 以編程方式將 PDF 轉換為文本

PDF 是一種文檔文件格式,包含文本、數據等,並且與操作系統無關。 TXT 文件是擴展名為 .TXT 的標准文本文檔,其中包含行形式的純文本。它可以在任何文本編輯或文字處理工具中打開和編輯。在某些情況下,您可能需要以編程方式將 PDF 文檔轉換為文本文件。在本文中,您將了解如何使用 Ruby 中的 REST API 以編程方式將 PDF 轉換為文本文件。

本文應涵蓋以下主題:

PDF 到文本轉換 REST API 和 Ruby SDK

為了將 PDF 轉換為 TXT 文件,我們將使用 GroupDocs.Conversion Cloud API 的 Ruby SDK。您可以在 Rails 控制台中使用以下命令安裝它:

gem install groupdocs_conversion_cloud

在執行以下提到的步驟之前,請從 GroupDocs 儀表板 獲取您的客戶端 ID 和密碼。獲得客戶端 ID 和客戶端密碼後,將它們添加到 ruby 應用程序代碼中,如下所示:

# 免費註冊後,從 https://dashboard.groupdocs.cloud 獲取您的 client_id 和 client_secret。
# 在你的 ruby 應用程序中為 http://api.groupdocs.cloud 加載 gem

require 'groupdocs_conversion_cloud'
@client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

在 Ruby 中使用 REST API 將 PDF 轉換為文本文件

您可以按照下面給出的簡單步驟將 PDF 文件轉換為文本文件。讓我們按照以下步驟學習如何以編程方式將 PDF 文檔轉換為文本文件:

  • 首先,創建一個 ConvertApi 的實例。
  • 創建 ConvertSettings 的實例
  • 設置輸入PDF文檔路徑和輸出格式為“pdf”
  • 創建 PdfLoadOptions 的實例
  • 為pdf文件設置密碼
  • 然後,提供加載選項設置
  • 提供輸出文件路徑“pdf-to-text”
  • 使用 ConvertSettings 創建 ConvertDocumentRequest
  • 最後,使用 ConvertDocumentRequest 調用 ConvertApi.convertDocument() 方法。

以下代碼示例顯示瞭如何在 Ruby 中使用 REST API 將 PDF 文檔轉換為 TEXT 文件:

# 如何將 PDF 轉換為 TXT 文件。
# 創建 API 實例
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# 初始化轉換設置
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

settings.load_options = loadOptions
settings.output_path = "pdf-to-text"

# 使用 PDF 到 TEXT 轉換器進行轉換
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf document to text file.")

以上示例代碼會將轉換後的 TEXT 文件保存在雲端。

在 Ruby 中將 PDF 的特定頁面轉換為文本

您可以按照以下步驟以編程方式將 PDF 文檔的特定頁面轉換為文本文件:

  • 首先,創建一個 ConvertApi 的實例。
  • 接下來,創建 ConvertSettings 的實例
  • 設置輸入PDF文檔路徑和輸出格式為“pdf”
  • 然後,創建 PdfLoadOptions 的實例
  • 為pdf文件設置密碼
  • 創建 TxtConvertOptions 的實例
  • 在逗號分隔的數組中提供頁碼以進行轉換
  • 然後,提供 loadOptions 設置對象
  • 將 convertOptions 分配給設置對象
  • 提供輸出文件路徑“pdf-to-text”
  • 使用 ConvertSettings 創建 ConvertDocumentRequest
  • 最後,使用 ConvertDocumentRequest 調用 ConvertApi.convertDocument() 方法。

以下代碼示例顯示瞭如何使用 Ruby 中的 REST API 將特定頁面從 PDF 轉換為文本:

# 將 PDF 的特定頁面轉換為文本文件
# 創建必要的 API 實例
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# 初始化轉換設置
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

convertOptions = GroupDocsConversionCloud::TxtConvertOptions.new
convertOptions.pages = [2, 3]

settings.load_options = loadOptions
settings.convert_options = convertOptions
settings.output_path = "pdf-to-text"

# 將 PDF 的特定頁面轉換為 TXT
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf to text file.")

免費在線 TXT 到 PDF 轉換器

如何在線將 PDF 轉換為文本文件?使用我們最好的免費 pdf 到 TXT 轉換器免費在線轉換 PDF 到 TXT。這個免費的 pdf 到文本轉換器是使用上面的將 pdf 轉換為文本 API 開發的。

加起來

在本文中,我們學習瞭如何:

  • 如何使用 ruby 將 pdf 轉換為文本文件;
  • 如何將 pdf 的特定頁面轉換為 ruby 中的文本;

您可以使用 文檔 了解有關 GroupDocs.Conversion 文件轉換器 API 的更多信息。我們還提供了一個 API 參考 部分,讓您可以直接通過瀏覽器可視化我們的 API 並與之通信。

問一個問題

如果您對 PDF 到文本轉換器有任何疑問,請隨時在 免費支持論壇 上詢問我們。

也可以看看