PDF 是一種文檔文件格式,包含文本、數據等,並且與操作系統無關。 TXT 文件是擴展名為 .TXT 的標准文本文檔,其中包含行形式的純文本。它可以在任何文本編輯或文字處理工具中打開和編輯。在某些情況下,您可能需要以編程方式將 PDF 文檔轉換為文本文件。在本文中,您將了解如何使用 Ruby 中的 REST API 以編程方式將 PDF 轉換為文本文件。
本文應涵蓋以下主題:
- PDF 到文本轉換 REST API 和 Ruby SDK
- 在 Ruby 中使用 REST API 將 PDF 轉換為文本文件
- 在 Ruby 中將 PDF 的特定頁面轉換為文本
- 免費在線 TXT 到 PDF 轉換器
PDF 到文本轉換 REST API 和 Ruby SDK
為了將 PDF 轉換為 TXT 文件,我們將使用 GroupDocs.Conversion Cloud API 的 Ruby SDK。您可以在 Rails 控制台中使用以下命令安裝它:
gem install groupdocs_conversion_cloud
在執行以下提到的步驟之前,請從 GroupDocs 儀表板 獲取您的客戶端 ID 和密碼。獲得客戶端 ID 和客戶端密碼後,將它們添加到 ruby 應用程序代碼中,如下所示:
# 免費註冊後,從 https://dashboard.groupdocs.cloud 獲取您的 client_id 和 client_secret。
# 在你的 ruby 應用程序中為 http://api.groupdocs.cloud 加載 gem
require 'groupdocs_conversion_cloud'
@client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
在 Ruby 中使用 REST API 將 PDF 轉換為文本文件
您可以按照下面給出的簡單步驟將 PDF 文件轉換為文本文件。讓我們按照以下步驟學習如何以編程方式將 PDF 文檔轉換為文本文件:
- 首先,創建一個 ConvertApi 的實例。
- 創建 ConvertSettings 的實例
- 設置輸入PDF文檔路徑和輸出格式為“pdf”
- 創建 PdfLoadOptions 的實例
- 為pdf文件設置密碼
- 然後,提供加載選項設置
- 提供輸出文件路徑“pdf-to-text”
- 使用 ConvertSettings 創建 ConvertDocumentRequest
- 最後,使用 ConvertDocumentRequest 調用 ConvertApi.convertDocument() 方法。
以下代碼示例顯示瞭如何在 Ruby 中使用 REST API 將 PDF 文檔轉換為 TEXT 文件:
# 如何將 PDF 轉換為 TXT 文件。
# 創建 API 實例
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)
# 初始化轉換設置
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"
loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"
settings.load_options = loadOptions
settings.output_path = "pdf-to-text"
# 使用 PDF 到 TEXT 轉換器進行轉換
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf document to text file.")
以上示例代碼會將轉換後的 TEXT 文件保存在雲端。
在 Ruby 中將 PDF 的特定頁面轉換為文本
您可以按照以下步驟以編程方式將 PDF 文檔的特定頁面轉換為文本文件:
- 首先,創建一個 ConvertApi 的實例。
- 接下來,創建 ConvertSettings 的實例
- 設置輸入PDF文檔路徑和輸出格式為“pdf”
- 然後,創建 PdfLoadOptions 的實例
- 為pdf文件設置密碼
- 創建 TxtConvertOptions 的實例
- 在逗號分隔的數組中提供頁碼以進行轉換
- 然後,提供 loadOptions 設置對象
- 將 convertOptions 分配給設置對象
- 提供輸出文件路徑“pdf-to-text”
- 使用 ConvertSettings 創建 ConvertDocumentRequest
- 最後,使用 ConvertDocumentRequest 調用 ConvertApi.convertDocument() 方法。
以下代碼示例顯示瞭如何使用 Ruby 中的 REST API 將特定頁面從 PDF 轉換為文本:
# 將 PDF 的特定頁面轉換為文本文件
# 創建必要的 API 實例
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)
# 初始化轉換設置
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"
loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"
convertOptions = GroupDocsConversionCloud::TxtConvertOptions.new
convertOptions.pages = [2, 3]
settings.load_options = loadOptions
settings.convert_options = convertOptions
settings.output_path = "pdf-to-text"
# 將 PDF 的特定頁面轉換為 TXT
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf to text file.")
免費在線 TXT 到 PDF 轉換器
如何在線將 PDF 轉換為文本文件?使用我們最好的免費 pdf 到 TXT 轉換器免費在線轉換 PDF 到 TXT。這個免費的 pdf 到文本轉換器是使用上面的將 pdf 轉換為文本 API 開發的。
加起來
在本文中,我們學習瞭如何:
- 如何使用 ruby 將 pdf 轉換為文本文件;
- 如何將 pdf 的特定頁面轉換為 ruby 中的文本;
您可以使用 文檔 了解有關 GroupDocs.Conversion 文件轉換器 API 的更多信息。我們還提供了一個 API 參考 部分,讓您可以直接通過瀏覽器可視化我們的 API 並與之通信。
問一個問題
如果您對 PDF 到文本轉換器有任何疑問,請隨時在 免費支持論壇 上詢問我們。