在 Ruby 中使用 REST API 以编程方式将 PDF 转换为文本

在 Ruby 中使用 REST API 以编程方式将 PDF 转换为文本

PDF 是一种文档文件格式,包含文本、数据等,并且与操作系统无关。 TXT 文件是扩展名为 .TXT 的标准文本文档,其中包含行形式的纯文本。它可以在任何文本编辑或文字处理工具中打开和编辑。在某些情况下,您可能需要以编程方式将 PDF 文档转换为文本文件。在本文中,您将了解如何使用 Ruby 中的 REST API 以编程方式将 PDF 转换为文本文件。

本文应涵盖以下主题:

PDF 到文本转换 REST API 和 Ruby SDK

为了将 PDF 转换为 TXT 文件,我们将使用 GroupDocs.Conversion Cloud API 的 Ruby SDK。您可以在 Rails 控制台中使用以下命令安装它:

gem install groupdocs_conversion_cloud

在执行以下提到的步骤之前,请从 GroupDocs 仪表板 获取您的客户端 ID 和密码。获得客户端 ID 和客户端密码后,将它们添加到 ruby 应用程序代码中,如下所示:

# 免费注册后,从 https://dashboard.groupdocs.cloud 获取您的 client_id 和 client_secret。
# 在你的 ruby 应用程序中为 http://api.groupdocs.cloud 加载 gem

require 'groupdocs_conversion_cloud'
@client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

在 Ruby 中使用 REST API 将 PDF 转换为文本文件

您可以按照下面给出的简单步骤将 PDF 文件转换为文本文件。让我们按照以下步骤学习如何以编程方式将 PDF 文档转换为文本文件:

  • 首先,创建 ConvertApi 的实例。
  • 创建 ConvertSettings 的实例
  • 设置输入PDF文档路径和输出格式为“pdf”
  • 创建 PdfLoadOptions 的实例
  • 为pdf文件设置密码
  • 然后,提供加载选项设置
  • 提供输出文件路径“pdf-to-text”
  • 使用 ConvertSettings 创建 ConvertDocumentRequest
  • 最后,使用 ConvertDocumentRequest 调用 ConvertApi.convertDocument() 方法。

以下代码示例显示了如何在 Ruby 中使用 REST API 将 PDF 文档转换为 TEXT 文件:

# 如何将 PDF 转换为 TXT 文件。
# 创建 API 实例
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# 初始化转换设置
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

settings.load_options = loadOptions
settings.output_path = "pdf-to-text"

# 使用 PDF 到 TEXT 转换器进行转换
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf document to text file.")

以上示例代码会将转换后的 TEXT 文件保存在云端。

在 Ruby 中将 PDF 的特定页面转换为文本

您可以按照以下步骤以编程方式将 PDF 文档的特定页面转换为文本文件:

  • 首先,创建 ConvertApi 的实例。
  • 接下来,创建 ConvertSettings 的实例
  • 设置输入PDF文档路径和输出格式为“pdf”
  • 然后,创建 PdfLoadOptions 的实例
  • 为pdf文件设置密码
  • 创建 TxtConvertOptions 的实例
  • 在逗号分隔的数组中提供页码以进行转换
  • 然后,提供 loadOptions 设置对象
  • 将 convertOptions 分配给设置对象
  • 提供输出文件路径“pdf-to-text”
  • 使用 ConvertSettings 创建 ConvertDocumentRequest
  • 最后,使用 ConvertDocumentRequest 调用 ConvertApi.convertDocument() 方法。

以下代码示例显示了如何使用 Ruby 中的 REST API 将特定页面从 PDF 转换为文本:

# 将 PDF 的特定页面转换为文本文件
# 创建必要的 API 实例
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# 初始化转换设置
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

convertOptions = GroupDocsConversionCloud::TxtConvertOptions.new
convertOptions.pages = [2, 3]

settings.load_options = loadOptions
settings.convert_options = convertOptions
settings.output_path = "pdf-to-text"

# 将 PDF 的特定页面转换为 TXT
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf to text file.")

免费在线 TXT 到 PDF 转换器

如何在线将 PDF 转换为文本文件?使用我们最好的免费 pdf 到 TXT 转换器免费在线转换 PDF 到 TXT。这个免费的 pdf 到文本转换器是使用上面的将 pdf 转换为文本 API 开发的。

加起来

在本文中,我们学习了如何:

  • 如何使用 ruby 将 pdf 转换为文本文件;
  • 如何将 pdf 的特定页面转换为 ruby 中的文本;

您可以使用 文档 了解有关 GroupDocs.Conversion 文件转换器 API 的更多信息。我们还提供了一个 API 参考 部分,让您可以直接通过浏览器可视化我们的 API 并与之通信。

问一个问题

如果您对 PDF 到文本转换器有任何疑问,请随时在 免费支持论坛 上询问我们。

也可以看看