在 Ruby 中使用 REST API 将 PDF 转换为 HTML

在 Ruby 中使用 REST API 将 PDF 转换为 HTML

您可能需要将 PDF 文件转换为 HTML,因为 HTML 通常更适合通过网络提供信息。为了通过以编程方式保持格式来执行此 pdf 到 html 的转换,本文将介绍如何使用 Ruby 中的 REST API 将 PDF 转换为 HTML。此外,您还将学习如何使用在线 pdf 到 html 转换器免费下载库将 PDF 转换为 HTML 的其他选项。

PDF 提供共享和打印只读文档而不会丢失文档格式。我们可以轻松地将PDF文档转换为HTML网页,并在任何浏览器中查看。让我们学习如何使用 Ruby 将 pdf 格式转换为 html 格式。

本文应涵盖以下主题:

PDF 到 HTML 转换 REST API - 安装

为了将 pdf 格式转换为 html 格式,我们将使用 GroupDocs.Conversion Cloud API 的 Ruby SDK。您可以在控制台中使用以下命令安装 PDF 文档到 HTML 转换器免费下载库:

gem install groupdocs_conversion_cloud

此 PDF 到 HTML 转换器软件可免费下载。现在,请在执行以下步骤之前从 GroupDocs 仪表板 获取您的客户端 ID 和密码。获得客户端 ID 和客户端密码后,将它们添加到 ruby 应用程序代码中,如下所示:

# 免费注册后,从 https://dashboard.groupdocs.cloud 获取您的 client_id 和 client_secret。
# 在你的 ruby 应用程序中为 http://api.groupdocs.cloud 加载 gem
require 'groupdocs_conversion_cloud'

@client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# 设置您的存储名称
@storage_name = "test-internal-storage"

接下来,让我们逐步探索如何在 Ruby 中使用 REST API 将 pdf 格式转换为 html 格式。

在 Ruby 中使用 REST API 将 PDF 转换为 HTML

我们可以按照下面给出的简单步骤以编程方式将 pdf 文件转换为 html 格式:

  • 首先,创建 ConvertApi 的实例
  • 现在,使用 ConvertSettings 创建转换设置实例
  • 接下来,提供文件存储名称
  • 将输入 PDF 文件路径和输出文件格式设置为“html”
  • 然后,提供输出路径名
  • 之后,使用 ConvertSettings 作为参数创建 ConvertDocumentRequest
  • 最后,通过使用 ConvertDocumentRequest 调用 convert\document() 方法将 pdf 转换为 html

以下代码示例显示了如何在 Ruby 中将 pdf 格式更改为 html 格式。

# 此代码示例演示如何将 pdf 文档转换为 html 网页。
# 创建 ConvertApi 实例
@convert_api = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# 准备转换设置
@settings = GroupDocsConversionCloud::ConvertSettings.new
@settings.storage_name = @storage_name
@settings.file_path = "pdf-to-html/pdf-pages.pdf"
@settings.format = "html"
@settings.output_path = "pdf-to-html"

# 将 pdf 转换为 html
@result = @convert_api.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(@settings))
puts("PDF file successfully converted to HTML.")

最后,上面的代码示例会将 HTML 文件保存在云端。这是将 pdf 转换为 html 文档的最佳方法。

如何将页面范围从 PDF 转换为 HTML

我们可以按照以下步骤将 PDF 文档的页面范围转换为 HTML:

  • 首先,创建 ConvertApi 的实例
  • 现在,使用 ConvertSettings 创建转换设置实例
  • 接下来,提供文件存储名称
  • 将输入 PDF 文件路径和输出文件格式设置为“html”
  • 创建 HtmlConvertOptions 的实例
  • 设置 from\page、pages\count 和 fixed\layout 转换选项
  • 然后,设置 convert\options 和 output\path 值
  • 之后,使用 ConvertSettings 作为参数创建 ConvertDocumentRequest
  • 最后用ConvertDocumentRequest调用convert\document()方法在线将pdf转成html代码

以下代码示例显示了如何使用 Ruby 将一系列页面从 PDF 文档转换为 HTML 文件。

# 此代码示例演示如何在 Ruby 中将页面范围从 PDF 转换为 HTML
# 创建转换 Api 实例
@convert_api = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)
 
# 创建转换设置
@settings = GroupDocsConversionCloud::ConvertSettings.new
@settings.storage_name = @storage_name
@settings.file_path = "pdf-to-html/pdf-pages.pdf"
@settings.format = "html"
@convertOptions = GroupDocsConversionCloud::HtmlConvertOptions.new
@convertOptions.from_page = 1
# 要转换的页数
@convertOptions.pages_count = 3
@convertOptions.fixed_layout = true
@settings.convert_options = @convertOptions
@settings.output_path = "pdf-to-html"
 
# 使用高级选项将 pdf 转换为 html
@result = @convert_api.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(@settings))
puts("PDF file converted to HTML using advance options.")

最后,上面的代码示例将文档从pdf在线转换为html后保存在云端。

如何将 PDF 的特定页面转换为 HTML

我们可以按照以下步骤使用带有图像的最佳 pdf 到 html 在线转换器将 PDF 文档的特定页面转换为 HTML:

  • 首先,创建 ConvertApi 的实例
  • 现在,使用 ConvertSettings 创建转换设置实例
  • 接下来,提供文件存储名称
  • 将输入 PDF 文件路径和输出文件格式设置为“html”
  • 创建 HtmlConvertOptions 的实例
  • 提供页面集合 html 转换选项
  • 然后,设置 convert\options 和 output\path 值
  • 之后,使用 ConvertSettings 作为参数创建 ConvertDocumentRequest
  • 最后,通过使用 ConvertDocumentRequest 调用 convert\document() 方法将 pdf 转换为 html 文件

以下代码示例显示了如何使用 Ruby 将 PDF 文档的某些页面导出到 HTML 文件。

# 此代码示例演示如何在 Ruby 中将 PDF 的特定页面转换为 HTML
# 创建转换 api 实例
@convert_api = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)
 
# 创建转换设置
@settings = GroupDocsConversionCloud::ConvertSettings.new
@settings.storage_name = @storage_name
@settings.file_path = "pdf-to-html/pdf-pages.pdf"
@settings.format = "html"
@convertOptions = GroupDocsConversionCloud::HtmlConvertOptions.new
# 要转换的特定页面的页面索引
@convertOptions.pages = [1, 5]
@settings.convert_options = @convertOptions
@settings.output_path = "pdf-to-html"
 
# PDF 将特定页面转换为 HTML
@response = @convert_api.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(@settings))
puts("PDF certain pages converted to HTML successfully.")

最后,上面的代码示例将 pdf 转换为带有云端图像的 html。有一个在线 pdf 到 html 代码转换器,如下所述。

PDF 到 HTML 在线转换工具

如何免费在线将 PDF 转换为 HTML? Groupdocs.Conversion 提供了一个免费的在线 pdf 到 html 转换器工具,供您将 PDF 转换为 HTML 格式。只需选择您要转换的文件,然后使用最好的免费在线 pdf 到 html 转换器将您的 PDF 文件转换为 HTML 文件。它是使用 Groupdocs.Conversion 在线 pdf 到 html API 开发的。

结论

在本文中,您已了解:

  • 如何在不丢失 Ruby 格式的情况下将 pdf 转换为 html;
  • 如何在 Ruby 中按范围将 pdf 文件转换为 html 文件;
  • 将特定的 PDF 页面转换为 HTML 格式;
  • 免费在线将 pdf 转换为 html;

此外,您可以使用文档了解有关GroupDocs.Conversion 文件格式转换API 的更多信息。

问一个问题

如果您对如何将 pdf 文件转换为 html 格式有任何疑问,请随时在 免费支持论坛 上询问我们

也可以看看