PDF Splitter - 如何在 Ruby 中使用 Rest API 从 PDF 中提取页面

如何在 Ruby 中使用 Rest API 从 PDF 中提取页面

您可能需要从 PDF 文档中提取特定页面,或者可能需要将 pdf 拆分为单独的页面作为较小的部分。作为 Ruby 开发人员,您可以通过页码或一系列页面以编程方式轻松地从 pdf adobe reader 中提取页面。在本文中,您将学习如何使用 Ruby 中的 REST API 从 PDF 中提取页面,以及如何免费在线从 pdf 中提取页面。

在本教程中,应涵盖以下主题以将 pdf 转换为单独的页面:

PDF 拆分器 REST API 和 Ruby SDK

要将 pdf 拆分为页面,我们将使用 pdf 提取器免费下载 Cloud API GroupDocs.Merger 的 Ruby SDK。它是一个功能丰富且高性能的 Cloud SDK,用于从 pdf 保存一页或如何将 pdf 的某些页面保存到单个文档中。它还使 adobe acrobat 能够将 pdf 中的页面提取到多个文件中。 SDK 提供交换、移动、删除、旋转或更改整个或首选页面范围的页面方向的功能。您可以轻松地对任何支持的文件格式(如 PDF、Word、Powerpoint 和 Excel 工作表)执行其他操作。它支持 .NET、Java、PHP、Python、Android 和 Node.js SDK 作为其文档合并家族成员

您可以在控制台中使用以下命令安装 GroupDocs.Merger-Cloud 以从 Ruby 项目中的 pdf 中选择页面:

gem install groupdocs_merger_cloud

在开始执行步骤和可用代码示例之前,请从 仪表板 获取您的客户端 ID 和客户端密码。获得 ID 和密码后,添加如下所示的代码以将 pdf 文件拆分为页面:

# 在 Ruby 应用程序中为 http://api.groupdocs.cloud 加载 gem https://github.com/groupdocs-merger-cloud/groupdocs-merger-cloud-ruby
require 'groupdocs_merger_cloud'

# 免费注册后,从 https://dashboard.groupdocs.cloud 获取您的 client_id 和 client_secret。
@app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

使用 REST API 从 PDF 中提取特定页面

您可以通过上传的 PDF 文件中的页码保存特定的 pdf 页面。首先,上传 多页 PDF 文档到云端,PDF 文件将在仪表板的文件部分 中可用。请按照下面提到的步骤以编程方式保存 PDF 文档中的某些 pdf 页面。

  • 首先,创建实例PagesApi
  • 然后,创建 ExtractOptions 实例
  • 接下来,创建 FileInfo 的实例
  • 设置输入文件路径和输出目录路径
  • 提供逗号分隔的页码以提取
  • 接下来,创建一个 ExtractRequest 实例
  • 最后,通过使用 ExtractRequest 调用 PagesApi.extract() 方法来提取 PDF 页面

以下代码示例展示了如何使用 REST API 从 PDF 文档中提供特定页码来提取文件。

# 创建页面 API 的实例
@pagesApi = GroupDocsMergerCloud::PagesApi.from_keys(@app_sid, @app_key)
 
@options = GroupDocsMergerCloud::ExtractOptions.new
@options.file_info = GroupDocsMergerCloud::FileInfo.new
@options.file_info.file_path = 'extract-pages/extract-21pages.pdf'
@options.output_path = "extract-pages/extract-specific-pages.pdf"
@options.pages = [2, 4, 7, 13]
 
@result = @pagesApi.extract(GroupDocsMergerCloud::ExtractRequest.new(@options))
puts("Successfully extracted specific pages by number.")

上面的代码示例会将提取的页面保存在云中单独的 PDF 文件中。

按偶数页面范围从 PDF 中提取页面

请按照下面提到的步骤,了解如何通过以编程方式提供页面范围来从 pdf 中提取文档。

  • 首先,创建实例PagesApi
  • 然后,创建 ExtractOptions 实例
  • 接下来,创建 FileInfo 的实例
  • 设置输入文件路径和输出目录路径
  • 提供 start\page\number 和 end\page\number 选项
  • 将范围\模式设置为 EvenPages
  • 接下来,创建一个 ExtractRequest 实例
  • 最后,通过使用 ExtractRequest 调用 PagesApi.extract() 方法来提取 PDF 页面

以下代码示例显示通过使用 REST API 提供 PDF 文档的页面范围来拆分 pdf 中的页面。请按照前面提到的步骤上传文件。

# 创建页面 API 的实例
@pagesApi = GroupDocsMergerCloud::PagesApi.from_keys(@app_sid, @app_key)
 
@options = GroupDocsMergerCloud::ExtractOptions.new
@options.file_info = GroupDocsMergerCloud::FileInfo.new
@options.file_info.file_path = 'extract-pages/extract-21pages.pdf'
@options.output_path = "extract-pages/extract-even-pages.pdf"
@options.start_page_number = 1
@options.end_page_number = 10
@options.range_mode = "EvenPages"
 
@result = @pagesApi.extract(GroupDocsMergerCloud::ExtractRequest.new(@options))
puts("Successfully extracted pages by even range.")

按奇数页范围从 PDF 中提取页面

请按照下面提到的步骤通过以编程方式提供页面范围来从 pdf 文档中提取页面。

  • 首先,创建实例PagesApi
  • 然后,创建 ExtractOptions 实例
  • 接下来,创建 FileInfo 的实例
  • 设置输入文件路径和输出目录路径
  • 提供 start\page\number 和 end\page\number 选项
  • 将范围\模式设置为 OddPages
  • 接下来,创建一个 ExtractRequest 实例
  • 最后,通过使用 ExtractRequest 调用 PagesApi.extract() 方法来提取 PDF 页面

以下代码示例通过使用 REST API 从 PDF 文档提供页面范围来从 pdf 文件中提取 pdf 页面。请按照前面提到的步骤上传文件。

# 创建页面 API 的实例
@pagesApi = GroupDocsMergerCloud::PagesApi.from_keys(@app_sid, @app_key)
 
@options = GroupDocsMergerCloud::ExtractOptions.new
@options.file_info = GroupDocsMergerCloud::FileInfo.new
@options.file_info.file_path = 'extract-pages/extract-21pages.pdf'
@options.output_path = "extract-pages/extract-odd-pages.pdf"
@options.start_page_number = 1
@options.end_page_number = 15
@options.range_mode = "OddPages"
 
@result = @pagesApi.extract(GroupDocsMergerCloud::ExtractRequest.new(@options))
puts("Successfully extracted pages by odd range.")

现在,您可以使用 Rest API 按页面范围拆分 PDF 文件或将所有 PDF 页面提取到多个 PDF 文件。

使用 PDF 拆分器在线提取 PDF 页面

如何免费从pdf中提取页面?使用易于使用的免费在线提取 pdf 页面工具在线拆分或提取 PDF 页面。您可以使用我们的 PDF 拆分器免费从 pdf 中提取页面。分隔 pdf 页面绝对安全。 今天试试

加起来

在本文中,我们学习了如何使用 Ruby 从云端的 PDF 文档中提取页面。您还学习了如何在云端按页面范围或编号以编程方式将 pdf 拆分为页面。现在您知道如何从 pdf 导出单个页面以及如何快速从 pdf 文件中提取多个页面。您可以使用 文档 了解有关 GroupDocs.Merger Cloud API 的更多信息。我们还提供了一个 API 参考 部分,让您可以直接通过浏览器可视化我们的 API 并与之交互。

问一个问题

如果您对如何从pdf中提取单页或如何将pdf拆分为多页有任何疑问,请随时在论坛上提问。

也可以看看