您可能需要从 Word 文档中提取一组连续的页面,或者可能需要将单词拆分为单独的页面作为更小的部分。作为 Ruby 开发人员,您可以通过编程应用页码过滤器轻松地从 word 文档中提取某些页面。在本文中,您将学习如何在 Ruby 中使用 REST API 从 word 文档中提取页面。
在本教程中,应涵盖以下主题以将 word 文件转换为单独的页面:
- Word 文档提取 REST API 和 Ruby SDK
- 在 Ruby 中使用 REST API 从 Word 中提取特定页面
- 在 Ruby 中通过范围模式从 Word 文件中提取页面
- 免费在线提取 Word 页面
Word 文档提取 REST API 和 Ruby SDK
要将 word 拆分为单独的页面,我们将使用免费下载的 word 文档提取器 GroupDocs.Merger 的 Ruby SDK。它是一个功能丰富的高性能 Cloud SDK,用于将一个单词的一页或特定页面保存到一个文件中。它还允许将页面从 word 提取到多个文件中。此 SDK 提供额外的功能来交换、移动、删除、旋转或更改整个页面或首选页面范围的页面方向。此外,您可以轻松地对任何支持的文件格式(如 PDF、Powerpoint 和 Excel 工作表)执行其他操作。它支持 .NET、Java、PHP、Python、Android 和 Node.js SDK 作为其文档合并家族成员。
您可以安装 GroupDocs.Merger cloud 以在 Ruby 应用程序中使用以下命令从 word 中选择页面 rails 控制台:
gem install groupdocs_merger_cloud
在开始执行步骤和可用代码示例之前,请从 dashboard 获取您的 Client ID 和 Client Secret。获得 ID 和密码后,添加如下所示的代码以将 docx 文件拆分为页面:
# Word 文档提取 REST API 和 Ruby SDK
# 在 Ruby 应用程序中为 http://api.groupdocs.cloud 加载 gem https://github.com/groupdocs-merger-cloud/groupdocs-merger-cloud-ruby
require 'groupdocs_merger_cloud'
# 免费注册后,从 https://dashboard.groupdocs.cloud 获取您的 client_id 和 client_secret。
@app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
在 Ruby 中使用 REST API 从 Word 中提取特定页面
您可以从上传的word文件中按页码保存word的特定页面。您可以通过 按照步骤 将 word 文档上传到云端,word 文件将在您的仪表板的 文件部分 中可用。请按照下面提到的步骤以编程方式保存 word 文档的某些页面。
- 首先,创建实例PagesApi
- 然后,创建 ExtractOptions 实例
- 接下来,创建 FileInfo 的实例
- 设置输入文件路径和输出文件路径
- 提供要提取的逗号分隔页面集合
- 接下来,创建一个 ExtractRequest 实例
- 最后,使用 ExtractRequest 调用 PagesApi.extract() 方法提取词页
以下代码示例展示了如何使用 REST API 从 Word 文档中提供特定页码来提取文件:
# 如何从word docx中提取特定页面
# 创建页面 API 的实例
@pagesApi = GroupDocsMergerCloud::PagesApi.from_keys(@app_sid, @app_key)
@options = GroupDocsMergerCloud::ExtractOptions.new
@options.file_info = GroupDocsMergerCloud::FileInfo.new
@options.file_info.file_path = 'extract-pages/docx-pages.docx'
@options.output_path = "extract-pages/extract-specific-pages.docx"
@options.pages = [2, 4, 7, 9]
@result = @pagesApi.extract(GroupDocsMergerCloud::ExtractRequest.new(@options))
puts("Successfully extracted certain pages by page collection.")
上面的代码示例会将提取的页面保存在云端的单独 word 文件中。
在 Ruby 中通过范围模式从 Word 文件中提取页面
请按照下面提到的步骤通过以编程方式提供范围模式从 word 中提取文档。
- 首先,创建实例PagesApi
- 然后,创建 ExtractOptions 实例
- 接下来,创建 FileInfo 的实例
- 设置输入文件路径和输出文档路径
- 提供 start\page\number 和 end\page\number 选项
- 将范围\模式设置为 EvenPages
- 接下来,创建一个 ExtractRequest 实例
- 最后,使用 ExtractRequest 调用 PagesApi.extract() 方法提取单词页
以下代码示例显示通过使用 REST API 提供来自 word 文档的页面范围来拆分 word 中的页面:
# 如何使用页面范围模式提取Word页面
# 创建页面 API 的实例
@pagesApi = GroupDocsMergerCloud::PagesApi.from_keys(@app_sid, @app_key)
@options = GroupDocsMergerCloud::ExtractOptions.new
@options.file_info = GroupDocsMergerCloud::FileInfo.new
@options.file_info.file_path = 'extract-pages/docx-pages.docx'
@options.output_path = "extract-pages/extract-mode-pages.docx"
# 如果页面集合不为空,则忽略页码。
@options.start_page_number = 1
@options.end_page_number = 8
# 将范围模式设置为“OddPages”或“EvenPages”。默认值为 AllPages。
@options.range_mode = "EvenPages"
@result = @pagesApi.extract(GroupDocsMergerCloud::ExtractRequest.new(@options))
puts("Successfully extracted docx pages by page range mode.")
现在,您知道如何使用 Rest API 提供页面集合或页面范围模式来拆分或提取 word 文件。
免费在线提取 Word 页面
如何免费从word中提取页面?使用易于使用的 免费在线提取单词页面工具 在线拆分或提取单词页面。使用免费的分词器分离单词页面是绝对安全的。
加起来
在本文中,我们学习了如何:
- 使用 Ruby 从云上的 word 文档导出某些页面
- 如何使用 Ruby 按范围模式以编程方式将单词拆分为页面
现在您知道如何从 word 中导出单个页面或如何快速安全地从 word 文件中提取多个页面。您可以使用 文档 了解有关 GroupDocs.Merger Cloud API 的更多信息。我们还提供了一个 API 参考 部分,让您可以直接通过浏览器可视化我们的 API 并与之交互。
问一个问题
如果您对如何从word中提取单页或如何通过范围模式将word拆分为多页有任何疑问,请随时在[论坛](https://forum.groupdocs.cloud/c/merger /18)