Bạn có thể cần trích xuất các trang cụ thể từ tài liệu PDF hoặc có thể cần chia pdf thành các trang riêng lẻ thành các phần nhỏ hơn. Là một nhà phát triển Ruby, bạn có thể dễ dàng trích xuất các trang từ trình đọc adobe pdf theo số trang hoặc theo một loạt các trang theo chương trình. Trong bài viết này, bạn sẽ tìm hiểu cách trích xuất các trang từ PDF bằng API REST trong Ruby và cách trích xuất các trang từ pdf trực tuyến miễn phí.
Các chủ đề sau sẽ được đề cập để chuyển đổi pdf sang các trang riêng biệt trong hướng dẫn này:
- API REST của Bộ tách PDF và SDK Ruby
- Trích xuất các trang cụ thể từ PDF bằng API REST
- Trích xuất các trang từ PDF theo phạm vi trang chẵn
- Trích xuất các trang từ PDF theo phạm vi trang lẻ
- Trích xuất trực tuyến các trang PDF bằng PDF Splitter
PDF Splitter REST API và Ruby SDK
Để chia pdf thành các trang, chúng tôi sẽ sử dụng Cloud API tải xuống miễn phí trình trích xuất pdf Ruby SDK của GroupDocs.Merger. Đây là SDK đám mây có hiệu suất cao và giàu tính năng được sử dụng để lưu một trang từ pdf hoặc để biết cách lưu một số trang nhất định của pdf vào một tài liệu. Nó cũng cho phép adobe acrobat trích xuất các trang từ pdf thành nhiều tệp. SDK cung cấp chức năng hoán đổi, di chuyển, xóa, xoay hoặc thay đổi hướng trang cho toàn bộ hoặc phạm vi trang ưa thích. Bạn có thể thực hiện các thao tác khác một cách dễ dàng đối với mọi định dạng tệp được hỗ trợ, chẳng hạn như trang tính PDF, Word, Powerpoint và Excel. Nó hỗ trợ SDK .NET, Java, PHP, Python, Android và Node.js dưới dạng các thành viên gia đình hợp nhất tài liệu.
Bạn có thể cài đặt GroupDocs.Merger-Cloud để chọn các trang từ pdf trong dự án Ruby bằng lệnh sau trong bảng điều khiển:
gem install groupdocs_merger_cloud
Vui lòng lấy ID khách hàng và Bí mật khách hàng của bạn từ bảng điều khiển trước khi bạn bắt đầu làm theo các bước và ví dụ về mã có sẵn. Khi bạn có ID và bí mật của mình, hãy thêm mã như minh họa bên dưới để chia tệp pdf thành các trang:
# Tải đá quý https://github.com/groupdocs-merger-cloud/groupdocs-merger-cloud-ruby trong ứng dụng Ruby cho http://api.groupdocs.cloud
require 'groupdocs_merger_cloud'
# Nhận client_id và client_secret của bạn từ https://dashboard.groupdocs.cloud sau khi đăng ký miễn phí.
@app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
Trích xuất các trang cụ thể từ PDF bằng API REST
Bạn có thể lưu các trang pdf cụ thể theo số trang từ tệp PDF đã tải lên. Trước hết, tải lên tài liệu PDF nhiều trang lên đám mây và tệp PDF sẽ có sẵn trong phần tệp trên trang tổng quan của bạn. Vui lòng làm theo các bước được đề cập bên dưới để lưu một số trang pdf nhất định từ tài liệu PDF theo chương trình.
- Đầu tiên, tạo một phiên bản PagesApi
- Sau đó, tạo phiên bản ExtractOptions
- Tiếp theo, tạo một phiên bản của FileInfo
- Đặt đường dẫn tệp đầu vào và đường dẫn thư mục đầu ra
- Cung cấp số trang được phân tách bằng dấu phẩy để trích xuất
- Tiếp theo, tạo một phiên bản của ExtractRequest
- Cuối cùng, trích xuất các trang PDF bằng cách gọi phương thức PagesApi.extract() với ExtractRequest
Ví dụ mã sau đây cho biết cách giải nén tệp bằng cách cung cấp số trang cụ thể từ tài liệu PDF bằng API REST.
# Tạo một phiên bản của API Trang
@pagesApi = GroupDocsMergerCloud::PagesApi.from_keys(@app_sid, @app_key)
@options = GroupDocsMergerCloud::ExtractOptions.new
@options.file_info = GroupDocsMergerCloud::FileInfo.new
@options.file_info.file_path = 'extract-pages/extract-21pages.pdf'
@options.output_path = "extract-pages/extract-specific-pages.pdf"
@options.pages = [2, 4, 7, 13]
@result = @pagesApi.extract(GroupDocsMergerCloud::ExtractRequest.new(@options))
puts("Successfully extracted specific pages by number.")
Mẫu mã trên sẽ lưu các trang được trích xuất trong các tệp PDF riêng biệt trên đám mây.
Trích xuất các trang từ PDF theo phạm vi trang chẵn
Vui lòng làm theo các bước được đề cập bên dưới để biết cách trích xuất tài liệu từ pdf bằng cách cung cấp phạm vi trang theo chương trình.
- Đầu tiên, tạo một phiên bản PagesApi
- Sau đó, tạo phiên bản ExtractOptions
- Tiếp theo, tạo một phiên bản của FileInfo
- Đặt đường dẫn tệp đầu vào và đường dẫn thư mục đầu ra
- Cung cấp các tùy chọn bắt đầu\trang\số và kết thúc\trang\số
- Đặt phạm vi\chế độ thành Trang chẵn
- Tiếp theo, tạo một phiên bản của ExtractRequest
- Cuối cùng, trích xuất các trang PDF bằng cách gọi phương thức PagesApi.extract() với ExtractRequest
Ví dụ mã sau đây hiển thị để phân chia các trang trong pdf bằng cách cung cấp một phạm vi trang từ tài liệu PDF bằng API REST. Vui lòng làm theo các bước được đề cập trước đó để tải tệp lên.
# Tạo một phiên bản của API Trang
@pagesApi = GroupDocsMergerCloud::PagesApi.from_keys(@app_sid, @app_key)
@options = GroupDocsMergerCloud::ExtractOptions.new
@options.file_info = GroupDocsMergerCloud::FileInfo.new
@options.file_info.file_path = 'extract-pages/extract-21pages.pdf'
@options.output_path = "extract-pages/extract-even-pages.pdf"
@options.start_page_number = 1
@options.end_page_number = 10
@options.range_mode = "EvenPages"
@result = @pagesApi.extract(GroupDocsMergerCloud::ExtractRequest.new(@options))
puts("Successfully extracted pages by even range.")
Trích xuất các trang từ PDF theo phạm vi trang lẻ
Vui lòng làm theo các bước được đề cập bên dưới để trích xuất các trang từ tài liệu pdf bằng cách cung cấp phạm vi trang theo chương trình.
- Đầu tiên, tạo một phiên bản PagesApi
- Sau đó, tạo phiên bản ExtractOptions
- Tiếp theo, tạo một phiên bản của FileInfo
- Đặt đường dẫn tệp đầu vào và đường dẫn thư mục đầu ra
- Cung cấp các tùy chọn bắt đầu\trang\số và kết thúc\trang\số
- Đặt phạm vi\mode thành OddPages
- Tiếp theo, tạo một phiên bản của ExtractRequest
- Cuối cùng, trích xuất các trang PDF bằng cách gọi phương thức PagesApi.extract() với ExtractRequest
Ví dụ mã sau trích xuất các trang pdf từ tệp pdf bằng cách cung cấp một phạm vi trang từ tài liệu PDF bằng API REST. Vui lòng làm theo các bước được đề cập trước đó để tải tệp lên.
# Tạo một phiên bản của API Trang
@pagesApi = GroupDocsMergerCloud::PagesApi.from_keys(@app_sid, @app_key)
@options = GroupDocsMergerCloud::ExtractOptions.new
@options.file_info = GroupDocsMergerCloud::FileInfo.new
@options.file_info.file_path = 'extract-pages/extract-21pages.pdf'
@options.output_path = "extract-pages/extract-odd-pages.pdf"
@options.start_page_number = 1
@options.end_page_number = 15
@options.range_mode = "OddPages"
@result = @pagesApi.extract(GroupDocsMergerCloud::ExtractRequest.new(@options))
puts("Successfully extracted pages by odd range.")
Giờ đây, bạn có thể chia tệp PDF theo phạm vi trang hoặc trích xuất tất cả các trang PDF thành nhiều tệp PDF bằng Rest API.
Trích xuất các trang PDF trực tuyến bằng PDF Splitter
Làm cách nào để trích xuất các trang từ pdf miễn phí? Tách hoặc trích xuất các trang PDF trực tuyến bằng công cụ trích xuất các trang pdf trực tuyến miễn phí dễ sử dụng. Bạn có thể trích xuất các trang từ pdf miễn phí bằng bộ tách PDF của chúng tôi. Tách trang pdf tuyệt đối an toàn. Hãy thử ngay hôm nay.
Tổng hợp
Trong bài viết này, chúng ta đã học cách trích xuất các trang từ tài liệu PDF trên đám mây bằng Ruby. Bạn cũng đã học cách lập trình chia pdf thành các trang theo phạm vi hoặc số trang trên đám mây. Bây giờ bạn đã biết cách xuất một trang từ pdf và cách trích xuất nhiều trang từ tệp pdf một cách nhanh chóng. Bạn có thể tìm hiểu thêm về GroupDocs.Merger Cloud API bằng cách sử dụng tài liệu. Chúng tôi cũng cung cấp phần Tham khảo API cho phép bạn hình dung và tương tác trực tiếp với các API của chúng tôi thông qua trình duyệt.
Đặt một câu hỏi
Nếu bạn có bất kỳ câu hỏi nào về cách trích xuất một trang từ pdf hoặc cách chia pdf thành nhiều trang, vui lòng hỏi chúng tôi trên Diễn đàn