Chuyển đổi PDF thành văn bản theo chương trình bằng API REST trong Ruby

Chuyển đổi PDF thành văn bản theo chương trình bằng API REST trong Ruby

PDF là định dạng tệp tài liệu chứa văn bản, dữ liệu, v.v. và độc lập với hệ điều hành. Tệp TXT là tài liệu văn bản tiêu chuẩn có phần mở rộng .TXT chứa văn bản thuần túy ở dạng dòng. Nó có thể được mở và chỉnh sửa trong bất kỳ công cụ chỉnh sửa văn bản hoặc xử lý văn bản nào. Trong một số trường hợp nhất định, bạn có thể cần chuyển đổi tài liệu PDF thành tệp văn bản theo chương trình. Trong bài viết này, bạn sẽ tìm hiểu cách chuyển đổi tệp PDF thành tệp Văn bản theo lập trình bằng cách sử dụng API REST trong Ruby.

Các chủ đề sau đây sẽ được đề cập trong bài viết này:

API REST chuyển đổi từ PDF sang TEXT và Ruby SDK

Để chuyển đổi tệp PDF sang tệp TXT, chúng tôi sẽ sử dụng Ruby SDK của GroupDocs.Conversion Cloud API. Bạn có thể cài đặt nó bằng lệnh sau trong bảng điều khiển đường ray:

gem install groupdocs_conversion_cloud

Vui lòng lấy Client ID và Secret của bạn từ GroupDocs Dashboard trước khi làm theo các bước được đề cập bên dưới. Khi bạn có Client ID và Client Secret, hãy thêm những mã này vào mã ứng dụng ruby như bên dưới:

# Nhận client_id và client_secret của bạn từ https://dashboard.groupdocs.cloud sau khi đăng ký miễn phí.
# Tải đá quý trong ứng dụng ruby của bạn cho http://api.groupdocs.cloud

require 'groupdocs_conversion_cloud'
@client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

Chuyển đổi tệp PDF thành tệp TEXT bằng API REST trong Ruby

Bạn có thể chuyển đổi tệp PDF thành tệp văn bản bằng cách thực hiện theo các bước đơn giản dưới đây. Hãy tìm hiểu cách chuyển đổi tài liệu PDF thành tệp văn bản theo chương trình bằng cách thực hiện theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của ConvertApi.
  • Tạo một phiên bản của ConvertSettings
  • Đặt đường dẫn tài liệu PDF đầu vào và định dạng đầu ra là “pdf”
  • Tạo một phiên bản của PdfLoadOptions
  • Đặt mật khẩu cho file pdf
  • Sau đó, Cung cấp cài đặt tùy chọn tải
  • Cung cấp đường dẫn tệp đầu ra “pdf-to-text”
  • Tạo ConvertDocumentRequest với ConvertSettings
  • Cuối cùng, gọi phương thức ConvertApi.convertDocument() với ConvertDocumentRequest.

Ví dụ mã sau đây cho thấy cách chuyển đổi tài liệu PDF thành tệp TEXT bằng API REST trong Ruby:

# Cách chuyển đổi tệp PDF sang tệp TXT.
# Tạo phiên bản API
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# Khởi tạo cài đặt chuyển đổi
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

settings.load_options = loadOptions
settings.output_path = "pdf-to-text"

# Chuyển đổi bằng trình chuyển đổi PDF sang TEXT
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf document to text file.")

Mã mẫu ở trên sẽ lưu tệp TEXT đã chuyển đổi trên đám mây.

Chuyển đổi các trang cụ thể của PDF thành TEXT trong Ruby

Bạn có thể chuyển đổi các trang tài liệu PDF cụ thể thành tệp Văn bản theo chương trình bằng cách thực hiện theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của ConvertApi.
  • Tiếp theo, tạo một phiên bản của ConvertSettings
  • Đặt đường dẫn tài liệu PDF đầu vào và định dạng đầu ra là “pdf”
  • Sau đó, tạo một phiên bản của PdfLoadOptions
  • Đặt mật khẩu cho file pdf
  • Tạo một phiên bản của TxtConvertOptions
  • Cung cấp số trang trong một mảng được phân tách bằng dấu phẩy để chuyển đổi
  • Sau đó, cung cấp đối tượng cài đặt loadOptions
  • Gán convertOptions cho đối tượng cài đặt
  • Cung cấp đường dẫn tệp đầu ra “pdf-to-text”
  • Tạo ConvertDocumentRequest với ConvertSettings
  • Cuối cùng, gọi phương thức ConvertApi.convertDocument() với ConvertDocumentRequest.

Ví dụ mã sau đây cho thấy cách chuyển đổi các trang cụ thể từ PDF sang Văn bản bằng API REST trong Ruby:

# Chuyển đổi các trang cụ thể của PDF thành tệp TEXT
# Tạo các phiên bản API cần thiết
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# Khởi tạo cài đặt chuyển đổi
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

convertOptions = GroupDocsConversionCloud::TxtConvertOptions.new
convertOptions.pages = [2, 3]

settings.load_options = loadOptions
settings.convert_options = convertOptions
settings.output_path = "pdf-to-text"

# Chuyển đổi các trang cụ thể của PDF sang TXT
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf to text file.")

Trình chuyển đổi TXT sang PDF trực tuyến miễn phí

Làm cách nào để chuyển đổi tệp PDF sang tệp Văn bản trực tuyến? Chuyển đổi PDF sang TXT trực tuyến miễn phí bằng trình chuyển đổi pdf sang TXT miễn phí tốt nhất của chúng tôi. Trình chuyển đổi pdf sang văn bản miễn phí này được phát triển bằng cách sử dụng API chuyển đổi pdf sang văn bản ở trên.

Tổng hợp

Trong bài viết này, chúng ta đã học cách:

  • cách chuyển đổi pdf sang tệp văn bản bằng ruby;
  • cách chuyển đổi các trang cụ thể của pdf thành văn bản trong ruby;

Bạn có thể tìm hiểu thêm về API trình chuyển đổi tệp GroupDocs.Conversion bằng cách sử dụng tài liệu. Chúng tôi cũng cung cấp phần Tham chiếu API cho phép bạn trực quan hóa và giao tiếp với các API của chúng tôi trực tiếp thông qua trình duyệt.

Đặt một câu hỏi

Nếu bạn có bất kỳ thắc mắc nào về trình chuyển đổi PDF sang Văn bản, vui lòng hỏi chúng tôi trên Diễn đàn hỗ trợ miễn phí.

Xem thêm