Cách chuyển đổi PDF sang Excel trong Python bằng API REST

Chuyển đổi PDF sang Excel bằng Python bằng API REST

PDF là một trong những định dạng tài liệu đa năng được sử dụng phổ biến nhất để trình bày tài liệu. Nhưng rất khó để chỉnh sửa một tài liệu PDF. Để dễ dàng trích xuất bảng hoặc chỉnh sửa văn bản ở định dạng bảng tính, bạn cần chuyển đổi PDF sang bảng tính Excel có thể chỉnh sửa. Vì vậy, bạn không cần mất thời gian sao chép văn bản thủ công rồi chỉnh sửa. API chuyển đổi PDF sang XLS hoặc PDF sang XLSX của chúng tôi cho phép bạn chuyển đổi PDF sang định dạng bảng tính Excel một cách nhanh chóng. Trong bài viết này, chúng ta sẽ tìm hiểu cách chuyển đổi PDF sang Excel bằng Python bằng API REST.

Các chủ đề sau đây sẽ được đề cập trong bài viết này:

Python PDF to Excel Converter API – Cài đặt

Để chuyển đổi tệp PDF sang định dạng Excel, chúng tôi sẽ sử dụng Python SDK của GroupDocs.Conversion Cloud API. Nó là một thư viện Python chuyển đổi hình ảnh và tài liệu độc lập với nền tảng, giàu tính năng. Nó cung cấp khả năng chuyển đổi nhanh chóng hình ảnh và tài liệu của bất kỳ định dạng tệp được hỗ trợ nào sang bất kỳ định dạng nào với chất lượng cao.

Bạn có thể cài đặt thư viện Python chuyển đổi PDF sang XLSX vào ứng dụng Python của mình bằng lệnh sau trong bảng điều khiển:

pip install groupdocs_conversion_cloud

Vui lòng lấy Client ID và Secret của bạn từ bảng điều khiển trước khi làm theo các bước được đề cập. Khi bạn có ID và bí mật của mình, hãy thêm mã vào ứng dụng python của bạn:

# Thư viện Python để chuyển đổi PDF sang Excel trong ứng dụng python
import groupdocs_conversion_cloud

# Nhận client_id và client_secret từ https://dashboard.groupdocs.cloud sau khi đăng ký miễn phí.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Nhận các cấu hình khác nhau
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "local-storage-name"

Bây giờ, hãy trình bày cách từng bước chuyển đổi định dạng pdf sang xlsx bằng API REST trong Python.

Cách chuyển đổi PDF sang XLSX bằng Python bằng API REST

Chúng tôi có thể chuyển đổi tệp pdf sang định dạng excel theo chương trình bằng cách thực hiện theo các bước đơn giản dưới đây:

  • Đầu tiên, tạo một phiên bản của ConvertApi
  • Sau đó, tạo phiên bản cài đặt chuyển đổi bằng ConvertSettings
  • Tiếp theo, cung cấp tên lưu trữ tệp
  • Đặt đường dẫn tệp PDF đầu vào và định dạng đầu ra là “xlsx”
  • Tiếp theo, tạo một phiên bản của PdfLoadOptions.
  • Cung cấp mật khẩu tệp PDF
  • Sau đó, đặt đầu ra\đường dẫn và tải\tùy chọn
  • Sau đó, tạo ConvertDocumentRequest với ConvertSettings làm đối số
  • Cuối cùng, chuyển đổi pdf sang excel bằng cách gọi convert\document() với ConvertDocumentRequest

Mẫu mã sau đây cho biết cách thay đổi định dạng pdf thành excel trong Python:

# Cách Python Chuyển đổi PDF sang Excel trực tuyến
try:
  # Tạo một phiên bản của API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Xác định cài đặt chuyển đổi
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "xlsx"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Tạo yêu cầu tài liệu chuyển đổi
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Chuyển đổi tệp .pdf sang định dạng .xlsx
  result = convert_api.convert_document(request)
  print("pdf File converted to xlsx successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Cuối cùng, mẫu mã trên sẽ lưu tệp xlsx trên đám mây. Đây là cách tốt nhất để chuyển đổi tài liệu pdf sang excel.

Cách chuyển đổi PDF sang XLSX bằng Python bằng API REST

Cách chuyển đổi PDF sang XLSX bằng Python bằng API REST

Chuyển đổi phạm vi trang từ tệp PDF sang tệp Excel bằng Python

Chúng tôi có thể chuyển đổi nhiều trang của tài liệu PDF thành excel bằng cách thực hiện theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của ConvertApi
  • Sau đó, tạo phiên bản cài đặt chuyển đổi bằng ConvertSettings
  • Tiếp theo, cung cấp tên lưu trữ đám mây của bạn
  • Đặt đường dẫn tệp PDF đầu vào và định dạng đầu ra là “xlsx”
  • Tiếp theo, tạo một phiên bản của XlsConvertOptions
  • Đặt tùy chọn from\page và pages\count
  • Sau đó, đặt đường dẫn đầu ra và convertOptions
  • Bây giờ, hãy tạo ConvertDocumentRequest với ConvertSettings làm đối số
  • Cuối cùng, chuyển đổi mã pdf sang excel trực tuyến bằng cách gọi phương thức convert\document() với ConvertDocumentRequest

Mẫu mã sau đây cho biết cách chuyển đổi một loạt các trang từ tài liệu PDF sang tệp excel bằng Python:

# Cách chuyển đổi phạm vi trang từ PDF sang Excel bằng Python
# Tạo một phiên bản API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Chuẩn bị cài đặt chuyển đổi excel
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# Tùy chọn chuyển đổi PDF: số trang bắt đầu và tổng số trang để chuyển đổi
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.from_page = 2 
convertOptions.pages_count = 3

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Tạo yêu cầu tài liệu chuyển đổi
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Chuyển đổi các trang PDF sang tệp Excel
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to Excel file: " + result[0].path)

Cuối cùng, mẫu mã trên sẽ lưu tài liệu sau khi chuyển đổi từ pdf sang excel trực tuyến trên đám mây.

Chuyển đổi các trang cụ thể của định dạng PDF sang Excel bằng Python

Chúng tôi có thể chuyển đổi các trang cụ thể của tài liệu PDF sang Excel bằng cách sử dụng trình chuyển đổi pdf sang xlsx trực tuyến tốt nhất bằng hình ảnh bằng cách thực hiện theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của ConvertApi
  • Sau đó, tạo phiên bản cài đặt chuyển đổi bằng ConvertSettings
  • Tiếp theo, cung cấp tên lưu trữ đám mây của bạn
  • Đặt đường dẫn tệp PDF đầu vào và định dạng đầu ra là “xlsx”
  • Tiếp theo, tạo một phiên bản của XlsConvertOptions
  • Thêm số trang để chuyển đổi ở định dạng mảng
  • Sau đó, đặt đường dẫn đầu ra và convertOptions
  • Bây giờ, hãy tạo ConvertDocumentRequest với ConvertSettings làm đối số
  • Cuối cùng, chuyển đổi mã pdf sang excel trực tuyến bằng cách gọi phương thức convert\document() với ConvertDocumentRequest

Mẫu mã sau đây cho biết cách xuất các trang nhất định của tài liệu PDF sang tệp Excel bằng Python:

# Cách chuyển đổi các trang cụ thể của tệp PDF sang định dạng Excel bằng Python
# Tạo một phiên bản API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Xác định cài đặt chuyển đổi
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# Tùy chọn chuyển đổi PDF: số trang để chuyển đổi
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Tạo yêu cầu tài liệu chuyển đổi
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Chuyển đổi tệp PDF sang tệp Excel
result = convert_api.convert_document(request)
print("Successfully converted PDF file to XLSX document: " + result[0].path)

Cuối cùng, mẫu mã trên sẽ chuyển đổi pdf sang xlsx với hình ảnh trên đám mây. Có một công cụ chuyển đổi mã pdf sang xlsx trực tuyến như được giải thích bên dưới.

Trình chuyển đổi PDF sang Excel trực tuyến miễn phí

Trình chuyển đổi PDF sang Excel tốt nhất là gì? Groupdocs.Conversion cung cấp trình chuyển đổi pdf sang xlsx trực tuyến miễn phí tốt nhất để bạn chuyển đổi định dạng PDF sang Excel. Nó đã được phát triển bằng API Groupdocs.Conversion trực tuyến từ pdf sang xlsx.

Phần kết luận

Trong bài viết này, bạn đã học được:

  • cách chuyển đổi pdf sang xls/xlsx mà không làm mất định dạng trong Python;
  • cách chuyển file pdf sang excel theo dãy bằng Python;
  • chuyển đổi các trang PDF cụ thể sang định dạng XLSX bằng Python;

Ngoài ra, bạn có thể tìm hiểu thêm về API chuyển đổi định dạng tệp GroupDocs.Conversion bằng cách sử dụng tài liệu.

Đặt một câu hỏi

Bạn có thể đặt câu hỏi về cách chuyển đổi tệp pdf sang định dạng xlsx, thông qua Diễn đàn hỗ trợ miễn phí của chúng tôi

Xem thêm