Hợp nhất các loại tài liệu khác nhau bằng API REST trong Python

Việc hợp nhất các tài liệu khác nhau cùng loại hoặc khác loại cho phép thu thập dữ liệu hoặc thông tin phân tán vào một tệp duy nhất. Chúng tôi có thể dễ dàng hợp nhất nhiều tài liệu thuộc các loại tệp khác nhau thành một tệp trên đám mây. Trong bài viết này, chúng ta sẽ tìm hiểu cách hợp nhất các tài liệu thuộc các loại tệp khác nhau thành PDF bằng API REST trong Python.

Các chủ đề sau đây sẽ được đề cập trong bài viết này:

Hợp nhất tệp REST API và Python SDK

Để hợp nhất nhiều tệp, chúng tôi sẽ sử dụng Python SDK của GroupDocs.Merger Cloud API. Nó cho phép chúng tôi kết hợp, tách, xóa và sắp xếp lại một trang hoặc một tập hợp các trang từ các định dạng tài liệu được hỗ trợ của Word, Excel, PowerPoint, Bản vẽ Visio, PDFHTML. Vui lòng cài đặt nó bằng lệnh sau trong bảng điều khiển:

pip install groupdocs-merger-cloud

Vui lòng lấy Client ID và Secret của bạn từ bảng điều khiển trước khi làm theo các bước được đề cập. Khi bạn có ID và bí mật của mình, hãy thêm mã như hình bên dưới:

# Ví dụ về mã này trình bày cách thêm id khách hàng và bí mật trong mã.
client_id = "659fe7da-715b-4744-a0f7-cf469a392b73"
client_secret = "b377c36cfa28fa69960ebac6b6e36421"

configuration = groupdocs_merger_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

Hợp nhất nhiều loại tệp bằng API REST trong Python

Chúng tôi có thể kết hợp các tài liệu thuộc nhiều loại tệp theo chương trình trên đám mây bằng cách thực hiện theo các bước dưới đây:

  1. Tải lên tệp lên đám mây
  2. Hợp nhất Tài liệu thuộc các loại tệp khác nhau
  3. Tải xuống tệp đã hợp nhất

Tải tệp lên

Đầu tiên, chúng tôi sẽ tải các tệp lên đám mây bằng ví dụ mã được cung cấp bên dưới:

# Ví dụ mã này trình bày cách tải tệp lên đám mây.
# Tạo một phiên bản của các API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Tải lên các tệp mẫu
for filename in glob.iglob("C:\\Files\\Merger\\upload\\*.*", recursive=True):
    destFile = filename.replace("C:\\Files\\Merger\\upload", "", 1)           
    # Tạo yêu cầu tệp tải lên
    request = groupdocs_merger_cloud.UploadFileRequest(destFile, filename)
    # Cập nhật dử liệu
    file_api.upload_file(request)

Do đó, các tệp đã tải lên sẽ có sẵn trong phần tệp trên trang tổng quan của bạn trên đám mây.

Hợp nhất tài liệu của các loại tệp khác nhau trong Python

Giờ đây, chúng ta có thể dễ dàng hợp nhất các tệp đã tải lên thuộc các loại khác nhau thành một tệp duy nhất bằng cách thực hiện theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của DocumentApi.
  • Tiếp theo, cung cấp đường dẫn tệp đầu vào cho JoinItem đầu tiên.
  • Sau đó, cung cấp đường dẫn tệp đầu vào cho JoinItem thứ hai.
  • Nếu muốn, hãy lặp lại các bước trên để thêm nhiều tệp hơn.
  • Sau đó, xác định JoinOptions và đặt đường dẫn của tệp đầu ra.
  • Cuối cùng, gọi phương thức join() và lưu tài liệu đã hợp nhất.

Mẫu mã sau đây cho biết cách hợp nhất các loại tệp khác nhau bằng API REST trong Python.

# Ví dụ mã này trình bày cách hợp nhất các tài liệu thuộc các loại tệp khác nhau trong Python.
documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(client_id, client_secret)

# tập tin đầu tiên
item1 = groupdocs_merger_cloud.JoinItem()
item1.file_info = groupdocs_merger_cloud.FileInfo("sample.pdf")

# tập tin thứ hai
item2 = groupdocs_merger_cloud.JoinItem()
item2.file_info = groupdocs_merger_cloud.FileInfo("sample.docx")

# tùy chọn tham gia
options = groupdocs_merger_cloud.JoinOptions()
options.join_items = [item1, item2]
options.output_path = "joined.pdf"

# Tạo yêu cầu tham gia với JoinOptions
request = groupdocs_merger_cloud.JoinRequest(options)

# Ghép các tập tin
result = documentApi.join(request)        

Tải xuống tệp đã hợp nhất

Cuối cùng, mẫu mã trên sẽ lưu tệp PDF đã hợp nhất trên đám mây. Nó có thể được tải xuống bằng cách sử dụng mẫu mã sau:

# Ví dụ mã này trình bày cách tải xuống tệp đã hợp nhất từ đám mây.
# khởi tạo API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Tạo yêu cầu tệp tải xuống
request = groupdocs_merger_cloud.DownloadFileRequest("joined.pdf", my_storage)

# Tải tập tin
response = file_api.download_file(request)

# Di chuyển tệp đã tải xuống vào thư mục làm việc của bạn
shutil.move(response, "C:\\Files\\Merger\\")

Cách hợp nhất PDF và Excel thành PDF

Chúng tôi có thể hợp nhất các tệp PDF và Excel thành một tệp PDF bằng cách làm theo các bước được đề cập trước đó. Tuy nhiên, chúng tôi chỉ cần cung cấp đường dẫn tài liệu PDF và Excel dưới dạng JoinItems thứ nhất và thứ hai. Mẫu mã sau đây cho biết cách hợp nhất tài liệu PDF và trang tính Excel thành tệp PDF bằng API REST trong Python.

# Ví dụ mã này trình bày cách hợp nhất tệp Word và Excel thành PDF bằng Python.
documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(client_id, client_secret)

# tập tin đầu tiên
item1 = groupdocs_merger_cloud.JoinItem()
item1.file_info = groupdocs_merger_cloud.FileInfo("sample.pdf")

# tập tin thứ hai
item2 = groupdocs_merger_cloud.JoinItem()
item2.file_info = groupdocs_merger_cloud.FileInfo("sample.xlsx")

# tùy chọn tham gia
options = groupdocs_merger_cloud.JoinOptions()
options.join_items = [item1, item2]
options.output_path = "joined.pdf"

# Tạo yêu cầu tham gia với JoinOptions
request = groupdocs_merger_cloud.JoinRequest(options)

# Ghép các tập tin
result = documentApi.join(request)        

Cách hợp nhất PDF và PowerPoint thành PDF

Chúng tôi cũng có thể hợp nhất các tài liệu PDF và bản trình bày PowerPoint thành PDF bằng cách làm theo các bước đã đề cập trước đó. Tuy nhiên, chúng tôi chỉ cần cung cấp đường dẫn tài liệu PDF và PowerPoint dưới dạng JoinItems thứ nhất và thứ hai. Mẫu mã sau đây cho biết cách hợp nhất tài liệu PDF và bản trình bày PowerPoint thành tệp PDF bằng API REST trong Python.

# Ví dụ mã này trình bày cách hợp nhất bản trình bày Word và PowerPoint thành PDF bằng Python.
documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(client_id, client_secret)

# tập tin đầu tiên
item1 = groupdocs_merger_cloud.JoinItem()
item1.file_info = groupdocs_merger_cloud.FileInfo("sample.pdf")

# tập tin thứ hai
item2 = groupdocs_merger_cloud.JoinItem()
item2.file_info = groupdocs_merger_cloud.FileInfo("sample.pptx")

# tùy chọn tham gia
options = groupdocs_merger_cloud.JoinOptions()
options.join_items = [item1, item2]
options.output_path = "joined.pdf"

# Tạo yêu cầu tham gia với JoinOptions
request = groupdocs_merger_cloud.JoinRequest(options)

# Ghép các tập tin
result = documentApi.join(request)        

Kết hợp các trang cụ thể của các loại tệp khác nhau trong Python

Chúng tôi có thể hợp nhất các trang đã chọn từ các loại tài liệu khác nhau thành một tệp duy nhất bằng cách thực hiện theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của DocumentApi.
  • Tiếp theo, cung cấp đường dẫn tệp đầu vào cho JoinItem đầu tiên.
  • Sau đó, cung cấp số trang cụ thể để hợp nhất.
  • Tiếp theo, cung cấp đường dẫn tệp đầu vào cho JoinItem thứ hai.
  • Sau đó, xác định phạm vi trang để hợp nhất với số trang bắt đầu và số trang kết thúc.
  • Sau đó, xác định JoinOptions và đặt đường dẫn của tệp đầu ra.
  • Cuối cùng, gọi phương thức join() và lưu tài liệu đã hợp nhất.

Mẫu mã sau đây cho biết cách hợp nhất các trang cụ thể của các loại tệp khác nhau bằng cách sử dụng API REST trong Python.

# Ví dụ mã này trình bày cách hợp nhất các tài liệu thuộc các loại tệp khác nhau trong Python.
documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(client_id, client_secret)

# tập tin đầu tiên
item1 = groupdocs_merger_cloud.JoinItem()
item1.file_info = groupdocs_merger_cloud.FileInfo("sample.pdf")
# Số trang để hợp nhất từ tài liệu đầu tiên
item1.pages = [1, 2]

# tập tin thứ hai
item2 = groupdocs_merger_cloud.JoinItem()
item2.file_info = groupdocs_merger_cloud.FileInfo("sample.docx")
# Phạm vi trang để hợp nhất từ tài liệu thứ hai
item2.start_page_number = 1
item2.end_page_number = 3
  
# tùy chọn tham gia
options = groupdocs_merger_cloud.JoinOptions()
options.join_items = [item1, item2]
options.output_path = "joined.pdf"

# Tạo yêu cầu tham gia với JoinOptions
request = groupdocs_merger_cloud.JoinRequest(options)

# Ghép các tập tin
result = documentApi.join(request)        

Thử trực tuyến

Vui lòng thử công cụ hợp nhất trực tuyến miễn phí sau đây, được phát triển bằng cách sử dụng API ở trên. https://products.groupdocs.app/merger/

Phần kết luận

Trong bài viết này, chúng ta đã học được:

  • cách hợp nhất tài liệu của nhiều loại tệp trong Python;
  • cách kết hợp các trang cụ thể từ các tài liệu thuộc các loại tệp khác nhau trong Python;
  • tải nhiều tệp lên đám mây;
  • cách tải xuống PDF đã hợp nhất từ đám mây.

Ngoài ra, bạn có thể tìm hiểu thêm về GroupDocs.Merge Cloud API bằng cách sử dụng tài liệu. Chúng tôi cũng cung cấp phần Tham khảo API cho phép bạn hình dung và tương tác trực tiếp với các API của chúng tôi thông qua trình duyệt. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi theo số fo.

Xem thêm