Cách gộp nhiều văn bản word thành một mà vẫn giữ nguyên định dạng

Cách kết hợp nhiều tài liệu Word bằng Python

Kết hợp hai hoặc nhiều tài liệu từ thành một tệp từ duy nhất theo chương trình trên đám mây bằng API REST. API sáp nhập docx trực tuyến của chúng tôi cung cấp giải pháp thuận tiện để kết hợp và hợp nhất nhiều tài liệu từ thành một tài liệu từ trực tuyến thay vì xử lý từng tệp một. Là một nhà phát triển Python, bạn có thể hợp nhất hai tài liệu từ trực tuyến thành một tài liệu từ duy nhất. Trong bài viết này, bạn sẽ học cách kết hợp nhiều tài liệu từ bằng Python.

Các chủ đề sau đây sẽ được đề cập trong bài viết này:

Hợp nhất tài liệu Word API REST – Python SDK

Để hợp nhất các tệp từ trực tuyến, tôi sẽ sử dụng Python SDK của GroupDocs.Merger Cloud API. Nó hỗ trợ kết hợp hai hoặc nhiều tệp vào một tài liệu từ hoặc trích xuất một trang tài liệu từ một tài liệu. Hợp nhất từ trực tuyến cũng cho phép bạn di chuyển, xóa, trao đổi, xoay hoặc thay đổi hướng của trang theo hướng dọc hoặc ngang cho toàn bộ hoặc phạm vi trang ưa thích. SDK này hỗ trợ hợp nhất và chia nhỏ tất cả các định dạng tài liệu phổ biến như Word, Excel, PowerPoint, Visio, OneNote, PDF, HTML, v.v.

Cài đặt GroupDocs.Merger Python SDK để hợp nhất các tệp docx trực tuyến bằng lệnh bên dưới:

pip install groupdocs_merger_cloud

Vui lòng lấy Mã khách hàng và Bí mật của bạn từ bảng điều khiển trước khi làm theo các bước được đề cập. Khi bạn có ID và bí mật của mình, hãy thêm mã như hình bên dưới:

# Nhập Python SDK vào ứng dụng python của bạn từ http://api.groupdocs.cloud
import groupdocs_merger_cloud

# Nhận client_id và client_secret từ https://dashboard.groupdocs.cloud sau khi đăng ký miễn phí.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Nhận cấu hình API tệp 
configuration = groupdocs_merger_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "MyStorage"

Cách kết hợp các tệp Word trong Python bằng API REST

Để hợp nhất các tài liệu từ trực tuyến trên đám mây, chúng tôi sẽ thực hiện theo các bước đơn giản được đề cập bên dưới:

  1. Tải lên các tệp từ lên đám mây
  2. Hợp nhất tệp docx bằng Python
  3. Tải xuống tệp word docx đã hợp nhất

Tải lên tệp Word

Đầu tiên, tải các tệp từ lên đám mây bằng ví dụ mã được cung cấp bên dưới:

# Tải tài liệu Word lên bộ nhớ đám mây
# Tạo phiên bản của API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
storage_api = groupdocs_merger_cloud.StorageApi.from_config(configuration)

# tải lên các tập tin mẫu
for filename in glob.iglob("H:\\groupdocs-cloud-data\\upload\\*.docx", recursive=True):
    destFile = filename.replace("H:\\groupdocs-cloud-data\\upload", "", 1)           
    # kiểm tra xem tệp đã tồn tại chưa
    fileExistsResponse = storage_api.object_exists(groupdocs_merger_cloud.ObjectExistsRequest(destFile))
    if not fileExistsResponse.exists:
        # tạo yêu cầu tệp tải lên
        request = groupdocs_merger_cloud.UploadFileRequest(destFile, filename)
        # tải tệp lên đám mây
        response = file_api.upload_file(request)
        print(response.uploaded)

Do đó, các tệp từ đã tải lên sẽ có sẵn trong phần tệp của trang tổng quan của bạn trên đám mây.

Hợp nhất nhiều tệp Word bằng Python

Kết hợp các tệp từ trực tuyến thành một tệp duy nhất theo chương trình bằng cách thực hiện theo các bước được đề cập bên dưới:

  • Tạo một phiên bản của DocumentApi
  • Tạo một thể hiện của JoinItem
  • Cung cấp đường dẫn tệp đầu vào cho JoinItem đầu tiên trong FileInfo
  • Tạo một phiên bản khác của JoinItem
  • Cung cấp đường dẫn tệp đầu vào cho JoinItem thứ hai trong FileInfo
  • Thêm nhiều JoinItems để hợp nhất nhiều hơn hai tệp
  • Tạo một phiên bản của JoinOptions
  • Thêm danh sách các mục tham gia đã tạo được phân tách bằng dấu phẩy
  • Đặt đường dẫn tệp đầu ra
  • Tạo một phiên bản của JoinRequest với JoinOptions
  • Cuối cùng, kết hợp các tệp bằng cách gọi phương thức join() của DocumentAPI với JoinRequest

Đoạn mã sau đây cho thấy cách kết hợp các tài liệu từ thành một tài liệu trực tuyến bằng Python:

# Cách hợp nhất các tệp Word Docx trong Python 
# Tạo các phiên bản API cần thiết
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)

# Tệp nguồn đầu vào 1
item1 = groupdocs_merger_cloud.JoinItem()
item1.file_info = groupdocs_merger_cloud.FileInfo("python-testing/word-one.docx")

# Tệp nguồn đầu vào 2
item2 = groupdocs_merger_cloud.JoinItem()
item2.file_info = groupdocs_merger_cloud.FileInfo("python-testing/word-two.docx")

# Xác định các tùy chọn tham gia
options = groupdocs_merger_cloud.JoinOptions()
options.join_items = [item1, item2]
options.output_path = "python-testing/joined-files.docx"

# Tạo yêu cầu tham gia
request = groupdocs_merger_cloud.JoinRequest(options)

# Hợp nhất các tệp docx
result = documentApi.join(request)
print("Successfully merged Word Docx files: " + str(result))

Tải xuống tệp đã hợp nhất

Bây giờ bạn đã biết cách kết hợp các tài liệu từ và giữ định dạng bằng python. Bạn có thể tải xuống bằng mẫu mã sau:

# Khởi tạo API để tải xuống tệp đã chuyển đổi
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Tạo yêu cầu tệp tải xuống
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\\joined-files.docx", storage_name)

# Tải xuống tệp đã chuyển đổi
response = file_api.download_file(request)

# Di chuyển tệp đã tải xuống vào thư mục của bạn
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Hợp nhất các trang cụ thể của nhiều tệp Word trong Python

Tiếp theo, kết hợp các trang cụ thể của nhiều tệp từ vào một tài liệu theo chương trình bằng cách thực hiện theo các bước được đề cập bên dưới:

  • Tạo một phiên bản của DocumentApi
  • Tạo một thể hiện của JoinItem
  • Cung cấp đường dẫn tệp đầu vào cho JoinItem đầu tiên trong FileInfo
  • Xác định danh sách số trang trong một mảng được phân tách bằng dấu phẩy
  • Tạo một phiên bản khác của JoinItem
  • Cung cấp đường dẫn tệp đầu vào cho JoinItem thứ hai trong FileInfo
  • Xác định số trang bắt đầu và số trang kết thúc
  • Xác định chế độ phạm vi trang là OddPages
  • Tạo một phiên bản của JoinOptions
  • Thêm danh sách các mục tham gia đã tạo được phân tách bằng dấu phẩy
  • Đặt đường dẫn tệp đầu ra
  • Tạo một phiên bản của JoinRequest với JoinOptions
  • Cuối cùng, hợp nhất các tệp từ bằng cách gọi phương thức join() của DocumentAPI với JoinRequest

Đoạn mã sau đây cho biết cách hợp nhất các trang cụ thể của tệp từ thành một bằng API REST trong Python:

# Cách hợp nhất các trang cụ thể của nhiều tệp docx trong Python
# Tạo và khởi tạo các phiên bản api
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)

# Tệp nguồn đầu vào 1
item1 = groupdocs_merger_cloud.JoinItem()
item1.file_info = groupdocs_merger_cloud.FileInfo("python-testing/word-one.docx")
# số trang của các trang cụ thể để hợp nhất
item1.pages = [1,2]

# Tệp nguồn đầu vào 2
item2 = groupdocs_merger_cloud.JoinItem()
item2.file_info = groupdocs_merger_cloud.FileInfo("python-testing/word-two.docx")
# số trang bắt đầu
item2.start_page_number = 2
# số trang cuối
item2.end_page_number = 4
# chế độ phạm vi trang
item2.range_mode = "OddPages"

# Xác định các tùy chọn tham gia
options = groupdocs_merger_cloud.JoinOptions()
options.join_items = [item1, item2]
options.output_path = "python-testing/joined-pages.docx"

# Tạo yêu cầu tham gia
request = groupdocs_merger_cloud.JoinRequest(options)

# Hợp nhất các tệp docx
result = documentApi.join(request)
print("Successfully merged Word pages: " + str(result))

Hợp nhất tài liệu Word trực tuyến miễn phí

Làm thế nào để kết hợp các tài liệu từ trực tuyến miễn phí? Vui lòng thử cách sau để hợp nhất tài liệu trực tuyến miễn phí, được phát triển bằng API trên.

Phần kết luận

Trong hướng dẫn này, chúng ta đã học được:

  • cách gộp văn bản word trực tuyến trên cloud bằng python;
  • cách lập trình tải lên và tải xuống tệp tài liệu đã hợp nhất;
  • nối các trang của nhiều tài liệu từ trực tuyến thành một tệp duy nhất trong Python;

Ngoài ra, bạn có thể tìm hiểu thêm về GroupDocs.Merger Cloud API bằng cách sử dụng tài liệu. Chúng tôi cũng cung cấp phần Tham chiếu API cho phép bạn trực quan hóa và giao tiếp với các API của chúng tôi trực tiếp thông qua trình duyệt. Ngoài ra, vui lòng xem GroupDocs.Merger Cloud SDK dành cho Python Ví dụ tại đây.

Đặt một câu hỏi

Nếu bạn có bất kỳ câu hỏi nào về việc hợp nhất tài liệu từ, vui lòng hỏi chúng tôi trên Diễn đàn hỗ trợ miễn phí.

Xem thêm