Chuyển đổi tài liệu Word sang PDF bằng API REST trong Python.

Chia sẻ tài liệu Word ở định dạng PDF là một thông lệ phổ biến vì PDF là định dạng chia sẻ tài liệu được sử dụng rộng rãi trong ngành. Bạn có thể dễ dàng chuyển đổi Word sang PDF bằng chức năng tích hợp do Microsoft Office cung cấp, nhưng bạn có thể cần chuyển đổi tài liệu Word (DOC hoặc DOCX) thành PDF theo chương trình. Trong bài viết này, bạn sẽ tìm hiểu cách chuyển đổi tài liệu Word sang PDF bằng API REST trong Python.

Các chủ đề sau đây sẽ được đề cập trong bài viết này:

API REST chuyển đổi từ Word sang PDF và SDK Python

Để chuyển đổi DOCX thành PDF, chúng tôi sẽ sử dụng Python SDK của GroupDocs.Conversion Cloud API. Nó là một giải pháp chuyển đổi tài liệu/hình ảnh độc lập với nền tảng và không phụ thuộc vào bất kỳ công cụ hay phần mềm nào. Nó cho phép bạn chuyển đổi hình ảnh và tài liệu của bất kỳ định dạng tệp được hỗ trợ nào sang bất kỳ định dạng nào bạn cần một cách nhanh chóng và đáng tin cậy.

Bạn có thể cài đặt GroupDocs.Conversion Cloud cho ứng dụng Python của mình bằng lệnh sau trong bảng điều khiển:

pip install groupdocs_conversion_cloud

Vui lòng lấy Client ID và Secret của bạn từ bảng điều khiển trước khi làm theo các bước được đề cập. Khi bạn có ID và bí mật của mình, hãy thêm mã như hình bên dưới:

client_id = "659fe7da-715b-4744-a0f7-cf469a392b73"
client_secret = "b377c36cfa28fa69960ebac6b6e36421"

configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

Chuyển đổi tài liệu Word sang PDF bằng API REST trong Python

Bạn có thể chuyển đổi tài liệu Word của mình sang PDF theo chương trình trên đám mây bằng cách thực hiện theo các bước đơn giản dưới đây:

  1. Tải lên tệp DOCX lên đám mây
  2. Chuyển đổi DOCX sang PDF bằng Python
  3. Tải xuống tệp PDF đã chuyển đổi

Tải lên tệp DOCX

Đầu tiên, tải tệp DOCX lên đám mây bằng mẫu mã sau:

# Tạo phiên bản của API
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)

# tải lên yêu cầu tập tin
request = groupdocs_conversion_cloud.UploadFileRequest("sample.docx", "C:\\Files\\Conversion\\sample.docx", my_storage)

# tải lên tập tin mẫu
response = file_api.upload_file(request)

Do đó, tệp DOCX đã tải lên sẽ có sẵn trong phần tệp trên trang tổng quan của bạn trên đám mây.

Chuyển đổi DOCX sang PDF bằng Python

Bạn có thể dễ dàng chuyển đổi tài liệu DOCX sang PDF theo chương trình bằng cách thực hiện theo các bước được đề cập bên dưới:

  • Đầu tiên, tạo một phiên bản của ConvertApi.
  • Bây giờ, hãy tạo một phiên bản của ConvertSettings.
  • Sau đó, cung cấp đường dẫn tệp DOCX đầu vào.
  • Đặt định dạng là “pdf”.
  • Cung cấp đường dẫn tệp đầu ra.
  • Bây giờ, hãy tạo ConvertDocumentRequest với ConvertSettings.
  • Cuối cùng, chuyển đổi DOCX bằng cách gọi phương thức convert\document() với ConvertDocumentRequest.

Ví dụ mã sau đây cho biết cách chuyển đổi DOCX sang PDF bằng API REST trong Python.

# Tạo một phiên bản của API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Xác định cài đặt chuyển đổi
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "sample.docx"
settings.format = "pdf"
settings.output_path = "converted"

# Tạo yêu cầu tài liệu chuyển đổi
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Chuyển đổi tài liệu
result = convert_api.convert_document(request)

# Xong
print("Document converted: " + result[0].path)
Chuyển đổi tài liệu Word sang PDF bằng API REST trong Python

Chuyển đổi Tài liệu Word sang PDF bằng API REST trong Python.

Tải xuống tệp đã chuyển đổi

Mẫu mã trên sẽ lưu tệp PDF đã chuyển đổi trên đám mây. Bạn có thể tải xuống bằng mẫu mã sau:

# khởi tạo API
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)

# Tạo yêu cầu tệp tải xuống
request = groupdocs_conversion_cloud.DownloadFileRequest("converted\\sample.pdf", my_storage)

# Tải tập tin
response = file_api.download_file(request)

# Di chuyển tệp đã tải xuống vào thư mục làm việc của bạn
shutil.move(response, "C:\\Files\\Conversion\\")

Chuyển đổi Word sang PDF với các tùy chọn nâng cao

Bạn có thể chuyển đổi tài liệu Word thành tệp PDF bằng một số cài đặt nâng cao bằng cách thực hiện theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của ConvertApi.
  • Bây giờ, hãy tạo một phiên bản của ConvertSettings.
  • Sau đó, cung cấp đường dẫn tệp DOCX.
  • Đặt “pdf” làm định dạng.
  • Cung cấp đường dẫn tệp đầu ra.
  • Bây giờ, hãy tạo một phiên bản của DocxLoadOptions
  • Tùy ý thiết lập các tùy chọn tải khác nhau như ẩn\bình luận, ẩn\từ\được theo dõi\thay đổi, v.v.
  • Bây giờ, hãy tạo một phiên bản của PdfConvertOptions
  • Sau đó, đặt các tùy chọn chuyển đổi khác nhau như display\doc\title, lề (trên, trái, phải, dưới), v.v.
  • Bây giờ, hãy tạo ConvertDocumentRequest với ConvertSettings
  • Cuối cùng, chuyển đổi DOCX bằng cách gọi phương thức convert\document() với ConvertDocumentRequest

Ví dụ mã sau đây cho biết cách chuyển đổi tài liệu Word thành tài liệu PDF với các tùy chọn chuyển đổi nâng cao. Vui lòng làm theo các bước được đề cập trước đó để tải lên và tải xuống tệp.

# Tạo một phiên bản của API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Xác định cài đặt chuyển đổi
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "sample.docx"
settings.format = "pdf"
settings.output_path = "converted"

# Tùy chọn tải DOCX
loadOptions = groupdocs_conversion_cloud.DocxLoadOptions()
loadOptions.hide_comments = True              # Hide comments
loadOptions.hide_word_tracked_changes = True  # Hide tracked changes

# Tùy chọn chuyển đổi PDF
convertOptions = groupdocs_conversion_cloud.PdfConvertOptions()
convertOptions.center_window = True
convertOptions.compress_images = False
convertOptions.display_doc_title = True
convertOptions.dpi = 1024.0
convertOptions.fit_window = False
convertOptions.from_page = 1
convertOptions.grayscale = False
convertOptions.image_quality = 100
convertOptions.linearize = False
convertOptions.margin_top = 5
convertOptions.margin_left = 5
convertOptions.unembed_fonts = True
convertOptions.remove_unused_streams = True
convertOptions.remove_unused_objects = True
convertOptions.remove_pdfa_compliance = False

settings.convert_options = convertOptions

# Chuyển đổi yêu cầu tài liệu
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Chuyển đổi tài liệu
result = convert_api.convert_document(request)

# Xong
print("Document converted: " + result[0].path)

Chuyển đổi phạm vi trang từ DOCX sang PDF bằng Python

Bạn có thể chuyển đổi nhiều trang từ tài liệu Word sang tệp PDF theo chương trình bằng cách thực hiện theo các bước được đề cập bên dưới:

  • Đầu tiên, tạo một phiên bản của ConvertApi
  • Bây giờ, hãy tạo một phiên bản của ConvertSettings
  • Sau đó, cung cấp đường dẫn tệp DOCX đầu vào
  • Gán “pdf” cho định dạng
  • Cung cấp đường dẫn tệp đầu ra
  • Bây giờ, hãy tạo một phiên bản của PdfConvertOptions
  • Sau đó, cung cấp phạm vi trang để chuyển đổi từ số trang bắt đầu và tổng số trang để chuyển đổi
  • Bây giờ, hãy gán PdfConvertOptions cho ConvertSettings
  • Sau đó, tạo ConvertDocumentRequest với ConvertSettings
  • Cuối cùng, chuyển đổi bằng cách gọi phương thức convert\document() với ConvertDocumentRequest

Mẫu mã sau đây cho biết cách chuyển đổi một loạt trang từ DOCX sang PDF bằng API REST trong Python. Vui lòng làm theo các bước được đề cập trước đó để tải lên và tải xuống tệp.

# Tạo một phiên bản API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Xác định cài đặt chuyển đổi
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "sample.docx"
settings.format = "pdf"
settings.output_path = "converted"

# Tùy chọn chuyển đổi PDF
convertOptions = groupdocs_conversion_cloud.PdfConvertOptions()
convertOptions.from_page = 1;    # start page number
convertOptions.pages_count = 2;  # total pages to convert

settings.convert_options = convertOptions

# Chuyển đổi yêu cầu tài liệu
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Chuyển đổi tài liệu
result = convert_api.convert_document(request)

# Xong
print("Document converted: " + result[0].path)

Chuyển đổi các trang cụ thể của DOCX sang PDF bằng Python

Bạn có thể chuyển đổi các trang cụ thể của tài liệu Word thành tệp PDF theo chương trình bằng cách thực hiện theo các bước được đề cập bên dưới:

  • Đầu tiên, tạo một phiên bản của ConvertApi
  • Bây giờ, hãy tạo một phiên bản của ConvertSettings
  • Sau đó, cung cấp đường dẫn tệp DOCX đầu vào
  • Gán “pdf” cho định dạng
  • Cung cấp đường dẫn tệp đầu ra
  • Bây giờ, hãy tạo một phiên bản của PdfConvertOptions
  • Sau đó, cung cấp số trang cụ thể trong một mảng được phân tách bằng dấu phẩy để chuyển đổi
  • Bây giờ, hãy gán PdfConvertOptions cho ConvertSettings
  • Sau đó, tạo ConvertDocumentRequest với ConvertSettings
  • Cuối cùng, chuyển đổi bằng cách gọi phương thức convert\cocument() với ConvertDocumentRequest

Ví dụ mã sau đây cho biết cách chuyển đổi các trang cụ thể của tài liệu Word sang PDF bằng API REST trong Python. Vui lòng làm theo các bước được đề cập trước đó để tải lên và tải xuống tệp.

# Tạo một phiên bản API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Xác định cài đặt chuyển đổi
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "sample.docx"
settings.format = "pdf"
settings.output_path = "converted"

# Tùy chọn chuyển đổi PDF
convertOptions = groupdocs_conversion_cloud.PdfConvertOptions()
convertOptions.pages = [1,2];  # page numbers to convert

settings.convert_options = convertOptions

# Chuyển đổi yêu cầu tài liệu
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Chuyển đổi tài liệu
result = convert_api.convert_document(request)

# Xong
print("Document converted: " + result[0].path)

Chuyển đổi Word sang PDF với Watermark bằng Python

Bạn có thể chuyển đổi tài liệu Word sang tài liệu PDF và thêm hình mờ vào tài liệu đã chuyển đổi theo chương trình bằng cách thực hiện theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của ConvertApi
  • Bây giờ, hãy tạo một phiên bản của ConvertSettings
  • Sau đó, cung cấp đường dẫn tệp DOCX đầu vào
  • Gán “pdf” cho định dạng
  • Cung cấp đường dẫn tệp đầu ra
  • Bây giờ, hãy tạo một phiên bản của WatermarkOptions
  • Sau đó, đặt Văn bản hình mờ, Màu sắc, Chiều rộng, Chiều cao, Trái, Trên cùng, v.v.
  • Bây giờ, xác định PdfConvertOptions và gán WatermarkOptions
  • Bây giờ, hãy tạo ConvertDocumentRequest với ConvertSettings
  • Cuối cùng, chuyển đổi DOCX bằng cách gọi phương thức convert\document() với ConvertDocumentRequest

Ví dụ mã sau đây cho biết cách chuyển đổi tài liệu Word thành tài liệu PDF và thêm hình mờ vào tài liệu PDF đã chuyển đổi bằng API REST trong Python. Vui lòng làm theo các bước được đề cập trước đó để tải lên và tải xuống tệp.

# khởi tạo API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Xác định cài đặt chuyển đổi
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "sample.docx"
settings.format = "pdf"
settings.output_path = "converted"

# Xác định các tùy chọn hình mờ
watermark = groupdocs_conversion_cloud.WatermarkOptions()
watermark.text = "THIS IS SAMPLE WATERMARK"
watermark.bold = True;
watermark.font_size = 34;
watermark.color = "Gray";
watermark.background = False;
watermark.rotation_angle = 30;
watermark.left = 90;
watermark.top = 500;

# Xác định các tùy chọn chuyển đổi PDF
convertOptions = groupdocs_conversion_cloud.PdfConvertOptions()
convertOptions.watermark_options = watermark

settings.convert_options = convertOptions

# Tạo yêu cầu tài liệu chuyển đổi
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Chuyển đổi tài liệu
result = convert_api.convert_document(request)
print("Document converted successfully: " + result[0].url)
Chuyển đổi Word sang PDF với Watermark bằng Python.

Chuyển đổi Word sang PDF với Watermark bằng Python.

Chuyển đổi DOCX sang PDF mà không cần sử dụng Cloud Storage

Bạn có thể chuyển đổi tài liệu Word sang PDF mà không cần sử dụng bộ nhớ đám mây bằng cách chuyển nó vào phần thân yêu cầu và nhận tệp đầu ra trong phản hồi API. Vui lòng làm theo các bước được đề cập bên dưới để chuyển đổi DOCX thành PDF mà không cần sử dụng bộ nhớ đám mây.

  • Đầu tiên, tạo một phiên bản của ConvertApi
  • Đọc tệp DOCX đầu vào từ đường dẫn cục bộ
  • Bây giờ, hãy tạo ConvertDocumentDirectRequest
  • Sau đó, cung cấp định dạng đích là “pdf” và đường dẫn tệp đầu vào làm tham số đầu vào
  • Nhận kết quả bằng cách gọi phương thức convert\document\direct() với ConvertDocumentDirectRequest
  • Cuối cùng, lưu tệp đầu ra vào đường dẫn cục bộ bằng phương thức FileStream.writeFile()

Ví dụ mã sau đây cho biết cách chuyển đổi tài liệu Word thành PDF mà không cần sử dụng bộ nhớ đám mây.

# Tạo một phiên bản API
convert_api = groupdocs_conversion_cloud.Chuyển thànhApi.from_keys(client_id, client_secret)

# Tạo yêu cầu chuyển đổi
request = groupdocs_conversion_cloud.Chuyển thànhDocumentDirectRequest("pdf", "C:\\Files\\Conversion\\sample.docx")

# Chuyển thành
result = convert_api.convert_document_direct(request)

# Di chuyển tệp đã tải xuống vào thư mục làm việc của bạn
shutil.move(result, "C:\\Files\\Conversion\\")

Chuyển đổi DOCX sang PDF và tải xuống trực tiếp

Bạn có thể chuyển đổi tài liệu DOCX sang PDF theo chương trình và tải xuống tệp đã chuyển đổi trực tiếp bằng cách thực hiện theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản ConvertApi
  • Bây giờ, hãy tạo một phiên bản của ConvertSettings
  • Sau đó, đặt đường dẫn tệp DOCX
  • Gán “pdf” cho định dạng
  • Đặt “Không” cho đường dẫn đầu ra
  • Bây giờ, hãy tạo ConvertDocumentRequest với ConvertSettings
  • Sau đó, nhận kết quả bằng cách gọi phương thức convert\document\download()
  • Tùy chọn, lưu tệp đầu ra vào đường dẫn cục bộ bằng phương thức Shutil.move()

Ví dụ mã sau đây cho biết cách chuyển đổi tệp DOCX thành tài liệu PDF và tải xuống trực tiếp bằng API REST trong Python. API sẽ trả lại tệp PDF đã chuyển đổi để phản hồi. Vui lòng làm theo các bước được đề cập trước đó để tải tệp lên.

# Tạo các phiên bản API cần thiết
convert_api = groupdocs_conversion_cloud.Chuyển thànhApi.from_keys(client_id, client_secret)

# Xác định cài đặt chuyển đổi
settings = groupdocs_conversion_cloud.Chuyển thànhSettings()
settings.file_path = "sample.docx"
settings.format = "pdf"

settings.output_path = None    # leave OutputPath will result the output as document IOStream

# Tạo yêu cầu chuyển đổi
request = groupdocs_conversion_cloud.Chuyển thànhDocumentRequest(settings)

# Chuyển thành
response = convert_api.convert_document_download(request)

# Di chuyển tệp đã tải xuống vào thư mục làm việc của bạn
shutil.move(response, "C:\\Files\\Conversion\\")

Thử trực tuyến

Vui lòng dùng thử công cụ chuyển đổi DOCX sang PDF trực tuyến miễn phí sau đây, được phát triển bằng API trên. https://products.groupdocs.app/conversion/docx-to-pdf

Phần kết luận

Trong bài viết này, bạn đã học cách chuyển đổi tài liệu Word sang tệp PDF trên đám mây. Bạn cũng đã biết cách chuyển đổi các trang cụ thể hoặc một loạt trang từ DOCX sang PDF bằng Python. Bài viết này cũng giải thích cách lập trình tải tệp DOCX lên đám mây rồi tải xuống tệp PDF đã chuyển đổi từ đám mây. Ngoài ra, bạn có thể tìm hiểu thêm về GroupDocs.Conversion Cloud API bằng cách sử dụng tài liệu. Chúng tôi cũng cung cấp phần Tham khảo API cho phép bạn hình dung và tương tác trực tiếp với các API của chúng tôi thông qua trình duyệt. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn.

Xem thêm