Là nhà phát triển Python, bạn có thể yêu cầu người dùng cung cấp tính năng chuyển đổi tài liệu PDF sang Word trong ứng dụng của mình. Vì rất khó chỉnh sửa tài liệu PDF mà không có Adobe Acrobat. Và người dùng có yêu cầu chỉnh sửa văn bản, bảng biểu, hình ảnh và các nội dung khác trong tài liệu PDF. Một giải pháp cho yêu cầu này là chuyển đổi tài liệu PDF thành tài liệu Word có thể chỉnh sửa. Tuy nhiên, bạn biết rằng nó không đơn giản như vậy về mặt lập trình. May mắn thay, có một mô-đun; GroupDocs.Conversion Cloud SDK for Python giúp bạn dễ dàng chuyển đổi PDF sang tài liệu Word có thể chỉnh sửa bằng một vài dòng mã python.

PDF sang Word - API chuyển đổi và Python SDK

GroupDocs.Conversion cho đám mây

GroupDocs.Conversion Cloud là giải pháp chuyển đổi tài liệu và hình ảnh độc lập với nền tảng mà không phụ thuộc vào bất kỳ công cụ hay phần mềm nào. Nó có thể chuyển đổi hình ảnh và tài liệu của bất kỳ định dạng tệp được hỗ trợ nào một cách nhanh chóng và đáng tin cậy. Nó cung cấp SDK cho tất cả các ngôn ngữ lập trình phổ biến với mã nguồn và ví dụ hoạt động. Điều đó cho phép các nhà phát triển sử dụng GroupDocs.Conversion Cloud trực tiếp trong các ứng dụng của họ mà không phải lo lắng về các lệnh gọi API REST cơ bản. Trong bài viết này, tôi đang sử dụng Python SDK để chuyển đổi PDF sang Word.

Cách chuyển đổi PDF sang DOCX có thể chỉnh sửa bằng Python

Tôi sẽ sử dụng Python 3.7.4, bạn có thể sử dụng bất kỳ phiên bản nào bạn thích Python 2.7, 3.4 trở lên. Trước khi chúng ta bắt đầu viết mã, hãy đăng ký với groupdocs.cloud để nhận APP SID và Khóa APP của bạn.

Cài đặt gói groupdocs-conversion-cloud từ pypi bằng lệnh sau.

\> pip install groupdocs-conversion-cloud

Lưu trữ tài liệu PDF nguồn của bạn trong thư mục mà bạn đang lưu tệp tập lệnh của mình.

Mã Python mẫu để chuyển đổi

Sử dụng trình chỉnh sửa yêu thích của bạn và làm theo các bước sau để chuyển đổi tài liệu PDF sang tài liệu Word có thể chỉnh sửa bằng Python.

  • Nhập gói GroupDocs.Conversion Cloud Python
# Nhập mô-đun
import groupdocs_conversion_cloud
  • Khởi tạo API
# Nhận app_sid và app_key của bạn tại https://dashboard.groupdocs.cloud (yêu cầu đăng ký miễn phí).
app_sid = "xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Tạo phiên bản của API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(app_sid, app_key)
file_api = groupdocs_conversion_cloud.FileApi.from_keys(app_sid, app_key)
  • Tải tài liệu PDF nguồn lên bộ lưu trữ mặc định của GroupDocs
try:

        #upload soruce file to storage
        filename = '02_pages.pdf'
        remote_name = '02_pages.pdf'
        output_name= 'sample.docx'
        strformat='docx'

        request_upload = groupdocs_conversion_cloud.UploadFileRequest(remote_name,filename)
        response_upload = file_api.upload_file(request_upload)
  • Chuyển đổi tài liệu PDF sang DOCX có thể chỉnh sửa
        #Convert PDF to Word document
        settings = groupdocs_conversion_cloud.ConvertSettings()
        settings.file_path =remote_name
        settings.format = strformat
        settings.output_path = output_name
        
        loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
        loadOptions.hide_pdf_annotations = True
        loadOptions.remove_embedded_files = False
        loadOptions.flatten_all_fields = True

        settings.load_options = loadOptions

        convertOptions = groupdocs_conversion_cloud.DocxConvertOptions()
        convertOptions.from_page = 1
        convertOptions.pages_count = 1
            
        settings.convert_options = convertOptions
                
        request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
        response = convert_api.convert_document(request)

        print("Document converted successfully: " + str(response))
except groupdocs_conversion_cloud.ApiException as e:
        print("Exception when calling get_supported_conversion_types: {0}".format(e.message))
  • Và thế là xong. Tài liệu PDF được chuyển đổi thành DOCX và phản hồi API bao gồm URL của tài liệu kết quả.
Document converted successfully: [{'name': 'sample.docx',
 'path': 'sample.docx',
 'size': 4078202,
 'url': 'https://api.groupdocs.cloud/v2.0/conversion/storage/file/sample.docx'}]

Có một câu hỏi hoặc một gợi ý? Vui lòng gửi cho chúng tôi một nhận xét bên dưới hoặc đăng câu hỏi trong diễn đàn hỗ trợ. Nó giúp chúng tôi liên tục cải thiện và tinh chỉnh API của mình.

Muốn khám phá thêm về GroupDocs.Conversion Cloud, hãy xem qua các tài nguyên hữu ích sau của GroupDocs.Conversion Cloud.