作為 Python 開發人員,您的用戶可能會要求在您的應用程序中提供 PDF 到 Word 文檔轉換功能。因為如果沒有 Adobe Acrobat,編輯 PDF 文檔是非常困難的。用戶有編輯PDF文檔中的文本、表格、圖像等內容的需求。解決方案是將PDF文檔轉換為可編輯的Word文檔。但是,您知道這在編程上並不是那麼簡單。幸運的是,有一個模塊; GroupDocs.Conversion Cloud SDK for Python讓您只需幾行Python代碼即可輕鬆將PDF轉換為可編輯的Word文檔。

PDF 到 Word - 轉換 API 和 Python SDK

GroupDocs.Conversion 雲版

GroupDocs.Conversion Cloud是一個獨立於平台的文檔和圖像轉換解決方案,不依賴於任何工具或軟件。它可以快速可靠地轉換任何支持的文件格式的圖像和文檔。它為所有流行的編程語言提供了 SDK,以及源代碼和工作示例。這使得開發人員能夠直接在其應用程序中使用 GroupDocs.Conversion Cloud,而無需擔心底層 REST API 調用。在本文中,我使用 Python SDK 進行 PDF 到 Word 的轉換。

如何在 Python 中將 PDF 轉換為可編輯的 DOCX

我將使用 Python 3.7.4,您可以使用任何您喜歡的版本 Python 2.7、3.4 或更高版本。在開始編碼之前,註冊 groupdocs.cloud 獲取您的 APP SID 和 APP Key。

使用以下命令從 pypi 安裝 groupdocs-conversion-cloud 軟件包。

\> pip install groupdocs-conversion-cloud

將源 PDF 文檔存儲在保存腳本文件的文件夾中。

用於轉換的示例 Python 代碼

使用您喜歡的編輯器並按照以下步驟將 PDF 轉換為可在 Python 中編輯的 Word 文檔。

  • 導入 GroupDocs.Conversion Cloud Python 包
# 導入模塊
import groupdocs_conversion_cloud
  • 初始化API
# 在 https://dashboard.groupdocs.cloud 獲取您的 app_sid 和 app_key(需要免費註冊)。
app_sid = "xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# 創建 API 實例
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(app_sid, app_key)
file_api = groupdocs_conversion_cloud.FileApi.from_keys(app_sid, app_key)
  • 將源 PDF 文檔上傳到 GroupDocs 默認存儲
try:

        #upload soruce file to storage
        filename = '02_pages.pdf'
        remote_name = '02_pages.pdf'
        output_name= 'sample.docx'
        strformat='docx'

        request_upload = groupdocs_conversion_cloud.UploadFileRequest(remote_name,filename)
        response_upload = file_api.upload_file(request_upload)
  • 將 PDF 文檔轉換為可編輯的 DOCX
        #Convert PDF to Word document
        settings = groupdocs_conversion_cloud.ConvertSettings()
        settings.file_path =remote_name
        settings.format = strformat
        settings.output_path = output_name
        
        loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
        loadOptions.hide_pdf_annotations = True
        loadOptions.remove_embedded_files = False
        loadOptions.flatten_all_fields = True

        settings.load_options = loadOptions

        convertOptions = groupdocs_conversion_cloud.DocxConvertOptions()
        convertOptions.from_page = 1
        convertOptions.pages_count = 1
            
        settings.convert_options = convertOptions
                
        request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
        response = convert_api.convert_document(request)

        print("Document converted successfully: " + str(response))
except groupdocs_conversion_cloud.ApiException as e:
        print("Exception when calling get_supported_conversion_types: {0}".format(e.message))
  • 就是這樣。 PDF 文檔轉換為 DOCX,API 響應包括生成文檔的 URL。
Document converted successfully: [{'name': 'sample.docx',
 'path': 'sample.docx',
 'size': 4078202,
 'url': 'https://api.groupdocs.cloud/v2.0/conversion/storage/file/sample.docx'}]

有問題或建議嗎?請隨時在下面給我們留言或在支持論壇中提出問題。它幫助我們不斷改進和完善我們的 API。

想要了解有關 GroupDocs.Conversion Cloud 的更多信息,請瀏覽 GroupDocs.Conversion Cloud 的以下有用資源。