作為 Python 開發人員,您的用戶可能會要求在您的應用程序中提供 PDF 到 Word 文檔轉換功能。因為如果沒有 Adobe Acrobat,編輯 PDF 文檔是非常困難的。用戶有編輯PDF文檔中的文本、表格、圖像等內容的需求。解決方案是將PDF文檔轉換為可編輯的Word文檔。但是,您知道這在編程上並不是那麼簡單。幸運的是,有一個模塊; GroupDocs.Conversion Cloud SDK for Python讓您只需幾行Python代碼即可輕鬆將PDF轉換為可編輯的Word文檔。
PDF 到 Word - 轉換 API 和 Python SDK
GroupDocs.Conversion Cloud是一個獨立於平台的文檔和圖像轉換解決方案,不依賴於任何工具或軟件。它可以快速可靠地轉換任何支持的文件格式的圖像和文檔。它為所有流行的編程語言提供了 SDK,以及源代碼和工作示例。這使得開發人員能夠直接在其應用程序中使用 GroupDocs.Conversion Cloud,而無需擔心底層 REST API 調用。在本文中,我使用 Python SDK 進行 PDF 到 Word 的轉換。
如何在 Python 中將 PDF 轉換為可編輯的 DOCX
我將使用 Python 3.7.4,您可以使用任何您喜歡的版本 Python 2.7、3.4 或更高版本。在開始編碼之前,註冊 groupdocs.cloud 獲取您的 APP SID 和 APP Key。
使用以下命令從 pypi 安裝 groupdocs-conversion-cloud 軟件包。
\> pip install groupdocs-conversion-cloud
將源 PDF 文檔存儲在保存腳本文件的文件夾中。
用於轉換的示例 Python 代碼
使用您喜歡的編輯器並按照以下步驟將 PDF 轉換為可在 Python 中編輯的 Word 文檔。
- 導入 GroupDocs.Conversion Cloud Python 包
# 導入模塊
import groupdocs_conversion_cloud
- 初始化API
# 在 https://dashboard.groupdocs.cloud 獲取您的 app_sid 和 app_key(需要免費註冊)。
app_sid = "xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# 創建 API 實例
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(app_sid, app_key)
file_api = groupdocs_conversion_cloud.FileApi.from_keys(app_sid, app_key)
- 將源 PDF 文檔上傳到 GroupDocs 默認存儲
try:
#upload soruce file to storage
filename = '02_pages.pdf'
remote_name = '02_pages.pdf'
output_name= 'sample.docx'
strformat='docx'
request_upload = groupdocs_conversion_cloud.UploadFileRequest(remote_name,filename)
response_upload = file_api.upload_file(request_upload)
- 將 PDF 文檔轉換為可編輯的 DOCX
#Convert PDF to Word document
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path =remote_name
settings.format = strformat
settings.output_path = output_name
loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
loadOptions.hide_pdf_annotations = True
loadOptions.remove_embedded_files = False
loadOptions.flatten_all_fields = True
settings.load_options = loadOptions
convertOptions = groupdocs_conversion_cloud.DocxConvertOptions()
convertOptions.from_page = 1
convertOptions.pages_count = 1
settings.convert_options = convertOptions
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
response = convert_api.convert_document(request)
print("Document converted successfully: " + str(response))
except groupdocs_conversion_cloud.ApiException as e:
print("Exception when calling get_supported_conversion_types: {0}".format(e.message))
- 就是這樣。 PDF 文檔轉換為 DOCX,API 響應包括生成文檔的 URL。
Document converted successfully: [{'name': 'sample.docx',
'path': 'sample.docx',
'size': 4078202,
'url': 'https://api.groupdocs.cloud/v2.0/conversion/storage/file/sample.docx'}]
有問題或建議嗎?請隨時在下面給我們留言或在支持論壇中提出問題。它幫助我們不斷改進和完善我們的 API。
想要了解有關 GroupDocs.Conversion Cloud 的更多信息,請瀏覽 GroupDocs.Conversion Cloud 的以下有用資源。
- Web API Explorer → API 的實時示例
- 開發者文檔 → 在線文檔
- 示例和 SDK → Github 上的代碼示例
- 支持論壇 → 在線幫助