作為 Python 開發人員,您的用戶可能會要求在您的應用程序中提供 PDF 到 Word 文檔轉換功能。因為如果沒有 Adobe Acrobat,編輯 PDF 文檔是非常困難的。用戶有編輯PDF文檔中的文本、表格、圖像等內容的需求。解決方案是將PDF文檔轉換為可編輯的Word文檔。但是,您知道這在編程上並不是那麼簡單。幸運的是,有一個模塊; GroupDocs.Conversion Cloud SDK for Python讓您只需幾行Python代碼即可輕鬆將PDF轉換為可編輯的Word文檔。
PDF 到 Word - 轉換 API 和 Python SDK GroupDocs.Conversion Cloud是一個獨立於平台的文檔和圖像轉換解決方案,不依賴於任何工具或軟件。它可以快速可靠地轉換任何支持的文件格式的圖像和文檔。它為所有流行的編程語言提供了 SDK,以及源代碼和工作示例。這使得開發人員能夠直接在其應用程序中使用 GroupDocs.Conversion Cloud,而無需擔心底層 REST API 調用。在本文中,我使用 Python SDK 進行 PDF 到 Word 的轉換。
如何在 Python 中將 PDF 轉換為可編輯的 DOCX 我將使用 Python 3.7.4,您可以使用任何您喜歡的版本 Python 2.7、3.4 或更高版本。在開始編碼之前,註冊 groupdocs.cloud 獲取您的 APP SID 和 APP Key。
使用以下命令從 pypi 安裝 groupdocs-conversion-cloud 軟件包。
\> pip install groupdocs-conversion-cloud 將源 PDF 文檔存儲在保存腳本文件的文件夾中。
使用 GroupDocs.Conversion Cloud 使用 Python 從 PDF 文檔中提取文本
PDF(便攜式文檔格式)是用於呈現和交換文檔的最重要和最廣泛使用的文件格式之一。作為一名 Python 開發人員,在很多情況下您都希望從 PDF 文檔中提取文本並使用 Python 以不同的格式導出以進行文本分析。在這篇文章中,我們將向您展示如何使用 GroupDocs.Conversion Cloud SDK for Python 從 PDF 文檔中準確提取文本。
GroupDocs.Conversion Cloud是一個獨立於平台的文檔和圖像轉換REST API解決方案,不依賴於任何第三方應用程序。它將 50 多種類型的文檔從一種格式轉換為另一種格式。它為包括 Python 在內的所有流行編程語言提供 SDK,因此開發人員可以直接在其應用程序中使用 API,而無需擔心底層 REST API 調用。
讓我們開始編寫代碼:
安裝GroupDocs.Conversion雲包 首先,使用以下命令從 pypi 安裝 groupdocs-conversion-cloud 軟件包。
>pip 安裝 groupdocs-conversion-cloud
Python PDF 文本提取示例 我們將按照以下步驟從 PDF 文檔中提取文本:
免費註冊 groupdocs.cloud to get your AppSID and AppKey 創建一個 python 模塊並將以下代碼複製粘貼到其中。我們使用默認選項來提取 PDF 文檔的文本。您還可以使用文本格式的轉換選項提取特定頁面的文本。 # 導入模塊 import groupdocs_conversion_cloud # 在 https://dashboard.groupdocs.cloud 獲取您的 app_sid 和 app_key(需要免費註冊)。 app_sid = "xxxxx-xxxx-xxxx-xxxx-xxxxxxxx" app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" # 創建 API 實例 convert_api = groupdocs_conversion_cloud.
用於優化 PDF 文檔的可靠 RESTful API 解決方案
GroupDocs.Conversion Cloud 是一個文檔和圖像轉換解決方案。它使開發人員能夠在任何平台上的應用程序中添加文檔轉換功能,並使用標準 REST API 調用進行完全控制。在這篇文章中,我們將討論如何優化 PDF 文檔。您可以訪問 GroupDocs.Convesion Cloud 以獲取完整的功能列表。
PDF 文檔有時可能包含附加數據。減小 PDF 文件的大小將幫助您優化網絡傳輸和存儲。這對於在網頁上發布、在社交網絡上共享、通過電子郵件發送或在存儲中存檔特別方便。讓我向您展示如何輕鬆地使用 GroupDocs.Conversion Cloud 來優化 Web PDF 文檔或優化 PDF 文件大小。我將在以下示例中使用 cURL。您可以使用您最喜歡的編程語言的 SDK,而無需擔心底層 REST API 調用。
針對 Web 優化 PDF 文檔 Web 優化或線性化是指使 PDF 文件適合使用 Web 瀏覽器在線瀏覽的過程。線性化 PDF 文件通過 Internet 加載速度更快。因為,線性化 PDF 文件包含允許字節流服務器一次一頁下載 PDF 文件的信息。如果服務器上禁用了字節流或者 PDF 文件未線性化,則必須下載整個 PDF 文件才能查看。檢查 cURL API 命令以優化 PDF 文件以進行 Web 顯示:
優化 Web PDF
// 針對 Web 優化 PDF 文檔 curl -X POST "https://api.
GroupDocs.Conversion Cloud V2 簡介
GroupDocs Cloud 很高興發布 GroupDocs.Conversion Cloud REST API V2 版本。它是全新的 API 版本,與 V1 相比,具有簡化且直觀的方法。新的 API 通過改進的架構減少了文檔轉換任務的方法和選項。在此版本中,API 包括使用雲存儲的方法,這是重要的部分。 了解更多。
什麼是新的 GroupDocs.Conversion Cloud V2 的 API 方法分為四個部分。轉換 API 部分包括文檔轉換的方法。文件 API 部分具有上傳、下載、複製、移動和刪除文件的方法。文件夾 API 部分添加了在雲存儲中創建、複製、移動、刪除文件夾的方法。 Storage API包括獲取存儲信息和文件信息的方法。
在接下來的幾段中,我們將介紹 GroupDocs.Viewer Cloud V2 的特性和功能。
怎麼運行的 在這個數字時代,文檔轉換服務正在成為組織的基本需求。業務流程中出於不同的目的需要使用不同的文檔格式。因此,作為開發人員,您可能正在尋找一種高效可靠的解決方案來開發文檔轉換工具。 GroupDocs.Conversion Cloud REST API 支持 65 多種文檔格式的轉換。它允許將文檔轉換功能無縫集成到您的應用程序中。
我們將向您展示如何輕鬆快速地將文檔轉換為另一種文檔格式並同時添加水印。在此示例中,我們使用 cURL 來處理 REST API 請求。請檢查可用 SDK 的完整列表,以便直接在您喜歡的平台中使用 GroupDocs.Viewer Cloud API。
開始吧…我們將 DOCX 文件轉換為 PDF 並添加水印文本,如下所示
獲取驗證碼
GroupDocs.Conversion Cloud REST API 支持 JWT(JSON Web Token) 身份驗證。
下一代 GroupDocs.Conversion Cloud 18.6 中引入的 PDF 資源優化和書籤選項
我們很高興地宣布 Next Generation GroupDocs.Conversion Cloud 18.6 每月發布。此版本引入了 PDF 轉換功能的新選項以及“返回無效 URL”的重要錯誤修復。在此版本中,我們還更新了 PHP 和 .NET SDK,以便更好地了解 API 功能的使用。此API可以與您的應用程序集成以利用文檔轉換功能,請點擊此處了解更多詳情。
新功能 - GroupDocs.Conversion Cloud GroupDocs.Conversion Cloud API 18.6 版本包括從 Words、Cells 和 XPS 轉換 PDF 文檔的新選項,以控制資源優化、書籤選項和灰度 PDF 創建等。GroupDocs.Conversion Cloud API 支持幾乎所有主要文檔和圖像格式轉換為和從。下面列出了當前版本中的一些主要更改。您可以訪問我們的 GitHub 獲取更新的 SDK 以了解完整的詳細信息。
轉換為 PDF 時創建線性化 PDF 的選項 從 Words 轉換為 PDF 和 XPS 時指定書籤級別、標題級別和擴展級別 用於控制單元格轉換的選項 轉換為 PDF 時的資源優化選項 轉換為灰度 PDF 的選項 轉換結果返回無效 URL - 修復 GroupDocs.Conversion Cloud API 資源 您可以訪問以下 API 資源來開始使用該 API。