如果您是一名 Python 開發人員並且想要從文檔中提取數據,本文將指導您使用簡單的 Python 示例從 Word 文檔、電子表格、演示文稿和 PDF 文檔中提取圖像。
我們將使用 GroupDocs.Parser Cloud API 的 Python SDK。不過,目前它還提供.NET、Java、PHP、Ruby 和 Node.js SDK 作為其文檔解析系列成員。
該 API 還支持文本和元數據提取,以及從各種文檔(如文字處理文檔、電子表格、演示文稿、電子郵件、檔案、標記和 PDF 文檔)中提取圖像。
雲開發者的好消息! GroupDocs 推出了 Watermark Cloud API。這增強了 GroupDocs 水印解決方案。它已經作為 .NET 和 Java 開發人員的本地 API 以及任何類型用戶的跨平台在線應用程序 存在。 Watermark Cloud API 和 SDK 允許開發人員使用水印保護重要文檔,這些文檔很難被第三方工具自動刪除。
GroupDocs.Watermark Cloud 是 REST API,提供保護文檔和管理水印的所有主要功能。一些重要的功能包括:添加圖像或文本水印,刪除已添加的水印,替換或搜索所有支持格式的水印。
支持的文檔類型 以下是當前支持的文檔格式。您可以隨時訪問 GroupDocs.Watermark Cloud 的文檔,以全面了解適用於任何支持的文檔格式的特定功能。
SDK 和示例 除了水印REST API,GroupDocs還提供開源SDK,甚至可以根據需求進行自定義。開發人員可以使用相關的SDK來加快開發速度,而無需擔心發出請求和處理響應的底層細節。目前,我們已經推出了以下 SDK 以及示例。這些 SDK 和示例也可在 GitHub 上獲取:
以下是一些示例,可以幫助您獲得更好的想法。如需更多示例,您可以訪問[文檔][10]頁面或訪問相關的[GitHub存儲庫][11]。
Java中為Word文檔添加圖像水印 您可以在此處查看使用 [GroupDocs.Watermark Cloud SDK for Java][12] 向 Word 文檔添加水印的 Java 代碼示例。
// 如需完整示例和數據文件,請訪問 https://github.com/groupdocs-watermark-cloud/groupdocs-watermark-cloud-java-samples String MyAppKey = ""; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud String MyAppSid = ""; // Get AppKey and AppSID from https://dashboard.
GroupDocs Cloud 12 月定價更新
簡化新客戶的定價 我們更新了 GroupDocs Cloud 定價結構,以簡化新客戶的定價結構。以前,某些 API 調用是“收費的”,而其他 API 調用則不需要。如果 API 調用創建了文檔或有意義的結果,則需要付費。如果 API 調用未創建文檔或結果,則無需付費。然而,某些 GroupDocs Cloud 產品存在一些“灰色區域”,客戶對於是否應該為某些通話付費感到困惑。
為了解決此問題,我們更新了定價,現在對每次 API 調用收費,無論 API 調用執行什麼操作。同時,新定價方案上每次API調用的成本降低了1/3。
這對現有客戶有何影響? 由於此更改對每個客戶的影響都不同,因此我們不會自動將現有客戶切換到新定價。相反,與每次定價變化一樣,我們“保留”了現有客戶,他們將繼續根據註冊時的定價付費。
如果您是希望切換到新定價的現有客戶,您可以通過訪問 GroupDocs 雲帳戶中的“立即購買”頁面來執行此操作。
您可以在此處找到有關新定價的更多信息: https://purchase.groupdocs.cloud/pricing。
GroupDocs.Storage Cloud 已停止使用
GroupDocs 很高興與您分享 GroupDocs.Storage Cloud API 功能現在更加簡化。文件和文件夾存儲及其操作不再依賴於單獨的 GroupDocs.Storage Cloud API,但是,這些功能可作為每個 GroupDocs Cloud API 中的微服務使用非常準確地說,“GroupDocs.Storage Cloud 已作為獨立產品停產”。
現有用戶可以做什麼? 在 2020 年 12 月 31 日之前,GroupDocs.Storage Cloud API 和以下 SDK 將僅在 GitHub、NuGet 等公共存儲庫上為現有客戶提供:
適用於 .NET 的 GroupDocs.Storage Cloud SDK 適用於 PHP 的 GroupDocs.Storage Cloud SDK 適用於 Ruby 的 GroupDocs.Storage Cloud SDK 因此,我們建議您在將應用程序從每個平台上完全刪除之前將其更新到最新版本的 SDK/端點。
GroupDocs.Storage Cloud 將不再可單獨購買,也不再作為GroupDocs.Total Cloud 產品系列 的一部分。不過,技術支持 歡迎您就遷移到最新版本 提出任何進一步的疑問。
如何使用新的 API? 以下示例顯示瞭如何使用 GroupDocs.Storage Cloud API 獲取任何文件夾中的所有文件和文件夾的列表:
// How to get list of files and folders using GroupDocs.
我們很高興與大家分享即將推出的 GroupDocs.Parser Cloud API 的見解,這是 groupdocs.cloud 產品列表中的新成員。 GroupDocs.Parser Cloud 是一個文檔解析解決方案。作為開發人員,您將能夠在任何平台上的應用程序中添加文檔解析功能,而無需依賴任何第三方插件或工具。該 REST API 的主要功能是解析用戶定義模板上的文檔,以從發票、報價單或其他類型的業務文檔中提取數據。
即將推出的 API 支持的一些功能如下。 REST API 將不限於以下功能,但我們將不斷添加新的有用功能。
特徵
按模板解析文檔
提取文本
僅提取文本
使用提取模式選項提取格式化文本;純文本、HTML 和 降價
通過設置頁面範圍從特定頁面提取文本
提取圖像
文檔信息提取
模板管理
支持的格式 在 GroupDocs.Parser Cloud API 的第一個版本中,我們將支持以下文件格式:
文檔
微軟Word文檔
點
微軟Word文檔模板
DOCX
Office 打開 XML 文檔
DOCM
Office Open XML 啟用宏的文檔
DOTX
Office Open XML 文檔模板
DOTM
Office Open XML 文檔啟用宏的模板
TXT
純文本
ODT
打開文檔文本
OTT
打開文檔文本模板
RTF
富文本格式
PDF