中國傳統的

使用 Python 從 PDF、電子表格、演示文稿和 Word 文檔中提取圖像

如果您是一名 Python 開發人員並且想要從文檔中提取數據,本文將指導您使用簡單的 Python 示例從 Word 文檔、電子表格、演示文稿和 PDF 文檔中提取圖像。 我們將使用 GroupDocs.Parser Cloud API 的 Python SDK。不過,目前它還提供.NET、Java、PHP、Ruby 和 Node.js SDK 作為其文檔解析系列成員。 該 API 還支持文本和元數據提取,以及從各種文檔(如文字處理文檔、電子表格、演示文稿、電子郵件、檔案、標記和 PDF 文檔)中提取圖像。
· 舒阿布·汗 · 2 min

使用 Python 將 Excel 電子表格轉換為 PDF

本文將指導您在Python中將Excel電子表格(XLS、XLSX)轉換為PDF格式。 Excel 電子表格廣泛用於維護髮票、分類賬、庫存、賬戶和其他報告。另一方面,PDF也是最常用的格式之一,並以其可移植性而聞名。用戶和程序員也廣泛需要這兩種格式之間的轉換。 Python 開發於 20 世紀 90 年代,現在仍然是最好、最流行的語言之一,每個開發人員都應該在 2020 年學習[1]。讓我們繼續使用 Python 將雲存儲上的 Excel 文件轉換為 PDF。 用於將文檔轉換為 PDF 的 Python SDK 在本文中,我將使用 GroupDocs.Conversion Cloud API 的 Python SDK 進行轉換,因此在開始遵循以下步驟之前,請從 儀表板 獲取您的 APP KEY 和 APP SID步驟和可用的代碼示例。 在 Python 中將 Excel 電子表格轉換為 PDF 以下是使用 Python 將任何 XLS、XLSX 電子表格轉換為 PDF 的簡單步驟: 將電子表格上傳到雲端。 轉換上傳的電子表格。 下載轉換後的 PDF 文檔。 下面顯示了 Python 代碼,讓您更好地了解它有多麼簡單: 設置轉換設置(文件路徑和目標格式)。 使用 SpreadsheetLoadOptions 設置加載選項。 調用convert\document函數進行轉換。 從提供的 URL 下載轉換後的 PDF。 # 在 Python 中將 Excel 電子表格 XLS、XLSX 轉換為 PDF # 設置從dashboard.
· 舒阿布·汗 · 1 min

使用 REST API 翻譯 Word 或 Excel 文檔

今天我們正在研究翻譯 REST API,它可以將 Word 和 Excel 文檔翻譯成其他語言。通過GroupDocs.Translation Cloud,任何文檔都可以從英語翻譯成中文、法語、德語、意大利語、俄語或西班牙語,反之亦然。以下是可以進行翻譯的語言對。 英譯漢和漢譯英 英語到法語和法語到英語 英語到德語和德語到英語 英語到意大利語和意大利語到英語 英語到俄語和俄語到英語 英語到西班牙語和西班牙語到英語 翻譯時,API 會處理段落、表格和標題。頁腳、腳註、尾註,甚至 Word 處理文檔的圖像標題。對於 Excel 電子表格,它支持單元格、圖表、表格以及數據透視表。 如何使用 REST API 翻譯 Word 或 Excel 文檔 本文將引導您了解使用 REST API 翻譯 Word 或 Excel 文檔的流程。以下是要遵循的步驟: 上傳要翻譯的文檔 將文檔翻譯成不同的語言 下載翻譯後的文檔 上傳文檔進行翻譯 使用 儀表板 或使用 API 的 Swagger UI 在雲存儲中上傳文件。我將向您展示如何使用這兩個選項在雲上上傳。 使用儀表板上傳文件 您可以使用儀表板直接將文檔上傳到雲端。您所需要的只是在服務器上創建一個帳戶。只需單擊“上傳文件”按鈕並選擇要上傳的文檔即可。 使用 Swagger UI 上傳文件 另一種選擇是使用 Swagger UI 從此 鏈接 上傳文檔進行翻譯。 以下是上傳成功後服務器的響應。 { "uploaded": \[ "document.docx" \], "errors": \[\] } 使用 REST API 將 Word 或 Excel 文檔翻譯成不同語言 簡單的 cURL 命令即可讓您翻譯上傳的文檔。在這裡,我將 Word 文檔從英語翻譯成法語。文件 document.
· 舒阿布·汗 · 1 min

使用 Java 和 .NET 添加、刪除、更新和提取元數據

雲開發人員的又一個消息! GroupDocs 推出了文檔元數據操作雲 API。這豐富了GroupDocs的文檔元數據管理解決方案。該解決方案已經為 .NET 和 Java 開發人員提供服務,作為開發人員的 On-Premise API,以及任何類型的用戶查看和編輯文檔元數據的 免費在線文檔元數據編輯器應用程序。 元數據操作雲API GroupDocs.Metadata Cloud API 以及 SDK 允許開發人員操作(添加、刪除、更新、提取和查看)50 多種文件格式的元數據。 GroupDocs.Metadata 允許以不同的方式訪問和處理文件的元數據,例如: 可能的標籤名稱 物業名稱 適當的價值 精確匹配短語 匹配正則表達式 整個元數據樹 標籤 要更好地了解功能和產品,您可以隨時訪問 文檔 部分中的開發人員指南。 支持的文檔格式 您可以對任何文字處理文檔、電子表格、演示文稿、音頻和視頻文件、圖像、PDF、電子書、繪圖等文檔執行操作。下面列出了 GroupDocs API 當前支持的文件格式,希望能滿足您的要求。您可以隨時訪問文檔以了解所有支持的文檔格式或任何類型的指南。 元數據 - SDK 和示例 除了用於雲的元數據編輯REST API之外,GroupDocs還提供開源SDK,因此,可以根據需求進行自定義。開發人員可以使用cURL與GroupDocs.Metadata Cloud API進行交互,也可以使用相關的SDK來加快開發速度。這有助於開發人員不再擔心發出請求和處理響應的低級細節。 GitHub 上提供了下面提到的 SDK 以及代碼示例: 在這個博客中。我使用 Java 代碼來展示如何使用文檔的元數據屬性。此外,我將僅展示提取、添加、刪除和修改元數據的方法之一。您還可以從 文檔 和相關 GitHub 存儲庫中詳細查看 C# 示例和其他方式。 從 Java 或 .NET 文件中提取元數據 該 API 允許您使用不同的選項提取文檔的元數據,其中包括: 整個元數據屬性樹 按指定的標籤、名稱或值 為了給您提供幫助,可以在 GitHub 上獲取運行示例。 我上傳了 groupdocs.
· 舒阿布·汗 · 4 min

以編程方式編輯 Word、Excel、PPT 和 Web 文檔

對於雲開發者來說又一個好消息! GroupDocs 推出了文檔編輯雲 API。這改進了 GroupDocs 的文檔編輯解決方案。該解決方案已經作為本地 API 供 .NET 和 Java 開發人員使用,並作為跨平台在線應用程序 供任何類型的用戶免費在線編輯文檔。 GroupDocs.Editor Cloud API 和 SDK 允許開發人員使用前端所見即所得編輯器來編輯大多數流行的文檔格式,而無需任何其他應用程序。 GroupDocs.Editor Cloud 是 REST API,提供許多編輯選項和輸出自定義,以自定義各種文檔類型的編輯過程。一些主要功能包括: 在流程或分頁模式下編輯文字處理文檔。 管理字體提取以提供相同的用戶體驗。 大文件的內存使用優化。 支持多選項卡電子表格。 靈活的數字和日期轉換。 URI 和電子郵件地址識別。 要更好地了解功能和產品,您可以隨時訪問 文檔 部分中的開發人員指南。 支持的文檔類型 以下是當前支持的文檔格式。您可以隨時訪問 GroupDocs.Editor Cloud 的文檔,了解所有支持的文檔格式。 SDK 和示例 除了Cloud文檔編輯REST API之外,GroupDocs還提供開源SDK,因此可以根據需求進行自定義。開發者可以使用cURL與GroupDocs.Editor Cloud API進行交互,也可以使用相關的SDK來加快開發速度。這有助於開發人員不再擔心發出請求和處理響應的低級細節。下面提到的 SDK 以及代碼示例可在 GitHub 上獲取: 在 C# 中編輯 Word 文檔 您可以在此處查看使用 GroupDocs.Editor Cloud SDK for .NET 編輯 Word 文檔的 C# 代碼示例。使用相關的可用 SDK,可以在 Java、PHP、Python、Ruby 和 Node.js 中輕鬆實現同樣的效果。這只是將源文檔轉換為 HTML 格式並允許編輯,稍後將更新的文檔轉換回原始格式。
· 舒阿布·汗 · 3 min

用於保護文檔的 Watermark Cloud API 和 SDK

雲開發者的好消息! GroupDocs 推出了 Watermark Cloud API。這增強了 GroupDocs 水印解決方案。它已經作為 .NET 和 Java 開發人員的本地 API 以及任何類型用戶的跨平台在線應用程序 存在。 Watermark Cloud API 和 SDK 允許開發人員使用水印保護重要文檔,這些文檔很難被第三方工具自動刪除。 GroupDocs.Watermark Cloud 是 REST API,提供保護文檔和管理水印的所有主要功能。一些重要的功能包括:添加圖像或文本水印,刪除已添加的水印,替換或搜索所有支持格式的水印。 支持的文檔類型 以下是當前支持的文檔格式。您可以隨時訪問 GroupDocs.Watermark Cloud 的文檔,以全面了解適用於任何支持的文檔格式的特定功能。 SDK 和示例 除了水印REST API,GroupDocs還提供開源SDK,甚至可以根據需求進行自定義。開發人員可以使用相關的SDK來加快開發速度,而無需擔心發出請求和處理響應的底層細節。目前,我們已經推出了以下 SDK 以及示例。這些 SDK 和示例也可在 GitHub 上獲取: 以下是一些示例,可以幫助您獲得更好的想法。如需更多示例,您可以訪問[文檔][10]頁面或訪問相關的[GitHub存儲庫][11]。 Java中為Word文檔添加圖像水印 您可以在此處查看使用 [GroupDocs.Watermark Cloud SDK for Java][12] 向 Word 文檔添加水印的 Java 代碼示例。 // 如需完整示例和數據文件,請訪問 https://github.com/groupdocs-watermark-cloud/groupdocs-watermark-cloud-java-samples String MyAppKey = ""; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud String MyAppSid = ""; // Get AppKey and AppSID from https://dashboard.
· 舒阿布·汗 · 3 min

GroupDocs Cloud 12 月定價更新

簡化新客戶的定價 我們更新了 GroupDocs Cloud 定價結構,以簡化新客戶的定價結構。以前,某些 API 調用是“收費的”,而其他 API 調用則不需要。如果 API 調用創建了文檔或有意義的結果,則需要付費。如果 API 調用未創建文檔或結果,則無需付費。然而,某些 GroupDocs Cloud 產品存在一些“灰色區域”,客戶對於是否應該為某些通話付費感到困惑。 為了解決此問題,我們更新了定價,現在對每次 API 調用收費,無論 API 調用執行什麼操作。同時,新定價方案上每次API調用的成本降低了1/3。 這對現有客戶有何影響? 由於此更改對每個客戶的影響都不同,因此我們不會自動將現有客戶切換到新定價。相反,與每次定價變化一樣,我們“保留”了現有客戶,他們將繼續根據註冊時的定價付費。 如果您是希望切換到新定價的現有客戶,您可以通過訪問 GroupDocs 雲帳戶中的“立即購買”頁面來執行此操作。 您可以在此處找到有關新定價的更多信息: https://purchase.groupdocs.cloud/pricing。
· 比利倫迪 · 1 min

GroupDocs.Storage Cloud 已停止使用

GroupDocs 很高興與您分享 GroupDocs.Storage Cloud API 功能現在更加簡化。文件和文件夾存儲及其操作不再依賴於單獨的 GroupDocs.Storage Cloud API,但是,這些功能可作為每個 GroupDocs Cloud API 中的微服務使用非常準確地說,“GroupDocs.Storage Cloud 已作為獨立產品停產”。 現有用戶可以做什麼? 在 2020 年 12 月 31 日之前,GroupDocs.Storage Cloud API 和以下 SDK 將僅在 GitHub、NuGet 等公共存儲庫上為現有客戶提供: 適用於 .NET 的 GroupDocs.Storage Cloud SDK 適用於 PHP 的 GroupDocs.Storage Cloud SDK 適用於 Ruby 的 GroupDocs.Storage Cloud SDK 因此,我們建議您在將應用程序從每個平台上完全刪除之前將其更新到最新版本的 SDK/端點。 GroupDocs.Storage Cloud 將不再可單獨購買,也不再作為GroupDocs.Total Cloud 產品系列 的一部分。不過,技術支持 歡迎您就遷移到最新版本 提出任何進一步的疑問。 如何使用新的 API? 以下示例顯示瞭如何使用 GroupDocs.Storage Cloud API 獲取任何文件夾中的所有文件和文件夾的列表: // How to get list of files and folders using GroupDocs.
· 舒阿布·汗 · 1 min

用於解析文檔和提取數據的 REST API 解決方案

GroupDocs 即將退出以共享 GroupDocs.Parser Cloud 的第一個版本。它是一個開箱即用的獨立於平台的 REST API 解決方案,可從所有常見業務文件格式中解析和提取數據,而無需依賴任何第三方工具或插件。開發人員可以將其與他們的 Web、桌面、移動或云應用程序集成,而無需任何主要的學習曲線,因為它可以在支持 REST 的任何平台或語言上使用。 什麼是 GroupDocs.Parser Cloud? 假設您正在開發一個文檔管理系統,需要一個文本搜索或文本分析功能,如果您的系統無需安裝相關文檔閱讀器就可以讀取或分析多種文檔類型,豈不是很棒? GroupDocs.Parser Cloud完成了上述目的。它是一個文檔數據提取 REST API,支持 50 多種文檔類型。 GroupDocs.Parser Cloud 最有價值的功能之一是使用預定義模板解析文檔。可以輕鬆定義模板並從業務文檔(例如發票、收據、報價單、信件等)中提取數據。它不僅限於文本提取,還可以從支持的文檔類型中提取圖像。該 API 不僅可用於常規文檔,還可用於 ZIP 檔案、OST/PST 郵件數據文件和 PDF 組合等容器。抽出一些時間並訪問 首次公開發布的發行說明 以獲取其功能的完整列表。 怎麼運行的? 您可以通過兩種方式在應用程序中使用 GroupDocs.Parser Cloud 功能。您可以通過某些 REST 客戶端使用它,也可以直接以您最喜歡的編程語言使用我們的 SDK。您可以找到來自 GroupDocs.Parser Github 存儲庫的 SDK 的完整列表。 在這裡,我將通過使用預定義模板解析 Word 文檔來演示 GroupDocs.Parser Cloud 的功能。我正在使用 REST 客戶端; cURL 命令行工具。 首先,在繼續之前,請註冊 groupdocs.cloud 並獲取應用程序 SID 和應用程序密鑰來驗證您的其餘 API 調用。 創建模板 正如上面分享的,GroupDocs.Parser Cloud 允許用戶使用預定義模板解析文檔,以從文檔中提取數據。我們將為以下Word文檔創建一個模板並保存到默認存儲。 在這裡,我們按照以下步驟創建一個簡單的模板: 捲曲示例:
· 蒂拉爾·艾哈邁德 · 2 min

文檔解析器 REST API 解決方案簡介 - GroupDocs.Parser Cloud

我們很高興與大家分享即將推出的 GroupDocs.Parser Cloud API 的見解,這是 groupdocs.cloud 產品列表中的新成員。 GroupDocs.Parser Cloud 是一個文檔解析解決方案。作為開發人員,您將能夠在任何平台上的應用程序中添加文檔解析功能,而無需依賴任何第三方插件或工具。該 REST API 的主要功能是解析用戶定義模板上的文檔,以從發票、報價單或其他類型的業務文檔中提取數據。 即將推出的 API 支持的一些功能如下。 REST API 將不限於以下功能,但我們將不斷添加新的有用功能。 特徵 按模板解析文檔 提取文本 僅提取文本 使用提取模式選項提取格式化文本;純文本、HTML 和 降價 通過設置頁面範圍從特定頁面提取文本 提取圖像 文檔信息提取 模板管理 支持的格式 在 GroupDocs.Parser Cloud API 的第一個版本中,我們將支持以下文件格式: 文檔 微軟Word文檔 點 微軟Word文檔模板 DOCX Office 打開 XML 文檔 DOCM Office Open XML 啟用宏的文檔 DOTX Office Open XML 文檔模板 DOTM Office Open XML 文檔啟用宏的模板 TXT 純文本 ODT 打開文檔文本 OTT 打開文檔文本模板 RTF 富文本格式 PDF
· 蒂拉爾·艾哈邁德 · 2 min