中國傳統的

用於解析文檔和提取數據的 REST API 解決方案

GroupDocs 即將退出以共享 GroupDocs.Parser Cloud 的第一個版本。它是一個開箱即用的獨立於平台的 REST API 解決方案,可從所有常見業務文件格式中解析和提取數據,而無需依賴任何第三方工具或插件。開發人員可以將其與他們的 Web、桌面、移動或云應用程序集成,而無需任何主要的學習曲線,因為它可以在支持 REST 的任何平台或語言上使用。 什麼是 GroupDocs.Parser Cloud? 假設您正在開發一個文檔管理系統,需要一個文本搜索或文本分析功能,如果您的系統無需安裝相關文檔閱讀器就可以讀取或分析多種文檔類型,豈不是很棒? GroupDocs.Parser Cloud完成了上述目的。它是一個文檔數據提取 REST API,支持 50 多種文檔類型。 GroupDocs.Parser Cloud 最有價值的功能之一是使用預定義模板解析文檔。可以輕鬆定義模板並從業務文檔(例如發票、收據、報價單、信件等)中提取數據。它不僅限於文本提取,還可以從支持的文檔類型中提取圖像。該 API 不僅可用於常規文檔,還可用於 ZIP 檔案、OST/PST 郵件數據文件和 PDF 組合等容器。抽出一些時間並訪問 首次公開發布的發行說明 以獲取其功能的完整列表。 怎麼運行的? 您可以通過兩種方式在應用程序中使用 GroupDocs.Parser Cloud 功能。您可以通過某些 REST 客戶端使用它,也可以直接以您最喜歡的編程語言使用我們的 SDK。您可以找到來自 GroupDocs.Parser Github 存儲庫的 SDK 的完整列表。 在這裡,我將通過使用預定義模板解析 Word 文檔來演示 GroupDocs.Parser Cloud 的功能。我正在使用 REST 客戶端; cURL 命令行工具。 首先,在繼續之前,請註冊 groupdocs.cloud 並獲取應用程序 SID 和應用程序密鑰來驗證您的其餘 API 調用。 創建模板 正如上面分享的,GroupDocs.Parser Cloud 允許用戶使用預定義模板解析文檔,以從文檔中提取數據。我們將為以下Word文檔創建一個模板並保存到默認存儲。 在這裡,我們按照以下步驟創建一個簡單的模板: 捲曲示例:
· 蒂拉爾·艾哈邁德 · 2 min

文檔解析器 REST API 解決方案簡介 - GroupDocs.Parser Cloud

我們很高興與大家分享即將推出的 GroupDocs.Parser Cloud API 的見解,這是 groupdocs.cloud 產品列表中的新成員。 GroupDocs.Parser Cloud 是一個文檔解析解決方案。作為開發人員,您將能夠在任何平台上的應用程序中添加文檔解析功能,而無需依賴任何第三方插件或工具。該 REST API 的主要功能是解析用戶定義模板上的文檔,以從發票、報價單或其他類型的業務文檔中提取數據。 即將推出的 API 支持的一些功能如下。 REST API 將不限於以下功能,但我們將不斷添加新的有用功能。 特徵 按模板解析文檔 提取文本 僅提取文本 使用提取模式選項提取格式化文本;純文本、HTML 和 降價 通過設置頁面範圍從特定頁面提取文本 提取圖像 文檔信息提取 模板管理 支持的格式 在 GroupDocs.Parser Cloud API 的第一個版本中,我們將支持以下文件格式: 文檔 微軟Word文檔 點 微軟Word文檔模板 DOCX Office 打開 XML 文檔 DOCM Office Open XML 啟用宏的文檔 DOTX Office Open XML 文檔模板 DOTM Office Open XML 文檔啟用宏的模板 TXT 純文本 ODT 打開文檔文本 OTT 打開文檔文本模板 RTF 富文本格式 PDF
· 蒂拉爾·艾哈邁德 · 2 min

用於合併和拆分文檔的 REST API 解決方案 - GroupDocs.Merger Cloud

為了確保 GroupDocs REST API 作為文檔操作 API 的領導者,我們正在努力為您的日常使用案例引入新功能和 API。正如我們之前宣布的,我們正在 GroupDocs REST API 集合中添加新的 REST API。我們很高興發布 GroupDocs.Merger Cloud 的第一個版本。它是一個通用的 REST API 解決方案,可以在任何平台上合併和拆分各種文檔格式,而無需安裝任何插件或軟件。 什麼是 GroupDocs.Merger Cloud? 在處理文檔時,有時常見的要求是將文檔合併到單個文件中。當信息量不大時,可以直接複製粘貼內容。但如果情況並非如此呢?您需要一些能夠可靠、準確地合併文檔的自動化解決方案。 GroupDocs.Merger Cloud 是一個 REST API,它不僅允許您連接多個文檔,還可以跨多種支持的文檔類型操作單個文檔結構。作為開發人員,您可以在您的應用程序中使用它來實現文檔合併解決方案。它支持所有常見文件格式。支持的文件類型包括 PDF、Microsoft Word 文檔、Excel 電子表格、PowerPoint 演示文稿、純文本和格式化文本以及一長串支持的文檔格式。 以下是 GroupDocs.Merger Cloud 第一個版本支持的功能的完整列表: 文件操作 加入文件 分割文檔 文檔預覽 文檔頁面操作 移動頁面 刪除頁面 旋轉頁面 交換頁 提取頁面 更改頁面方向 文件安全操作 文檔信息提取 安全與認證 GroupDocs.Merger Cloud REST API 是安全的,需要使用應用程序訪問密鑰 ID (App SID) 和應用程序密鑰 (App Key) 以及 JSONweb 令牌身份驗證 進行身份驗證。通過 groupdocs.cloud 註冊 獲取您的 AppSID 和應用密鑰。
· 蒂拉爾·艾哈邁德 · 2 min

使用 Python SDK 將 PDF 轉換為可編輯的 Word 文檔

作為 Python 開發人員,您的用戶可能會要求在您的應用程序中提供 PDF 到 Word 文檔轉換功能。因為如果沒有 Adobe Acrobat,編輯 PDF 文檔是非常困難的。用戶有編輯PDF文檔中的文本、表格、圖像等內容的需求。解決方案是將PDF文檔轉換為可編輯的Word文檔。但是,您知道這在編程上並不是那麼簡單。幸運的是,有一個模塊; GroupDocs.Conversion Cloud SDK for Python讓您只需幾行Python代碼即可輕鬆將PDF轉換為可編輯的Word文檔。 PDF 到 Word - 轉換 API 和 Python SDK GroupDocs.Conversion Cloud是一個獨立於平台的文檔和圖像轉換解決方案,不依賴於任何工具或軟件。它可以快速可靠地轉換任何支持的文件格式的圖像和文檔。它為所有流行的編程語言提供了 SDK,以及源代碼和工作示例。這使得開發人員能夠直接在其應用程序中使用 GroupDocs.Conversion Cloud,而無需擔心底層 REST API 調用。在本文中,我使用 Python SDK 進行 PDF 到 Word 的轉換。 如何在 Python 中將 PDF 轉換為可編輯的 DOCX 我將使用 Python 3.7.4,您可以使用任何您喜歡的版本 Python 2.7、3.4 或更高版本。在開始編碼之前,註冊 groupdocs.cloud 獲取您的 APP SID 和 APP Key。 使用以下命令從 pypi 安裝 groupdocs-conversion-cloud 軟件包。 \> pip install groupdocs-conversion-cloud 將源 PDF 文檔存儲在保存腳本文件的文件夾中。
· 蒂拉爾·艾哈邁德 · 2 min

GroupDocs.Merger Cloud 即將推出!

您是否正在開發文檔管理應用程序並正在尋找 API 來合併應用程序中的文檔?您對該選項的搜索應該結束了。 GroupDocs將發布一個新的雲API GroupDocs.Merger Cloud,它將使開發人員能夠在任何平台上高精度、高保真地合併多個相同格式的文檔,並且無需依賴任何第三方插件或應用程序。新 API 將提供的一些值得注意的功能包括合併文檔、拆分文檔、移動文檔頁面、旋轉文檔頁面、提取文檔頁面等等。 我們將在下面分享即將推出的 GroupDocs.Merger Cloud API。它不會僅限於以下功能,但我們將不斷在 API 中添加新的有用功能和對新文件格式的支持。 特徵 文件操作 加入文件 拆分文檔 文檔預覽 文檔頁面操作 移動頁面 刪除頁面 旋轉頁面 交換頁 提取頁面 更改頁面方向 文檔安全操作 文檔信息提取 支持的格式 GroupDocs.Merger Cloud REST API 支持以下文件格式: 格式 描述 文檔 微軟Word文檔 DOCX Microsoft Word 打開 XML 文檔 DOCM Word Open XML 啟用宏的文檔 點 Word文檔模板 DOTX Word 打開 XML 文檔模板 DOTM Word Open XML 啟用宏的文檔模板 RTF 富文本格式文件 TXT 純文本文件 ODT OpenDocument 文本文檔 OTT
· 蒂拉爾·艾哈邁德 · 1 min

使用 Cloud Java SDK 將文檔渲染為 HTML5

您正在使用 Java 開發文檔查看器應用程序嗎?您想擁有一個查看所有常見文件格式的單一解決方案嗎?有個好消息給您,您可以使用 GroupDocs.Viewer Cloud SDK for Java 將 MS Office、PDF 和許多其他文件格式渲染為 HTML5。這樣,不同類型的文檔就可以在您的應用程序中輕鬆顯示,無需安裝任何其他軟件(例如 MS Office、Apache Open Office、Adobe Acrobat Reader 等)。 GroupDocs.Viewer Cloud是一個獨立於平台的文檔渲染和查看解決方案。它允許您在應用程序中顯示 80 多種行業標准文檔類型。 GroupDocs.Viewer Cloud 的主要目的是能夠快速、高質量地將文檔呈現為 HTML、圖像或 PDF 表示形式。在這篇文章中,我將重點關注 HTML5 輸出。 現在,我將向您展示如何輕鬆地將輸入文檔呈現為 HTML5,只需幾行代碼。如前所述,我將在本文中使用適用於 Java 的 GroupDocs.Viewer Cloud SDK。但是,如果您使用其他編程語言,則可以從我們的 GitHub 存儲庫中檢查您選擇的 SDK。它包含適用於所有流行編程語言的 SDK。它使開發人員能夠直接在其應用程序中使用 GroupDocs.Viewer Cloud,而無需擔心底層 REST API 調用。 開始了! 步驟1: 在開始編碼之前,請註冊 groupdocs.cloud 以獲取您的 APP SID 和 APP Key。 第2步: GroupDocs Cloud 在 Maven 存儲庫 上託管其所有 Java SDK。創建一個新的 Maven 項目並在 Maven pom.
· 蒂拉爾·艾哈邁德 · 1 min

使用 GroupDocs.Conversion Cloud 使用 Python 從 PDF 文檔中提取文本

PDF(便攜式文檔格式)是用於呈現和交換文檔的最重要和最廣泛使用的文件格式之一。作為一名 Python 開發人員,在很多情況下您都希望從 PDF 文檔中提取文本並使用 Python 以不同的格式導出以進行文本分析。在這篇文章中,我們將向您展示如何使用 GroupDocs.Conversion Cloud SDK for Python 從 PDF 文檔中準確提取文本。 GroupDocs.Conversion Cloud是一個獨立於平台的文檔和圖像轉換REST API解決方案,不依賴於任何第三方應用程序。它將 50 多種類型的文檔從一種格式轉換為另一種格式。它為包括 Python 在內的所有流行編程語言提供 SDK,因此開發人員可以直接在其應用程序中使用 API,而無需擔心底層 REST API 調用。 讓我們開始編寫代碼: 安裝GroupDocs.Conversion雲包 首先,使用以下命令從 pypi 安裝 groupdocs-conversion-cloud 軟件包。 >pip 安裝 groupdocs-conversion-cloud Python PDF 文本提取示例 我們將按照以下步驟從 PDF 文檔中提取文本: 免費註冊 groupdocs.cloud to get your AppSID and AppKey 創建一個 python 模塊並將以下代碼複製粘貼到其中。我們使用默認選項來提取 PDF 文檔的文本。您還可以使用文本格式的轉換選項提取特定頁面的文本。 # 導入模塊 import groupdocs_conversion_cloud # 在 https://dashboard.groupdocs.cloud 獲取您的 app_sid 和 app_key(需要免費註冊)。 app_sid = "xxxxx-xxxx-xxxx-xxxx-xxxxxxxx" app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" # 創建 API 實例 convert_api = groupdocs_conversion_cloud.
· 蒂拉爾·艾哈邁德 · 1 min

用於優化 PDF 文檔的可靠 RESTful API 解決方案

GroupDocs.Conversion Cloud 是一個文檔和圖像轉換解決方案。它使開發人員能夠在任何平台上的應用程序中添加文檔轉換功能,並使用標準 REST API 調用進行完全控制。在這篇文章中,我們將討論如何優化 PDF 文檔。您可以訪問 GroupDocs.Convesion Cloud 以獲取完整的功能列表。 PDF 文檔有時可能包含附加數據。減小 PDF 文件的大小將幫助您優化網絡傳輸和存儲。這對於在網頁上發布、在社交網絡上共享、通過電子郵件發送或在存儲中存檔特別方便。讓我向您展示如何輕鬆地使用 GroupDocs.Conversion Cloud 來優化 Web PDF 文檔或優化 PDF 文件大小。我將在以下示例中使用 cURL。您可以使用您最喜歡的編程語言的 SDK,而無需擔心底層 REST API 調用。 針對 Web 優化 PDF 文檔 Web 優化或線性化是指使 PDF 文件適合使用 Web 瀏覽器在線瀏覽的過程。線性化 PDF 文件通過 Internet 加載速度更快。因為,線性化 PDF 文件包含允許字節流服務器一次一頁下載 PDF 文件的信息。如果服務器上禁用了字節流或者 PDF 文件未線性化,則必須下載整個 PDF 文件才能查看。檢查 cURL API 命令以優化 PDF 文件以進行 Web 顯示: 優化 Web PDF // 針對 Web 優化 PDF 文檔 curl -X POST "https://api.
· 蒂拉爾·艾哈邁德 · 1 min

使用 cURL 對 MS Office、PDF 和許多其他文檔中的原始文本進行分類

什麼是文本分類? 文本分類是根據文本內容為其分配標籤或類別的過程,具有廣泛的應用,例如情感分析、主題標記、垃圾郵件檢測和意圖檢測。 GroupDocs.分類雲 原始文本形式的非結構化數據無處不在:電子郵件、聊天、網頁、社交媒體、支持票、調查回復等等。文本可以是極其豐富的信息源,但由於其非結構化性質,從中提取見解可能非常困難且耗時。企業正在轉向文本分類,以快速且經濟高效的方式構建文本,以增強決策和自動化流程。 什麼是分類法? 分類學是分類的實踐和科學。該詞也用作分類方案。分類法是一種特殊的分類。從更廣泛、更一般的意義上來說,它可以指事物或概念的分類,以及這種分類背後的原則。 GroupDocs.分類雲API GroupDocs.Classification Cloud API 檢索 IAB-2 分類法 或 文檔分類法 的原始文本分類輸出。它返回一個對象,其中包含有關最佳類別及其概率以及其他類別的概率的信息。 IAB-2 分類示例 GroupDocs.Classification Cloud API 支持 IAB-2 分類方案,下面列出了一些分類示例: “汽車”, ‘書籍\和\文學’, “商業\和\金融”, “職業生涯”, ‘教育’, ‘活動\和\景點’, ‘家庭\和\關係’, ‘美術\藝術’, ‘食物和飲料’, ‘健康生活’, ‘興趣愛好’, ‘家&\花園’, ‘醫療\健康’, ‘電影’, ‘音樂\和\音頻’, ‘新聞\和\政治’, ‘個人財務’ ETC。 捲曲請求 ### Upload document to default storage curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage" -H "accept: application/json" -H "authorization: Bearer [Access_Token]" -H "Content-Type: multipart/form-data" -T C:/Temp/three-layouts.dwf 回复 { "bestClassName": "Healthy_Living", "bestClassProbability": 53.
· 穆罕默德·里茲萬 · 2 min

用於編輯 PDF 文本的 REST API 解決方案

GroupDocs.Annotation Cloud API 是一個獨立於平台的文檔和圖像註釋解決方案,使開發人員能夠以最少的努力在其應用程序中添加註釋功能。該 API 支持一系列註釋類型,但在這篇文章中,我將重點關注文本密文註釋,以演示如何密文 PDF 文本。 文本編輯是從文檔中永久刪除內容的過程。在發布文檔之前,您需要從文檔中刪除敏感和私人數據。 GroupDocs.Annotation Cloud 提供文本編輯註釋來編輯特定頁面區域上的文本。文本密文用黑色矩形填充部分文本,以隱藏底層單詞或短語。 讓我快速概述一下如何使用 GroupDocs.Annotation Cloud 通過一組簡單的 HTTP 請求來編輯文本。在此示例中,我將使用 cURL 來編輯 PDF 文檔中的文本。該API不限於PDF文件格式,您可以查看支持的文件格式的完整列表。它還提供適用於所有流行編程語言的 SDK。您可以通過工作示例檢查可用的來自 GitHub 存儲庫的 SDK,並直接在您的應用程序中使用。 我們將按照以下步驟查找重複圖像: 生成用於身份驗證的訪問令牌 將源文檔上傳至存儲 向文檔添加註釋 下載帶註釋的文檔 生成訪問令牌 ### Retrieve access token JWT(JSON Web Token) ### TODO: Get your AppSID and AppKey at https://dashboard.groupdocs.cloud (free registration is required). curl --request POST https://api.groupdocs.cloud/connect/token --header "Content-Type: application/x-www-form-urlencoded" --data "grant_type=client_credentials&client_id=[APP_SID]&client_secret=[APP_KEY]" 將源文檔上傳至存儲 ### Upload document to default storage curl -X POST "https://api.
· 蒂拉爾·艾哈邁德 · 1 min