中國傳統的

使用 GroupDocs.Conversion Cloud 使用 Python 從 PDF 文檔中提取文本

PDF(便攜式文檔格式)是用於呈現和交換文檔的最重要和最廣泛使用的文件格式之一。作為一名 Python 開發人員,在很多情況下您都希望從 PDF 文檔中提取文本並使用 Python 以不同的格式導出以進行文本分析。在這篇文章中,我們將向您展示如何使用 GroupDocs.Conversion Cloud SDK for Python 從 PDF 文檔中準確提取文本。 GroupDocs.Conversion Cloud是一個獨立於平台的文檔和圖像轉換REST API解決方案,不依賴於任何第三方應用程序。它將 50 多種類型的文檔從一種格式轉換為另一種格式。它為包括 Python 在內的所有流行編程語言提供 SDK,因此開發人員可以直接在其應用程序中使用 API,而無需擔心底層 REST API 調用。 讓我們開始編寫代碼: 安裝GroupDocs.Conversion雲包 首先,使用以下命令從 pypi 安裝 groupdocs-conversion-cloud 軟件包。 >pip 安裝 groupdocs-conversion-cloud Python PDF 文本提取示例 我們將按照以下步驟從 PDF 文檔中提取文本: 免費註冊 groupdocs.cloud to get your AppSID and AppKey 創建一個 python 模塊並將以下代碼複製粘貼到其中。我們使用默認選項來提取 PDF 文檔的文本。您還可以使用文本格式的轉換選項提取特定頁面的文本。 # 導入模塊 import groupdocs_conversion_cloud # 在 https://dashboard.groupdocs.cloud 獲取您的 app_sid 和 app_key(需要免費註冊)。 app_sid = "xxxxx-xxxx-xxxx-xxxx-xxxxxxxx" app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" # 創建 API 實例 convert_api = groupdocs_conversion_cloud.
· 蒂拉爾·艾哈邁德 · 1 min

用於優化 PDF 文檔的可靠 RESTful API 解決方案

GroupDocs.Conversion Cloud 是一個文檔和圖像轉換解決方案。它使開發人員能夠在任何平台上的應用程序中添加文檔轉換功能,並使用標準 REST API 調用進行完全控制。在這篇文章中,我們將討論如何優化 PDF 文檔。您可以訪問 GroupDocs.Convesion Cloud 以獲取完整的功能列表。 PDF 文檔有時可能包含附加數據。減小 PDF 文件的大小將幫助您優化網絡傳輸和存儲。這對於在網頁上發布、在社交網絡上共享、通過電子郵件發送或在存儲中存檔特別方便。讓我向您展示如何輕鬆地使用 GroupDocs.Conversion Cloud 來優化 Web PDF 文檔或優化 PDF 文件大小。我將在以下示例中使用 cURL。您可以使用您最喜歡的編程語言的 SDK,而無需擔心底層 REST API 調用。 針對 Web 優化 PDF 文檔 Web 優化或線性化是指使 PDF 文件適合使用 Web 瀏覽器在線瀏覽的過程。線性化 PDF 文件通過 Internet 加載速度更快。因為,線性化 PDF 文件包含允許字節流服務器一次一頁下載 PDF 文件的信息。如果服務器上禁用了字節流或者 PDF 文件未線性化,則必須下載整個 PDF 文件才能查看。檢查 cURL API 命令以優化 PDF 文件以進行 Web 顯示: 優化 Web PDF // 針對 Web 優化 PDF 文檔 curl -X POST "https://api.
· 蒂拉爾·艾哈邁德 · 1 min

使用 cURL 對 MS Office、PDF 和許多其他文檔中的原始文本進行分類

什麼是文本分類? 文本分類是根據文本內容為其分配標籤或類別的過程,具有廣泛的應用,例如情感分析、主題標記、垃圾郵件檢測和意圖檢測。 GroupDocs.分類雲 原始文本形式的非結構化數據無處不在:電子郵件、聊天、網頁、社交媒體、支持票、調查回復等等。文本可以是極其豐富的信息源,但由於其非結構化性質,從中提取見解可能非常困難且耗時。企業正在轉向文本分類,以快速且經濟高效的方式構建文本,以增強決策和自動化流程。 什麼是分類法? 分類學是分類的實踐和科學。該詞也用作分類方案。分類法是一種特殊的分類。從更廣泛、更一般的意義上來說,它可以指事物或概念的分類,以及這種分類背後的原則。 GroupDocs.分類雲API GroupDocs.Classification Cloud API 檢索 IAB-2 分類法 或 文檔分類法 的原始文本分類輸出。它返回一個對象,其中包含有關最佳類別及其概率以及其他類別的概率的信息。 IAB-2 分類示例 GroupDocs.Classification Cloud API 支持 IAB-2 分類方案,下面列出了一些分類示例: “汽車”, ‘書籍\和\文學’, “商業\和\金融”, “職業生涯”, ‘教育’, ‘活動\和\景點’, ‘家庭\和\關係’, ‘美術\藝術’, ‘食物和飲料’, ‘健康生活’, ‘興趣愛好’, ‘家&\花園’, ‘醫療\健康’, ‘電影’, ‘音樂\和\音頻’, ‘新聞\和\政治’, ‘個人財務’ ETC。 捲曲請求 ### Upload document to default storage curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage" -H "accept: application/json" -H "authorization: Bearer [Access_Token]" -H "Content-Type: multipart/form-data" -T C:/Temp/three-layouts.dwf 回复 { "bestClassName": "Healthy_Living", "bestClassProbability": 53.
· 穆罕默德·里茲萬 · 2 min

用於編輯 PDF 文本的 REST API 解決方案

GroupDocs.Annotation Cloud API 是一個獨立於平台的文檔和圖像註釋解決方案,使開發人員能夠以最少的努力在其應用程序中添加註釋功能。該 API 支持一系列註釋類型,但在這篇文章中,我將重點關注文本密文註釋,以演示如何密文 PDF 文本。 文本編輯是從文檔中永久刪除內容的過程。在發布文檔之前,您需要從文檔中刪除敏感和私人數據。 GroupDocs.Annotation Cloud 提供文本編輯註釋來編輯特定頁面區域上的文本。文本密文用黑色矩形填充部分文本,以隱藏底層單詞或短語。 讓我快速概述一下如何使用 GroupDocs.Annotation Cloud 通過一組簡單的 HTTP 請求來編輯文本。在此示例中,我將使用 cURL 來編輯 PDF 文檔中的文本。該API不限於PDF文件格式,您可以查看支持的文件格式的完整列表。它還提供適用於所有流行編程語言的 SDK。您可以通過工作示例檢查可用的來自 GitHub 存儲庫的 SDK,並直接在您的應用程序中使用。 我們將按照以下步驟查找重複圖像: 生成用於身份驗證的訪問令牌 將源文檔上傳至存儲 向文檔添加註釋 下載帶註釋的文檔 生成訪問令牌 ### Retrieve access token JWT(JSON Web Token) ### TODO: Get your AppSID and AppKey at https://dashboard.groupdocs.cloud (free registration is required). curl --request POST https://api.groupdocs.cloud/connect/token --header "Content-Type: application/x-www-form-urlencoded" --data "grant_type=client_credentials&client_id=[APP_SID]&client_secret=[APP_KEY]" 將源文檔上傳至存儲 ### Upload document to default storage curl -X POST "https://api.
· 蒂拉爾·艾哈邁德 · 1 min

將電子簽名添加到您的文檔中

什麼是電子簽名? 電子簽名或電子簽名是指與其他電子形式的數據在邏輯上關聯並由簽名人用於簽名的電子形式的數據。只要符合特定法規的要求,這種類型的簽名就具有與手寫簽名相同的法律地位。電子簽名可以是數字文本、圖像、條形碼、二維碼等形式。 電子簽名是一個與數字簽名不同的法律概念,數字簽名是一種通常用於實現電子簽名的加密機制。雖然電子簽名可以像在電子文檔中輸入名稱一樣簡單,但數字簽名越來越多地用於電子商務和監管備案中,以加密保護的方式實施電子簽名。 GroupDocs.Signature 雲 API? GroupDocs.Signature Cloud 是一個 REST API,用於在雲中創建、驗證和搜索不同類型的 Signature 對像到文檔。您可以使用五種主要類型的受支持簽名: 文字簽名 條碼簽名 二維碼簽名 電子簽名 圖像簽名 印章簽名 如何使用電子簽名 API 處理條形碼文檔? 該 API 旨在根據作為簽名選項數組傳遞的參數向文檔添加電子簽名。可以使用輸出 URL 或路徑下載呈現的文檔。 以下是使用文檔簽名的步驟: 將文件上傳到存儲。 創建簽名。 驗證簽名。 搜索簽名。 下載 HTML 文件。 1.將文件上傳到存儲 以下代碼演示瞭如何將文件上傳到存儲。 ### Upload document to default storage curl -X POST "https://api.groupdocs.cloud/v2.0/signature/storage/file/signaturedocs%2Fone-page.docx?storageName=MyStorage" -H "accept: application/json" -H "authorization: Bearer [Access Token]" 現在,我們的文件“one-page.docx”可在存儲上的文件夾“signaturedocs”下找到。 2.創建條形碼簽名 GroupDocs.Signature Cloud REST API 支持使用條形碼簽署文檔。它提供了通過使用請求正文中的簽名選項對象數據在文檔頁面中創建條形碼簽名的方法,其中包含不同的條形碼類型、位置、對齊方式、字體、邊距和外觀選項。 以下代碼演示瞭如何創建條形碼簽名。 curl -X POST "https://api.groupdocs.cloud/v2.0/signature/create" -H "accept: application/json" -H "authorization: Bearer [Access Token]" -H "Content-Type: application/json" -d "{ \"FileInfo\": { \"FilePath\": \"one-page.
· 穆罕默德·里茲萬 · 2 min

渲染 CAD 文件格式從未如此簡單

CAD(計算機輔助設計) 它用於 3D 圖形文件格式,可能包含 2D 或 3D 設計。 CAD 文件是 CAD 軟件生成和使用的對象的數字文件格式。 CAD 文件包含對象的技術繪圖、藍圖、原理圖或 3D 渲染。 GroupDocs.Viewer 雲 API GroupDocs.Viewer Cloud API 是靈活的文檔渲染和查看解決方案,供程序員和專業人員在任何地方渲染和顯示廣泛使用的文件格式。 支持的 CAD 文件格式 文件擴展名 文件格式 DGN MicroStation 設計文件 DWF 設計網頁格式 DWG Autodesk 設計數據格式 DXF Autodesk 繪圖交換文件格式 IFC 行業基礎類文件 STL 立體光刻文件 如何渲染 CAD 文件格式的 HTML 視圖 我們的文檔渲染和查看解決方案使開發人員能夠通過幾行指令在其應用程序中渲染 CAD 文件格式,其中包括放大輸出、設置輸出文件的高度和寬度等選項。 以下是渲染 CAD 文件的 HTML 視圖的步驟: 將文件上傳到存儲。 創建 HTML 視圖。 下載 HTML 文件。 1.將文件上傳到存儲 以下代碼演示瞭如何將文件上傳到存儲。 ### Upload document to default storage curl -X POST "https://api.
· 穆罕默德·里茲萬 · 2 min

隆重推出 GroupDocs.Comparison Cloud 19.5!

伙計們!新版本的 Groupdocs.Comparison Cloud 19.5 已發布。您對我們的文檔比較雲 API 的反饋和興趣使我們有動力實施新功能。全新的API;在此版本中,我們將 API 作為微服務實現。它提高了 API 的性能和穩定性。新 API 的方法和選項較少。我們還在 GroupDocs.Comparison Cloud API 中引入了雲存儲操作的新方法。我將在以下部分中概述一些新功能。有關新功能和增強功能的完整詳細信息,請查看此版本的發行說明。 新的API版本 我們在 19.5 版本中引入了 V2 API 版本,並將使用以下基本 URL。請注意,V1 將仍然可用。 https://api.groupdocs.cloud/v2.0/comparison/ 驗證 為了提高安全性,我們在此版本中引入了 JWT(JSON Web Token)身份驗證。 V2 API 版本不再支持 OAuth2 和 URL 簽名身份驗證方法。讓我們向您展示如何獲取 JWT 訪問令牌。 ### Retrieve access token JWT(JSON Web Token) ### TODO: Get your AppSID and AppKey at https://dashboard.groupdocs.cloud (free registration is required). curl --request POST https://api.groupdocs.cloud/connect/token --header "Content-Type: application/x-www-form-urlencoded" --data "grant_type=client_credentials&client_id=[APP_SID]&client_secret=[APP_KEY]" 存儲API
· 蒂拉爾·艾哈邁德 · 2 min

GroupDocs.批註雲19.5

對於開發者來說是個好消息!引入了全新的 GroupDocs.Annotation Cloud 19.5。我們致力於發展 GroupDocs.Annotation Cloud REST API,使其更加簡化和易於使用。考慮到這一點,我們對此版本進行了必要的更改。新的 API 更加優化,方法和選項更少。其內部架構經過改進,可實現快速可靠的處理,以構建文檔和圖像註釋工具,並支持基於文本和圖形的註釋操作。現在該 API 還包括使用雲存儲的方法。因此,您可以直接使用 GroupDocs.Annotation Cloud REST API 執行存儲操作,而不是使用單獨的 API。 請查看詳細的此版本的發行說明 以了解此版本中的所有新功能/增強功能。 重大變化 新的API版本 19.5版本引入API版本V2,V1將保持可用。 驗證 此版本中引入了 JWT(JSON Web Token)身份驗證,現在 OAuth2 和 URL 簽名身份驗證方法已過時。 註釋API 簡化的 API 方法可將基於文本和圖形的註釋應用於所有流行格式的文檔和圖像。 存儲API 文件API - 引入了上傳、下載、複製、移動、刪除文件的方法:輸入文檔和渲染結果,在雲存儲中 Folder API - 引入了在雲存儲中創建、複製、移動、刪除文件夾的方法 Storage API - 引入了獲取存儲信息和文件信息的方法 為文檔添加註釋 這裡我們將向您展示 GroupDocs.Annotation Cloud V2 API 版本的工作原理,它與 V1 有所不同。我們將按照以下步驟使用 GroupDocs.Annotation Cloud SDK for .NET 在 Word 文檔中添加註釋: 將源文檔上傳至存儲 在源文檔中添加註釋 我們需要將源文檔上傳到雲存儲,因為在本例中我們將處理來自云存儲的文檔。在該版本中,我們引入了用於文件存儲操作的 File API。我們將使用 Annotation V2 API 版本的 UploadFile 方法而不是 GroupDocs.
· 蒂拉爾·艾哈邁德 · 3 min

全新GroupDocs.Signature Cloud V2!

伙計們,過去打印、簽署、掃描和郵寄文件的繁瑣的簽署文件的工作已經一去不復返了。現在,在這個數字時代,在線文檔簽名選項使生活變得更加輕鬆。 GroupDocs.Signature Cloud REST API 經過測試且可靠的電子簽名 REST API,可在您的應用程序中添加電子簽名的功能,而無需安裝任何第三方軟件。它可以通過應用文本、圖章、QR 碼、條形碼、圖像和數字簽名來幫助您以電子方式保護文檔。 GroupDocs.Signature Cloud 19.5新版本發布。 請查看此版本的詳細發行說明,以了解此版本中的所有新功能/增強功能。 什麼是新的 API版本 - 推出API版本V2 身份驗證 - JWT(JSON Web Token) 身份驗證 簽名 API - 用於創建、驗證和搜索簽名的簡化 API 方法,與獲取文檔的附加信息相同 文件API – 引入了上傳、下載、複製、移動、刪除文件的方法:輸入文檔和渲染結果,在雲存儲中 文件夾 API - 引入了在雲存儲中創建、複製、移動、刪除文件夾的方法 Storage API - 引入了獲取存儲信息和文件信息的方法 怎麼運行的 此版本的主要變化是引入了V2 API版本,它是全新的API版本。它是更簡化的 API,具有更少的方法和選項。同時,其內部架構也更加優化和精緻。在此版本中,API 包含使用雲存儲的方法。因此,您可以使用 GroupDocs.Signature Cloud REST API 執行存儲操作,而不是使用單獨的 API。 這裡我們將向您展示 GroupDocs.Signature Cloud V2 API 版本的工作原理,它與 V1 有所不同。我們將按照以下步驟使用 V1 和 V2 在 Word 文檔中添加條形碼簽名: 檢索訪問令牌 將源文檔上傳至存儲 將條形碼簽名添加到源文檔 從以下 cURL 示例中您可以注意到,我們在 V2 示例中使用了 JWT 身份驗證。請注意,V2 不再支持 V1 API 版本的 OAuth 2.
· 蒂拉爾·艾哈邁德 · 3 min

GroupDocs.Conversion Cloud V2 簡介

GroupDocs Cloud 很高興發布 GroupDocs.Conversion Cloud REST API V2 版本。它是全新的 API 版本,與 V1 相比,具有簡化且直觀的方法。新的 API 通過改進的架構減少了文檔轉換任務的方法和選項。在此版本中,API 包括使用雲存儲的方法,這是重要的部分。 了解更多。 什麼是新的 GroupDocs.Conversion Cloud V2 的 API 方法分為四個部分。轉換 API 部分包括文檔轉換的方法。文件 API 部分具有上傳、下載、複製、移動和刪除文件的方法。文件夾 API 部分添加了在雲存儲中創建、複製、移動、刪除文件夾的方法。 Storage API包括獲取存儲信息和文件信息的方法。 在接下來的幾段中,我們將介紹 GroupDocs.Viewer Cloud V2 的特性和功能。 怎麼運行的 在這個數字時代,文檔轉換服務正在成為組織的基本需求。業務流程中出於不同的目的需要使用不同的文檔格式。因此,作為開發人員,您可能正在尋找一種高效可靠的解決方案來開發文檔轉換工具。 GroupDocs.Conversion Cloud REST API 支持 65 多種文檔格式的轉換。它允許將文檔轉換功能無縫集成到您的應用程序中。 我們將向您展示如何輕鬆快速地將文檔轉換為另一種文檔格式並同時添加水印。在此示例中,我們使用 cURL 來處理 REST API 請求。請檢查可用 SDK 的完整列表,以便直接在您喜歡的平台中使用 GroupDocs.Viewer Cloud API。 開始吧…我們將 DOCX 文件轉換為 PDF 並添加水印文本,如下所示 獲取驗證碼 GroupDocs.Conversion Cloud REST API 支持 JWT(JSON Web Token) 身份驗證。
· 蒂拉爾·艾哈邁德 · 1 min