作為 Python 開發人員,您可以輕鬆地解析 Word 文檔並以編程方式在雲端提取所有圖像/文本。在本文中,您將學習如何在 Python 中使用 REST API 解析 Word 文檔。
在 Node.js 中使用 REST API 從 PDF 中提取文本
作為 Node.js 開發人員,解析您的 PDF 文檔並在雲端以編程方式提取所有文本。在本文中,您將學習如何在 Node.js 中使用 REST API 從 PDF 文檔中提取文本。
在 Node.js 中使用 REST API 解析 Word 文檔
作為 Node.js 開發人員,您可以通過編程方式在雲端輕鬆提取 Word 文檔中的所有文本和圖像。本文將重點介紹如何在 Node.js 中使用 REST API 解析 Word 文檔。
使用 Python 從 PDF 中提取特定數據
您可以在雲端以編程方式解析任何文檔並提取字段和表格數據。本文將解釋如何在 Python 中使用 REST API 從 PDF 文檔中提取特定數據
使用 Python 從 PDF 文檔中提取圖像
您可以在雲端以編程方式從 PDF 文檔中提取圖像。從特定頁面範圍或容器內的文檔中提取圖像。本文將重點介紹如何在 Python 中使用 REST API 從 PDF 文檔中提取圖像。
使用 Python 從 PDF 中提取文本
在雲端以編程方式從 PDF 文檔中提取文本。從特定頁面範圍或容器內的文檔中讀取文本。本文將重點介紹如何使用 Python 中的 REST API 從 PDF 文檔中提取文本。
使用 Python 從 PDF、電子表格、演示文稿和 Word 文檔中提取圖像
如果您是一名 Python 開發人員並且想要從文檔中提取數據,本文將指導您使用簡單的 Python 示例從 Word 文檔、電子表格、演示文稿和 PDF 文檔中提取圖像。
我們將使用 GroupDocs.Parser Cloud API 的 Python SDK。不過,目前它還提供.NET、Java、PHP、Ruby 和 Node.js SDK 作為其文檔解析系列成員。
該 API 還支持文本和元數據提取,以及從各種文檔(如文字處理文檔、電子表格、演示文稿、電子郵件、檔案、標記和 PDF 文檔)中提取圖像。
我們很高興與大家分享即將推出的 GroupDocs.Parser Cloud API 的見解,這是 groupdocs.cloud 產品列表中的新成員。 GroupDocs.Parser Cloud 是一個文檔解析解決方案。作為開發人員,您將能夠在任何平台上的應用程序中添加文檔解析功能,而無需依賴任何第三方插件或工具。該 REST API 的主要功能是解析用戶定義模板上的文檔,以從發票、報價單或其他類型的業務文檔中提取數據。
即將推出的 API 支持的一些功能如下。 REST API 將不限於以下功能,但我們將不斷添加新的有用功能。
特徵
按模板解析文檔
提取文本
僅提取文本
使用提取模式選項提取格式化文本;純文本、HTML 和 降價
通過設置頁面範圍從特定頁面提取文本
提取圖像
文檔信息提取
模板管理
支持的格式 在 GroupDocs.Parser Cloud API 的第一個版本中,我們將支持以下文件格式:
文檔
微軟Word文檔
點
微軟Word文檔模板
DOCX
Office 打開 XML 文檔
DOCM
Office Open XML 啟用宏的文檔
DOTX
Office Open XML 文檔模板
DOTM
Office Open XML 文檔啟用宏的模板
TXT
純文本
ODT
打開文檔文本
OTT
打開文檔文本模板
RTF
富文本格式
PDF