合併、提取文本、圖像和元數據

我們很高興與大家分享即將推出的 GroupDocs.Parser Cloud API 的見解,這是 groupdocs.cloud 產品列表中的新成員。 GroupDocs.Parser Cloud 是一個文檔解析解決方案。作為開發人員,您將能夠在任何平台上的應用程序中添加文檔解析功能,而無需依賴任何第三方插件或工具。該 REST API 的主要功能是解析用戶定義模板上的文檔,以從發票、報價單或其他類型的業務文檔中提取數據。

即將推出的 API 支持的一些功能如下。 REST API 將不限於以下功能,但我們將不斷添加新的有用功能。

特徵

  • 按模板解析文檔

  • 提取文本

    • 僅提取文本

    • 使用提取模式選項提取格式化文本;純文本、HTML 和 降價

    • 通過設置頁面範圍從特定頁面提取文本

  • 提取圖像

  • 文檔信息提取

  • 模板管理

支持的格式

在 GroupDocs.Parser Cloud API 的第一個版本中,我們將支持以下文件格式:

文檔

微軟Word文檔

微軟Word文檔模板

DOCX

Office 打開 XML 文檔

DOCM

Office Open XML 啟用宏的文檔

DOTX

Office Open XML 文檔模板

DOTM

Office Open XML 文檔啟用宏的模板

TXT

純文本

ODT

打開文檔文本

OTT

打開文檔文本模板

RTF

富文本格式

PDF

便攜式文檔格式文件

HTML

超文本標記語言文件

XHTML

Extensible 超文本標記語言文件

MHTML

MIME HTML 文件

MD

降價

XML

XML文件

CHM

編譯的 HTML 幫助文件

EPUB

數字電子書文件格式

FB2

小說書 2.0 文件

XLS

Microsoft Excel 電子表格

XLT

微軟Excel模板

XLSX

Office Open XML 電子表格

XLSM

Office Open XML 啟用宏的電子表格

XLSB

Office Open XML 二進制電子表格

XLTX

Office Open XML 電子表格模板

XLTM

Office Open XML 啟用宏的電子表格模板

ODS

打開文檔電子表格

奧特斯

打開文檔電子表格模板

CSV

逗號分隔值

XLA

Excel 加載項文件

XLAM

Excel Open XML 啟用宏的加載項

數字

蘋果 iWork 號碼

PPT

PowerPoint演示文稿

PPS

PowerPoint 幻燈片

POT

PowerPoint模板

PPTX

Office Open XML 演示文稿

PPTM

Office Open XML 支持宏的演示文稿

POTX

Office Open XML 演示模板

POTM

Office Open XML 啟用宏的演示模板

PPSX

Office Open XML 演示文稿幻燈片

PPSM

Office Open XML 支持宏的演示文稿幻燈片

ODP

開放文檔演示

OTP

打開文檔演示模板

PST

Outlook 個人信息存儲文件

OST

Outlook 脫機數據文件

EML

電子郵件信息

EMLX

蘋果郵件消息

味精

Outlook 郵件消息

OneNote 文檔

ZIP

壓縮文件

安全與認證

GroupDocs.Parser Cloud REST API 是安全的並且需要身份驗證。您將需要 AppSID 和 AppKey 進行身份驗證,可以在 儀表板 中創建。

API瀏覽器

我們將為 GroupDocs.Parser Cloud 提供基於 Web 的 API 參考瀏覽器。因此,您將能夠立即在瀏覽器中嘗試 REST API。您還可以獲取API中所有資源的信息。

軟件開發工具包

GroupDocs.Parser Cloud 將附帶託管在我們的 GitHub 存儲庫 上的所有流行編程語言的 SDK 以及工作示例,這將允許您將其集成到現有系統中。 SDK 將圍繞 REST API 進行封裝。 SDK 將處理髮出請求和處理響應的低級細節,這將使您能夠專注於編寫特定於您的特定項目的代碼。

我們的第一個版本

我們目前正在最終確定 GroupDocs.Parser Cloud 的文檔和示例。我們計劃很快發布新產品的第一個版本,其功能如上所述。如果您有任何問題或建議,請隨時在groupdocs.cloud論壇上給我們寫信。

請繼續關注groupdocs.cloud blog以獲取更多更新。