合并、提取文本、图像和元数据

我们很高兴与大家分享即将推出的 GroupDocs.Parser Cloud API 的见解,这是 groupdocs.cloud 产品列表中的新成员。 GroupDocs.Parser Cloud 是一个文档解析解决方案。作为开发人员,您将能够在任何平台上的应用程序中添加文档解析功能,而无需依赖任何第三方插件或工具。该 REST API 的主要功能是解析用户定义模板上的文档,以从发票、报价单或其他类型的业务文档中提取数据。

即将推出的 API 支持的一些功能如下。 REST API 将不限于以下功能,但我们将不断添加新的有用功能。

特征

  • 按模板解析文档

  • 提取文本

    • 仅提取文本

    • 使用提取模式选项提取格式化文本;纯文本、HTML 和 降价

    • 通过设置页面范围从特定页面提取文本

  • 提取图像

  • 文档信息提取

  • 模板管理

支持的格式

在 GroupDocs.Parser Cloud API 的第一个版本中,我们将支持以下文件格式:

文档

微软Word文档

微软Word文档模板

DOCX

Office 打开 XML 文档

DOCM

Office Open XML 启用宏的文档

DOTX

Office Open XML 文档模板

DOTM

Office Open XML 文档启用宏的模板

TXT

纯文本

ODT

打开文档文本

OTT

打开文档文本模板

RTF

富文本格式

PDF

便携式文档格式文件

HTML

超文本标记语言文件

XHTML

Extensible 超文本标记语言文件

MHTML

MIME HTML 文件

MD

降价

XML

XML文件

CHM

编译的 HTML 帮助文件

EPUB

数字电子书文件格式

FB2

小说书 2.0 文件

XLS

Microsoft Excel 电子表格

XLT

微软Excel模板

XLSX

Office Open XML 电子表格

XLSM

Office Open XML 启用宏的电子表格

XLSB

Office Open XML 二进制电子表格

XLTX

Office Open XML 电子表格模板

XLTM

Office Open XML 启用宏的电子表格模板

ODS

打开文档电子表格

奥特斯

打开文档电子表格模板

CSV

逗号分隔值

XLA

Excel 加载项文件

XLAM

Excel Open XML 启用宏的加载项

数字

苹果 iWork 号码

PPT

PowerPoint演示文稿

PPS

PowerPoint 幻灯片

POT

PowerPoint模板

PPTX

Office Open XML 演示文稿

PPTM

Office Open XML 支持宏的演示文稿

POTX

Office Open XML 演示模板

POTM

Office Open XML 启用宏的演示模板

PPSX

Office Open XML 演示文稿幻灯片

PPSM

Office Open XML 支持宏的演示文稿幻灯片

ODP

开放文档演示

OTP

打开文档演示模板

PST

Outlook 个人信息存储文件

OST

Outlook 脱机数据文件

EML

电子邮件信息

EMLX

苹果邮件消息

味精

Outlook 邮件消息

OneNote 文档

ZIP

压缩文件

安全与认证

GroupDocs.Parser Cloud REST API 是安全的并且需要身份验证。您将需要 AppSID 和 AppKey 进行身份验证,可以在 仪表板 中创建。

API浏览器

我们将为 GroupDocs.Parser Cloud 提供基于 Web 的 API 参考浏览器。因此,您将能够立即在浏览器中尝试 REST API。您还可以获取API中所有资源的信息。

软件开发工具包

GroupDocs.Parser Cloud 将附带托管在我们的 GitHub 存储库 上的所有流行编程语言的 SDK 以及工作示例,这将允许您将其集成到现有系统中。 SDK 将围绕 REST API 进行封装。 SDK 将处理发出请求和处理响应的低级细节,这将使您能够专注于编写特定于您的特定项目的代码。

我们的第一个版本

我们目前正在最终确定 GroupDocs.Parser Cloud 的文档和示例。我们计划很快发布新产品的第一个版本,其功能如上所述。如果您有任何问题或建议,请随时在groupdocs.cloud论坛上给我们写信。

请继续关注groupdocs.cloud blog以获取更多更新。