中文

在 Node.js 中使用 REST API 从 PDF 中提取数据

作为 Node.js 开发人员,您可以轻松解析 PDF 文档并从云端的特定字段或表格中提取数据。在本文中,您将学习如何使用 Node.js 中的 REST API 从 PDF 文档中提取特定数据。
· 穆扎米尔汗 · 5 分钟

在 Node.js 中使用 REST API 从 PDF 中提取文本

作为 Node.js 开发人员,解析您的 PDF 文档并在云端以编程方式提取所有文本。在本文中,您将学习如何在 Node.js 中使用 REST API 从 PDF 文档中提取文本。
· 穆扎米尔汗 · 3 分钟

在 Node.js 中使用 REST API 解析 Word 文档

作为 Node.js 开发人员,您可以通过编程方式在云端轻松提取 Word 文档中的所有文本和图像。本文将重点介绍如何在 Node.js 中使用 REST API 解析 Word 文档。
· 穆扎米尔汗 · 3 分钟

使用 Python 从 PDF 中提取特定数据

您可以在云端以编程方式解析任何文档并提取字段和表格数据。本文将解释如何在 Python 中使用 REST API 从 PDF 文档中提取特定数据
· 穆扎米尔汗 · 4 分钟

用于解析文档和提取数据的 REST API 解决方案

GroupDocs 即将退出以共享 GroupDocs.Parser Cloud 的第一个版本。它是一个开箱即用的独立于平台的 REST API 解决方案,可从所有常见业务文件格式中解析和提取数据,而无需依赖任何第三方工具或插件。开发人员可以将其与他们的 Web、桌面、移动或云应用程序集成,而无需任何主要的学习曲线,因为它可以在支持 REST 的任何平台或语言上使用。 什么是 GroupDocs.Parser Cloud? 假设您正在开发一个文档管理系统,需要一个文本搜索或文本分析功能,如果您的系统无需安装相关文档阅读器就可以读取或分析多种文档类型,岂不是很棒? GroupDocs.Parser Cloud完成了上述目的。它是一个文档数据提取 REST API,支持 50 多种文档类型。 GroupDocs.Parser Cloud 最有价值的功能之一是使用预定义模板解析文档。可以轻松定义模板并从业务文档(例如发票、收据、报价单、信件等)中提取数据。它不仅限于文本提取,还可以从支持的文档类型中提取图像。该 API 不仅可用于常规文档,还可用于 ZIP 档案、OST/PST 邮件数据文件和 PDF 组合等容器。抽出一些时间并访问 首次公开发布的发行说明 以获取其功能的完整列表。 怎么运行的? 您可以通过两种方式在应用程序中使用 GroupDocs.Parser Cloud 功能。您可以通过某些 REST 客户端使用它,也可以直接以您最喜欢的编程语言使用我们的 SDK。您可以找到来自 GroupDocs.Parser Github 存储库的 SDK 的完整列表。 在这里,我将通过使用预定义模板解析 Word 文档来演示 GroupDocs.Parser Cloud 的功能。我正在使用 REST 客户端; cURL 命令行工具。 首先,在继续之前,请注册 groupdocs.cloud 并获取应用程序 SID 和应用程序密钥来验证您的其余 API 调用。 创建模板 正如上面分享的,GroupDocs.Parser Cloud 允许用户使用预定义模板解析文档,以从文档中提取数据。我们将为以下Word文档创建一个模板并保存到默认存储。 在这里,我们按照以下步骤创建一个简单的模板: 卷曲示例:
· 蒂拉尔·艾哈迈德 · 2 分钟

文档解析器 REST API 解决方案简介 - GroupDocs.Parser Cloud

我们很高兴与大家分享即将推出的 GroupDocs.Parser Cloud API 的见解,这是 groupdocs.cloud 产品列表中的新成员。 GroupDocs.Parser Cloud 是一个文档解析解决方案。作为开发人员,您将能够在任何平台上的应用程序中添加文档解析功能,而无需依赖任何第三方插件或工具。该 REST API 的主要功能是解析用户定义模板上的文档,以从发票、报价单或其他类型的业务文档中提取数据。 即将推出的 API 支持的一些功能如下。 REST API 将不限于以下功能,但我们将不断添加新的有用功能。 特征 按模板解析文档 提取文本 仅提取文本 使用提取模式选项提取格式化文本;纯文本、HTML 和 降价 通过设置页面范围从特定页面提取文本 提取图像 文档信息提取 模板管理 支持的格式 在 GroupDocs.Parser Cloud API 的第一个版本中,我们将支持以下文件格式: 文档 微软Word文档 点 微软Word文档模板 DOCX Office 打开 XML 文档 DOCM Office Open XML 启用宏的文档 DOTX Office Open XML 文档模板 DOTM Office Open XML 文档启用宏的模板 TXT 纯文本 ODT 打开文档文本 OTT 打开文档文本模板 RTF 富文本格式 PDF
· 蒂拉尔·艾哈迈德 · 2 分钟