作为 Python 开发人员,您可以轻松地解析 Word 文档并以编程方式在云端提取所有图像/文本。在本文中,您将学习如何在 Python 中使用 REST API 解析 Word 文档。
在 Node.js 中使用 REST API 从 PDF 中提取文本
作为 Node.js 开发人员,解析您的 PDF 文档并在云端以编程方式提取所有文本。在本文中,您将学习如何在 Node.js 中使用 REST API 从 PDF 文档中提取文本。
在 Node.js 中使用 REST API 解析 Word 文档
作为 Node.js 开发人员,您可以通过编程方式在云端轻松提取 Word 文档中的所有文本和图像。本文将重点介绍如何在 Node.js 中使用 REST API 解析 Word 文档。
使用 Python 从 PDF 中提取特定数据
您可以在云端以编程方式解析任何文档并提取字段和表格数据。本文将解释如何在 Python 中使用 REST API 从 PDF 文档中提取特定数据
使用 Python 从 PDF 文档中提取图像
您可以在云端以编程方式从 PDF 文档中提取图像。从特定页面范围或容器内的文档中提取图像。本文将重点介绍如何在 Python 中使用 REST API 从 PDF 文档中提取图像。
使用 Python 从 PDF 中提取文本
在云端以编程方式从 PDF 文档中提取文本。从特定页面范围或容器内的文档中读取文本。本文将重点介绍如何使用 Python 中的 REST API 从 PDF 文档中提取文本。
使用 Python 从 PDF、电子表格、演示文稿和 Word 文档中提取图像
如果您是一名 Python 开发人员并且想要从文档中提取数据,本文将指导您使用简单的 Python 示例从 Word 文档、电子表格、演示文稿和 PDF 文档中提取图像。
我们将使用 GroupDocs.Parser Cloud API 的 Python SDK。不过,目前它还提供.NET、Java、PHP、Ruby 和 Node.js SDK 作为其文档解析系列成员。
该 API 还支持文本和元数据提取,以及从各种文档(如文字处理文档、电子表格、演示文稿、电子邮件、档案、标记和 PDF 文档)中提取图像。
我们很高兴与大家分享即将推出的 GroupDocs.Parser Cloud API 的见解,这是 groupdocs.cloud 产品列表中的新成员。 GroupDocs.Parser Cloud 是一个文档解析解决方案。作为开发人员,您将能够在任何平台上的应用程序中添加文档解析功能,而无需依赖任何第三方插件或工具。该 REST API 的主要功能是解析用户定义模板上的文档,以从发票、报价单或其他类型的业务文档中提取数据。
即将推出的 API 支持的一些功能如下。 REST API 将不限于以下功能,但我们将不断添加新的有用功能。
特征
按模板解析文档
提取文本
仅提取文本
使用提取模式选项提取格式化文本;纯文本、HTML 和 降价
通过设置页面范围从特定页面提取文本
提取图像
文档信息提取
模板管理
支持的格式 在 GroupDocs.Parser Cloud API 的第一个版本中,我们将支持以下文件格式:
文档
微软Word文档
点
微软Word文档模板
DOCX
Office 打开 XML 文档
DOCM
Office Open XML 启用宏的文档
DOTX
Office Open XML 文档模板
DOTM
Office Open XML 文档启用宏的模板
TXT
纯文本
ODT
打开文档文本
OTT
打开文档文本模板
RTF
富文本格式
PDF