Объединяйте, извлекайте текст, изображения и метаданные

Мы рады поделиться информацией о готовящемся облачном API GroupDocs.Parser, новом дополнении к списку продуктов groupdocs.cloud. GroupDocs.Parser Cloud — решение для парсинга документов. Как разработчик, вы сможете добавить функцию синтаксического анализа документов в свои приложения на любой платформе, не завися от какого-либо стороннего плагина или инструмента. Основная функция этого REST API будет заключаться в анализе документов по пользовательским шаблонам для извлечения данных из ваших счетов-фактур, коммерческих предложений или других видов деловых документов.

Вот некоторые из поддерживаемых функций в будущем API. REST API не будет ограничен следующими функциями, но мы будем продолжать добавлять новые полезные функции.

Функции

  • Разобрать документ по шаблону

  • Извлечь текст

    • Извлечь только текст

    • Извлечение форматированного текста с использованием опции режима извлечения; Обычный текст, HTML и Уценка

    • Извлечение текста с определенных страниц путем установки диапазона страниц

  • Извлечь изображения

  • Извлечение информации из документа

  • Управление шаблонами

Поддерживаемые форматы

В первом выпуске GroupDocs.Parser Cloud API мы будем поддерживать следующие форматы файлов:

DOC

Документ Microsoft Word

DOT

Шаблон документа Microsoft Word

DOCX

Документ Office Open XML

DOCM

Документ Office Open XML с поддержкой макросов

DOTX

Шаблон документа Office Open XML

DOTM

Шаблон документа Office Open XML с поддержкой макросов

TXT

Простой текст

ODT

Открыть текст документа

ОТТ

Открыть текстовый шаблон документа

RTF

Расширенный текстовый формат

PDF

Файл переносимого формата документа

HTML

Файл языка гипертекстовой разметки

XHTML

Extensible Файл языка гипертекстовой разметки

MHTML

HTML-файл MIME

MD

Уценка

XML

XML-файл

CHM

Скомпилированный HTML-файл справки

EPUB

Формат файла цифровой электронной книги

FB2

Файл FictionBook 2.0

XLS

Электронная таблица Microsoft Excel

XLT

Шаблон Microsoft Excel

XLSX

Электронная таблица Office Open XML

XLSM

Электронная таблица Office Open XML с поддержкой макросов

XLSB

Двоичная электронная таблица Office Open XML

XLTX

Шаблон электронной таблицы Office Open XML

XLTM

Шаблон электронной таблицы Office Open XML с поддержкой макросов

ODS

Открыть электронную таблицу документов

ОТС

Открыть шаблон электронной таблицы документа

CSV

Значения, разделенные запятыми

XLA

Файл надстройки Excel

XLAM

Надстройка Excel Open XML с поддержкой макросов

НОМЕРА

Номера Apple iWork

PPT

Презентация PowerPoint

PPS

Слайд-шоу PowerPoint

POT

Шаблон PowerPoint

PPTX

Презентация Office Open XML

PPTM

Презентация Office Open XML с поддержкой макросов

POTX

Шаблон презентации Office Open XML

POTM

Шаблон презентации Office Open XML с поддержкой макросов

PPSX

Слайд-шоу презентации Office Open XML

ППСМ

Слайд-шоу презентации Office Open XML с поддержкой макросов

ODP

Презентация открытого документа

OTP

Открыть шаблон презентации документа

PST

Файл хранилища личной информации Outlook

ОСТ

Автономный файл данных Outlook

EML

Сообщение электронной почты

EMLX

Почтовое сообщение Apple

MSG

Почтовое сообщение Outlook

ONE

Документ OneNote

ZIP

Заархивированный файл

Безопасность и аутентификация

The GroupDocs.Parser Cloud REST API is secured and requires authentication. You will need AppSID and AppKey for authentication, which can be created at the dashboard.

API Explorer

Мы предоставим веб-справочник по API для GroupDocs.Parser Cloud. Таким образом, вы сможете сразу попробовать REST API в своем браузере. А также вы можете получить информацию обо всех ресурсах в API.

SDK

GroupDocs.Parser Cloud будет поставляться с SDK для всех популярных языков программирования, размещенными в нашем репозитории GitHub, а также с рабочими примерами, которые позволят вам интегрировать его в существующие системы. SDK будут использовать REST API. SDK позаботится о низкоуровневых деталях отправки запросов и обработки ответов, что позволит вам сосредоточиться на написании кода, специфичного для вашего конкретного проекта.

Наша первая версия

В настоящее время мы дорабатываем документацию и примеры для GroupDocs.Parser Cloud. Мы планируем вскоре выпустить первую версию нового продукта с описанными выше функциями. Если у вас есть вопросы или предложения, пишите нам на форум groupdocs.cloud.

Пожалуйста, следите за обновлениями в блог groupdocs.cloud.