テキスト、画像、メタデータの結合、抽出

groupdocs.cloud 製品リストに新たに追加される、今後の GroupDocs.Parser Cloud API に関する洞察を共有できることを嬉しく思います。 GroupDocs.Parser Cloud は、ドキュメント解析ソリューションです。開発者は、サードパーティのプラグインやツールに依存せずに、任意のプラットフォーム上のアプリケーションにドキュメント解析機能を追加できるようになります。この REST API の主な機能は、ユーザー定義のテンプレート上のドキュメントを解析して、請求書、見積書、またはその他の種類のビジネス ドキュメントからデータを抽出することです。

今後の API でサポートされる機能の一部は次のとおりです。 REST APIは以下の機能に限定されるものではなく、今後も便利な新機能を追加していきます。

特徴

  • テンプレートによるドキュメントの解析

  • テキストの抽出

    • テキストのみを抽出する

    • 抽出モード オプションを使用して書式設定されたテキストを抽出します。プレーンテキスト、HTML、マークダウン

    • ページ範囲を設定して特定のページからテキストを抽出する

  • 画像の抽出

  • 文書情報の抽出

  • テンプレート管理

サポートされている形式

GroupDocs.Parser Cloud API の最初のリリースでは、次のファイル形式がサポートされる予定です。

ドキュメント

Microsoft Word文書

DOT

Microsoft Wordドキュメントテンプレート

DOCX

Office オープン XML ドキュメント

DOCM

Office Open XML マクロ有効ドキュメント

DOTX

Office Open XML ドキュメント テンプレート

DOTM

Office Open XML ドキュメントのマクロ有効テンプレート

TXT

プレーンテキスト

ODT

文書テキストを開く

OTT

ドキュメントテキストテンプレートを開く

RTF

リッチテキスト形式

PDF

PDF形式ファイル

HTML

ハイパーテキスト マークアップ言語ファイル

XHTML

Extensible ハイパーテキスト マークアップ言語ファイル

MHTML

MIME HTML ファイル

MD

マークダウン

XML

XMLファイル

CHM

コンパイルされた HTML ヘルプ ファイル

EPUB

デジタル電子書籍のファイル形式

FB2

FictionBook 2.0 ファイル

XLS

Microsoft Excel スプレッドシート

XLT

Microsoft Excel テンプレート

XLSX

Office オープン XML スプレッドシート

XLSM

Office Open XML マクロ対応スプレッドシート

XLSB

Office Open XML バイナリ スプレッドシート

XLTX

Office Open XML スプレッドシート テンプレート

XLTM

Office Open XML マクロ対応スプレッドシート テンプレート

ODS

ドキュメントのスプレッドシートを開く

OTS

オープンドキュメントスプレッドシートテンプレート

CSV

カンマ区切り値

XLA

Excelアドインファイル

XLAM

Excel Open XML マクロ有効アドイン

数字

Apple iWork 番号

PPT

パワーポイントによるプレゼンテーション

PPS

PowerPoint スライドショー

POT

PowerPointのテンプレート

PPTX

Office Open XML プレゼンテーション

PPTM

Office Open XML マクロ有効プレゼンテーション

POTX

Office Open XML プレゼンテーション テンプレート

POTM

Office Open XML マクロ有効プレゼンテーション テンプレート

PPSX

Office Open XML プレゼンテーション スライドショー

PPSM

Office Open XML マクロ対応プレゼンテーション スライドショー

ODP

オープンドキュメントプレゼンテーション

OTP

オープンドキュメントプレゼンテーションテンプレート

PST

Outlook 個人情報ストア ファイル

OST

Outlook オフライン データ ファイル

EML

電子メールメッセージ

EMLX

Apple メールのメッセージ

MSG

Outlook メール メッセージ

ONE

OneNote ドキュメント

ZIP

圧縮ファイル

セキュリティと認証

GroupDocs.Parser クラウド REST API は保護されており、認証が必要です。認証にはAppSIDとAppKeyが必要になります。ダッシュボードで作成できます。

APIエクスプローラー

GroupDocs.Parser Cloud 向けに Web ベースの API リファレンス エクスプローラー を提供します。そのため、ブラウザですぐに REST API を試すことができます。また、API 内のすべてのリソースに関する情報を取得することもできます。

SDK

GroupDocs.Parser Cloud には、GitHub リポジトリ でホストされているすべての一般的なプログラミング言語用の SDK と、それを既存のシステムに統合できる実用的なサンプルが付属します。 SDK は REST API にラップされます。 SDK は、リクエストの作成と応答の処理に関する低レベルの詳細を処理するため、特定のプロジェクトに固有のコードの作成に集中できるようになります。

私たちの最初のバージョン

現在、GroupDocs.Parser Cloud のドキュメントとサンプルを完成させているところです。上記で共有した機能を備えた新製品の最初のバージョンを間もなくリリースする予定です。ご質問やご提案がございましたら、お気軽に groupdocs.cloud フォーラム にご記入ください。

今後の最新情報については、groupdocs.cloud ブログ をご覧ください。