日本

ドキュメントを解析してデータを抽出するための REST API ソリューション

GroupDocs は、GroupDocs.Parser Cloud の最初のバージョンを共有するために終了します。これは、サードパーティのツールやプラグインに依存せずに、すべての一般的なビジネス ファイル形式からデータを解析して抽出する、すぐに使用できるプラットフォームに依存しない REST API ソリューションです。 REST をサポートする任意のプラットフォームまたは言語で使用できるため、開発者は大きな学習曲線を必要とせずに Web、デスクトップ、モバイル、またはクラウド アプリケーションと統合できます。 GroupDocs.Parser クラウドとは何ですか? ドキュメント管理システムを開発していて、テキスト検索またはテキスト分析の機能が必要だとします。関連するドキュメント リーダーをインストールせずに、システムが幅広い種類のドキュメントを読み取ったり分析できれば素晴らしいと思いませんか? GroupDocs.Parser Cloud は上記の目的を達成します。 50種類以上の文書タイプをサポートする文書データ抽出REST APIです。 GroupDocs.Parser Cloud の最も価値のある機能の 1 つは、事前定義されたテンプレートを使用してドキュメントを解析することです。テンプレートを定義して、請求書、領収書、見積書、手紙などのビジネス文書からデータを抽出するのは簡単です。テキスト抽出に限定されず、サポートされている文書タイプから画像を抽出することもできます。この API は、通常のドキュメントだけでなく、ZIP アーカイブ、OST/PST メール データ ファイル、PDF ポートフォリオなどのコンテナーでも使用できます。時間を割いて、最初の公開リリースのリリース ノート にアクセスして、その機能の完全なリストを確認してください。 使い方? アプリケーションで GroupDocs.Parser Cloud 機能を使用するには、2 つの方法があります。 REST クライアント経由で使用するか、お気に入りのプログラミング言語で SDK を直接使用してください。 GroupDocs.Parser Github リポジトリの SDK の完全なリストを見つけることができます。 ここでは、事前定義されたテンプレートを使用して Word ドキュメントを解析することにより、GroupDocs.Parser Cloud の機能を示します。 REST クライアントを使用しています。 cURL コマンドラインツール。 まず最初に、続行する前に groupdocs.cloud にサインアップ して、残りの API 呼び出しを認証するためのアプリ SID とアプリ キーを取得してください。 テンプレートの作成 上で共有したように、GroupDocs.
· ティラル・アハマド · 2 分

ドキュメント パーサー REST API ソリューションの紹介 - GroupDocs.Parser Cloud

groupdocs.cloud 製品リストに新たに追加される、今後の GroupDocs.Parser Cloud API に関する洞察を共有できることを嬉しく思います。 GroupDocs.Parser Cloud は、ドキュメント解析ソリューションです。開発者は、サードパーティのプラグインやツールに依存せずに、任意のプラットフォーム上のアプリケーションにドキュメント解析機能を追加できるようになります。この REST API の主な機能は、ユーザー定義のテンプレート上のドキュメントを解析して、請求書、見積書、またはその他の種類のビジネス ドキュメントからデータを抽出することです。 今後の API でサポートされる機能の一部は次のとおりです。 REST APIは以下の機能に限定されるものではなく、今後も便利な新機能を追加していきます。 特徴 テンプレートによるドキュメントの解析 テキストの抽出 テキストのみを抽出する 抽出モード オプションを使用して書式設定されたテキストを抽出します。プレーンテキスト、HTML、マークダウン ページ範囲を設定して特定のページからテキストを抽出する 画像の抽出 文書情報の抽出 テンプレート管理 サポートされている形式 GroupDocs.Parser Cloud API の最初のリリースでは、次のファイル形式がサポートされる予定です。 ドキュメント Microsoft Word文書 DOT Microsoft Wordドキュメントテンプレート DOCX Office オープン XML ドキュメント DOCM Office Open XML マクロ有効ドキュメント DOTX Office Open XML ドキュメント テンプレート DOTM Office Open XML ドキュメントのマクロ有効テンプレート TXT プレーンテキスト ODT 文書テキストを開く OTT ドキュメントテキストテンプレートを開く RTF リッチテキスト形式 PDF
· ティラル・アハマド · 2 分

ドキュメントを結合および分割するための REST API ソリューション - GroupDocs.Merger Cloud

GroupDocs REST API がドキュメント操作 API のリーダーとしての地位を確立するために、私たちは日常のユースケースに合わせた新機能と API の導入に懸命に取り組んでいます。以前に発表したように、GroupDocs REST API コレクションに新しい REST API を追加する作業を進めています。 GroupDocs.Merger Cloud の最初のバージョンをリリースできることを嬉しく思います。これは、プラグインやソフトウェアをインストールすることなく、あらゆるプラットフォームで幅広いドキュメント形式を結合および分割できるユニバーサル REST API ソリューションです。 GroupDocs.Merger Cloud とは何ですか? ドキュメントを操作する際、ドキュメントを 1 つのファイルに結合することが一般的な要件となる場合があります。情報量が多くない場合は、内容を直接コピー&ペーストできます。しかし、そうでない場合はどうなるでしょうか?文書を確実かつ正確に結合できる自動化されたソリューションが必要です。 GroupDocs.Merger Cloud は、複数のドキュメントを結合できるだけでなく、サポートされている幅広い種類のドキュメントにわたって単一のドキュメント構造を操作できる REST API です。開発者は、ドキュメント結合ソリューションのアプリケーションでこれを使用できます。すべての一般的なファイル形式をサポートします。サポートされるファイル タイプには、PDF、Microsoft Word ドキュメント、Excel スプレッドシート、PowerPoint プレゼンテーション、プレーン テキストおよび書式設定されたテキスト、およびサポートされるドキュメント形式の長いリストが含まれます。 GroupDocs.Merger Cloud の最初のバージョンでサポートされている機能の完全なリストは次のとおりです。 文書操作 ドキュメントに参加する ドキュメントの分割 ドキュメントプレビュー ドキュメントページの操作 ページの移動 ページの削除 ページの回転 ページを切り替える ページの抽出 ページの向きを変更する ドキュメントセキュリティ運用 文書情報の抽出 セキュリティと認証 GroupDocs.Merger Cloud REST API はセキュリティで保護されており、JSONweb トークン認証 によるアプリ アクセス キー ID (アプリ SID) とアプリ シークレット (アプリ キー) を使用した認証が必要です。 groupdocs.
· ティラル・アハマド · 2 分

Python SDK を使用して PDF を編集可能な Word ドキュメントに変換する

Python 開発者は、アプリケーションに PDF から Word へのドキュメント変換機能を提供するようユーザーから要求されることがあります。 Adobe Acrobat なしで PDF ドキュメントを編集するのは非常に難しいためです。また、ユーザーは PDF ドキュメント内のテキスト、表、画像、その他のコンテンツを編集する必要があります。この要件に対する解決策は、PDF ドキュメントを編集可能な Word ドキュメントに変換することです。ただし、プログラム的にはそれほど単純ではないことはご存知でしょう。幸いなことに、モジュールがあります。 GroupDocs.Conversion Cloud SDK for Python を使用すると、数行の Python コードで PDF を編集可能な Word ドキュメントに簡単に変換できます。 PDF から Word - 変換 API と Python SDK GroupDocs.Conversion Cloud は、ツールやソフトウェアに依存しない、プラットフォームに依存しないドキュメントと画像の変換ソリューションです。あらゆるサポートされているファイル形式の画像とドキュメントを迅速かつ確実に変換できます。すべての一般的なプログラミング言語の SDK をソース コードと実際のサンプルとともに提供します。これにより、開発者は基盤となる REST API 呼び出しを気にせずに、GroupDocs.Conversion Cloud をアプリケーション内で直接使用できるようになります。この記事では、PDF から Word への変換に Python SDK を使用します。 Python で PDF を編集可能な DOCX に変換する方法 ここでは Python 3.7.4 を使用しますが、Python 2.7、3.4、またはそれ以降の任意のバージョンを使用できます。コーディングを始める前に、groupdocs.cloud にサインアップして APP SID と APP Key を取得してください。
· ティラル・アハマド · 2 分

GroupDocs.Merger Cloud が間もなく開始されます!

ドキュメント管理アプリケーションを開発していて、アプリケーション内でドキュメントをマージするための API を探していますか?オプションの検索は終了したはずです。 GroupDocs は、新しいクラウド API、GroupDocs.Merger Cloud をリリースする予定です。これにより、開発者はサードパーティのプラグインに依存せずに、どのプラットフォームでも同じ形式の複数のドキュメントを高精度かつ忠実にマージできるようになります。またはアプリケーション。新しい API が提供する注目すべき機能には、ドキュメントの結合、ドキュメントの分割、ドキュメント ページの移動、ドキュメント ページの回転、ドキュメント ページの抽出などがあります。 今後の GroupDocs.Merger Cloud API の概要を以下で共有します。以下の機能に限定されるものではありませんが、今後も API に便利な新機能や新しいファイル形式のサポートを追加していきます。 特徴 文書操作 ドキュメントを結合する 分割ドキュメント ドキュメントのプレビュー ドキュメントページの操作 ページの移動 ページの削除 ページを回転する ページを切り替える ページの抽出 ページの向きを変更する ドキュメントセキュリティ運用 文書情報の抽出 サポートされている形式 GroupDocs.Merger クラウド REST API は、次のファイル形式をサポートしています。 フォーマット 説明 ドキュメント Microsoft Word文書 DOCX Microsoft WordのオープンXMLドキュメント DOCM Word Open XML マクロ有効ドキュメント DOT Wordドキュメントテンプレート DOTX Word オープン XML ドキュメント テンプレート DOTM Word Open XML マクロ有効ドキュメント テンプレート RTF リッチテキスト形式ファイル
· ティラル・アハマド · 2 分

Cloud Java SDK を使用してドキュメントを HTML5 にレンダリングする

Java でドキュメント ビューア アプリケーションを開発していますか?すべての一般的なファイル形式を表示する単一のソリューションが必要ですか?良いニュースがあります。GroupDocs.Viewer Cloud SDK for Java を使用すると、MS Office、PDF、その他多くのファイル形式を HTML5 にレンダリングできます。そのため、追加のソフトウェア (MS Office、Apache Open Office、Adobe Acrobat Reader など) をインストールしなくても、さまざまな種類のドキュメントをアプリケーション内で簡単に表示できます。 GroupDocs.Viewer Cloud は、プラットフォームに依存しないドキュメントのレンダリングおよび表示ソリューションです。これにより、80 を超える業界標準のドキュメント タイプをアプリケーションで表示できます。 GroupDocs.Viewer Cloud の主な目的は、ドキュメントを HTML、画像、または PDF 表現に高速かつ高品質でレンダリングできる機能です。この投稿では、HTML5 出力に焦点を当てていきます。 ここで、数行のコードで入力ドキュメントを HTML5 にレンダリングする方法を簡単に説明します。前に述べたように、この投稿では Java 用 GroupDocs.Viewer Cloud SDK を使用します。ただし、他のプログラミング言語を使用している場合は、GitHub リポジトリから選択した SDK を確認できます。これには、すべての一般的なプログラミング言語の SDK が含まれています。これにより、開発者は、基礎となる REST API 呼び出しを気にせずに、アプリケーション内で直接 GroupDocs.Viewer Cloud を使用できるようになります。 どうぞ! ステップ1: コーディングを始める前に、groupdocs.cloud にサインアップして APP SID と APP Key を取得してください。 ステップ2: GroupDocs Cloud は、すべての Java SDK を Maven リポジトリ でホストします。 groupdocs-viewer-cloud を使用するには、新しい Maven プロジェクトを作成し、Maven pom.
· ティラル・アハマド · 2 分

GroupDocs.Conversion Cloud を使用して Python で PDF ドキュメントからテキストを抽出する

PDF (Portable Document Format) は、ドキュメントの表示と交換に使用される最も重要で広く使用されているファイル形式の 1 つです。 Python 開発者として、テキスト分析に Python を使用して PDF ドキュメントからテキストを抽出し、別の形式でエクスポートしたいというシナリオが数多くあります。この投稿では、GroupDocs.Conversion Cloud SDK for Python を使用して PDF ドキュメントからテキストを正確に抽出する方法を説明します。 GroupDocs.Conversion Cloud は、サードパーティ アプリケーションに依存せずにドキュメントと画像を変換する、プラットフォームに依存しない REST API ソリューションです。 50 種類以上のドキュメントをある形式から別の形式に変換します。 Python を含むすべての一般的なプログラミング言語用の SDK が提供されているため、開発者は基盤となる REST API 呼び出しを気にすることなく、アプリケーションで API を直接使用できます。 コードを開始しましょう: GroupDocs.Conversion クラウド パッケージをインストールする まず最初に、次のコマンドで pypi から groupdocs-conversion-cloud パッケージをインストールします。 >pip インストール groupdocs-conversion-cloud Python PDF テキスト抽出の例 PDF ドキュメントからテキストを抽出するには、次の手順に従います。 groupdocs.cloud に無料でサインアップ to get your AppSID and AppKey Python モジュールを作成し、次のコードをコピーしてその中に貼り付けます。 PDF ドキュメントのテキストを抽出するためにデフォルトのオプションを使用しました。テキスト形式の変換オプションを使用すると、特定のページのテキストを抽出することもできます。 # インポートモジュール import groupdocs_conversion_cloud # https://dashboard.
· ティラル・アハマド · 1 分

PDF ドキュメントを最適化する信頼性の高い RESTful API ソリューション

GroupDocs.Conversion Cloud は、ドキュメントと画像の変換ソリューションです。これにより、開発者は、標準の REST API 呼び出しを使用して完全に制御しながら、任意のプラットフォーム上のアプリケーションにドキュメント変換機能を追加できるようになります。この記事では、PDF ドキュメントを最適化する方法について説明します。機能の完全なリストについては、GroupDocs.Convesion Cloud にアクセスしてください。 PDF ドキュメントには追加データが含まれる場合があります。 PDF ファイルのサイズを小さくすると、ネットワーク転送とストレージを最適化できます。これは、Web ページでの公開、ソーシャル ネットワークでの共有、電子メールでの送信、またはストレージへのアーカイブに特に便利です。 GroupDocs.Conversion Cloud を使用して PDF ドキュメントを Web 用に最適化したり、PDF ファイルのサイズを最適化したりする方法を簡単に説明します。次の例では cURL を使用します。基礎となる REST API 呼び出しを気にせずに、お気に入りのプログラミング言語の SDK を使用できます。 PDF ドキュメントを Web 用に最適化 最適化 (Web 用の線形化) とは、Web ブラウザを使用したオンライン閲覧に適した PDF ファイルを作成するプロセスを指します。線形化された PDF ファイルは、インターネット経由でより速く読み込まれます。線形化された PDF ファイルには、バイト ストリーミング サーバーが PDF ファイルを一度に 1 ページずつダウンロードできるようにする情報が含まれているためです。サーバー上でバイト ストリーミングが無効になっている場合、または PDF ファイルがリニアライズされていない場合は、表示する前に PDF ファイル全体をダウンロードする必要があります。 Web 表示用に PDF ファイルを最適化するには、cURL API コマンドを確認します。 PDF を Web 用に最適化する // PDF ドキュメントを Web 用に最適化する curl -X POST "https://api.
· ティラル・アハマド · 1 分

cURL を使用して、MS Office、PDF、その他多くのドキュメントの生のテキストを分類します。

テキスト分類とは何ですか? テキスト分類は、感情分析、トピックのラベル付け、スパム検出、意図検出などの幅広い用途で、内容に応じてテキストにタグまたはカテゴリを割り当てるプロセスです。 GroupDocs.分類クラウド 生のテキスト形式の非構造化データは、電子メール、チャット、Web ページ、ソーシャル メディア、サポート チケット、アンケート回答など、あらゆる場所に存在します。テキストは非常に豊富な情報源ですが、構造化されていないため、そこから洞察を抽出するのは困難で時間がかかる場合があります。企業は、意思決定を強化し、プロセスを自動化するために、迅速かつコスト効率の高い方法でテキストを構造化するためのテキスト分類に注目しています。 分類学とは何ですか? 分類学は分類の実践および科学です。この単語は分類スキームとしても使用されます。分類法は特定の分類です。より広く、より一般的な意味では、物事や概念の分類、およびそのような分類の基礎となる原則を指す場合があります。 GroupDocs.Classification クラウド API GroupDocs.Classification Cloud API は、IAB-2 分類 または ドキュメント分類 の生のテキスト分類出力を取得します。これは、最良のクラスとその確率、および他のクラスの確率に関する情報を含むオブジェクトを返します。 IAB-2 分類の例 GroupDocs.Classification Cloud API は IAB-2 分類スキームをサポートしています。分類例の一部を以下に示します。 「自動車」、 「書籍と文学」、 ‘ビジネス\と\財務’, ‘キャリア’、 ‘教育’、 ‘イベント\と\アトラクション’, 「家族と人間関係」、 ‘美術品’、 ‘食べ物飲み物’、 ‘健康的な生活’、 「趣味&\興味」、 ‘家&\庭’, ‘医療健康’、 ‘映画’、 ‘音楽\と\オーディオ’, 「ニュースと政治」、 ‘個人融資’ 等 cURLリクエスト ### Upload document to default storage curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage" -H "accept: application/json" -H "authorization: Bearer [Access_Token]" -H "Content-Type: multipart/form-data" -T C:/Temp/three-layouts.dwf 応答 { "bestClassName": "Healthy_Living", "bestClassProbability": 53.
· ムハマド・リズワン · 2 分

PDF テキストを秘匿化するための REST API ソリューション

GroupDocs.Annotation Cloud API は、プラットフォームに依存しないドキュメントおよび画像の注釈ソリューションであり、開発者が最小限の労力でアプリケーションに注釈機能を追加できるようにします。 API はさまざまな 注釈タイプ をサポートしていますが、この投稿ではテキスト秘匿化注釈に焦点を当てて、PDF テキストを秘匿化する方法を示します。 テキストの墨消しは、ドキュメントからコンテンツを永久に削除するプロセスです。ドキュメントを公開する前に、ドキュメントから機密データや個人データを削除する必要があります。 GroupDocs.Annotation Cloud は、特定のページ領域のテキストを編集するための Text Redaction Annotation を提供します。テキストの墨消しは、テキストの一部を黒い四角形で塗りつぶし、下にある単語や語句を非表示にします。 簡単な HTTP リクエストのセットを使用して、GroupDocs.Annotation Cloud でテキストを編集する方法の概要を簡単に説明します。この例では、cURL を使用して PDF ドキュメント内のテキストを編集します。 API は PDF ファイル形式に限定されません。サポートされているファイル形式 の完全なリストを確認できます。また、すべての一般的なプログラミング言語用の SDK も提供します。利用可能な GitHub リポジトリの SDK を動作例とともに確認し、アプリケーションで直接使用できます。 次の手順に従って、重複したイメージを見つけます。 認証用のアクセストークンを生成する ソースドキュメントをストレージにアップロードする ドキュメントに注釈を追加する 注釈付きドキュメントをダウンロードする アクセストークンの生成 ### Retrieve access token JWT(JSON Web Token) ### TODO: Get your AppSID and AppKey at https://dashboard.groupdocs.cloud (free registration is required). curl --request POST https://api.groupdocs.cloud/connect/token --header "Content-Type: application/x-www-form-urlencoded" --data "grant_type=client_credentials&client_id=[APP_SID]&client_secret=[APP_KEY]" ソースドキュメントをストレージにアップロードする ### Upload document to default storage curl -X POST "https://api.
· ティラル・アハマド · 2 分