Overview

GroupDocs.Parser Cloud MCP Server は、GroupDocs.Parser Cloud API の軽量ラッパーであり、Model Context Protocol (MCP) を実装しています。ドキュメント解析機能(テキスト、画像、バーコード)とクラウドストレージユーティリティ(一覧取得、アップロード、ダウンロード、削除)を MCP 準拠のツールとして公開することで、AI エージェント、アシスタント、開発ツールが従来の SDK 呼び出しやプロプライエタリな統合を必要とせず、ドキュメント抽出を LLM 主導のワークフローやコードアシスタント環境にシームレスに組み込めます。

主な利点は以下の通りです。

  • ユニバーサルアクセス – 任意の MCP 互換クライアント(VS Code、Cursor、KiloCode、カスタムエージェント等)から同一エンドポイントを呼び出し、GroupDocs Cloud に保存されたドキュメントを解析できます。
  • リッチな抽出 – 50 種類以上のファイル形式(PDF、Word、Excel、PowerPoint、メール、アーカイブ等)からプレーンテキスト、埋め込み画像、バーコードを取得できます。
  • ストレージ操作 – フォルダー一覧、ファイルのアップロード・ダウンロード・削除を MCP 呼び出しだけで実行できます。
  • クロスプラットフォーム – Windows、macOS、Linux で単一の Python ベースサービスとして動作します。

以下はプロトコルの概要、インストール手順、主要ツール向け設定、詳細オプション、FAQ へのクイックナビゲーションです。


What is Model Context Protocol (MCP)?

Model Context Protocol (MCP) は、大規模言語モデル(LLM)や AI エージェントが外部ツールやサービスと 構造化・予測可能・発見可能 な形でやり取りできる標準インターフェイスです。

プロンプトにビジネスロジックを埋め込む代わりに、MCP は外部機能(API、サービス、データソース)を 型付けされたツール として公開し、必要に応じて AI エージェントが呼び出せるようにします。

主要な MCP コンセプト

  • ツールベース統合
    各機能は ツール として公開され、目的が明確です(例:ドキュメントからテキストを抽出ストレージ内のファイル一覧を取得)。AI エージェントはユーザー意図に応じてツールを動的に選択・実行できます。

  • 型付けされた入出力スキーマ
    MCP ツールは JSON スキーマで入力と出力を定義します。これにより曖昧さが排除され、ファンタジー(幻覚)を減らし、モデルが「どのツールを呼び出すか」「結果をどう扱うか」を論理的に判断できます。

  • 推論と実行の明示的分離
    LLM は推論と意思決定に集中し、MCP サーバーは文書解析やファイル処理、データ取得といった決定的操作を実行します。

  • 環境横断的再利用
    任意の MCP 互換クライアント(AI IDE、チャットアプリ、自律エージェント、ローカルツール)が同一 MCP サーバーへ接続でき、カスタムの接着コードが不要です。

MCP を実装することで、サービスは AI ネイティブ となり、機能が自動的に発見・理解・安全に呼び出せるようになります。


Why use GroupDocs.Parser Cloud MCP Server?

BenefitHow it helps you
単一の統合ポイント任意の MCP 互換クライアント(Cursor、VS Code 拡張、AI エージェント、カスタムツール)が、一貫したインターフェイスだけでドキュメント解析にアクセスできます。
包括的なコンテンツ抽出PDF、DOCX、XLSX、PPTX、メール、アーカイブなど、50 種類以上の形式からテキスト、画像、バーコードを取得できます。
クラウドストレージ操作が組み込みGroupDocs Cloud のストレージに直接アクセスし、アップロード・ダウンロード・フォルダー一覧・存在確認・削除を同一ワークフローで実行できます。
エージェント側に SDK は不要AI エージェントやクライアントアプリは GroupDocs SDK を組み込む必要がなく、MCP サーバーがすべての API 通信と認証を代行します。
クロスプラットフォーム・セルフホストWindows、macOS、Linux で単一の Python サービスとしてローカルまたは自前インフラ上で実行可能です。
AI ワークフロー向けに設計スキーマベースの決定的ツールを提供し、LLM が安全かつ予測可能に呼び出せるようにします。

Quick Start

このセクションでは GroupDocs.Parser Cloud MCP Server を数ステップで設定・起動する方法を示します。

1. リポジトリをクローン

git clone https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-mcp.git
cd groupdocs-parser-cloud-mcp

2. 環境変数を設定

.env ファイルに GroupDocs Cloud の認証情報を書き込みます。
手動で作成するか、テンプレートの .env.example をコピーしてください。

CLIENT_ID=your-client-id
CLIENT_SECRET=your-client-secret
MCP_PORT=8000

Client IDClient Secret は GroupDocs Cloud ダッシュボードから取得できます:
https://dashboard.groupdocs.cloud/#/applications


3. MCP サーバーを起動

OS に合わせたコマンドを実行します。

Linux / macOS

./run_mcp.sh

Windows (PowerShell)

.\run_mcp.ps1

Windows (Command Prompt)

run_mcp.bat

サーバーエンドポイント

起動後、MCP サーバーは次の URL で利用可能です。

http://localhost:8000/mcp

このエンドポイントを MCP 互換ホスト(AI エージェント、IDE コパイロット、LLM ツール等)に接続すれば、すぐに利用開始できます。


Using MCP with KiloCode

KiloCode はチャットインターフェイスから任意の MCP エンドポイントを呼び出せます。

設定手順

  1. KiloCode の Settings → MCP Servers を開く。
  2. 新規サーバーエントリ groupdocs-parser-mcp-local を追加。
  3. 設定 JSON(URL とタイプ)を貼り付ける。

KiloCode 用設定 JSON

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "type": "streamable-http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

KiloCode での例プロンプト

sample_invoice.pdf の全テキストを GroupDocs.Parser MCP サーバーで抽出し、請求金額の要約を作成してください。

このプロンプト送信後、KiloCode は次を実行します。

  • sample_invoice.pdf を GroupDocs Cloud にアップロード
  • MCP の parse/text メソッドを呼び出しテキスト取得
  • 取得したテキストを元にモデルが要約を生成

document.pdf からすべての画像を抽出し、現在のフォルダー配下に document_images サブフォルダーを作成して保存した後、GroupDocs.Cloud ストレージから画像を削除してください。

KiloCode は上記フローを自動で処理します。


Using MCP with Cursor

Cursor の Tools & MCP パネルからカスタム MCP サーバーを登録できます。

設定手順

  1. Cursor Settings → Tools & MCP を開く。
  2. Add Custom MCP をクリック。
  3. mcp.json セクションに以下の JSON を貼り付ける。

Cursor 用 mcp.json 設定

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

Cursor 用サンプルプロンプト

Message.msg を GroupDocs.Parser MCP でテキスト抽出し、メール本文の要約をお願いします。

Cursor は自動的に

  • 個人の GroupDocs.Cloud ストレージへファイルをアップロード
  • GroupDocs.Parser Cloud でテキスト抽出
  • 結果をチャット回答に組み込む、という流れを実行します。

Using MCP with VS Code

VS Code でも MCP サーバーを利用できます。以下の手順で設定し、チャットウィンドウからツールを呼び出せます。

設定手順

  1. プロジェクトに .vscode フォルダーが無い場合は作成。
  2. mcp.json という名前のファイルを作り、サーバー定義を書き込む。

VS Code 用 mcp.json

{
  "servers": {
    "groupdocs-parser-mcp-local": {
      "type": "http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}
  1. VS Code をリロード(Ctrl+Shift+P → Developer: Reload Window)。
  2. チャットパネル(Ctrl+Alt+I)を開き、必要に応じて MCP ツールを呼び出す。

例:

Invoice.pdf を GroupDocs.Parser MCP で解析し、請求書の要約を作成してください。


Advanced Options

MCP Inspector でサーバーをテスト

MCP Inspector は軽量 UI で、サーバースキーマの確認やインタラクティブ呼び出しが可能です。

# Inspector を起動(Node.js が必要)
npx @modelcontextprotocol/inspector

ブラウザで次を実行:

  1. 接続タイプとして “streamable HTTP” を選択。
  2. サーバー URL に http://127.0.0.1:8000/mcp を入力。
  3. Connect をクリックし、parser_extract_textparser_extract_barcodes などのメソッドを探索。

仮想環境の再初期化

requirements.txt を変更したり依存関係エラーが出た場合は、以下で環境を再作成してください。

# Linux / macOS
./init_mcp.sh

# Windows PowerShell
.\init_mcp.ps1

# Windows CMD
init_mcp.bat

スクリプトの流れ:

  1. 既存の .venv を削除。
  2. クリーンな仮想環境を再作成。
  3. requirements.txt からすべてのパッケージを再インストール。

再初期化後、サーバーを再起動します。

# Linux / macOS
./run.sh

# Windows PowerShell
.\run.ps1

# Windows CMD
run.bat

Conclusion

本稿で取り上げた内容:

  • MCP とは何か、そして AI 主導ツールにとっての意義。
  • GroupDocs.Parser Cloud MCP Server – テキスト・画像・バーコード抽出とストレージ管理を提供する軽量ブリッジ。
  • ステップバイステップのインストール手順(クローン、設定、実行)。
  • 主要開発環境への組み込み方法 – KiloCode、Cursor、VS Code。
  • MCP Inspector を用いた高度な診断と仮想環境のリセット手順。

MCP サーバーを導入すれば、開発者は LLM がデータベースや従来の API と同様の感覚でドキュメントにアクセスでき、SDK のボイラープレートを排除し、AI 主導の文書処理ワークフローを迅速に構築できます。


See also


Frequently Asked Questions (FAQs)

  • Q: なぜ MCP サーバーはオープンソースでローカル実行なのですか?公開ホスト型の MCP サーバーがないのはなぜですか?
    A: Model Context Protocol はまだ新しい規格であり、現在の LLM と AI アシスタントは バイナリストリーム(PDF、画像、アーカイブ)へのネイティブサポートが限定的または信頼性が低い ことが多いです。文書解析・OCR・バーコード認識は GroupDocs.Parser Cloud のような専門 API が得意とする領域です。ローカル MCP サーバーはこのギャップを、信頼性と標準化されたインターフェイスで埋める役割を果たします。

  • Q: MCP サーバーを利用するために追加ソフトは必要ですか?
    A: いいえ。Python 3.10 以上と Git があれば動作します。その他の依存関係は requirements.txt に記載され、スクリプトが自動でインストールします。

  • Q: サポートされているドキュメント形式は?
    A: PDF、DOCX、XLSX、PPTX、メール(.eml、.msg)、ZIP、RAR などを含む 50 種類以上です。

  • Q: スキャンした PDF からバーコードを抽出できますか?
    A: はい。parse/barcodes エンドポイントがラスタ画像や PDF 内の 1D・2D バーコードを検出します。

  • Q: 特定の GroupDocs Cloud フォルダー内のファイル一覧はどう取得しますか?
    A: MCP サーバーは storage/liststorage/uploadstorage/downloadstorage/delete といった GroupDocs.Cloud ストレージエンドポイントを提供し、チャットセッションや直接リクエストで使用できます。

  • Q: 実行中に MCP ポートを変更したらどうすれば?
    A: .envMCP_PORT を新しい値に更新し、サーバーを再起動してください。

  • Q: 無料トライアルはありますか?
    A: はい、月間 150 回の無料 API 呼び出しが利用可能です。