Overview

GroupDocs.Parser Cloud MCP 伺服器 是圍繞 GroupDocs.Parser Cloud API 的輕量級封裝,實作 Model Context Protocol (MCP)。透過將文件解析功能(文字、圖像、條碼)以及雲端儲存工具(列出、上傳、下載、刪除)以 MCP 相容工具形式公開,伺服器讓 AI 代理人、助理與開發工具能像使用其他模型驅動的資料來源一樣與文件互動。這消除了自訂 SDK 呼叫或專有整合的需求,使在 LLM 驅動的工作流程、自動完成工具或程式碼助理環境中嵌入文件提取變得簡單直接。

主要優點包括:

  • 通用存取 – 任何支援 MCP 的客戶端(VS Code、Cursor、KiloCode、自訂代理人等)都可以呼叫同一端點,解析存放於 GroupDocs Cloud 中的文件。
  • 豐富抽取 – 從超過 50 種檔案格式(PDF、Word、Excel、PowerPoint、郵件、壓縮檔等)取得純文字、內嵌圖像與條碼。
  • 儲存操作 – 直接透過 MCP 呼叫列出資料夾、上傳新檔、下載現有檔案,以及管理雲端儲存。
  • 跨平台 – 在 Windows、macOS 與 Linux 上以單一 Python 服務執行。

以下為快速導航,帶您逐步了解協定、安裝、在熱門工具中的設定、進階選項與常見問答。

What is Model Context Protocol (MCP)?

Model Context Protocol (MCP) 是一套標準介面,允許大型語言模型(LLM)與 AI 代理人以 結構化、可預測且可發現的方式 與外部工具與服務互動。

MCP 不是將業務邏輯直接寫入提示中,而是將外部能力(API、服務、資料來源)以 具類型的工具 形式公開,讓 AI 代理人在需要時呼叫。

主要 MCP 概念

  • 基於工具的整合
    每項功能皆以 tool(工具)形式曝光,具明確目的(例如「從文件提取文字」或「列出儲存中的檔案」),AI 代理人可根據使用者意圖動態選擇並呼叫這些工具。

  • 具類型的輸入與輸出結構
    MCP 工具使用 JSON Schema 定義其輸入與輸出,消除歧義、降低幻覺,並讓模型能推理該呼叫哪個工具以及如何使用結果。

  • 推理與執行的明確分離
    LLM 專注於推理與決策,MCP 伺服器負責執行確定性操作,如文件解析、檔案處理或資料檢索。

  • 跨環境可重用
    任何支援 MCP 的客戶端(AI IDE、聊天應用、自律代理、在地工具)皆可連接同一 MCP 伺服器,無需撰寫客製化黏合程式碼。

透過實作 MCP,服務即可變得 AI 原生:其功能可被 AI 代理人發現、理解,並安全地在更大型的工作流程中被呼叫。

Why use GroupDocs.Parser Cloud MCP Server?

好處如何協助您
單一整合點任何支援 MCP 的客戶端(Cursor、VS Code 擴充套件、AI 代理人、客製工具)皆可透過一致介面存取文件解析。
全方位內容抽取從 50 多種文件格式(包括 PDF、DOCX、XLSX、PPTX、郵件與壓縮檔)抽取純文字、圖像與條碼。
雲端儲存操作已內建直接在 GroupDocs Cloud 儲存中操作檔案:上傳、下載、列出資料夾、檢查存在性與刪除,全部納入同一工作流程。
代理人不需 SDKAI 代理人與客戶端應用不必嵌入或管理 GroupDocs SDK——MCP 伺服器負責所有 API 通訊與驗證。
跨平台且自行託管可在本機或自行基礎架構上以單一 Python 服務執行,支援 Windows、macOS 與 Linux。
為 AI 工作流程設計MCP 介面提供確定性、基於 Schema 的工具,AI 代理人可安全地在更大的推理與自動化流程中呼叫。

Quick Start

本節展示如何在數分鐘內配置並執行 GroupDocs.Parser Cloud MCP 伺服器

1. 克隆儲存庫

git clone https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-mcp.git
cd groupdocs-parser-cloud-mcp

2. 設定環境變數

建立 .env 檔案,填入您的 GroupDocs Cloud 憑證。
您可以手動建立,或複製範本 .env.example 後修改。

CLIENT_ID=your-client-id
CLIENT_SECRET=your-client-secret
MCP_PORT=8000

Client IDClient Secret 可於 GroupDocs Cloud 控制台取得:
https://dashboard.groupdocs.cloud/#/applications


3. 執行 MCP 伺服器

選擇符合您作業系統的指令。

Linux / macOS

./run_mcp.sh

Windows (PowerShell)

.\run_mcp.ps1

Windows (Command Prompt)

run_mcp.bat

伺服器端點

啟動後,MCP 伺服器會在以下網址提供服務:

http://localhost:8000/mcp

現在您可以將此端點接至任何 支援 MCP 的主機(AI 代理人、IDE Copilot、LLM 工具等)。

Using MCP with KiloCode

KiloCode 可直接從聊天介面呼叫任意 MCP 端點。

準備步驟

  1. 前往 Settings → MCP Servers
  2. 新增名稱為 groupdocs-parser-mcp-local 的伺服器項目。
  3. 貼上以下 JSON 設定(包含 URL 與類型)。

KiloCode 設定 JSON

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "type": "streamable-http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

KiloCode 中的範例提示

Extract all text from sample_invoice.pdf using the GroupDocs.Parser MCP server, then give me a brief summary of the invoice amount

當您送出此提示時,KiloCode 會:

  • 上傳 sample_invoice.pdf 至 GroupDocs Cloud。
  • 呼叫 MCP parse/text 方法。
  • 回傳模型生成的發票金額摘要。

Extract all images from document.pdf, save them in current folder, subfolder “document_images” and after processing remove the images from GroupDocs.Cloud storage

KiloCode 會:

  • 上傳 document.pdf
  • 呼叫 MCP 以抽取圖像。
  • 下載圖像並存入 document_images 資料夾。
  • 從 GroupDocs.Cloud 刪除已抽取的圖像。

Using MCP with Cursor

Cursor 的 Tools & MCP 面板允許您註冊自訂 MCP 伺服器。

設定步驟

  1. 開啟 Cursor Settings → Tools & MCP
  2. 點選 Add Custom MCP
  3. mcp.json 區段貼入以下 JSON 片段。

Cursor mcp.json 設定

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

Cursor 的範例提示

Extract text from Message.msg using the GroupDocs.Parser MCP, then give me a brief summary of the email message.

Cursor 會自動:

  • 將檔案上傳至您的個人 GroupDocs.Cloud 儲存。
  • 使用 GroupDocs.Parser Cloud 取得文字。
  • 在聊天回覆中包含摘要結果。

Using MCP with VS Code

VS Code 也支援 MCP 伺服器。以下說明如何設定並使用 GroupDocs MCP 功能。

設定步驟

  1. 若尚未存在,於專案根目錄建立 .vscode 資料夾。
  2. 在該資料夾內新增 mcp.json,內容如下:

VS Code mcp.json 範例

{
  "servers": {
    "groupdocs-parser-mcp-local": {
      "type": "http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}
  1. 重新載入 VS Code (Ctrl+Shift+P → Developer: Reload Window)。
  2. 開啟聊天視窗 (Ctrl+Alt+I),當您提出需要文件解析的需求時,聊天會自動呼叫 MCP 工具。

例如,在聊天中詢問當前開啟的資料夾內的檔案:

Parse the Invoice.pdf using the GroupDocs.Parser MCP, give me a brief summary of invoice.

VS Code 會透過 MCP 取得解析結果並在聊天回覆中呈現。

Advanced Options

使用 MCP Inspector 測試伺服器

MCP Inspector 是一個輕量級 UI,讓您探索伺服器的 Schema 並即時測試呼叫。

# 執行 inspector(需要 Node.js)
npx @modelcontextprotocol/inspector

在瀏覽器中:

  1. 選擇 “streamable HTTP” 作為連線類型。
  2. 輸入伺服器 URL:http://127.0.0.1:8000/mcp
  3. 點擊 Connect,即可瀏覽可用方法(例如 parser_extract_textparser_extract_barcodes)。

重新初始化虛擬環境

若您修改了 requirements.txt 或遇到相依性錯誤,請重新建立環境:

# Linux / macOS
./init_mcp.sh

# Windows PowerShell
.\init_mcp.ps1

# Windows CMD
init_mcp.bat

腳本會:

  1. 刪除現有的 .venv
  2. 重新建立乾淨的虛擬環境。
  3. requirements.txt 重新安裝所有套件。

重置完成後,重新啟動伺服器:

# Linux / macOS
./run.sh

# Windows PowerShell
.\run.ps1

# Windows CMD
run.bat

Conclusion

本文涵蓋了:

  • MCP 是什麼 以及它對 AI 工具的重要性。
  • GroupDocs.Parser Cloud MCP 伺服器 —— 為任何支援 MCP 的客戶端提供文字、圖像、條碼抽取及完整儲存管理的輕量橋接。
  • 逐步安裝指引(克隆、設定、執行)。
  • 如何將伺服器接入主流環境 —— KiloCode、Cursor、VS Code。
  • 使用 MCP Inspector 與環境重建 的進階診斷方式。

有了 MCP 伺服器,開發者即可讓 LLM 像操作資料庫或 API 那樣自然地與文件互動,省去繁雜的 SDK 程式碼,快速推進 AI 驅動的文件工作流程。

See also

Frequently Asked Questions (FAQs)

  • Q: 為什麼 MCP 伺服器是開源且在本機執行?為何沒有公開的 MCP 伺服器?
    A: Model Context Protocol (MCP) 仍屬新興標準,現有的 LLM 與 AI 助理對二進位檔案串流(PDF、影像、壓縮檔)支援有限且常不可靠。文件解析、OCR、圖像抽取與條碼辨識是 GroupDocs.Parser Cloud 的強項。本地 MCP 伺服器以可靠且標準化的方式彌補此缺口。

  • Q: 使用 MCP 伺服器是否需要安裝其他軟體?
    A: 不需要。只要作業系統支援 Python 3.10+,其餘套件皆由 requirements.txt 內的腳本安裝。

  • Q: 支援哪些文件格式?
    A: 超過 50 種,包括 PDF、DOCX、XLSX、PPTX、郵件(.eml、.msg)、壓縮檔(ZIP、RAR)以及常見影像類型(PNG、JPG、TIFF)。

  • Q: 能從掃描的 PDF 中抽取條碼嗎?
    A: 能。MCP 伺服器提供 parse/barcodes 端點,能在點陣圖與 PDF 中偵測 1D 與 2D 條碼。

  • Q: 如何列出特定 GroupDocs Cloud 資料夾內的檔案?
    A: 使用 MCP 的 storage/liststorage/uploadstorage/downloadstorage/delete 端點,這些儲存操作會在聊天會話中自動使用或依您的請求執行。

  • Q: 如果變更了 MCP 埠號,該怎麼辦?
    A: 更新 .env 中的 MCP_PORT,然後重新啟動伺服器(run.sh / run.ps1)。

  • Q: 是否提供免費試用?
    A: 有的,每月提供 150 次免費 API 呼叫。