概述

GroupDocs.Parser Cloud MCP 服务器 是围绕 GroupDocs.Parser Cloud API 的轻量级包装器,实现了 Model Context Protocol (MCP)。通过将文档解析功能(文本、图像、条形码)和云存储工具(列出、上传、下载、删除)以 MCP 兼容的方式公开,服务器使 AI 代理、助手以及开发工具能够像使用其他模型驱动的数据源一样与文档交互。这消除了自定义 SDK 调用或专有集成的需求,让在 LLM 驱动的工作流、代码补全工具或代码助手环境中嵌入文档提取变得直观。

主要优势包括:

  • 通用访问 – 任意 MCP 兼容客户端(VS Code、Cursor、KiloCode、定制代理等)都可以调用同一端点解析存储在 GroupDocs Cloud 中的文档。
  • 丰富抽取 – 从超过 50 种文件格式(PDF、Word、Excel、PowerPoint、邮件、压缩包等)获取纯文本、内嵌图像和条形码。
  • 存储操作 – 列出文件夹、上传新文件、下载已有文件,并直接通过 MCP 调用管理云存储。
  • 跨平台 – 在 Windows、macOS 和 Linux 上仅通过单一基于 Python 的服务运行。

下面提供快速导航,帮助您了解协议、安装、各工具的配置、进阶选项以及常见问题。

什么是 Model Context Protocol (MCP)?

Model Context Protocol (MCP) 是一种标准接口,使大语言模型(LLM)和 AI 代理能够以 结构化、可预测且可发现 的方式与外部工具和服务交互。

与其直接在提示中嵌入业务逻辑,MCP 将外部能力(API、服务、数据源)以 带类型的工具 形式公开,AI 代理在需要时调用这些工具。

MCP 的关键概念

  • 基于工具的集成
    每项能力都以 工具 的形式暴露,具有明确的用途(例如 “从文档中提取文本” 或 “列出存储中的文件”),AI 代理可根据用户意图动态选择并调用。

  • 带类型的输入输出模式
    MCP 工具使用 JSON Schema 定义输入输出,消除歧义,降低幻觉风险,并帮助模型推理该调用哪个工具以及如何使用返回结果。

  • 推理与执行的显式分离
    LLM 负责推理和决策,MCP 服务器负责确定性操作,如文档解析、文件处理或数据检索。

  • 跨环境可复用
    任意 MCP 兼容客户端(AI IDE、聊天应用、自主代理、本地工具)均可连接同一 MCP 服务器,无需自定义胶水代码。

通过实现 MCP,服务即可 AI 原生:其功能可被 AI 代理发现、理解并安全调用,成为更大工作流的一部分。

为什么使用 GroupDocs.Parser Cloud MCP 服务器?

好处对您的帮助
单一点集成任意 MCP 兼容客户端(Cursor、VS Code 插件、AI 代理、定制工具)都可以通过统一接口访问文档解析。
全面内容抽取从超过 50 种文档格式中提取纯文本、图像和条形码,包括 PDF、DOCX、XLSX、PPTX、邮件和压缩包。
内置云存储操作直接在 GroupDocs Cloud 存储中上传、下载、列文件、检查存在性以及删除文件,全部在同一工作流中完成。
无需在代理中使用 SDKAI 代理和客户端应用不必嵌入或管理 GroupDocs SDK——MCP 服务器负责所有 API 通信与身份验证。
跨平台且可自托管在本地或您的基础设施上运行 MCP 服务器,使用单一 Python 服务即可在 Windows、macOS 或 Linux 上部署。
专为 AI 工作流设计MCP 接口提供确定性、基于模式的工具,AI 代理能够安全调用这些工具,以实现更复杂的推理与自动化流程。

快速入门

本节展示如何在几步内配置并运行 GroupDocs.Parser Cloud MCP 服务器

1. 克隆代码库

git clone https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-mcp.git
cd groupdocs-parser-cloud-mcp

2. 配置环境变量

创建一个 .env 文件并填写您的 GroupDocs Cloud 凭证。您可以手动创建,或复制提供的模板 .env.example

CLIENT_ID=your-client-id
CLIENT_SECRET=your-client-secret
MCP_PORT=8000

客户端 ID客户端密钥 可在 GroupDocs Cloud 仪表盘获取:
https://dashboard.groupdocs.cloud/#/applications


3. 运行 MCP 服务器

根据操作系统选择对应的启动命令。

Linux / macOS

./run_mcp.sh

Windows (PowerShell)

.\run_mcp.ps1

Windows (Command Prompt)

run_mcp.bat

服务器端点

启动后,MCP 服务器可通过以下地址访问:

http://localhost:8000/mcp

现在您可以将该端点连接到任何 MCP 兼容主机,比如 AI 代理、IDE Copilot 或支持 Model Context Protocol 的 LLM 工具。

在 KiloCode 中使用 MCP

KiloCode 可以直接在聊天界面调用任意 MCP 端点。

准备步骤

  1. 打开 设置 → MCP 服务器
    2️⃣ 添加名为 groupdocs-parser-mcp-local 的新服务器条目。
    3️⃣ 粘贴下面的配置 JSON(包含 URL 与类型)。

KiloCode 配置 JSON

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "type": "streamable-http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

KiloCode 示例提示

使用 GroupDocs.Parser MCP 服务器从 sample_invoice.pdf 中提取全部文本,并给出发票金额的简要摘要。

发送提示后,KiloCode 将会:

  • sample_invoice.pdf 上传至 GroupDocs Cloud。
  • 调用 MCP parse/text 方法。
  • 返回模型生成的摘要。

document.pdf 中提取所有图像,保存到当前文件夹的子文件夹 “document_images”,随后从 GroupDocs.Cloud 存储中删除这些图像。

KiloCode 执行流程:

  • 上传 document.pdf
  • 调用 MCP 图像抽取工具 (parse/images)。
  • 下载提取的图像并保存至 document_images 文件夹。
  • 调用删除接口从云端移除图像。

在 Cursor 中使用 MCP

Cursor 的 “工具 & MCP” 面板允许注册自定义 MCP 服务器。

设置步骤

  1. 打开 Cursor 设置 → 工具 & MCP
  2. 点击 添加自定义 MCP
  3. mcp.json 区域粘贴以下 JSON 片段。

Cursor mcp.json 配置

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

Cursor 示例提示

使用 GroupDocs.Parser MCP 从 Message.msg 中提取文本,然后给出该邮件的简要摘要。

Cursor 会自动:

  • 将文件上传至您个人的 GroupDocs.Cloud 存储。
  • 调用 GroupDocs.Parser Cloud 提取文本。
  • 在聊天回答中加入结果。

在 VS Code 中使用 MCP

VS Code 同样支持 MCP 服务器。本节演示如何配置并使用 GroupDocs MCP 服务器功能。

配置步骤

  1. 若项目中不存在 .vscode 文件夹,请创建。
  2. .vscode 下新建 mcp.json,写入服务器定义。

VS Code mcp.json 示例

{
  "servers": {
    "groupdocs-parser-mcp-local": {
      "type": "http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}
  1. 重新加载 VS Code(Ctrl+Shift+P → Developer: Reload Window)。
  2. 打开聊天窗口(Ctrl+Alt+I),当请求涉及文档时,聊天会自动调用 MCP 工具。

示例聊天请求:

使用 GroupDocs.Parser MCP 解析当前文件夹中的 Invoice.pdf,并给出发票的简要摘要。

进阶选项

使用 MCP Inspector 测试服务器

MCP Inspector 是一个轻量级 UI,帮助您浏览服务器的模式并交互式调用。

# 运行 inspector(需要 Node.js)
npx @modelcontextprotocol/inspector

在浏览器中:

  1. 选择 “streamable HTTP” 作为连接类型。
  2. 输入服务器 URL:http://127.0.0.1:8000/mcp
  3. 点击 Connect,即可浏览可用方法(如 parser_extract_textparser_extract_barcodes)。

重新初始化虚拟环境

若修改 requirements.txt 或出现依赖错误,可通过以下脚本重新创建环境:

# Linux / macOS
./init_mcp.sh

# Windows PowerShell
.\init_mcp.ps1

# Windows CMD
init_mcp.bat

脚本将会:

  1. 删除现有的 .venv
  2. 创建全新虚拟环境。
  3. 根据 requirements.txt 重新安装所有依赖。

重置后再次启动服务器:

# Linux / macOS
./run.sh

# Windows PowerShell
.\run.ps1

# Windows CMD
run.bat

结论

本文回顾了:

  • MCP 的概念及其在 AI 工具链中的价值。
  • GroupDocs.Parser Cloud MCP 服务器 —— 为任意 MCP 客户端提供文本、图像、条形码抽取以及完整存储管理的轻量桥梁。
  • 一步步安装指南(克隆、配置、运行)。
  • 在主流环境中的集成方式——KiloCode、Cursor、VS Code。
  • 使用 MCP Inspector 与环境重置的进阶诊断

有了 MCP 服务器,开发者可以让 LLM 以与数据库或 API 相同的自然方式与文档交互,省去繁琐的 SDK 编码,加速 AI 驱动的文档工作流。

相关阅读

常见问题 (FAQs)

  • 问: 为什么 MCP 服务器是开源且本地运行的?为什么没有公开托管的 MCP 服务器?
    答: Model Context Protocol (MCP) 仍属新兴标准,现有 LLM 与 AI 助手对二进制文件流(PDF、图像、压缩包)的原生支持有限且不可靠。文档解析、OCR、图像抽取及条形码识别是 GroupDocs.Parser Cloud 的强项。本地 MCP 服务器以可靠且标准化的方式弥补这一缺口。

  • 问: 使用 MCP 服务器是否需要额外的软件?
    答: 不需要。只要运行支持 Python 3.10+ 的操作系统即可,所有依赖均在 requirements.txt 中声明并通过脚本自动安装。

  • 问: 支持哪些文档格式?
    答: 超过 50 种格式,包括 PDF、DOCX、XLSX、PPTX、邮件文件(.eml、.msg)、压缩包(ZIP、RAR)以及常见图像(PNG、JPG、TIFF)。

  • 问: 可以从扫描的 PDF 中提取条形码吗?
    答: 可以。MCP 服务器提供 parse/barcodes 接口,能够在光栅图像和 PDF 中检测 1D 与 2D 条形码。

  • 问: 如何列出特定 GroupDocs Cloud 文件夹中的文件?
    答: MCP 服务器支持 GroupDocs.Cloud 存储端点(storage/liststorage/uploadstorage/downloadstorage/delete),这些操作可在聊天会话中自动使用,也可以根据需求手动调用。

  • 问: 如果更改了 MCP 端口,应如何操作?
    答:.env 文件中更新 MCP_PORT,随后重新启动服务器(run.sh / run.ps1)。

  • 问: 是否提供免费试用?
    答: 有的,每月提供 150 次免费 API 调用。