Обзор

GroupDocs.Parser Cloud MCP Server — это лёгкая обёртка вокруг API GroupDocs.Parser Cloud, реализующая Model Context Protocol (MCP). Предоставляя возможности парсинга документов (текст, изображения, штрихкоды) и утилиты работы с облачным хранилищем (просмотр, загрузка, скачивание, удаление) в виде MCP‑совместимых инструментов, сервер позволяет AI‑агентам, помощникам и инструментам разработки взаимодействовать с документами так же, как с любым другим источником данных, управляемым моделью. Это устраняет необходимость в пользовательских вызовах SDK или проприетарных интеграциях, упрощая встраивание извлечения данных в LLM‑ориентированные рабочие процессы, автодополнение или среды код‑ассистентов.

Ключевые преимущества:

  • Универсальный доступ — любой MCP‑совместимый клиент (VS Code, Cursor, KiloCode, пользовательские агенты и др.) может вызывать один и тот же эндпоинт для парсинга документов, хранящихся в GroupDocs Cloud.
  • Богатое извлечение — получение чистого текста, встроенных изображений и штрихкодов из более чем 50 форматов (PDF, Word, Excel, PowerPoint, письма, архивы и т.д.).
  • Операции с хранилищем — просмотр папок, загрузка новых файлов, скачивание существующих и управление облачным хранилищем напрямую через вызовы MCP.
  • Кроссплатформенность — работает на Windows, macOS и Linux в виде единой службы на Python.

Ниже представлена навигация по разделам, где подробно рассматриваются протокол, установка, настройка популярных инструментов, расширенные возможности и FAQ.

Что такое Model Context Protocol (MCP)?

Model Context Protocol (MCP) — это стандартный интерфейс, позволяющий большим языковым моделям (LLM) и AI‑агентам взаимодействовать с внешними инструментами и сервисами структурированным, предсказуемым и обнаруживаемым способом.

Вместо того чтобы вплетать бизнес‑логику напрямую в подсказки, MCP раскрывает внешние возможности (APIs, сервисы, источники данных) как типизированные инструменты, которые AI‑агент может вызывать при необходимости.

Ключевые концепции MCP

  • Интеграция на основе инструментов
    Каждая возможность представлена как инструмент с чётко определённой задачей (например, извлечь текст из документа или получить список файлов в хранилище). AI‑агенты выбирают и вызывают эти инструменты динамически в зависимости от намерения пользователя.

  • Типизированные схемы ввода/вывода
    Инструменты MCP описывают свои входные и выходные параметры при помощи JSON‑схем. Это устраняет неоднозначность, снижает количество галлюцинаций и позволяет моделям рассуждать о том, какой инструмент вызвать и как использовать полученный результат.

  • Явное разделение рассуждения и выполнения
    LLM отвечает за рассуждения и принятие решений, а MCP‑сервер выполняет детерминированные операции, такие как парсинг документов, обработка файлов или получение данных.

  • Повторное использование в разных средах
    Любой MCP‑совместимый клиент (AI‑IDE, чат‑приложения, автономные агенты, локальные инструменты) может подключиться к одному и тому же серверу без написания пользовательского кода.

Реализуя MCP, сервис становится AI‑нативным: его функции могут быть обнаружены, поняты и безопасно вызваны AI‑агентами в рамках более сложного рабочего процесса.

Зачем нужен GroupDocs.Parser Cloud MCP Server?

ПреимуществоКак это помогает
Одна точка интеграцииЛюбой MCP‑совместимый клиент (Cursor, VS Code extensions, AI‑агенты, кастомные инструменты) получает доступ к парсингу документов через единый, согласованный интерфейс.
Полный набор возможностей извлеченияИзвлекайте чистый текст, изображения и штрихкоды из более чем 50 форматов, включая PDF, DOCX, XLSX, PPTX, письма и архивы.
Операции с облачным хранилищемРаботайте с файлами непосредственно в GroupDocs Cloud: загрузка, скачивание, просмотр папок, проверка наличия и удаление файлов в рамках того же рабочего процесса.
Отсутствие SDK в агентахAI‑агенты и клиентские приложения не нуждаются в встраивании или управлении SDK GroupDocs — сервер MCP берёт на себя всю коммуникацию и аутентификацию.
Кроссплатформенность и самостоятельный хостингЗапускайте сервер локально или в своей инфраструктуре с помощью единой Python‑службы на Windows, macOS или Linux.
Оптимизировано для AI‑рабочих процессовMCP‑интерфейс предоставляет детерминированные, схематизированные инструменты, которые AI‑агенты могут безопасно вызывать как часть более крупных цепочек рассуждений и автоматизации.

Быстрый старт

В этом разделе показано, как за несколько шагов настроить и запустить GroupDocs.Parser Cloud MCP Server.

1. Клонируйте репозиторий

git clone https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-mcp.git
cd groupdocs-parser-cloud-mcp

2. Настройте переменные окружения

Создайте файл .env с вашими учётными данными GroupDocs Cloud.
Можно создать его вручную или скопировать из шаблона .env.example.

CLIENT_ID=your-client-id
CLIENT_SECRET=your-client-secret
MCP_PORT=8000

Получить Client ID и Client Secret можно в панели управления GroupDocs Cloud:
https://dashboard.groupdocs.cloud/#/applications


3. Запустите MCP‑сервер

Выберите команду, соответствующую вашей операционной системе.

Linux / macOS

./run_mcp.sh

Windows (PowerShell)

.\run_mcp.ps1

Windows (Command Prompt)

run_mcp.bat

Точка доступа сервера

После запуска сервер доступен по адресу:

http://localhost:8000/mcp

Теперь вы можете подключить этот эндпоинт к любому MCP‑совместимому хосту, будь то AI‑агенты, IDE‑коприлоты или инструменты, поддерживающие Model Context Protocol.

Использование MCP с KiloCode

KiloCode может вызывать любой MCP‑эндпоинт напрямую из чат‑интерфейса.

Подготовительные шаги

  1. Откройте Settings → MCP Servers в KiloCode.
  2. Добавьте новый сервер с именем groupdocs-parser-mcp-local.
  3. Вставьте конфигурационный JSON (URL и тип).

JSON‑конфигурация KiloCode

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "type": "streamable-http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

Пример запросов в KiloCode

Extract all text from sample_invoice.pdf using the GroupDocs.Parser MCP server, then give me a brief summary of the invoice amount

KiloCode выполнит:

  • загрузку sample_invoice.pdf в GroupDocs Cloud;
  • вызов метода MCP parse/text;
  • возвращение сгенерированного моделью резюме.

Extract all images from document.pdf, save them in current folder, subfolder “document_images” and after processing remove the images from GroupDocs.Cloud storage

KiloCode выполнит:

  • загрузку document.pdf в GroupDocs Cloud;
  • вызов инструмента MCP для извлечения изображений;
  • вызов эндпоинта parse/images через MCP;
  • скачивание полученных изображений и сохранение их в папку document_images;
  • удаление изображений из хранилища GroupDocs.Cloud.

Использование MCP с Cursor

Панель Tools & MCP в Cursor позволяет регистрировать собственные MCP‑серверы.

Настройка

  1. Откройте Cursor Settings → Tools & MCP.
  2. Нажмите Add Custom MCP.
  3. Вставьте следующий JSON‑фрагмент в раздел mcp.json.

Конфигурация Cursor (mcp.json)

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

Пример Prompt для Cursor

Extract text from Message.msg using the GroupDocs.Parser MCP, then give me a brief summary of the email message.

Cursor автоматически:

  • загрузит файл в ваше личное хранилище GroupDocs.Cloud;
  • получит текст через GroupDocs.Parser Cloud;
  • включит результат в ответ чата.

Использование MCP с VS Code

VS Code поддерживает MCP‑серверы. В этом разделе показана базовая настройка.

Шаги конфигурации

  1. Если ещё нет, создайте в проекте папку .vscode.
  2. Добавьте файл mcp.json с определением сервера.

Пример mcp.json для VS Code

{
  "servers": {
    "groupdocs-parser-mcp-local": {
      "type": "http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}
  1. Перезапустите VS Code (Ctrl+Shift+P → Developer: Reload Window).
  2. Откройте чат (Ctrl+Alt+I) — чат будет вызывать инструменты MCP по запросу.

Пример вопроса:

Parse the Invoice.pdf using the GroupDocs.Parser MCP, give me a brief summary of invoice.

Расширенные параметры

Тестирование сервера с помощью MCP Inspector

MCP Inspector — лёгкий UI, позволяющий исследовать схему сервера и выполнять вызовы интерактивно.

# Запуск инспектора (требуется Node.js)
npx @modelcontextprotocol/inspector

В браузере:

  1. Выберите тип соединения “streamable HTTP”.
  2. Введите URL вашего сервера: http://127.0.0.1:8000/mcp.
  3. Нажмите Connect и просмотрите доступные методы (например, parser_extract_text, parser_extract_barcodes).

Переинициализация виртуального окружения

Если вы изменили requirements.txt или столкнулись с проблемами зависимостей, переинициализируйте окружение:

# Linux / macOS
./init_mcp.sh

# Windows PowerShell
.\init_mcp.ps1

# Windows CMD
init_mcp.bat

Скрипт выполнит:

  1. Удаление текущего .venv.
  2. Создание чистого виртуального окружения.
  3. Установку всех пакетов из requirements.txt.

После сброса запустите сервер снова:

# Linux / macOS
./run.sh

# Windows PowerShell
.\run.ps1

# Windows CMD
run.bat

Заключение

В статье мы рассмотрели:

  • Что такое MCP и зачем он нужен для AI‑инструментов.
  • GroupDocs.Parser Cloud MCP Server — лёгкий мост, добавляющий извлечение текста, изображений и штрихкодов, а также полное управление хранилищем к любому MCP‑совместимому клиенту.
  • Пошаговая установка (клонирование репозитория, настройка, запуск).
  • Подключение сервера к популярным средам — KiloCode, Cursor и VS Code.
  • Расширенная диагностика с помощью MCP Inspector и переинициализация окружения.

С установленным MCP‑сервером разработчики могут позволить LLM взаимодействовать с документами так же естественно, как с базами данных или API, устраняя шаблонный код SDK и ускоряя создание AI‑управляемых документоориентированных рабочих процессов.

Смотрите также

Часто задаваемые вопросы (FAQs)

  • Вопрос: Почему сервер MCP является открытым и запускается локально? Почему нет публично‑хостируемого MCP‑сервера?
    Ответ: Model Context Protocol — всё ещё новая спецификация, и текущие LLM и AI‑ассистенты обычно имеют ограниченную или ненадёжную нативную поддержку бинарных потоков (PDF, изображения, архивы). Парсинг документов, OCR, извлечение изображений и распознавание штрихкодов – это задачи, где специализированные API, такие как GroupDocs.Parser Cloud, показывают лучшие результаты. Локальный MCP‑сервер заполняет этот пробел, предоставляя надёжный и стандартизированный путь.

  • Вопрос: Нужен ли дополнительный софт для работы сервера MCP?
    Ответ: Нет. Сервер работает на любой ОС, где поддерживается Python 3.10+, и требует лишь Git.

  • Вопрос: Какие форматы документов поддерживаются?
    Ответ: Более 50 форматов, включая PDF, DOCX, XLSX, PPTX, файлы электронной почты (.eml, .msg), архивы (ZIP, RAR) и популярные типы изображений (PNG, JPG, TIFF).

  • Вопрос: Можно ли извлекать штрихкоды из сканированных PDF?
    Ответ: Да. MCP‑сервер поддерживает эндпоинт parse/barcodes, определяющий 1D и 2D штрихкоды в растровых изображениях и PDF.

  • Вопрос: Как просмотреть файлы в конкретной папке GroupDocs Cloud?
    Ответ: Сервер реализует эндпоинты GroupDocs.Cloud (storage/list, storage/upload, storage/download, storage/delete), которые автоматически доступны в чат‑сессиях либо могут быть вызваны вручную.

  • Вопрос: Что делать, если я изменю порт MCP?
    Ответ: Обновите значение MCP_PORT в файле .env и перезапустите сервер (run.sh / run.ps1).

  • Вопрос: Есть ли бесплатный пробный период?
    Ответ: Да, предоставляется 150 бесплатных API‑вызовов в месяц.