Обзор
GroupDocs.Parser Cloud MCP Server — это лёгкая обёртка вокруг API GroupDocs.Parser Cloud, реализующая Model Context Protocol (MCP). Предоставляя возможности парсинга документов (текст, изображения, штрихкоды) и утилиты работы с облачным хранилищем (просмотр, загрузка, скачивание, удаление) в виде MCP‑совместимых инструментов, сервер позволяет AI‑агентам, помощникам и инструментам разработки взаимодействовать с документами так же, как с любым другим источником данных, управляемым моделью. Это устраняет необходимость в пользовательских вызовах SDK или проприетарных интеграциях, упрощая встраивание извлечения данных в LLM‑ориентированные рабочие процессы, автодополнение или среды код‑ассистентов.
Ключевые преимущества:
- Универсальный доступ — любой MCP‑совместимый клиент (VS Code, Cursor, KiloCode, пользовательские агенты и др.) может вызывать один и тот же эндпоинт для парсинга документов, хранящихся в GroupDocs Cloud.
- Богатое извлечение — получение чистого текста, встроенных изображений и штрихкодов из более чем 50 форматов (PDF, Word, Excel, PowerPoint, письма, архивы и т.д.).
- Операции с хранилищем — просмотр папок, загрузка новых файлов, скачивание существующих и управление облачным хранилищем напрямую через вызовы MCP.
- Кроссплатформенность — работает на Windows, macOS и Linux в виде единой службы на Python.
Ниже представлена навигация по разделам, где подробно рассматриваются протокол, установка, настройка популярных инструментов, расширенные возможности и FAQ.
- Что такое Model Context Protocol (MCP)?
- Зачем нужен GroupDocs.Parser Cloud MCP Server?
- Быстрый старт
- Использование MCP с KiloCode
- Использование MCP с Cursor
- Использование MCP с VS Code
- Расширенные параметры
- Заключение
- Смотрите также
- FAQ
Что такое Model Context Protocol (MCP)?
Model Context Protocol (MCP) — это стандартный интерфейс, позволяющий большим языковым моделям (LLM) и AI‑агентам взаимодействовать с внешними инструментами и сервисами структурированным, предсказуемым и обнаруживаемым способом.
Вместо того чтобы вплетать бизнес‑логику напрямую в подсказки, MCP раскрывает внешние возможности (APIs, сервисы, источники данных) как типизированные инструменты, которые AI‑агент может вызывать при необходимости.
Ключевые концепции MCP
Интеграция на основе инструментов
Каждая возможность представлена как инструмент с чётко определённой задачей (например, извлечь текст из документа или получить список файлов в хранилище). AI‑агенты выбирают и вызывают эти инструменты динамически в зависимости от намерения пользователя.Типизированные схемы ввода/вывода
Инструменты MCP описывают свои входные и выходные параметры при помощи JSON‑схем. Это устраняет неоднозначность, снижает количество галлюцинаций и позволяет моделям рассуждать о том, какой инструмент вызвать и как использовать полученный результат.Явное разделение рассуждения и выполнения
LLM отвечает за рассуждения и принятие решений, а MCP‑сервер выполняет детерминированные операции, такие как парсинг документов, обработка файлов или получение данных.Повторное использование в разных средах
Любой MCP‑совместимый клиент (AI‑IDE, чат‑приложения, автономные агенты, локальные инструменты) может подключиться к одному и тому же серверу без написания пользовательского кода.
Реализуя MCP, сервис становится AI‑нативным: его функции могут быть обнаружены, поняты и безопасно вызваны AI‑агентами в рамках более сложного рабочего процесса.
Зачем нужен GroupDocs.Parser Cloud MCP Server?
| Преимущество | Как это помогает |
|---|---|
| Одна точка интеграции | Любой MCP‑совместимый клиент (Cursor, VS Code extensions, AI‑агенты, кастомные инструменты) получает доступ к парсингу документов через единый, согласованный интерфейс. |
| Полный набор возможностей извлечения | Извлекайте чистый текст, изображения и штрихкоды из более чем 50 форматов, включая PDF, DOCX, XLSX, PPTX, письма и архивы. |
| Операции с облачным хранилищем | Работайте с файлами непосредственно в GroupDocs Cloud: загрузка, скачивание, просмотр папок, проверка наличия и удаление файлов в рамках того же рабочего процесса. |
| Отсутствие SDK в агентах | AI‑агенты и клиентские приложения не нуждаются в встраивании или управлении SDK GroupDocs — сервер MCP берёт на себя всю коммуникацию и аутентификацию. |
| Кроссплатформенность и самостоятельный хостинг | Запускайте сервер локально или в своей инфраструктуре с помощью единой Python‑службы на Windows, macOS или Linux. |
| Оптимизировано для AI‑рабочих процессов | MCP‑интерфейс предоставляет детерминированные, схематизированные инструменты, которые AI‑агенты могут безопасно вызывать как часть более крупных цепочек рассуждений и автоматизации. |
Быстрый старт
В этом разделе показано, как за несколько шагов настроить и запустить GroupDocs.Parser Cloud MCP Server.
1. Клонируйте репозиторий
git clone https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-mcp.git
cd groupdocs-parser-cloud-mcp
2. Настройте переменные окружения
Создайте файл .env с вашими учётными данными GroupDocs Cloud.
Можно создать его вручную или скопировать из шаблона .env.example.
CLIENT_ID=your-client-id
CLIENT_SECRET=your-client-secret
MCP_PORT=8000
Получить Client ID и Client Secret можно в панели управления GroupDocs Cloud:
https://dashboard.groupdocs.cloud/#/applications
3. Запустите MCP‑сервер
Выберите команду, соответствующую вашей операционной системе.
Linux / macOS
./run_mcp.sh
Windows (PowerShell)
.\run_mcp.ps1
Windows (Command Prompt)
run_mcp.bat
Точка доступа сервера
После запуска сервер доступен по адресу:
http://localhost:8000/mcp
Теперь вы можете подключить этот эндпоинт к любому MCP‑совместимому хосту, будь то AI‑агенты, IDE‑коприлоты или инструменты, поддерживающие Model Context Protocol.
Использование MCP с KiloCode
KiloCode может вызывать любой MCP‑эндпоинт напрямую из чат‑интерфейса.
Подготовительные шаги
- Откройте Settings → MCP Servers в KiloCode.
- Добавьте новый сервер с именем
groupdocs-parser-mcp-local. - Вставьте конфигурационный JSON (URL и тип).
JSON‑конфигурация KiloCode
{
"mcpServers": {
"groupdocs-parser-mcp-local": {
"type": "streamable-http",
"url": "http://127.0.0.1:8000/mcp"
}
}
}
Пример запросов в KiloCode
Extract all text from
sample_invoice.pdfusing the GroupDocs.Parser MCP server, then give me a brief summary of the invoice amount
KiloCode выполнит:
- загрузку
sample_invoice.pdfв GroupDocs Cloud; - вызов метода MCP
parse/text; - возвращение сгенерированного моделью резюме.
Extract all images from document.pdf, save them in current folder, subfolder “document_images” and after processing remove the images from GroupDocs.Cloud storage
KiloCode выполнит:
- загрузку
document.pdfв GroupDocs Cloud; - вызов инструмента MCP для извлечения изображений;
- вызов эндпоинта
parse/imagesчерез MCP; - скачивание полученных изображений и сохранение их в папку
document_images; - удаление изображений из хранилища GroupDocs.Cloud.
Использование MCP с Cursor
Панель Tools & MCP в Cursor позволяет регистрировать собственные MCP‑серверы.
Настройка
- Откройте Cursor Settings → Tools & MCP.
- Нажмите Add Custom MCP.
- Вставьте следующий JSON‑фрагмент в раздел
mcp.json.
Конфигурация Cursor (mcp.json)
{
"mcpServers": {
"groupdocs-parser-mcp-local": {
"url": "http://127.0.0.1:8000/mcp"
}
}
}
Пример Prompt для Cursor
Extract text from Message.msg using the GroupDocs.Parser MCP, then give me a brief summary of the email message.
Cursor автоматически:
- загрузит файл в ваше личное хранилище GroupDocs.Cloud;
- получит текст через GroupDocs.Parser Cloud;
- включит результат в ответ чата.
Использование MCP с VS Code
VS Code поддерживает MCP‑серверы. В этом разделе показана базовая настройка.
Шаги конфигурации
- Если ещё нет, создайте в проекте папку
.vscode. - Добавьте файл
mcp.jsonс определением сервера.
Пример mcp.json для VS Code
{
"servers": {
"groupdocs-parser-mcp-local": {
"type": "http",
"url": "http://127.0.0.1:8000/mcp"
}
}
}
- Перезапустите VS Code (
Ctrl+Shift+P → Developer: Reload Window). - Откройте чат (
Ctrl+Alt+I) — чат будет вызывать инструменты MCP по запросу.
Пример вопроса:
Parse the Invoice.pdf using the GroupDocs.Parser MCP, give me a brief summary of invoice.
Расширенные параметры
Тестирование сервера с помощью MCP Inspector
MCP Inspector — лёгкий UI, позволяющий исследовать схему сервера и выполнять вызовы интерактивно.
# Запуск инспектора (требуется Node.js)
npx @modelcontextprotocol/inspector
В браузере:
- Выберите тип соединения “streamable HTTP”.
- Введите URL вашего сервера:
http://127.0.0.1:8000/mcp. - Нажмите Connect и просмотрите доступные методы (например,
parser_extract_text,parser_extract_barcodes).
Переинициализация виртуального окружения
Если вы изменили requirements.txt или столкнулись с проблемами зависимостей, переинициализируйте окружение:
# Linux / macOS
./init_mcp.sh
# Windows PowerShell
.\init_mcp.ps1
# Windows CMD
init_mcp.bat
Скрипт выполнит:
- Удаление текущего
.venv. - Создание чистого виртуального окружения.
- Установку всех пакетов из
requirements.txt.
После сброса запустите сервер снова:
# Linux / macOS
./run.sh
# Windows PowerShell
.\run.ps1
# Windows CMD
run.bat
Заключение
В статье мы рассмотрели:
- Что такое MCP и зачем он нужен для AI‑инструментов.
- GroupDocs.Parser Cloud MCP Server — лёгкий мост, добавляющий извлечение текста, изображений и штрихкодов, а также полное управление хранилищем к любому MCP‑совместимому клиенту.
- Пошаговая установка (клонирование репозитория, настройка, запуск).
- Подключение сервера к популярным средам — KiloCode, Cursor и VS Code.
- Расширенная диагностика с помощью MCP Inspector и переинициализация окружения.
С установленным MCP‑сервером разработчики могут позволить LLM взаимодействовать с документами так же естественно, как с базами данных или API, устраняя шаблонный код SDK и ускоряя создание AI‑управляемых документоориентированных рабочих процессов.
Смотрите также
- GroupDocs.Parser Cloud API Reference – https://reference.groupdocs.cloud/parser/
- GroupDocs.Parser Cloud Documentation – https://docs.groupdocs.cloud/parser/
- Start a Free Trial – https://purchase.groupdocs.cloud/cloud/trial/
- Purchase Policies and FAQ – https://purchase.groupdocs.cloud/cloud/policies/
Часто задаваемые вопросы (FAQs)
Вопрос: Почему сервер MCP является открытым и запускается локально? Почему нет публично‑хостируемого MCP‑сервера?
Ответ: Model Context Protocol — всё ещё новая спецификация, и текущие LLM и AI‑ассистенты обычно имеют ограниченную или ненадёжную нативную поддержку бинарных потоков (PDF, изображения, архивы). Парсинг документов, OCR, извлечение изображений и распознавание штрихкодов – это задачи, где специализированные API, такие как GroupDocs.Parser Cloud, показывают лучшие результаты. Локальный MCP‑сервер заполняет этот пробел, предоставляя надёжный и стандартизированный путь.Вопрос: Нужен ли дополнительный софт для работы сервера MCP?
Ответ: Нет. Сервер работает на любой ОС, где поддерживается Python 3.10+, и требует лишь Git.Вопрос: Какие форматы документов поддерживаются?
Ответ: Более 50 форматов, включая PDF, DOCX, XLSX, PPTX, файлы электронной почты (.eml, .msg), архивы (ZIP, RAR) и популярные типы изображений (PNG, JPG, TIFF).Вопрос: Можно ли извлекать штрихкоды из сканированных PDF?
Ответ: Да. MCP‑сервер поддерживает эндпоинтparse/barcodes, определяющий 1D и 2D штрихкоды в растровых изображениях и PDF.Вопрос: Как просмотреть файлы в конкретной папке GroupDocs Cloud?
Ответ: Сервер реализует эндпоинты GroupDocs.Cloud (storage/list,storage/upload,storage/download,storage/delete), которые автоматически доступны в чат‑сессиях либо могут быть вызваны вручную.Вопрос: Что делать, если я изменю порт MCP?
Ответ: Обновите значениеMCP_PORTв файле.envи перезапустите сервер (run.sh/run.ps1).Вопрос: Есть ли бесплатный пробный период?
Ответ: Да, предоставляется 150 бесплатных API‑вызовов в месяц.
