개요

GroupDocs.Parser Cloud MCP Server는 GroupDocs.Parser Cloud API를 감싸는 가벼운 래퍼로, **Model Context Protocol (MCP)**을 구현합니다. 문서‑파싱 기능(텍스트, 이미지, 바코드)과 클라우드‑스토리지 유틸리티(목록, 업로드, 다운로드, 삭제)를 MCP‑준수 도구로 노출함으로써, 서버는 AI 에이전트, 어시스턴트 및 개발 도구가 문서와 마치 다른 모델‑드리븐 데이터 소스와 상호 작용하듯 사용할 수 있게 합니다. 이를 통해 맞춤형 SDK 호출이나 독점 통합이 필요 없어, LLM‑구동 워크플로, 자동 완성 도구 또는 코드‑어시스턴트 환경에 문서 추출을 손쉽게 삽입할 수 있습니다.

주요 이점:

  • 범용 접근 – VS Code, Cursor, KiloCode, 맞춤형 에이전트 등 MCP‑호환 클라이언트라면 누구나 동일한 엔드포인트를 호출해 GroupDocs Cloud에 저장된 문서를 파싱할 수 있습니다.
  • 풍부한 추출 – 50여 개 파일 형식(PDF, Word, Excel, PowerPoint, 이메일, 아카이브 등)에서 순수 텍스트, 포함된 이미지 및 바코드를 가져옵니다.
  • 스토리지 작업 – 폴더 목록 확인, 새 파일 업로드, 기존 파일 다운로드 및 클라우드 스토리지 관리까지 MCP 호출 하나로 수행합니다.
  • 크로스‑플랫폼 – Windows, macOS, Linux에서 단일 Python 기반 서비스로 실행됩니다.

아래는 프로토콜, 설치, 인기 도구별 설정, 고급 옵션 및 FAQ 섹션을 안내하는 빠른 내비게이션입니다.

Model Context Protocol (MCP)이란?

**Model Context Protocol (MCP)**은 대형 언어 모델(LLM)과 AI 에이전트가 외부 도구 및 서비스를 구조화되고 예측 가능하며 탐색 가능한 방식으로 상호 작용할 수 있게 하는 표준 인터페이스입니다.

프롬프트에 비즈니스 로직을 직접 삽입하는 대신, MCP는 외부 기능(API, 서비스, 데이터 소스)을 형식이 지정된 도구로 노출하여 AI 에이전트가 필요할 때 호출하도록 합니다.

핵심 MCP 개념

  • 도구 기반 통합
    각 기능은 도구로 노출되며 명확한 목적을 가집니다(예: 문서에서 텍스트 추출 또는 스토리지 파일 목록 조회). AI 에이전트는 사용자 의도에 따라 동적으로 도구를 선택하고 호출합니다.

  • 타입이 지정된 입력·출력 스키마
    MCP 도구는 입력·출력을 JSON 스키마로 정의합니다. 이를 통해 모호성을 해소하고, 환각을 줄이며, 모델이 어떤 도구를 언제 어떻게 호출할지 논리적으로 판단할 수 있습니다.

  • 추론과 실행의 명시적 분리
    LLM은 추론과 의사결정에 집중하고, MCP 서버는 문서 파싱·파일 처리·데이터 검색 등 결정론적 작업을 수행합니다.

  • 다양한 환경에서 재사용 가능
    AI IDE, 채팅 애플리케이션, 자율 에이전트, 로컬 도구 등 MCP‑호환 클라이언트라면 모두 동일한 MCP 서버에 연결해 별도 코드 없이 사용할 수 있습니다.

MCP를 구현하면 서비스가 AI‑네이티브가 됩니다: 기능이 발견되고 이해되며 안전하게 AI 에이전트에 의해 호출될 수 있습니다.

GroupDocs.Parser Cloud MCP Server를 사용해야 하는 이유

이점어떻게 도움이 되나요
단일 통합 포인트Cursor, VS Code 확장, AI 에이전트, 맞춤형 도구 등 MCP‑호환 클라이언트라면 모두 일관된 인터페이스로 문서 파싱에 접근할 수 있습니다.
포괄적인 콘텐츠 추출PDF, DOCX, XLSX, PPTX, 이메일, 아카이브 등을 포함해 50여 개 형식에서 순수 텍스트, 이미지 및 바코드를 추출합니다.
클라우드 스토리지 작업 포함GroupDocs Cloud 스토리지에 직접 파일을 업로드·다운로드·목록 조회·존재 여부 확인·삭제할 수 있어 동일 워크플로에서 관리가 가능합니다.
에이전트에 SDK 불필요AI 에이전트와 클라이언트 애플리케이션은 GroupDocs SDK를 내장하거나 관리할 필요 없이 MCP 서버가 모든 API 통신 및 인증을 수행합니다.
크로스‑플랫폼·셀프‑호스팅Windows, macOS, Linux에서 단일 Python 서비스로 로컬 또는 자체 인프라에 배포할 수 있습니다.
AI 워크플로 전용 설계MCP 인터페이스는 결정론적·스키마 기반 도구를 제공해 AI 에이전트가 보다 안전하고 예측 가능한 방식으로 문서와 상호 작용하도록 돕습니다.

빠른 시작

이 섹션에서는 GroupDocs.Parser Cloud MCP Server를 몇 단계만에 구성하고 실행하는 방법을 보여줍니다.

1. 저장소 복제

git clone https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-mcp.git
cd groupdocs-parser-cloud-mcp

2. 환경 변수 설정

CLIENT_IDCLIENT_SECRET를 포함한 .env 파일을 만들거나 제공된 .env.example을 복사합니다.

CLIENT_ID=your-client-id
CLIENT_SECRET=your-client-secret
MCP_PORT=8000

Client IDClient Secret은 GroupDocs Cloud 대시보드에서 확인할 수 있습니다:
https://dashboard.groupdocs.cloud/#/applications


3. MCP 서버 실행

운영 체제에 맞는 명령을 선택합니다.

Linux / macOS

./run_mcp.sh

Windows (PowerShell)

.\run_mcp.ps1

Windows (Command Prompt)

run_mcp.bat

서버 엔드포인트

서버가 시작되면 아래 주소에서 이용할 수 있습니다.

http://localhost:8000/mcp

이제 이 엔드포인트를 AI 에이전트, IDE 코파일럿 또는 Model Context Protocol을 지원하는 LLM 도구에 연결하면 됩니다.

KiloCode와 MCP 사용

KiloCode는 채팅 인터페이스에서 MCP 엔드포인트를 직접 호출할 수 있습니다.

사전 준비 단계

  1. KiloCode 설정 → MCP 서버를 엽니다.
  2. groupdocs-parser-mcp-local라는 새 서버 항목을 추가합니다.
  3. 구성 JSON(URL 및 타입)을 붙여넣습니다.

KiloCode 구성 JSON

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "type": "streamable-http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

KiloCode 예시 프롬프트

sample_invoice.pdf 파일에서 모든 텍스트를 추출하고, 청구서 금액을 요약해 주세요.

프롬프트 전송 시 KiloCode는

  • sample_invoice.pdf를 GroupDocs Cloud에 업로드하고,
  • MCP parse/text 메서드를 호출하고,
  • 모델이 생성한 요약을 반환합니다.

document.pdf에서 모든 이미지를 추출해 현재 폴더의 subfolder “document_images"에 저장하고, 처리 후 GroupDocs.Cloud 스토리지에서 이미지를 제거해 주세요.

KiloCode는

  • document.pdf를 업로드하고,
  • MCP parse/images 엔드포인트로 이미지를 추출하고,
  • 추출된 이미지를 다운로드해 document_images 폴더에 저장한 뒤,
  • 해당 이미지 파일을 스토리지에서 삭제합니다.

Cursor와 MCP 사용

Cursor의 Tools & MCP 패널에서 맞춤형 MCP 서버를 등록할 수 있습니다.

설정 단계

  1. Cursor 설정 → Tools & MCP를 엽니다.
  2. Add Custom MCP를 클릭합니다.
  3. mcp.json 섹션에 아래 JSON을 입력합니다.

Cursor mcp.json 구성

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

Cursor 예시 프롬프트

Message.msg 파일에서 텍스트를 추출하고, 이메일 내용 요약을 제공해 주세요.

Cursor는 자동으로

  • 개인 GroupDocs.Cloud 스토리지에 파일을 업로드하고,
  • GroupDocs.Parser Cloud를 이용해 텍스트를 추출한 뒤,
  • 결과를 채팅 답변에 포함합니다.

VS Code와 MCP 사용

VS Code에서도 MCP 서버를 활용할 수 있습니다. 아래는 설정 및 사용 방법입니다.

설정 단계

  1. 프로젝트에 .vscode 폴더가 없으면 생성합니다.
  2. mcp.json 파일을 만들고 서버 정의를 넣습니다.

VS Code mcp.json 예시

{
  "servers": {
    "groupdocs-parser-mcp-local": {
      "type": "http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}
  1. VS Code를 새로 고칩니다 (Ctrl+Shift+P → Developer: Reload Window).
  2. 이제 채팅 창(Ctrl+Alt+I)을 열면 필요 시 MCP 도구가 자동 호출됩니다.

예시 질문:

Invoice.pdf를 파싱해 청구서 요약을 알려 주세요.

채팅이 요청을 받아 MCP 서버를 통해 문서를 파싱하고, 요약을 반환합니다.

고급 옵션

MCP Inspector로 서버 테스트

MCP Inspector는 서버 스키마를 탐색하고 호출을 인터랙티브하게 시도할 수 있는 가벼운 UI입니다.

# Inspector 실행 (Node.js 필요)
npx @modelcontextprotocol/inspector

브라우저에서

  1. 연결 유형으로 “streamable HTTP” 선택
  2. 서버 URL 입력: http://127.0.0.1:8000/mcp
  3. Connect 클릭 후 parser_extract_text, parser_extract_barcodes 등 사용 가능한 메서드를 확인합니다.

가상 환경 재초기화

requirements.txt를 수정했거나 의존성 오류가 발생하면 환경을 재설정합니다.

# Linux / macOS
./init_mcp.sh

# Windows PowerShell
.\init_mcp.ps1

# Windows CMD
init_mcp.bat

스크립트는

  1. 기존 .venv 삭제
  2. 새 가상 환경 생성
  3. requirements.txt에 정의된 모든 패키지 재설치

재설정 후 서버를 다시 시작합니다.

# Linux / macOS
./run.sh

# Windows PowerShell
.\run.ps1

# Windows CMD
run.bat

결론

본 기사에서는

  • MCP가 무엇이며 AI 도구에 왜 중요한지
  • GroupDocs.Parser Cloud MCP Server가 어떻게 텍스트·이미지·바코드 추출 및 스토리지 관리를 MCP‑호환 클라이언트에 제공하는지
  • 설치·구성 단계(복제, 환경 변수, 실행)
  • KiloCode, Cursor, VS Code 등 인기 환경에 서버를 연결하는 방법
  • MCP Inspector와 가상 환경 재설정 같은 고급 진단 방법

을 다루었습니다.

MCP 서버를 구축하면 개발자는 LLM이 데이터베이스나 API처럼 문서에 직접 접근하도록 할 수 있어, SDK 코드를 제거하고 AI‑구동 문서 워크플로를 크게 가속화할 수 있습니다.

관련 자료

Frequently Asked Questions (FAQs)

  • Q: 왜 MCP 서버를 오픈소스로 제공하고 로컬에서 실행해야 하나요? 공개 MCP 서버가 없는 이유는?
    A: Model Context Protocol은 아직 초기 단계이며 현재 LLM 및 AI 어시스턴트는 **이진 파일 스트림(PDF, 이미지, 아카이브)**에 대한 지원이 제한적이거나 신뢰성이 낮습니다. 문서 파싱·OCR·이미지·바코드 인식은 GroupDocs.Parser Cloud와 같은 특화 API가 강점이며, 로컬 MCP 서버는 이러한 기능을 표준화된 방식으로 안정적으로 연결해 줍니다.

  • Q: MCP 서버를 사용하려면 추가 소프트웨어가 필요한가요?
    A: 필요 없습니다. Python 3.10+가 실행 가능한 OS와 Git만 있으면 되며, 나머지 종속성은 requirements.txt에 정의된 스크립트가 자동으로 설치합니다.

  • Q: 지원하는 문서 형식은 어떤 것이 있나요?
    A: PDF, DOCX, XLSX, PPTX, 이메일(.eml, .msg), ZIP, RAR 등 50여 개 형식과 일반 이미지(PNG, JPG, TIFF)를 포함합니다.

  • Q: 스캔한 PDF에서 바코드를 추출할 수 있나요?
    A: 예. MCP 서버는 parse/barcodes 엔드포인트를 통해 래스터 이미지와 PDF 내 1D·2D 바코드를 감지합니다.

  • Q: 특정 GroupDocs Cloud 폴더의 파일을 어떻게 나열하나요?
    A: MCP 서버는 storage/list, storage/upload, storage/download, storage/delete와 같은 GroupDocs.Cloud 스토리지 엔드포인트를 제공하며, 채팅 세션에서 자동으로 또는 명시적인 요청으로 사용할 수 있습니다.

  • Q: MCP 포트를 변경하면 어떻게 해야 하나요?
    A: .env 파일의 MCP_PORT 값을 새 포트 번호로 수정하고 서버를 재시작하면 됩니다.

  • Q: 무료 체험이 있나요?
    A: 예, 월 150회의 무료 API 호출이 제공됩니다.