Tổng quan

GroupDocs.Parser Cloud MCP Server là một wrapper nhẹ quanh API GroupDocs.Parser Cloud, thực thi Model Context Protocol (MCP). Bằng cách cung cấp các khả năng phân tích tài liệu (văn bản, hình ảnh, mã vạch) và các tiện ích lưu trữ đám mây (liệt kê, tải lên, tải xuống, xóa) dưới dạng công cụ tuân thủ MCP, server cho phép AI agents, trợ lý và công cụ phát triển tương tác với tài liệu giống như chúng tương tác với bất kỳ nguồn dữ liệu mô hình nào khác. Điều này loại bỏ nhu cầu viết mã SDK tùy chỉnh hay tích hợp độc quyền, giúp bạn dễ dàng nhúng việc trích xuất tài liệu vào các quy trình làm việc dựa trên LLM, công cụ tự động hoàn thành hay môi trường trợ lý lập trình.

Lợi ích chính

  • Truy cập toàn cầu – Bất kỳ client nào tương thích MCP (VS Code, Cursor, KiloCode, các agent tùy chỉnh…) đều có thể gọi cùng một endpoint để phân tích các tài liệu lưu trong GroupDocs Cloud.
  • Trích xuất phong phú – Lấy được văn bản thuần, hình ảnh nhúng và mã vạch từ hơn 50 định dạng tệp (PDF, Word, Excel, PowerPoint, email, tệp nén, v.v.).
  • Thao tác lưu trữ – Liệt kê thư mục, tải lên tệp mới, tải xuống tệp hiện có và quản lý lưu trữ đám mây trực tiếp qua các lệnh MCP.
  • Đa nền tảng – Chạy trên Windows, macOS và Linux chỉ với một dịch vụ Python duy nhất.

Dưới đây là bảng điều hướng nhanh tới các phần sẽ hướng dẫn bạn qua giao thức, cài đặt, cấu hình cho các công cụ phổ biến, các tùy chọn nâng cao và phần FAQ.

Model Context Protocol (MCP) là gì?

Model Context Protocol (MCP) là một giao diện chuẩn cho phép các mô hình ngôn ngữ lớn (LLM) và AI agents tương tác với các công cụ và dịch vụ bên ngoài một cách có cấu trúc, dự đoán được và dễ khám phá.

Thay vì nhúng trực tiếp logic kinh doanh vào prompt, MCP mở ra các khả năng bên ngoài (API, dịch vụ, nguồn dữ liệu) dưới dạng công cụ có kiểu dữ liệu mà AI agent có thể gọi khi cần.

Các khái niệm chính của MCP

  • Tích hợp dựa trên công cụ
    Mỗi khả năng được biểu diễn như một công cụ với mục đích rõ ràng (ví dụ: trích xuất văn bản từ tài liệu hay liệt kê các tệp trong lưu trữ). AI agents có thể lựa chọn và gọi các công cụ này một cách động dựa trên ý định của người dùng.

  • Schema đầu vào/đầu ra có kiểu
    Các công cụ MCP định nghĩa đầu vào và đầu ra bằng các JSON schema. Điều này loại bỏ sự mơ hồ, giảm hiện tượng “hallucination” và cho phép mô hình suy luận được công cụ nào cần gọi và cách sử dụng kết quả.

  • Tách biệt rõ ràng giữa suy luận và thực thi
    LLM tập trung vào suy luận và ra quyết định, trong khi server MCP thực hiện các thao tác quyết định như phân tích tài liệu, xử lý tệp hoặc truy xuất dữ liệu.

  • Tái sử dụng trên nhiều môi trường
    Bất kỳ client nào tương thích MCP (IDE AI, ứng dụng chat, agents tự động, công cụ nội bộ) đều có thể kết nối tới cùng một server MCP mà không cần code “kết dính” riêng.

Khi triển khai MCP, một dịch vụ trở thành AI‑native: chức năng của nó có thể được khám phá, hiểu và gọi một cách an toàn bởi AI agents như một phần của workflow lớn hơn.

Tại sao nên dùng GroupDocs.Parser Cloud MCP Server?

Lợi íchCách nó giúp bạn
Điểm tích hợp duy nhấtBất kỳ client nào tương thích MCP (Cursor, VS Code, AI agents, công cụ tùy chỉnh…) đều có thể truy cập phân tích tài liệu qua một giao diện nhất quán.
Trích xuất nội dung toàn diệnLấy được văn bản thuần, hình ảnh và mã vạch từ hơn 50 định dạng tài liệu, bao gồm PDF, DOCX, XLSX, PPTX, email và các tệp nén.
Bao gồm thao tác lưu trữ đám mâyLàm việc trực tiếp với các tệp trong lưu trữ GroupDocs Cloud: tải lên, tải xuống, liệt kê thư mục, kiểm tra sự tồn tại và xóa tệp trong cùng một workflow.
Không cần SDK trong agentsAI agents và các ứng dụng client không cần nhúng hoặc quản lý SDK của GroupDocs – server MCP chịu trách nhiệm giao tiếp API và xác thực.
Cross‑platform và tự‑hostChạy server MCP cục bộ hoặc trên hạ tầng của bạn bằng một dịch vụ Python duy nhất trên Windows, macOS hoặc Linux.
Được thiết kế cho workflow AIGiao diện MCP cung cấp các công cụ có schema chắc chắn, cho phép AI agents gọi một cách an toàn trong các vòng suy luận và tự động hoá phức tạp.

Bắt đầu nhanh

Phần này minh họa cách cấu hình và chạy GroupDocs.Parser Cloud MCP Server chỉ trong vài bước.

1. Sao chép repository

git clone https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-mcp.git
cd groupdocs-parser-cloud-mcp

2. Cấu hình biến môi trường

Tạo file .env chứa thông tin xác thực GroupDocs Cloud của bạn.
Bạn có thể tạo thủ công hoặc sao chép mẫu từ file .env.example.

CLIENT_ID=your-client-id
CLIENT_SECRET=your-client-secret
MCP_PORT=8000

Bạn lấy Client IDClient Secret từ bảng điều khiển GroupDocs Cloud:
https://dashboard.groupdocs.cloud/#/applications


3. Chạy server MCP

Chọn lệnh phù hợp với hệ điều hành của bạn.

Linux / macOS

./run_mcp.sh

Windows (PowerShell)

.\run_mcp.ps1

Windows (Command Prompt)

run_mcp.bat

Endpoint của server

Sau khi khởi động, server MCP sẽ sẵn sàng tại:

http://localhost:8000/mcp

Bạn có thể kết nối endpoint này tới bất kỳ host tương thích MCP nào, chẳng hạn AI agents, IDE copilots hoặc công cụ LLM hỗ trợ Model Context Protocol.

Sử dụng MCP với KiloCode

KiloCode có thể gọi bất kỳ endpoint MCP nào trực tiếp từ giao diện chat.

Các bước chuẩn bị

  1. Mở Settings → MCP Servers trong KiloCode.
  2. Thêm một entry mới tên groupdocs-parser-mcp-local.
  3. Dán đoạn JSON cấu hình (URL và kiểu) vào.

JSON cấu hình KiloCode

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "type": "streamable-http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

Ví dụ câu lệnh trong KiloCode

Trích xuất toàn bộ văn bản từ sample_invoice.pdf bằng GroupDocs.Parser MCP server, sau đó tóm tắt ngắn gọn số tiền trong hóa đơn.

KiloCode sẽ:

  • Tải sample_invoice.pdf lên GroupDocs Cloud.
  • Gọi phương thức MCP parse/text.
  • Trả về bản tóm tắt do mô hình sinh.

Trích xuất tất cả hình ảnh từ document.pdf, lưu chúng vào thư mục hiện tại, thư mục con “document_images” và sau khi xong xóa các hình ảnh khỏi GroupDocs.Cloud storage.

KiloCode sẽ:

  • Tải document.pdf lên GroupDocs Cloud.
  • Gọi công cụ MCP để trích xuất hình ảnh.
  • Gọi endpoint parse/images qua MCP.
  • Tải các hình ảnh đã trích xuất xuống và lưu vào thư mục document_images.

Sử dụng MCP với Cursor

Bảng “Tools & MCP” của Cursor cho phép đăng ký các server MCP tùy chỉnh.

Các bước thiết lập

  1. Mở Cursor Settings → Tools & MCP.
  2. Nhấn Add Custom MCP.
  3. Dán đoạn JSON dưới đây vào phần mcp.json.

Cấu hình mcp.json cho Cursor

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

Ví dụ prompt cho Cursor

Trích xuất văn bản từ Message.msg bằng GroupDocs.Parser MCP, sau đó tóm tắt ngắn gọn nội dung email.

Cursor sẽ tự động:

  • Tải tệp lên lưu trữ cá nhân trong GroupDocs.Cloud.
  • Lấy văn bản bằng GroupDocs.Parser Cloud.
  • Đưa kết quả vào câu trả lời trong chat.

Sử dụng MCP với VS Code

VS Code hỗ trợ các server MCP. Dưới đây là các bước để cấu hình và sử dụng tính năng của server GroupDocs.

Các bước cấu hình

  1. Tạo thư mục .vscode trong dự án nếu chưa có.
  2. Thêm file mcp.json với định nghĩa server.

Ví dụ mcp.json cho VS Code

{
  "servers": {
    "groupdocs-parser-mcp-local": {
      "type": "http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}
  1. Reload VS Code (Ctrl+Shift+P → Developer: Reload Window).
  2. Mở một Chat (Ctrl+Alt+I) – chat sẽ tự động gọi các công cụ MCP khi bạn yêu cầu.

Ví dụ, hỏi về tệp hiện đang mở trong VS Code:

Phân tích Invoice.pdf bằng GroupDocs.Parser MCP, cho tôi tóm tắt ngắn gọn hóa đơn.

Tùy chọn nâng cao

Kiểm tra server bằng MCP Inspector

MCP Inspector là một UI nhẹ cho phép bạn khám phá schema của server và thử các cuộc gọi một cách tương tác.

# Chạy inspector (cần Node.js)
npx @modelcontextprotocol/inspector

Trong trình duyệt:

  1. Chọn “streamable HTTP” làm kiểu kết nối.
  2. Nhập URL server: http://127.0.0.1:8000/mcp.
  3. Nhấn Connect và duyệt các phương thức có sẵn (ví dụ parser_extract_text, parser_extract_barcodes).

Khởi tạo lại môi trường ảo

Nếu bạn thay đổi requirements.txt hoặc gặp lỗi phụ thuộc, hãy khởi tạo lại môi trường:

# Linux / macOS
./init_mcp.sh

# Windows PowerShell
.\init_mcp.ps1

# Windows CMD
init_mcp.bat

Script sẽ:

  1. Xóa .venv hiện tại.
  2. Tạo lại môi trường ảo sạch.
  3. Cài đặt lại toàn bộ gói từ requirements.txt.

Sau khi reset, khởi động lại server:

# Linux / macOS
./run.sh

# Windows PowerShell
.\run.ps1

# Windows CMD
run.bat

Kết luận

Trong bài viết này chúng ta đã đề cập:

  • MCP là gì và tại sao nó quan trọng cho công cụ dựa trên AI.
  • GroupDocs.Parser Cloud MCP Server – cầu nối nhẹ giúp thêm khả năng trích xuất văn bản, hình ảnh, mã vạch và quản lý lưu trữ vào bất kỳ client tương thích MCP nào.
  • Cài đặt từng bước (clone, cấu hình, chạy).
  • Cách kết nối server với các môi trường phổ biến – KiloCode, Cursor và VS Code.
  • Chẩn đoán nâng cao bằng MCP Inspector và cách khởi tạo lại môi trường.

Với server MCP đã được thiết lập, các nhà phát triển có thể để LLM tương tác với tài liệu một cách tự nhiên như với cơ sở dữ liệu hoặc API, loại bỏ mã SDK rườm rà và tăng tốc độ triển khai các workflow tài liệu dựa trên AI.

Xem thêm

Câu hỏi thường gặp (FAQs)

  • H: Tại sao server MCP lại là mã nguồn mở và chạy cục bộ? Tại sao không có một server MCP công khai?
    Đ: Model Context Protocol (MCP) còn mới và các LLM / AI assistants hiện tại thường hạn chế hoặc không ổn định trong việc xử lý các luồng tệp nhị phân (PDF, ảnh, archive). Phân tích tài liệu, OCR, trích xuất hình ảnh và nhận dạng mã vạch là những lĩnh vực mà các API chuyên biệt như GroupDocs.Parser Cloud làm tốt. Server MCP cục bộ lấp đầy khoảng trống này một cách đáng tin cậy và tiêu chuẩn hoá.

  • H: Tôi có cần cài phần mềm bổ sung nào để dùng server MCP không?
    Đ: Không. Server chạy trên bất kỳ hệ điều hành nào hỗ trợ Python 3.10+ và chỉ yêu cầu các package trong requirements.txt.

  • H: Những định dạng tài liệu nào được hỗ trợ?
    Đ: Hơn 50 định dạng, bao gồm PDF, DOCX, XLSX, PPTX, email (.eml, .msg), archive (ZIP, RAR) và các loại ảnh phổ biến (PNG, JPG, TIFF).

  • H: Có thể trích xuất mã vạch từ PDF đã quét không?
    Đ: Có. Server MCP hỗ trợ endpoint parse/barcodes phát hiện mã vạch 1D và 2D trong ảnh raster và PDF.

  • H: Làm sao để liệt kê các tệp trong một thư mục cụ thể của GroupDocs Cloud?
    Đ: Server MCP hỗ trợ các endpoint lưu trữ của GroupDocs.Cloud (storage/list, storage/upload, storage/download, storage/delete). Các thao tác lưu trữ sẽ được sử dụng trong các phiên chat một cách tự động hoặc theo yêu cầu của bạn.

  • H: Nếu tôi thay đổi cổng MCP sau khi server đã chạy thì phải làm gì?
    Đ: Cập nhật giá trị MCP_PORT trong file .env và khởi động lại server (run.sh / run.ps1).

  • H: Có được dùng bản dùng thử miễn phí không?
    Đ: Có, bạn sẽ nhận được 150 lượt gọi API miễn phí mỗi tháng.