Przegląd

The GroupDocs.Parser Cloud MCP Server jest lekkim wrapperem wokół API GroupDocs.Parser Cloud, które implementuje Model Context Protocol (MCP). Udostępniając możliwości parsowania dokumentów (tekst, obrazy, kody kreskowe) oraz narzędzia do obsługi przechowywania w chmurze (lista, wgranie, pobranie, usunięcie) jako narzędzia zgodne z MCP, serwer umożliwia agentom AI, asystentom i narzędziom programistycznym interakcję z dokumentami tak, jakby były innym źródłem danych sterowanym modelem. To eliminuje potrzebę wywołań własnych SDK lub własnych integracji, co ułatwia osadzanie wyodrębniania dokumentów w przepływach opartych na LLM, narzędziach autouzupełniania czy środowiskach asystenta kodu.

Kluczowe korzyści:

  • Universal access – Każdy klient zgodny z MCP (VS Code, Cursor, KiloCode, własne agenty i inne) może wywołać ten sam punkt końcowy, aby parsować dokumenty przechowywane w GroupDocs Cloud.
  • Rich extraction – Pobieraj czysty tekst, osadzone obrazy i kody kreskowe z ponad 50 formatów plików (PDF, Word, Excel, PowerPoint, e‑maile, archiwa itp.).
  • Storage operations – Wyświetlaj foldery, wgrywaj nowe pliki, pobieraj istniejące i zarządzaj przechowywaniem w chmurze bezpośrednio przez wywołania MCP.
  • Cross‑platform – Działa na Windows, macOS i Linux jako jedyna usługa oparta na Pythonie.

Poniżej szybka nawigacja po sekcjach, które przeprowadzą Cię przez protokół, instalację, konfigurację popularnych narzędzi, opcje zaawansowane i FAQ.

Czym jest Model Context Protocol (MCP)?

Model Context Protocol (MCP) to standardowy interfejs, który pozwala dużym modelom językowym (LLM) i agentom AI współdziałać z zewnętrznymi narzędziami i usługami w ustrukturyzowany, przewidywalny i odkrywalny sposób.

Zamiast osadzać logikę biznesową bezpośrednio w podpowiedziach, MCP udostępnia zewnętrzne możliwości (API, usługi, źródła danych) jako typowane narzędzia, które agent AI może wywołać w razie potrzeby.

Kluczowe koncepcje MCP

  • Tool-based integration
    Każda możliwość jest wystawiona jako narzędzie o jasnym przeznaczeniu (np. wyodrębnij tekst z dokumentu lub wyświetl pliki w magazynie). Agenci AI mogą dynamicznie wybierać i wywoływać te narzędzia w oparciu o intencję użytkownika.

  • Typed input and output schemas
    Narzędzia MCP definiują swoje wejścia i wyjścia przy użyciu schematów JSON. To usuwa niejasności, zmniejsza halucynacje i pozwala modelom rozumieć, które narzędzie wywołać i jak użyć wyniku.

  • Explicit separation of reasoning and execution
    LLM koncentruje się na rozumowaniu i podejmowaniu decyzji, podczas gdy serwer MCP wykonuje deterministyczne operacje, takie jak parsowanie dokumentów, przetwarzanie plików czy pobieranie danych.

  • Reusable across environments
    Każdy klient zgodny z MCP (IDE AI, aplikacje czatu, autonomiczne agenty, lokalne narzędzia) może połączyć się z tym samym serwerem MCP bez potrzeby własnego kodu łączącego.

Implementując MCP, usługa staje się AI‑native: jej funkcjonalność może być odkryta, zrozumiana i bezpiecznie wywołana przez agenty AI jako część większych przepływów.

Dlaczego warto używać serwera GroupDocs.Parser Cloud MCP?

KorzyśćJak to pomaga
Jednopunktowa integracjaKażdy klient zgodny z MCP (Cursor, rozszerzenia VS Code, agenci AI, własne narzędzia) może uzyskać dostęp do parsowania dokumentów przez jednolity interfejs.
Kompleksowe wyodrębnianie treściWyodrębnia czysty tekst, obrazy i kody kreskowe z ponad 50 formatów dokumentów, w tym PDF, DOCX, XLSX, PPTX, e‑maile i archiwa.
Operacje przechowywania w chmurze w zestawiePracuj z plikami bezpośrednio w GroupDocs Cloud: wgrywanie, pobieranie, wyświetlanie folderów, sprawdzanie istnienia i usuwanie plików jako część tego samego przepływu.
Brak SDK w Twoich agentachAgenci AI i aplikacje klienckie nie muszą embedować ani zarządzać SDK GroupDocs – serwer MCP obsługuje całą komunikację API i autoryzację.
Wieloplatformowość i własny hostingUruchom serwer MCP lokalnie lub w własnej infrastrukturze jako pojedynczą usługę Python na Windows, macOS lub Linux.
Zaprojektowane dla przepływów AIInterfejs MCP udostępnia deterministyczne, oparte na schematach narzędzia, które agenci AI mogą bezpiecznie wywoływać jako część większych procesów rozumowania i automatyzacji.

Szybki start

Ten rozdział pokazuje, jak skonfigurować i uruchomić GroupDocs.Parser Cloud MCP Server w kilku prostych krokach.

1. Clone the repository

git clone https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-mcp.git
cd groupdocs-parser-cloud-mcp

2. Configure environment variables

Utwórz plik .env z poświadczeniami GroupDocs Cloud.
Możesz go utworzyć ręcznie lub skopiować dostarczony szablon .env.example.

CLIENT_ID=your-client-id
CLIENT_SECRET=your-client-secret
MCP_PORT=8000

Możesz uzyskać Client ID i Client Secret w panelu kontrolnym GroupDocs Cloud:
https://dashboard.groupdocs.cloud/#/applications


3. Run the MCP server

Wybierz polecenie odpowiednie dla Twojego systemu operacyjnego.

Linux / macOS

./run_mcp.sh

Windows (PowerShell)

.\run_mcp.ps1

Windows (Command Prompt)

run_mcp.bat

Server endpoint

Po uruchomieniu serwer MCP jest dostępny pod adresem:

http://localhost:8000/mcp

Teraz możesz podłączyć ten punkt końcowy do dowolnego klienta zgodnego z MCP, takiego jak agenty AI, IDE‑copilot czy narzędzia LLM obsługujące Model Context Protocol.

Używanie MCP z KiloCode

KiloCode może wywoływać dowolny endpoint MCP bezpośrednio z interfejsu czatu.

Kroki przygotowawcze

  1. Otwórz Ustawienia KiloCode → MCP Servers.
  2. Dodaj nowy wpis serwera o nazwie groupdocs-parser-mcp-local.
  3. Wklej poniższy JSON konfiguracyjny (URL i typ).

KiloCode Configuration JSON

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "type": "streamable-http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

Przykładowe polecenia w KiloCode

Wyodrębnij cały tekst z sample_invoice.pdf przy użyciu serwera GroupDocs.Parser MCP, a następnie podaj mi krótkie podsumowanie kwoty faktury.

Po wysłaniu tego polecenia KiloCode:

  • Wgrywa sample_invoice.pdf do GroupDocs Cloud.
  • Wywołuje metodę MCP parse/text.
  • Zwraca podsumowanie wygenerowane przez model.

Wyodrębnij wszystkie obrazy z document.pdf, zapisz je w bieżącym folderze, podfolderze „document_images” i po przetworzeniu usuń obrazy z przechowywania GroupDocs.Cloud.

KiloCode:

  • Wgrywa document.pdf do GroupDocs Cloud.
  • Wywołuje narzędzie MCP do wyodrębniania obrazów.
  • Pobiera obrazy przez endpoint parse/images i zapisuje je w folderze document_images.
  • Usuwa pobrane obrazy z magazynu GroupDocs.Cloud.

Używanie MCP z Cursor

Panel „Tools & MCP” w Cursorze pozwala na rejestrację własnych serwerów MCP.

Setup Steps

  1. Otwórz Cursor Settings → Tools & MCP.
  2. Kliknij Add Custom MCP.
  3. Wklej poniższy fragment JSON do sekcji mcp.json.

Cursor mcp.json Configuration

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

Przykładowy prompt dla Cursor

Wyodrębnij tekst z Message.msg przy użyciu GroupDocs.Parser MCP, a następnie podaj krótkie podsumowanie wiadomości e‑mail.

Cursor automatycznie:

  • Wgra plik do Twojego osobistego przechowywania GroupDocs.Cloud
  • Pobierze tekst przy użyciu GroupDocs.Parser Cloud.
  • Dołączy wynik do odpowiedzi w czacie.

Używanie MCP z VS Code

VS Code obsługuje serwery MCP. Poniżej pokazujemy, jak skonfigurować i korzystać z funkcji MCP w VS Code.

Configuration Steps

  1. Utwórz folder .vscode w projekcie, jeśli jeszcze go nie ma.
  2. Dodaj plik mcp.json z definicją serwera.

VS Code mcp.json Example

{
  "servers": {
    "groupdocs-parser-mcp-local": {
      "type": "http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}
  1. Przeładuj VS Code (Ctrl+Shift+P → Developer: Reload Window).
  2. Otwórz czat (Ctrl+Alt+I) – czat wywoła narzędzia MCP, gdy zostaną zażądane.

Przykładowe pytanie w czacie VS Code

Przetwórz Invoice.pdf przy użyciu GroupDocs.Parser MCP i podaj krótkie podsumowanie faktury.

Zaawansowane opcje

Testowanie serwera przy użyciu MCP Inspector

MCP Inspector to lekka aplikacja UI, która pozwala przeglądać schemat serwera i testować wywołania interaktywnie.

# Run the inspector (Node.js required)
npx @modelcontextprotocol/inspector

W przeglądarce:

  1. Wybierz “streamable HTTP” jako typ połączenia.
  2. Wpisz URL serwera: http://127.0.0.1:8000/mcp.
  3. Kliknij Connect i przejrzyj dostępne metody (np. parser_extract_text, parser_extract_barcodes).

Ponowne inicjalizowanie środowiska wirtualnego

Jeśli modyfikujesz requirements.txt lub napotkasz błędy zależności, zrestartuj środowisko:

# Linux / macOS
./init_mcp.sh

# Windows PowerShell
.\init_mcp.ps1

# Windows CMD
init_mcp.bat

Skrypt:

  1. Usunie istniejący katalog .venv.
  2. Utworzy czyste środowisko wirtualne.
  3. Zainstaluje wszystkie pakiety z requirements.txt.

Po resecie uruchom serwer ponownie:

# Linux / macOS
./run.sh

# Windows PowerShell
.\run.ps1

# Windows CMD
run.bat

Podsumowanie

W tym artykule omówiliśmy:

  • Czym jest MCP i dlaczego jest ważny dla narzędzi AI.
  • GroupDocs.Parser Cloud MCP Server – lekki most, który dodaje wyodrębnianie tekstu, obrazów i kodów kreskowych oraz pełne zarządzanie przechowywaniem do każdego klienta zgodnego z MCP.
  • Krok po kroku instalację (klonowanie, konfiguracja, uruchomienie).
  • Jak podłączyć serwer do popularnych środowisk – KiloCode, Cursor i VS Code.
  • Zaawansowaną diagnostykę przy użyciu MCP Inspector oraz resetowanie środowiska.

Mając uruchomiony serwer MCP, programiści mogą pozwolić modelom LLM na naturalne interakcje z dokumentami, tak jak z bazami danych czy API, eliminując zbędny kod SDK i przyspieszając tworzenie przepływów dokumentacyjnych napędzanych AI.

Zobacz także

Często zadawane pytania (FAQ)

  • Q: Dlaczego serwer MCP jest otwartoźródłowy i uruchamiany lokalnie? Dlaczego nie ma publicznie hostowanego serwera MCP?
    A: Model Context Protocol (MCP) jest wciąż bardzo nowym standardem, a obecne LLM i asystenci AI mają ograniczone lub niewiarygodne natywne wsparcie dla strumieniowania plików binarnych (PDF, obrazy, archiwa). Parsowanie dokumentów, OCR, wyodrębnianie obrazów i rozpoznawanie kodów kreskowych to obszary, w których wyspecjalizowane API, takie jak GroupDocs.Parser Cloud, wypadają zdecydowanie lepiej. Lokalne serwery MCP wypełniają tę lukę, zapewniając niezawodny i ustandaryzowany dostęp.

  • Q: Czy muszę instalować dodatkowe oprogramowanie, aby używać serwera MCP?
    A: Nie. Serwer działa na dowolnym systemie operacyjnym obsługującym Python 3.10+ i wymaga jedynie Git; wszystkie pozostałe zależności są instalowane automatycznie.

  • Q: Jakie formaty dokumentów są obsługiwane?
    A: Ponad 50 formatów, w tym PDF, DOCX, XLSX, PPTX, pliki e‑mail (.eml, .msg), archiwa (ZIP, RAR) oraz popularne typy obrazów (PNG, JPG, TIFF).

  • Q: Czy mogę wyodrębnić kody kreskowe ze skanowanych PDF‑ów?
    A: Tak. Serwer MCP obsługuje endpoint parse/barcodes, który wykrywa zarówno kody 1D, jak i 2D w obrazach rasterowych i dokumentach PDF.

  • Q: Jak mogę wyświetlić pliki w określonym folderze GroupDocs Cloud?
    A: Serwer MCP obsługuje endpointy przechowywania GroupDocs.Cloud (storage/list, storage/upload, storage/download, storage/delete). Operacje te są wykorzystywane automatycznie w sesjach czatu lub na żądanie.

  • Q: Co zrobić, jeśli po uruchomieniu serwera zmienię port MCP?
    A: Zaktualizuj wartość MCP_PORT w pliku .env i ponownie uruchom serwer (run.sh / run.ps1).

  • Q: Czy mogę skorzystać z darmowego okresu próbnego?
    A: Tak, dostępne jest 150 darmowych wywołań API miesięcznie.