Überblick

Der GroupDocs.Parser Cloud MCP‑Server ist ein leichtgewichtiger Wrapper um die GroupDocs.Parser‑Cloud‑API, der das Model Context Protocol (MCP) implementiert. Durch das Bereitstellen von Dokument‑Parsing‑Funktionen (Text, Bilder, Barcodes) und Cloud‑Speicher‑Utilities (Auflisten, Hochladen, Herunterladen, Löschen) als MCP‑konforme Werkzeuge lässt der Server KI‑Agenten, Assistenten und Entwicklungs‑Tools mit Dokumenten interagieren, als wären sie beliebige andere modellbasierte Datenquellen. Das eliminiert die Notwendigkeit von eigenen SDK‑Aufrufen oder proprietären Integrationen und macht es unkompliziert, Dokumenten‑Extraktion in LLM‑getriebene Workflows, Autocompletion‑Tools oder Code‑Assistent‑Umgebungen einzubinden.

Hauptvorteile

  • Universeller Zugriff – Jeder MCP‑kompatible Client (VS Code, Cursor, KiloCode, eigene Agenten usw.) kann denselben Endpunkt aufrufen, um Dokumente im GroupDocs‑Cloud‑Speicher zu parsen.
  • Umfangreiche Extraktion – Abruf von Klartext, eingebetteten Bildern und Barcodes aus über 50 Dateiformaten (PDF, Word, Excel, PowerPoint, E‑Mails, Archive usw.).
  • Speicher‑Operationen – Ordner auflisten, neue Dateien hochladen, vorhandene herunterladen und Cloud‑Speicher direkt über MCP‑Aufrufe verwalten.
  • Plattform‑übergreifend – Läuft auf Windows, macOS und Linux mit einem einzigen Python‑basierten Service.

Unten finden Sie eine schnelle Navigation zu den Abschnitten, die Sie Schritt für Schritt durch das Protokoll, die Installation, die Konfiguration für gängige Tools, erweiterte Optionen und FAQs führen.


Was ist das Model Context Protocol (MCP)?

Das Model Context Protocol (MCP) ist eine standardisierte Schnittstelle, die großen Sprachmodellen (LLMs) und KI‑Agenten ermöglicht, externen Tools und Services auf strukturierte, vorhersehbare und entdeckbare Weise zu nutzen.

Statt Business‑Logik direkt in Prompts zu verankern, stellt MCP externe Fähigkeiten (APIs, Services, Datenquellen) als getypte Werkzeuge bereit, die ein KI‑Agent bei Bedarf aufrufen kann.

Zentrale MCP‑Konzepte

  • Werkzeug‑basierte Integration
    Jede Fähigkeit wird als Tool mit eindeutiger Aufgabe veröffentlicht (z. B. Text aus einem Dokument extrahieren oder Dateien im Speicher auflisten). KI‑Agenten können diese Tools dynamisch basierend auf der Benutzerintention auswählen und ausführen.

  • Getypte Eingabe‑ und Ausgabeschemata
    MCP‑Tools definieren ihre Parameter und Rückgabewerte mit JSON‑Schemas. Das reduziert Mehrdeutigkeiten, verringert Halluzinationen und erlaubt dem Modell, zu entscheiden, welches Tool zu verwenden ist und wie das Ergebnis zu interpretieren ist.

  • Klare Trennung von Denken und Ausführen
    Das LLM konzentriert sich auf das Denken und die Entscheidungsfindung, während der MCP‑Server deterministische Operationen wie Dokumenten‑Parsing, Dateiverarbeitung oder Datenabruf übernimmt.

  • Wiederverwendbarkeit in unterschiedlichen Umgebungen
    Jeder MCP‑kompatible Client (KI‑IDEs, Chat‑Anwendungen, autonome Agenten, lokale Tools) kann sich mit demselben MCP‑Server verbinden, ohne zusätzlichen Glue‑Code schreiben zu müssen.

Durch die Implementierung von MCP wird ein Service KI‑nativ: Seine Funktionen können entdeckt, verstanden und sicher von KI‑Agenten im Rahmen größerer Workflows aufgerufen werden.


Warum den GroupDocs.Parser Cloud MCP‑Server nutzen?

NutzenWie er Ihnen hilft
Ein einziger Integrations‑PunktJeder MCP‑kompatible Client (Cursor, VS‑Code‑Erweiterungen, KI‑Agenten, eigene Tools) kann Dokumenten‑Parsing über eine konsistente Schnittstelle ansprechen.
Umfassende InhaltsextraktionExtrahieren Sie Klartext, Bilder und Barcodes aus mehr als 50 Dokumentformaten, darunter PDF, DOCX, XLSX, PPTX, E‑Mails und Archive.
Integrierte Cloud‑Speicher‑OperationenArbeiten Sie direkt mit Dateien im GroupDocs‑Cloud‑Speicher: Hochladen, Herunterladen, Ordner auflisten, Existenz prüfen und Dateien löschen – alles im selben Workflow.
Keine SDKs in Ihren AgentenKI‑Agenten und Client‑Applikationen müssen keine GroupDocs‑SDKs einbetten oder verwalten – der MCP‑Server übernimmt die gesamte API‑Kommunikation und Authentifizierung.
Plattform‑übergreifend und self‑hostedFühren Sie den MCP‑Server lokal oder in Ihrer eigenen Infrastruktur mit einem einzigen Python‑Service auf Windows, macOS oder Linux aus.
Für KI‑Workflows konzipiertDie MCP‑Schnittstelle stellt deterministische, schema‑basierte Werkzeuge bereit, die KI‑Agenten sicher als Teil größerer Denk‑ und Automatisierungsabläufe aufrufen können.

Schnellstart

Dieser Abschnitt zeigt, wie Sie den GroupDocs.Parser Cloud MCP‑Server in nur wenigen Schritten konfigurieren und starten.

1. Repository klonen

git clone https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-mcp.git
cd groupdocs-parser-cloud-mcp

2. Umgebungsvariablen konfigurieren

Erstellen Sie eine .env‑Datei mit Ihren GroupDocs‑Cloud‑Anmeldeinformationen.
Sie können die Datei manuell anlegen oder die bereitgestellte Vorlage .env.example kopieren.

CLIENT_ID=Ihr-Client-ID
CLIENT_SECRET=Ihr-Client-Secret
MCP_PORT=8000

Ihre Client‑ID und Ihr Client‑Secret erhalten Sie im GroupDocs‑Cloud‑Dashboard:
https://dashboard.groupdocs.cloud/#/applications


3. MCP‑Server starten

Wählen Sie den Befehl, der zu Ihrem Betriebssystem passt.

Linux / macOS

./run_mcp.sh

Windows (PowerShell)

.\run_mcp.ps1

Windows (Command Prompt)

run_mcp.bat

Server‑Endpunkt

Nach dem Start ist der MCP‑Server unter folgender Adresse erreichbar:

http://localhost:8000/mcp

Sie können diesen Endpunkt nun mit jedem MCP‑kompatiblen Host verbinden – sei es ein KI‑Agent, ein IDE‑Copilot oder ein LLM‑Tool, das das Model Context Protocol unterstützt.


MCP mit KiloCode verwenden

KiloCode kann jedes MCP‑Endpoint direkt aus seiner Chat‑Oberfläche aufrufen.

Vorbereitung

  1. Öffnen Sie in KiloCode Einstellungen → MCP‑Server.
  2. Legen Sie einen neuen Eintrag mit dem Namen groupdocs-parser-mcp-local an.
  3. Fügen Sie das Konfigurations‑JSON (URL und Typ) ein.

KiloCode‑Konfigurations‑JSON

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "type": "streamable-http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

Beispiel‑Prompts in KiloCode

Extrahiere gesamten Text aus sample_invoice.pdf mit dem GroupDocs.Parser MCP‑Server und gib mir anschließend eine kurze Zusammenfassung des Rechnungsbetrags.

KiloCode führt dann aus:

  • sample_invoice.pdf in die GroupDocs‑Cloud hochladen.
  • Das MCP‑Tool parse/text aufrufen.
  • Die vom Modell generierte Zusammenfassung zurückgeben.

Extrahiere alle Bilder aus document.pdf, speichere sie im aktuellen Ordner im Unterordner “document_images” und lösche nach der Verarbeitung die Bilder aus dem GroupDocs.Cloud‑Speicher.

KiloCode wird:

  • document.pdf hochladen.
  • Das MCP‑Tool zum Bild‑Extrahieren aufrufen (parse/images).
  • Die extrahierten Bilder herunterladen und im Ordner document_images ablegen.
  • Die Bilder anschließend aus dem Cloud‑Speicher entfernen.

MCP mit Cursor verwenden

Im Cursor‑Panel Tools & MCP können Sie eigene MCP‑Server registrieren.

Einrichtung

  1. Öffnen Sie Cursor → Einstellungen → Tools & MCP.
  2. Klicken Sie auf Add Custom MCP.
  3. Fügen Sie im Abschnitt für die Datei mcp.json den folgenden JSON‑Abschnitt ein.

Cursor‑mcp.json‑Konfiguration

{
  "mcpServers": {
    "groupdocs-parser-mcp-local": {
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}

Beispiel‑Prompt für Cursor

Extrahiere Text aus Message.msg mit dem GroupDocs.Parser MCP und gib mir anschließend eine kurze Zusammenfassung der E‑Mail.

Cursor wird automatisch:

  • Die Datei in Ihren persönlichen GroupDocs.Cloud‑Speicher hochladen.
  • Den Text über den GroupDocs.Parser‑Cloud‑Dienst abrufen.
  • Das Ergebnis in die Chat‑Antwort einbetten.

MCP mit VS Code verwenden

VS Code unterstützt MCP‑Server. Im Folgenden zeigen wir, wie Sie den GroupDocs‑MCP‑Server einrichten und nutzen.

Konfigurationsschritte

  1. Legen Sie im Projektordner, falls noch nicht vorhanden, einen Ordner .vscode an.
  2. Erstellen Sie dort eine Datei mcp.json mit der Server‑Definition.

VS Code‑mcp.json‑Beispiel

{
  "servers": {
    "groupdocs-parser-mcp-local": {
      "type": "http",
      "url": "http://127.0.0.1:8000/mcp"
    }
  }
}
  1. VS Code neu laden (Ctrl+Shift+P → Developer: Reload Window).
  2. Öffnen Sie den Chat (Ctrl+Alt+I). Der Chat kann nun MCP‑Tools aufrufen, wenn Sie sie anfordern.

Beispiel‑Anfrage im Chat:

Parsiere die Invoice.pdf mit dem GroupDocs.Parser MCP und gib mir eine kurze Zusammenfassung der Rechnung.


Erweiterte Optionen

Server mit dem MCP‑Inspector testen

Der MCP‑Inspector ist ein leichtgewichtiges UI, das das Durchstöbern des Schemas und das interaktive Ausprobieren von Aufrufen ermöglicht.

# Inspector starten (Node.js erforderlich)
npx @modelcontextprotocol/inspector

Im Browser:

  1. Wählen Sie “streamable HTTP” als Verbindungstyp.
  2. Geben Sie Ihre Server‑URL ein: http://127.0.0.1:8000/mcp.
  3. Klicken Sie Connect und stöbern Sie durch die verfügbaren Methoden (z. B. parser_extract_text, parser_extract_barcodes).

Virtuelle Umgebung neu initialisieren

Falls Sie requirements.txt ändern oder Abhängigkeits‑Fehler erhalten, initialisieren Sie die Umgebung neu:

# Linux / macOS
./init_mcp.sh

# Windows PowerShell
.\init_mcp.ps1

# Windows CMD
init_mcp.bat

Das Skript wird:

  1. Das bestehende .venv‑Verzeichnis löschen.
  2. Eine neue, saubere virtuelle Umgebung erzeugen.
  3. Alle Pakete aus requirements.txt neu installieren.

Anschließend starten Sie den Server erneut:

# Linux / macOS
./run.sh

# Windows PowerShell
.\run.ps1

# Windows CMD
run.bat

Fazit

In diesem Beitrag haben wir behandelt:

  • Was MCP ist und warum es für KI‑basierte Werkzeuge bedeutsam ist.
  • GroupDocs.Parser Cloud MCP‑Server – ein leichter Vermittler, der Text‑, Bild‑ und Barcode‑Extraktion sowie vollständiges Speicher‑Management zu jedem MCP‑kompatiblen Client hinzufügt.
  • Schritt‑für‑Schritt‑Installation (Repository klonen, konfigurieren, starten).
  • Integration in gängige Umgebungen – KiloCode, Cursor und VS Code.
  • Erweiterte Diagnose mittels MCP‑Inspector und Neu‑Initialisierung der virtuellen Umgebung.

Mit dem MCP‑Server können Entwickler LLMs Dokumente genauso einfach wie Datenbanken oder APIs verarbeiten lassen, ohne aufwändige SDK‑Code‑Einbindungen. Das beschleunigt KI‑gestützte Dokumenten‑Workflows erheblich.


Siehe auch


Häufig gestellte Fragen (FAQ)

  • F: Warum ist der MCP‑Server Open‑Source und läuft lokal? Warum gibt es keinen öffentlich gehosteten MCP‑Server?
    A: Das Model Context Protocol (MCP) ist noch ein sehr neuer Standard und aktuelle LLMs sowie KI‑Assistenten bieten nur begrenzte oder unzuverlässige native Unterstützung für binäre Datenströme (PDFs, Bilder, Archive). Dokumenten‑Parsing, OCR, Bild‑Extraktion und Barcode‑Erkennung sind Spezialgebiete, in denen APIs wie GroupDocs.Parser Cloud glänzen. Der lokale MCP‑Server schließt diese Lücke auf zuverlässige und standardisierte Weise.

  • F: Muss ich zusätzliche Software installieren, um den MCP‑Server zu nutzen?
    A: Nein. Der Server läuft auf jedem OS, das Python 3.10+ unterstützt, und benötigt nur die Pakete aus requirements.txt.

  • F: Welche Dokumentformate werden unterstützt?
    A: Über 50 Formate, darunter PDF, DOCX, XLSX, PPTX, E‑Mails (.eml, .msg), Archive (ZIP, RAR) und gängige Bildtypen (PNG, JPG, TIFF).

  • F: Kann ich Barcodes aus gescannten PDFs extrahieren?
    A: Ja. Der MCP‑Server unterstützt den Endpunkt parse/barcodes, der 1D‑ und 2D‑Barcodes in Raster‑Bildern und PDFs erkennt.

  • F: Wie liste ich Dateien in einem bestimmten GroupDocs‑Cloud‑Ordner auf?
    A: Der MCP‑Server stellt GroupDocs.Cloud‑Speicher‑Endpunkte (storage/list, storage/upload, storage/download, storage/delete) bereit; diese werden in Chatsitzungen automatisch oder auf Anfrage verwendet.

  • F: Was ist zu tun, wenn ich den MCP‑Port nach dem Start ändere?
    A: Aktualisieren Sie den Wert MCP_PORT in der Datei .env und starten Sie den Server neu (run.sh / run.ps1).

  • F: Bekomme ich eine kostenlose Testphase?
    A: Ja, monatlich stehen Ihnen 150 kostenlose API‑Aufrufe zur Verfügung.