Agent-Vergleich – Claude vs. ChatGPT vs. Copilot

Worum geht's?

„AI-Coding-Agent" ist 2026 ein Sammelbegriff für sehr unterschiedliche Werkzeuge. Manche leben im Terminal, manche im Editor, manche im Messenger. Manche sind eng an einen Modell-Anbieter gekoppelt, andere sind agnostisch und fahren wahlweise Claude, GPT-5 oder ein lokales Modell. Dieser Guide gibt dir eine eindeutige Landkarte: welcher Agent kommt aus welchem Lager, was kann er, wann nimmst du ihn – und wann nicht.

1. Schnell-Entscheidungshilfe

Du willst…	Nimm
Pair-Programming im Terminal, beste Reasoning-Qualität	Claude Code
Pair-Programming im Editor, native VS-Code-Integration	GitHub Copilot (Chat + Agent Mode)
OpenAI-Modelle im Terminal	Codex CLI
Schnellen Headless-Loop ohne UI, fire-and-forget	Open Ralph Wiggum
Persönlichen Allzweck-Agent mit Memory, Voice, Messengern	Hermes Agent
Selbst gehostetes Messaging-Gateway, Claude im WhatsApp/Telegram	OpenClaw
Editor-Agent mit Multi-File-Refactor	Cursor Agent
Open-Source-Agent, modell-agnostisch, lokale Modelle	OpenCode
Aufgaben in der Cloud, Branches/PRs ohne lokales Setup	OpenAI Codex Cloud / Copilot Coding Agent / Claude on Web

2. Die drei Lager

┌─────────────────────────┬─────────────────────────┬─────────────────────────┐
│      ANTHROPIC          │        OPENAI           │        GITHUB           │
│      (Claude)           │       (ChatGPT)         │       (Copilot)         │
├─────────────────────────┼─────────────────────────┼─────────────────────────┤
│ Claude Code (CLI/IDE)   │ Codex CLI               │ Copilot (VS Code)       │
│ Claude API + Agent SDK  │ OpenAI Agents SDK       │ Copilot CLI             │
│ Claude Skills           │ Custom GPTs             │ Copilot Coding Agent    │
│ Claude on the Web       │ Codex Cloud             │ Copilot Workspace       │
│ MCP (Erfinder)          │ Function Calling        │ Copilot Extensions      │
└─────────────────────────┴─────────────────────────┴─────────────────────────┘

Drittanbieter & Open Source – modell-agnostisch:
  Cursor Agent · OpenCode · Hermes · OpenClaw · Open Ralph Wiggum · Aider · Continue

3. Anthropic / Claude – die Agents

Claude Code

Was es ist: Anthropics offizielle Coding-CLI, läuft im Terminal und in IDE-Plugins (VS Code, JetBrains).


Modell	Claude Opus 4.7 (1M ctx), Sonnet 4.6, Haiku 4.5
Schnittstelle	Terminal, VS-Code-Extension, JetBrains-Plugin, Web (claude.ai/code)
Tools	Read/Write/Edit, Bash, WebFetch, MCP-Client, Subagents, Skills
Stärken	Reasoning auf großen Codebases, sauberer Diff-Stil, Prompt-Caching, Skill-System
Schwächen	Eng an Anthropic gekoppelt; pro Token teurer als GPT-Tier-2
Idealer Use-Case	Komplexe Refactors, Architektur-Migrationen, alles mit großem Kontext

npm install -g @anthropic-ai/claude-code
claude   # interaktiv

Claude Agent SDK

Was es ist: Programmatisches SDK, um eigene Agents auf Claude-Basis zu bauen – inklusive Tool-Calling, Memory und Subagent-Spawning.

Sprachen: Python, TypeScript
Verteilt MCP-Tools, Skills, Hooks und Subagents
Wann nehmen? Wenn du eigene Agents in Produktion bringst, statt Claude Code „nur" zu nutzen.

Claude Skills

Wiederverwendbare Markdown-Module mit YAML-Frontmatter, die als prozedurale Memory wirken. Funktionieren in Claude Code und im Agent SDK.

MCP – Model Context Protocol

Von Anthropic erfundener offener Standard, mit dem Agents zu beliebigen Tool-Servern sprechen (Filesystem, GitHub, DBs, eigene Server). Inzwischen auch von OpenAI und anderen unterstützt – MCP ist 2025/2026 zum De-facto-Standard geworden.

4. OpenAI / ChatGPT – die Agents

Codex CLI

Was es ist: OpenAIs offizielle Coding-CLI – das Anthropic-Code-Pendant aus dem GPT-Lager.


Modell	GPT-5, GPT-5-Codex, o-Serie (reasoning)
Schnittstelle	Terminal, VS-Code-Extension
Tools	Datei-Edit, Shell, Web, MCP-Client
Stärken	Schnell, günstig auf Mini-Tier, gute Test-First-Workflows
Schwächen	Kürzerer Default-Kontext als Claude Opus, weniger ausgereiftes Skill-System
Idealer Use-Case	Schnelle Iterationen, Test-getriebene Entwicklung, kostensensitiv

npm install -g @openai/codex
codex

OpenAI Agents SDK

Pythons-/TypeScript-SDK für agentische Apps auf OpenAI-Basis. Function-Calling-zentrisch, gute Streaming-Story, integriert sich mit Assistants API und MCP.

Wann nehmen? Wenn du im OpenAI-Ökosystem bleibst (Embeddings, Vector Stores, RAG-Pipelines) und einen eigenen Agent baust.

Custom GPTs

Konfigurierbare GPT-Instanzen in der ChatGPT-UI mit Actions (HTTP-APIs) und Knowledge-Files. Kein Coding-Agent im engeren Sinn, aber für Domänen-Assistenten und interne Tools relevant.

Codex Cloud

OpenAIs Cloud-Coding-Service: Du gibst eine Aufgabe + Repo-URL, Codex Cloud öffnet einen PR. Pendant zum Copilot Coding Agent und zu Claude on the Web.

5. GitHub / Copilot – die Agents

GitHub Copilot (Editor)

Was es ist: Der Klassiker – inline Code-Completion + Chat in VS Code, JetBrains, Visual Studio, Vim/Neovim, Xcode.


Modell	Wählbar: GPT-5, Claude Sonnet 4.6, Gemini, o-Serie
Schnittstelle	Editor-Inline + Chat-Panel + Agent Mode
Tools	Workspace-Index, Tests, Terminal (Agent Mode)
Stärken	Tiefste IDE-Integration, GitHub-/PR-Kontext native, Multi-Modell-Auswahl
Schwächen	Editor-zentriert, weniger gut für reine CLI-Workflows
Idealer Use-Case	Tägliches Coden im Editor, „im Flow" bleiben

Copilot Agent Mode

Innerhalb von VS Code: Copilot übernimmt Multi-File-Edits, führt Tests aus, korrigiert sich selbst – ähnlich Cursor Agent. Modellauswahl frei (auch Claude!).

Copilot CLI

GitHub's offizieller Terminal-Agent, optimiert für Repo-Kontext und Git-/PR-Operationen.

gh extension install github/gh-copilot
gh copilot suggest "find files modified in last commit"

Copilot Coding Agent

Asynchroner Cloud-Agent: Du weist ihm ein Issue zu, er erstellt einen PR auf einer eigenen Branch, läuft CI und reagiert auf Review-Comments. Pendant zu Codex Cloud / Claude on the Web.

Copilot Extensions

Erweiterbarkeit: Drittanbieter (Sentry, Docker, Stripe etc.) bauen eigene Copilot-Skills. Ähnlich Custom GPTs, aber im Dev-Kontext.

6. Modell-agnostische Agents (Drittanbieter & Open Source)

Diese Tools sind nicht an einen Modell-Anbieter gebunden – du wählst, welches LLM darunter läuft.

Cursor Agent


Was	Editor-First-Agent (Cursor IDE) mit headless-CLI (`cursor-agent`)
Modelle	Anthropic, OpenAI, eigene
Stärke	Multi-File-Refactor, Composer-Mode, sehr schnelle Apply-Loops
Use-Case	Editor-Heavy-User, die mehr als Copilot wollen

OpenCode


Was	Open-Source-Coding-CLI, aktiv entwickelt
Modelle	beliebig (Anthropic, OpenAI, OpenRouter, Ollama, lokale Modelle)
Stärke	Plugin-System, MCP, kostenlose Lizenz, lokal lauffähig
Use-Case	Privatsphäre/Self-Hosting, kostenbewusste Teams

Aider

CLI-Pair-Programmer, der Git-zentriert arbeitet (jede Änderung = Commit). Modell-agnostisch, ältere und sehr stabile Lösung.

Continue

VS-Code-/JetBrains-Extension, Open Source, modell-agnostisch. Direkter Konkurrent zu Copilot mit der Freiheit, lokale Modelle anzubinden.

Hermes Agent

Allzweck-Agent mit Memory, Skills-Self-Authoring, Voice und 18+ Messaging-Channels. Self-improving: schreibt eigene Skills aus Erfahrung. Modell-agnostisch.

OpenClaw

Selbst-gehostetes Messaging-Gateway: bringt deinen Coding-Agent in WhatsApp, Telegram, Slack & Co. Multi-Agent, Sandboxing, AgentSkills-kompatibel.

Open Ralph Wiggum

Autonomer Loop-Runner: ruft Claude Code, Codex, Copilot CLI, Cursor oder OpenCode in Endlosschleife, bis das Akzeptanzkriterium erfüllt ist. Agent-Rotation für Modell-Vergleich.

7. Große Vergleichstabelle

Tool	Lager	UI	Modelle	Self-Host	Best For
Claude Code	Anthropic	CLI / IDE / Web	Claude only	–	Reasoning-heavy Coding
Claude Agent SDK	Anthropic	Library	Claude only	–	Eigene Agents bauen
Codex CLI	OpenAI	CLI / IDE	GPT only	–	Schnelle TDD-Loops
OpenAI Agents SDK	OpenAI	Library	GPT only	–	Custom Agents im OpenAI-Stack
Codex Cloud	OpenAI	Web / GitHub	GPT only	–	Async Cloud-Coding
Copilot (Editor)	GitHub	IDE	Multi (GPT/Claude/Gemini)	–	Daily Coding im Editor
Copilot Agent Mode	GitHub	IDE	Multi	–	Multi-File-Tasks im Editor
Copilot CLI	GitHub	CLI	Multi	–	Git/Repo-Operationen
Copilot Coding Agent	GitHub	GitHub.com	Multi	–	Async PR-Bot
Cursor Agent	Drittanbieter	IDE / CLI	Multi	–	Editor-Heavy-Refactors
OpenCode	OSS	CLI	beliebig	✅	Privacy / Lokal
Aider	OSS	CLI	beliebig	✅	Git-First Pair-Coding
Continue	OSS	IDE	beliebig	✅	Copilot-Alternative
Hermes	OSS	TUI / Messenger	beliebig	✅	Persönlicher Allzweck-Agent
OpenClaw	OSS	Messenger / Web	beliebig	✅	Messaging-Gateway
Open Ralph Wiggum	OSS	CLI	beliebig (5 Agents)	✅	Autonome Loops

8. Feature-Matrix

Feature	Claude Code	Codex CLI	Copilot	Cursor	OpenCode	Hermes	OpenClaw	Ralph
Inline-Edit im Editor	⚪	⚪	✅	✅	⚪	⚪	⚪	⚪
Terminal-Modus	✅	✅	✅	✅	✅	✅	⚪	✅
Multi-File Refactor	✅	✅	✅	✅	✅	✅	✅	✅
Subagents	✅	⚪	⚪	⚪	⚪	✅	✅	⚪
MCP-Client	✅	✅	⚪	⚪	✅	✅	✅	⚪
Skills / Procedural Memory	✅	⚪	⚪	⚪	⚪	✅	✅	⚪
Cross-Session-Memory	✅	⚪	⚪	⚪	⚪	✅	✅	⚪
Voice-Mode	⚪	⚪	⚪	⚪	⚪	✅	⚪	⚪
Messenger-Integration	⚪	⚪	⚪	⚪	⚪	✅	✅	⚪
Cloud-Async-Modus	✅	✅	✅	⚪	⚪	⚪	⚪	⚪
Sandboxing	tlw.	tlw.	⚪	⚪	tlw.	✅	✅	⚪
Modell-Auswahl	⚪	⚪	✅	✅	✅	✅	✅	✅
Agent-Rotation	⚪	⚪	⚪	⚪	⚪	⚪	⚪	✅
Self-Hosting	⚪	⚪	⚪	⚪	✅	✅	✅	✅
Self-Improvement (Skills)	⚪	⚪	⚪	⚪	⚪	✅	⚪	⚪

9. Use-Case-Empfehlungen

„Ich bin Solo-Dev und will einfach loslegen."

→ Copilot im Editor (vertraut) oder Claude Code im Terminal (mehr Power). Beides kann parallel laufen.

„Ich arbeite an einer großen, komplexen Codebase."

→ Claude Code mit Opus 4.7 (1M Kontext) – nichts anderes spielt in dieser Klasse. Ergänzend Cursor Agent für tatsächliche Multi-File-Apply-Schleifen im Editor.

„Ich hasse manuelles Klicken, Loops müssen autonom laufen."

→ Open Ralph Wiggum – schreib Akzeptanzkriterien als Tests, lass Ralph laufen, geh Mittagessen.

„Privatsphäre ist Pflicht, alles lokal."

→ OpenCode + Ollama/vLLM. Kein Code verlässt die Maschine. Optional Hermes als Wrapper für Memory/Skills.

„Ich will einen persönlichen Agent, der mich überall begleitet."

→ Hermes mit Telegram-/Discord-Gateway, optional Voice-Mode.

„Ich will Coding-Agents im Team-Chat (WhatsApp/Slack)."

→ OpenClaw – Self-Hosted Gateway, Multi-Agent, Pairing-Allowlists.

„Async Cloud-Workflows, der Bot soll PRs aufmachen."

→ Copilot Coding Agent (GitHub-native) oder Codex Cloud (OpenAI-native) oder Claude on the Web (Anthropic-native).

„Ich will Modelle direkt vergleichen können."

→ Open Ralph Wiggum mit --rotation, oder Copilot Agent Mode mit Modell-Switcher, oder Cursor mit Modell-Auswahl pro Request.

10. Kosten – grobe Orientierung

Preise ändern sich ständig

Stand 2026-05. Verifiziere immer auf den Hersteller-Seiten.

Tier	Tools	Idee
Pro-Abo (~$20/Monat)	ChatGPT Plus, Claude Pro, Copilot Individual	Editor-Plugins + Web-UI, „all you can eat" mit Throttling
Pro Max / Team (~$100–200/Monat)	Claude Max, ChatGPT Pro, Copilot Business	Höhere Kontingente, Team-Features
API pro Token	Claude API, OpenAI API, OpenRouter	Pay-as-you-go, ideal für Agents im Dauerlauf
Self-Hosted lokal	Ollama, vLLM + OpenCode/Aider	Hardware-Kosten, dafür kein Token-Preis

Faustregel: Für aktiven Editor-Gebrauch lohnt sich ein Abo, für Loops/Agents im Hintergrund (Ralph, Hermes) wird API-pro-Token schnell teurer als ein Pro-Abo, ist aber transparenter.

11. Sicherheits-Checkliste (übergreifend)

Diese Punkte gelten für ALLE Coding-Agents

Niemals API-Keys in Prompts oder committeten Configs ablegen → .env + .gitignore
Sensible Repos in einer VM/Container klonen, bevor du Auto-Approve einschaltest
Auto-Commit kontrollieren – git log --oneline regelmäßig prüfen
MCP-Server sind unvertrauter Code – sie sehen Files und Tool-Outputs
Drittanbieter-Skills/Plugins vor Aktivierung lesen
Messaging-Gateways mit Pairing-Allowlists schützen (OpenClaw, Hermes)
Cloud-Agents (Copilot Coding Agent, Codex Cloud) haben Repo-Schreibrechte – PR-Reviews ernst nehmen
Prompt-Injection ist real: eingehende Daten (Tickets, Mails, Issues) können den Agent kapern

12. So kombiniere ich sie (Beispiel-Stack)

Ein praktikabler Setup für eine 1-Person-Dev:

┌─────────────────────────────────────────────────────────────────┐
│ Editor (VS Code)                                                │
│   └─ GitHub Copilot           für Inline-Completion             │
│   └─ Claude Code Extension    für Reasoning-heavy Tasks         │
├─────────────────────────────────────────────────────────────────┤
│ Terminal                                                        │
│   └─ Claude Code CLI          für Architektur, große Diffs      │
│   └─ Codex CLI                für schnelle Mini-Tasks           │
│   └─ Open Ralph Wiggum        für autonome PRD-Umsetzung        │
├─────────────────────────────────────────────────────────────────┤
│ Persönlicher Layer                                              │
│   └─ Hermes (Telegram-Bot)    Memory, Erinnerungen, Voice       │
├─────────────────────────────────────────────────────────────────┤
│ Cloud (async)                                                   │
│   └─ Copilot Coding Agent     für Issue-zu-PR-Tasks             │
└─────────────────────────────────────────────────────────────────┘

→ Wenn du Hermes und OpenClaw parallel betreibst, lies vorher den Guide OpenClaw + Hermes parallel betreiben – sonst klauen sich die Bots gegenseitig die Telegram-Updates.

13. Weiterführend

Anthropic / Claude

OpenAI / ChatGPT

GitHub / Copilot

Drittanbieter / OSS

Quote

„Pick the smallest agent that fits your loop. Stack only when each layer earns its keep."

1. Schnell-Entscheidungshilfe​

2. Die drei Lager​

3. Anthropic / Claude – die Agents​

Claude Code​

Claude Agent SDK​

Claude Skills​

MCP – Model Context Protocol​

4. OpenAI / ChatGPT – die Agents​

Codex CLI​

OpenAI Agents SDK​

Custom GPTs​

Codex Cloud​

5. GitHub / Copilot – die Agents​

GitHub Copilot (Editor)​

Copilot Agent Mode​

Copilot CLI​

Copilot Coding Agent​

Copilot Extensions​

6. Modell-agnostische Agents (Drittanbieter & Open Source)​

Cursor Agent​

OpenCode​

Aider​

Continue​

Hermes Agent​

OpenClaw​

Open Ralph Wiggum​

7. Große Vergleichstabelle​

8. Feature-Matrix​

9. Use-Case-Empfehlungen​

„Ich bin Solo-Dev und will einfach loslegen."​

„Ich arbeite an einer großen, komplexen Codebase."​

„Ich hasse manuelles Klicken, Loops müssen autonom laufen."​

„Privatsphäre ist Pflicht, alles lokal."​

„Ich will einen persönlichen Agent, der mich überall begleitet."​

„Ich will Coding-Agents im Team-Chat (WhatsApp/Slack)."​

„Async Cloud-Workflows, der Bot soll PRs aufmachen."​

„Ich will Modelle direkt vergleichen können."​

10. Kosten – grobe Orientierung​

11. Sicherheits-Checkliste (übergreifend)​

12. So kombiniere ich sie (Beispiel-Stack)​

13. Weiterführend​