Agent-Vergleich – Claude vs. ChatGPT vs. Copilot
„AI-Coding-Agent" ist 2026 ein Sammelbegriff für sehr unterschiedliche Werkzeuge. Manche leben im Terminal, manche im Editor, manche im Messenger. Manche sind eng an einen Modell-Anbieter gekoppelt, andere sind agnostisch und fahren wahlweise Claude, GPT-5 oder ein lokales Modell. Dieser Guide gibt dir eine eindeutige Landkarte: welcher Agent kommt aus welchem Lager, was kann er, wann nimmst du ihn – und wann nicht.
1. Schnell-Entscheidungshilfe
| Du willst… | Nimm |
|---|---|
| Pair-Programming im Terminal, beste Reasoning-Qualität | Claude Code |
| Pair-Programming im Editor, native VS-Code-Integration | GitHub Copilot (Chat + Agent Mode) |
| OpenAI-Modelle im Terminal | Codex CLI |
| Schnellen Headless-Loop ohne UI, fire-and-forget | Open Ralph Wiggum |
| Persönlichen Allzweck-Agent mit Memory, Voice, Messengern | Hermes Agent |
| Selbst gehostetes Messaging-Gateway, Claude im WhatsApp/Telegram | OpenClaw |
| Editor-Agent mit Multi-File-Refactor | Cursor Agent |
| Open-Source-Agent, modell-agnostisch, lokale Modelle | OpenCode |
| Aufgaben in der Cloud, Branches/PRs ohne lokales Setup | OpenAI Codex Cloud / Copilot Coding Agent / Claude on Web |
2. Die drei Lager
┌─────────────────────────┬─────────────────────────┬─────────────────────────┐
│ ANTHROPIC │ OPENAI │ GITHUB │
│ (Claude) │ (ChatGPT) │ (Copilot) │
├─────────────────────────┼─────────────────────────┼─────────────────────────┤
│ Claude Code (CLI/IDE) │ Codex CLI │ Copilot (VS Code) │
│ Claude API + Agent SDK │ OpenAI Agents SDK │ Copilot CLI │
│ Claude Skills │ Custom GPTs │ Copilot Coding Agent │
│ Claude on the Web │ Codex Cloud │ Copilot Workspace │
│ MCP (Erfinder) │ Function Calling │ Copilot Extensions │
└─────────────────────────┴─────────────────────────┴─────────────────────────┘
Drittanbieter & Open Source – modell-agnostisch:
Cursor Agent · OpenCode · Hermes · OpenClaw · Open Ralph Wiggum · Aider · Continue
3. Anthropic / Claude – die Agents
Claude Code
Was es ist: Anthropics offizielle Coding-CLI, läuft im Terminal und in IDE-Plugins (VS Code, JetBrains).
| Modell | Claude Opus 4.7 (1M ctx), Sonnet 4.6, Haiku 4.5 |
| Schnittstelle | Terminal, VS-Code-Extension, JetBrains-Plugin, Web (claude.ai/code) |
| Tools | Read/Write/Edit, Bash, WebFetch, MCP-Client, Subagents, Skills |
| Stärken | Reasoning auf großen Codebases, sauberer Diff-Stil, Prompt-Caching, Skill-System |
| Schwächen | Eng an Anthropic gekoppelt; pro Token teurer als GPT-Tier-2 |
| Idealer Use-Case | Komplexe Refactors, Architektur-Migrationen, alles mit großem Kontext |
npm install -g @anthropic-ai/claude-code
claude # interaktiv
Claude Agent SDK
Was es ist: Programmatisches SDK, um eigene Agents auf Claude-Basis zu bauen – inklusive Tool-Calling, Memory und Subagent-Spawning.
- Sprachen: Python, TypeScript
- Verteilt MCP-Tools, Skills, Hooks und Subagents
- Wann nehmen? Wenn du eigene Agents in Produktion bringst, statt Claude Code „nur" zu nutzen.
Claude Skills
Wiederverwendbare Markdown-Module mit YAML-Frontmatter, die als prozedurale Memory wirken. Funktionieren in Claude Code und im Agent SDK.
MCP – Model Context Protocol
Von Anthropic erfundener offener Standard, mit dem Agents zu beliebigen Tool-Servern sprechen (Filesystem, GitHub, DBs, eigene Server). Inzwischen auch von OpenAI und anderen unterstützt – MCP ist 2025/2026 zum De-facto-Standard geworden.
4. OpenAI / ChatGPT – die Agents
Codex CLI
Was es ist: OpenAIs offizielle Coding-CLI – das Anthropic-Code-Pendant aus dem GPT-Lager.
| Modell | GPT-5, GPT-5-Codex, o-Serie (reasoning) |
| Schnittstelle | Terminal, VS-Code-Extension |
| Tools | Datei-Edit, Shell, Web, MCP-Client |
| Stärken | Schnell, günstig auf Mini-Tier, gute Test-First-Workflows |
| Schwächen | Kürzerer Default-Kontext als Claude Opus, weniger ausgereiftes Skill-System |
| Idealer Use-Case | Schnelle Iterationen, Test-getriebene Entwicklung, kostensensitiv |
npm install -g @openai/codex
codex
OpenAI Agents SDK
Pythons-/TypeScript-SDK für agentische Apps auf OpenAI-Basis. Function-Calling-zentrisch, gute Streaming-Story, integriert sich mit Assistants API und MCP.
Wann nehmen? Wenn du im OpenAI-Ökosystem bleibst (Embeddings, Vector Stores, RAG-Pipelines) und einen eigenen Agent baust.
Custom GPTs
Konfigurierbare GPT-Instanzen in der ChatGPT-UI mit Actions (HTTP-APIs) und Knowledge-Files. Kein Coding-Agent im engeren Sinn, aber für Domänen-Assistenten und interne Tools relevant.
Codex Cloud
OpenAIs Cloud-Coding-Service: Du gibst eine Aufgabe + Repo-URL, Codex Cloud öffnet einen PR. Pendant zum Copilot Coding Agent und zu Claude on the Web.
5. GitHub / Copilot – die Agents
GitHub Copilot (Editor)
Was es ist: Der Klassiker – inline Code-Completion + Chat in VS Code, JetBrains, Visual Studio, Vim/Neovim, Xcode.
| Modell | Wählbar: GPT-5, Claude Sonnet 4.6, Gemini, o-Serie |
| Schnittstelle | Editor-Inline + Chat-Panel + Agent Mode |
| Tools | Workspace-Index, Tests, Terminal (Agent Mode) |
| Stärken | Tiefste IDE-Integration, GitHub-/PR-Kontext native, Multi-Modell-Auswahl |
| Schwächen | Editor-zentriert, weniger gut für reine CLI-Workflows |
| Idealer Use-Case | Tägliches Coden im Editor, „im Flow" bleiben |
Copilot Agent Mode
Innerhalb von VS Code: Copilot übernimmt Multi-File-Edits, führt Tests aus, korrigiert sich selbst – ähnlich Cursor Agent. Modellauswahl frei (auch Claude!).
Copilot CLI
GitHub's offizieller Terminal-Agent, optimiert für Repo-Kontext und Git-/PR-Operationen.
gh extension install github/gh-copilot
gh copilot suggest "find files modified in last commit"
Copilot Coding Agent
Asynchroner Cloud-Agent: Du weist ihm ein Issue zu, er erstellt einen PR auf einer eigenen Branch, läuft CI und reagiert auf Review-Comments. Pendant zu Codex Cloud / Claude on the Web.
Copilot Extensions
Erweiterbarkeit: Drittanbieter (Sentry, Docker, Stripe etc.) bauen eigene Copilot-Skills. Ähnlich Custom GPTs, aber im Dev-Kontext.
6. Modell-agnostische Agents (Drittanbieter & Open Source)
Diese Tools sind nicht an einen Modell-Anbieter gebunden – du wählst, welches LLM darunter läuft.
Cursor Agent
| Was | Editor-First-Agent (Cursor IDE) mit headless-CLI (cursor-agent) |
| Modelle | Anthropic, OpenAI, eigene |
| Stärke | Multi-File-Refactor, Composer-Mode, sehr schnelle Apply-Loops |
| Use-Case | Editor-Heavy-User, die mehr als Copilot wollen |
OpenCode
| Was | Open-Source-Coding-CLI, aktiv entwickelt |
| Modelle | beliebig (Anthropic, OpenAI, OpenRouter, Ollama, lokale Modelle) |
| Stärke | Plugin-System, MCP, kostenlose Lizenz, lokal lauffähig |
| Use-Case | Privatsphäre/Self-Hosting, kostenbewusste Teams |
Aider
CLI-Pair-Programmer, der Git-zentriert arbeitet (jede Änderung = Commit). Modell-agnostisch, ältere und sehr stabile Lösung.
Continue
VS-Code-/JetBrains-Extension, Open Source, modell-agnostisch. Direkter Konkurrent zu Copilot mit der Freiheit, lokale Modelle anzubinden.
Hermes Agent
Allzweck-Agent mit Memory, Skills-Self-Authoring, Voice und 18+ Messaging-Channels. Self-improving: schreibt eigene Skills aus Erfahrung. Modell-agnostisch.
OpenClaw
Selbst-gehostetes Messaging-Gateway: bringt deinen Coding-Agent in WhatsApp, Telegram, Slack & Co. Multi-Agent, Sandboxing, AgentSkills-kompatibel.
Open Ralph Wiggum
Autonomer Loop-Runner: ruft Claude Code, Codex, Copilot CLI, Cursor oder OpenCode in Endlosschleife, bis das Akzeptanzkriterium erfüllt ist. Agent-Rotation für Modell-Vergleich.
7. Große Vergleichstabelle
| Tool | Lager | UI | Modelle | Self-Host | Best For |
|---|---|---|---|---|---|
| Claude Code | Anthropic | CLI / IDE / Web | Claude only | – | Reasoning-heavy Coding |
| Claude Agent SDK | Anthropic | Library | Claude only | – | Eigene Agents bauen |
| Codex CLI | OpenAI | CLI / IDE | GPT only | – | Schnelle TDD-Loops |
| OpenAI Agents SDK | OpenAI | Library | GPT only | – | Custom Agents im OpenAI-Stack |
| Codex Cloud | OpenAI | Web / GitHub | GPT only | – | Async Cloud-Coding |
| Copilot (Editor) | GitHub | IDE | Multi (GPT/Claude/Gemini) | – | Daily Coding im Editor |
| Copilot Agent Mode | GitHub | IDE | Multi | – | Multi-File-Tasks im Editor |
| Copilot CLI | GitHub | CLI | Multi | – | Git/Repo-Operationen |
| Copilot Coding Agent | GitHub | GitHub.com | Multi | – | Async PR-Bot |
| Cursor Agent | Drittanbieter | IDE / CLI | Multi | – | Editor-Heavy-Refactors |
| OpenCode | OSS | CLI | beliebig | ✅ | Privacy / Lokal |
| Aider | OSS | CLI | beliebig | ✅ | Git-First Pair-Coding |
| Continue | OSS | IDE | beliebig | ✅ | Copilot-Alternative |
| Hermes | OSS | TUI / Messenger | beliebig | ✅ | Persönlicher Allzweck-Agent |
| OpenClaw | OSS | Messenger / Web | beliebig | ✅ | Messaging-Gateway |
| Open Ralph Wiggum | OSS | CLI | beliebig (5 Agents) | ✅ | Autonome Loops |
8. Feature-Matrix
| Feature | Claude Code | Codex CLI | Copilot | Cursor | OpenCode | Hermes | OpenClaw | Ralph |
|---|---|---|---|---|---|---|---|---|
| Inline-Edit im Editor | ⚪ | ⚪ | ✅ | ✅ | ⚪ | ⚪ | ⚪ | ⚪ |
| Terminal-Modus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ⚪ | ✅ |
| Multi-File Refactor | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Subagents | ✅ | ⚪ | ⚪ | ⚪ | ⚪ | ✅ | ✅ | ⚪ |
| MCP-Client | ✅ | ✅ | ⚪ | ⚪ | ✅ | ✅ | ✅ | ⚪ |
| Skills / Procedural Memory | ✅ | ⚪ | ⚪ | ⚪ | ⚪ | ✅ | ✅ | ⚪ |
| Cross-Session-Memory | ✅ | ⚪ | ⚪ | ⚪ | ⚪ | ✅ | ✅ | ⚪ |
| Voice-Mode | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ✅ | ⚪ | ⚪ |
| Messenger-Integration | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ✅ | ✅ | ⚪ |
| Cloud-Async-Modus | ✅ | ✅ | ✅ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ |
| Sandboxing | tlw. | tlw. | ⚪ | ⚪ | tlw. | ✅ | ✅ | ⚪ |
| Modell-Auswahl | ⚪ | ⚪ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Agent-Rotation | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ✅ |
| Self-Hosting | ⚪ | ⚪ | ⚪ | ⚪ | ✅ | ✅ | ✅ | ✅ |
| Self-Improvement (Skills) | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ✅ | ⚪ | ⚪ |
9. Use-Case-Empfehlungen
„Ich bin Solo-Dev und will einfach loslegen."
→ Copilot im Editor (vertraut) oder Claude Code im Terminal (mehr Power). Beides kann parallel laufen.
„Ich arbeite an einer großen, komplexen Codebase."
→ Claude Code mit Opus 4.7 (1M Kontext) – nichts anderes spielt in dieser Klasse. Ergänzend Cursor Agent für tatsächliche Multi-File-Apply-Schleifen im Editor.
„Ich hasse manuelles Klicken, Loops müssen autonom laufen."
→ Open Ralph Wiggum – schreib Akzeptanzkriterien als Tests, lass Ralph laufen, geh Mittagessen.
„Privatsphäre ist Pflicht, alles lokal."
→ OpenCode + Ollama/vLLM. Kein Code verlässt die Maschine. Optional Hermes als Wrapper für Memory/Skills.
„Ich will einen persönlichen Agent, der mich überall begleitet."
→ Hermes mit Telegram-/Discord-Gateway, optional Voice-Mode.
„Ich will Coding-Agents im Team-Chat (WhatsApp/Slack)."
→ OpenClaw – Self-Hosted Gateway, Multi-Agent, Pairing-Allowlists.
„Async Cloud-Workflows, der Bot soll PRs aufmachen."
→ Copilot Coding Agent (GitHub-native) oder Codex Cloud (OpenAI-native) oder Claude on the Web (Anthropic-native).
„Ich will Modelle direkt vergleichen können."
→ Open Ralph Wiggum mit --rotation, oder Copilot Agent Mode mit Modell-Switcher, oder Cursor mit Modell-Auswahl pro Request.
10. Kosten – grobe Orientierung
Stand 2026-05. Verifiziere immer auf den Hersteller-Seiten.
| Tier | Tools | Idee |
|---|---|---|
| Pro-Abo (~$20/Monat) | ChatGPT Plus, Claude Pro, Copilot Individual | Editor-Plugins + Web-UI, „all you can eat" mit Throttling |
| Pro Max / Team (~$100–200/Monat) | Claude Max, ChatGPT Pro, Copilot Business | Höhere Kontingente, Team-Features |
| API pro Token | Claude API, OpenAI API, OpenRouter | Pay-as-you-go, ideal für Agents im Dauerlauf |
| Self-Hosted lokal | Ollama, vLLM + OpenCode/Aider | Hardware-Kosten, dafür kein Token-Preis |
Faustregel: Für aktiven Editor-Gebrauch lohnt sich ein Abo, für Loops/Agents im Hintergrund (Ralph, Hermes) wird API-pro-Token schnell teurer als ein Pro-Abo, ist aber transparenter.
11. Sicherheits-Checkliste (übergreifend)
- Niemals API-Keys in Prompts oder committeten Configs ablegen →
.env+.gitignore - Sensible Repos in einer VM/Container klonen, bevor du Auto-Approve einschaltest
- Auto-Commit kontrollieren –
git log --onelineregelmäßig prüfen - MCP-Server sind unvertrauter Code – sie sehen Files und Tool-Outputs
- Drittanbieter-Skills/Plugins vor Aktivierung lesen
- Messaging-Gateways mit Pairing-Allowlists schützen (OpenClaw, Hermes)
- Cloud-Agents (Copilot Coding Agent, Codex Cloud) haben Repo-Schreibrechte – PR-Reviews ernst nehmen
- Prompt-Injection ist real: eingehende Daten (Tickets, Mails, Issues) können den Agent kapern
12. So kombiniere ich sie (Beispiel-Stack)
Ein praktikabler Setup für eine 1-Person-Dev:
┌─────────────────────────────────────────────────────────────────┐
│ Editor (VS Code) │
│ └─ GitHub Copilot für Inline-Completion │
│ └─ Claude Code Extension für Reasoning-heavy Tasks │
├─────────────────────────────────────────────────────────────────┤
│ Terminal │
│ └─ Claude Code CLI für Architektur, große Diffs │
│ └─ Codex CLI für schnelle Mini-Tasks │
│ └─ Open Ralph Wiggum für autonome PRD-Umsetzung │
├─────────────────────────────────────────────────────────────────┤
│ Persönlicher Layer │
│ └─ Hermes (Telegram-Bot) Memory, Erinnerungen, Voice │
├─────────────────────────────────────────────────────────────────┤
│ Cloud (async) │
│ └─ Copilot Coding Agent für Issue-zu-PR-Tasks │
└─────────────────────────────────────────────────────────────────┘
→ Wenn du Hermes und OpenClaw parallel betreibst, lies vorher den Guide OpenClaw + Hermes parallel betreiben – sonst klauen sich die Bots gegenseitig die Telegram-Updates.
13. Weiterführend
Anthropic / Claude
OpenAI / ChatGPT
GitHub / Copilot
Drittanbieter / OSS
„Pick the smallest agent that fits your loop. Stack only when each layer earns its keep."