Zum Hauptinhalt springen

Agent-Vergleich – Claude vs. ChatGPT vs. Copilot

Worum geht's?

„AI-Coding-Agent" ist 2026 ein Sammelbegriff für sehr unterschiedliche Werkzeuge. Manche leben im Terminal, manche im Editor, manche im Messenger. Manche sind eng an einen Modell-Anbieter gekoppelt, andere sind agnostisch und fahren wahlweise Claude, GPT-5 oder ein lokales Modell. Dieser Guide gibt dir eine eindeutige Landkarte: welcher Agent kommt aus welchem Lager, was kann er, wann nimmst du ihn – und wann nicht.

1. Schnell-Entscheidungshilfe

Du willst…Nimm
Pair-Programming im Terminal, beste Reasoning-QualitätClaude Code
Pair-Programming im Editor, native VS-Code-IntegrationGitHub Copilot (Chat + Agent Mode)
OpenAI-Modelle im TerminalCodex CLI
Schnellen Headless-Loop ohne UI, fire-and-forgetOpen Ralph Wiggum
Persönlichen Allzweck-Agent mit Memory, Voice, MessengernHermes Agent
Selbst gehostetes Messaging-Gateway, Claude im WhatsApp/TelegramOpenClaw
Editor-Agent mit Multi-File-RefactorCursor Agent
Open-Source-Agent, modell-agnostisch, lokale ModelleOpenCode
Aufgaben in der Cloud, Branches/PRs ohne lokales SetupOpenAI Codex Cloud / Copilot Coding Agent / Claude on Web

2. Die drei Lager

┌─────────────────────────┬─────────────────────────┬─────────────────────────┐
│ ANTHROPIC │ OPENAI │ GITHUB │
│ (Claude) │ (ChatGPT) │ (Copilot) │
├─────────────────────────┼─────────────────────────┼─────────────────────────┤
│ Claude Code (CLI/IDE) │ Codex CLI │ Copilot (VS Code) │
│ Claude API + Agent SDK │ OpenAI Agents SDK │ Copilot CLI │
│ Claude Skills │ Custom GPTs │ Copilot Coding Agent │
│ Claude on the Web │ Codex Cloud │ Copilot Workspace │
│ MCP (Erfinder) │ Function Calling │ Copilot Extensions │
└─────────────────────────┴─────────────────────────┴─────────────────────────┘

Drittanbieter & Open Source – modell-agnostisch:
Cursor Agent · OpenCode · Hermes · OpenClaw · Open Ralph Wiggum · Aider · Continue

3. Anthropic / Claude – die Agents

Claude Code

Was es ist: Anthropics offizielle Coding-CLI, läuft im Terminal und in IDE-Plugins (VS Code, JetBrains).

ModellClaude Opus 4.7 (1M ctx), Sonnet 4.6, Haiku 4.5
SchnittstelleTerminal, VS-Code-Extension, JetBrains-Plugin, Web (claude.ai/code)
ToolsRead/Write/Edit, Bash, WebFetch, MCP-Client, Subagents, Skills
StärkenReasoning auf großen Codebases, sauberer Diff-Stil, Prompt-Caching, Skill-System
SchwächenEng an Anthropic gekoppelt; pro Token teurer als GPT-Tier-2
Idealer Use-CaseKomplexe Refactors, Architektur-Migrationen, alles mit großem Kontext
npm install -g @anthropic-ai/claude-code
claude # interaktiv

Claude Agent SDK

Was es ist: Programmatisches SDK, um eigene Agents auf Claude-Basis zu bauen – inklusive Tool-Calling, Memory und Subagent-Spawning.

  • Sprachen: Python, TypeScript
  • Verteilt MCP-Tools, Skills, Hooks und Subagents
  • Wann nehmen? Wenn du eigene Agents in Produktion bringst, statt Claude Code „nur" zu nutzen.

Claude Skills

Wiederverwendbare Markdown-Module mit YAML-Frontmatter, die als prozedurale Memory wirken. Funktionieren in Claude Code und im Agent SDK.

MCP – Model Context Protocol

Von Anthropic erfundener offener Standard, mit dem Agents zu beliebigen Tool-Servern sprechen (Filesystem, GitHub, DBs, eigene Server). Inzwischen auch von OpenAI und anderen unterstützt – MCP ist 2025/2026 zum De-facto-Standard geworden.


4. OpenAI / ChatGPT – die Agents

Codex CLI

Was es ist: OpenAIs offizielle Coding-CLI – das Anthropic-Code-Pendant aus dem GPT-Lager.

ModellGPT-5, GPT-5-Codex, o-Serie (reasoning)
SchnittstelleTerminal, VS-Code-Extension
ToolsDatei-Edit, Shell, Web, MCP-Client
StärkenSchnell, günstig auf Mini-Tier, gute Test-First-Workflows
SchwächenKürzerer Default-Kontext als Claude Opus, weniger ausgereiftes Skill-System
Idealer Use-CaseSchnelle Iterationen, Test-getriebene Entwicklung, kostensensitiv
npm install -g @openai/codex
codex

OpenAI Agents SDK

Pythons-/TypeScript-SDK für agentische Apps auf OpenAI-Basis. Function-Calling-zentrisch, gute Streaming-Story, integriert sich mit Assistants API und MCP.

Wann nehmen? Wenn du im OpenAI-Ökosystem bleibst (Embeddings, Vector Stores, RAG-Pipelines) und einen eigenen Agent baust.

Custom GPTs

Konfigurierbare GPT-Instanzen in der ChatGPT-UI mit Actions (HTTP-APIs) und Knowledge-Files. Kein Coding-Agent im engeren Sinn, aber für Domänen-Assistenten und interne Tools relevant.

Codex Cloud

OpenAIs Cloud-Coding-Service: Du gibst eine Aufgabe + Repo-URL, Codex Cloud öffnet einen PR. Pendant zum Copilot Coding Agent und zu Claude on the Web.


5. GitHub / Copilot – die Agents

GitHub Copilot (Editor)

Was es ist: Der Klassiker – inline Code-Completion + Chat in VS Code, JetBrains, Visual Studio, Vim/Neovim, Xcode.

ModellWählbar: GPT-5, Claude Sonnet 4.6, Gemini, o-Serie
SchnittstelleEditor-Inline + Chat-Panel + Agent Mode
ToolsWorkspace-Index, Tests, Terminal (Agent Mode)
StärkenTiefste IDE-Integration, GitHub-/PR-Kontext native, Multi-Modell-Auswahl
SchwächenEditor-zentriert, weniger gut für reine CLI-Workflows
Idealer Use-CaseTägliches Coden im Editor, „im Flow" bleiben

Copilot Agent Mode

Innerhalb von VS Code: Copilot übernimmt Multi-File-Edits, führt Tests aus, korrigiert sich selbst – ähnlich Cursor Agent. Modellauswahl frei (auch Claude!).

Copilot CLI

GitHub's offizieller Terminal-Agent, optimiert für Repo-Kontext und Git-/PR-Operationen.

gh extension install github/gh-copilot
gh copilot suggest "find files modified in last commit"

Copilot Coding Agent

Asynchroner Cloud-Agent: Du weist ihm ein Issue zu, er erstellt einen PR auf einer eigenen Branch, läuft CI und reagiert auf Review-Comments. Pendant zu Codex Cloud / Claude on the Web.

Copilot Extensions

Erweiterbarkeit: Drittanbieter (Sentry, Docker, Stripe etc.) bauen eigene Copilot-Skills. Ähnlich Custom GPTs, aber im Dev-Kontext.


6. Modell-agnostische Agents (Drittanbieter & Open Source)

Diese Tools sind nicht an einen Modell-Anbieter gebunden – du wählst, welches LLM darunter läuft.

Cursor Agent

WasEditor-First-Agent (Cursor IDE) mit headless-CLI (cursor-agent)
ModelleAnthropic, OpenAI, eigene
StärkeMulti-File-Refactor, Composer-Mode, sehr schnelle Apply-Loops
Use-CaseEditor-Heavy-User, die mehr als Copilot wollen

OpenCode

WasOpen-Source-Coding-CLI, aktiv entwickelt
Modellebeliebig (Anthropic, OpenAI, OpenRouter, Ollama, lokale Modelle)
StärkePlugin-System, MCP, kostenlose Lizenz, lokal lauffähig
Use-CasePrivatsphäre/Self-Hosting, kostenbewusste Teams

Aider

CLI-Pair-Programmer, der Git-zentriert arbeitet (jede Änderung = Commit). Modell-agnostisch, ältere und sehr stabile Lösung.

Continue

VS-Code-/JetBrains-Extension, Open Source, modell-agnostisch. Direkter Konkurrent zu Copilot mit der Freiheit, lokale Modelle anzubinden.

Hermes Agent

Allzweck-Agent mit Memory, Skills-Self-Authoring, Voice und 18+ Messaging-Channels. Self-improving: schreibt eigene Skills aus Erfahrung. Modell-agnostisch.

OpenClaw

Selbst-gehostetes Messaging-Gateway: bringt deinen Coding-Agent in WhatsApp, Telegram, Slack & Co. Multi-Agent, Sandboxing, AgentSkills-kompatibel.

Open Ralph Wiggum

Autonomer Loop-Runner: ruft Claude Code, Codex, Copilot CLI, Cursor oder OpenCode in Endlosschleife, bis das Akzeptanzkriterium erfüllt ist. Agent-Rotation für Modell-Vergleich.


7. Große Vergleichstabelle

ToolLagerUIModelleSelf-HostBest For
Claude CodeAnthropicCLI / IDE / WebClaude onlyReasoning-heavy Coding
Claude Agent SDKAnthropicLibraryClaude onlyEigene Agents bauen
Codex CLIOpenAICLI / IDEGPT onlySchnelle TDD-Loops
OpenAI Agents SDKOpenAILibraryGPT onlyCustom Agents im OpenAI-Stack
Codex CloudOpenAIWeb / GitHubGPT onlyAsync Cloud-Coding
Copilot (Editor)GitHubIDEMulti (GPT/Claude/Gemini)Daily Coding im Editor
Copilot Agent ModeGitHubIDEMultiMulti-File-Tasks im Editor
Copilot CLIGitHubCLIMultiGit/Repo-Operationen
Copilot Coding AgentGitHubGitHub.comMultiAsync PR-Bot
Cursor AgentDrittanbieterIDE / CLIMultiEditor-Heavy-Refactors
OpenCodeOSSCLIbeliebigPrivacy / Lokal
AiderOSSCLIbeliebigGit-First Pair-Coding
ContinueOSSIDEbeliebigCopilot-Alternative
HermesOSSTUI / MessengerbeliebigPersönlicher Allzweck-Agent
OpenClawOSSMessenger / WebbeliebigMessaging-Gateway
Open Ralph WiggumOSSCLIbeliebig (5 Agents)Autonome Loops

8. Feature-Matrix

FeatureClaude CodeCodex CLICopilotCursorOpenCodeHermesOpenClawRalph
Inline-Edit im Editor
Terminal-Modus
Multi-File Refactor
Subagents
MCP-Client
Skills / Procedural Memory
Cross-Session-Memory
Voice-Mode
Messenger-Integration
Cloud-Async-Modus
Sandboxingtlw.tlw.tlw.
Modell-Auswahl
Agent-Rotation
Self-Hosting
Self-Improvement (Skills)

9. Use-Case-Empfehlungen

„Ich bin Solo-Dev und will einfach loslegen."

Copilot im Editor (vertraut) oder Claude Code im Terminal (mehr Power). Beides kann parallel laufen.

„Ich arbeite an einer großen, komplexen Codebase."

Claude Code mit Opus 4.7 (1M Kontext) – nichts anderes spielt in dieser Klasse. Ergänzend Cursor Agent für tatsächliche Multi-File-Apply-Schleifen im Editor.

„Ich hasse manuelles Klicken, Loops müssen autonom laufen."

Open Ralph Wiggum – schreib Akzeptanzkriterien als Tests, lass Ralph laufen, geh Mittagessen.

„Privatsphäre ist Pflicht, alles lokal."

OpenCode + Ollama/vLLM. Kein Code verlässt die Maschine. Optional Hermes als Wrapper für Memory/Skills.

„Ich will einen persönlichen Agent, der mich überall begleitet."

Hermes mit Telegram-/Discord-Gateway, optional Voice-Mode.

„Ich will Coding-Agents im Team-Chat (WhatsApp/Slack)."

OpenClaw – Self-Hosted Gateway, Multi-Agent, Pairing-Allowlists.

„Async Cloud-Workflows, der Bot soll PRs aufmachen."

Copilot Coding Agent (GitHub-native) oder Codex Cloud (OpenAI-native) oder Claude on the Web (Anthropic-native).

„Ich will Modelle direkt vergleichen können."

Open Ralph Wiggum mit --rotation, oder Copilot Agent Mode mit Modell-Switcher, oder Cursor mit Modell-Auswahl pro Request.


10. Kosten – grobe Orientierung

Preise ändern sich ständig

Stand 2026-05. Verifiziere immer auf den Hersteller-Seiten.

TierToolsIdee
Pro-Abo (~$20/Monat)ChatGPT Plus, Claude Pro, Copilot IndividualEditor-Plugins + Web-UI, „all you can eat" mit Throttling
Pro Max / Team (~$100–200/Monat)Claude Max, ChatGPT Pro, Copilot BusinessHöhere Kontingente, Team-Features
API pro TokenClaude API, OpenAI API, OpenRouterPay-as-you-go, ideal für Agents im Dauerlauf
Self-Hosted lokalOllama, vLLM + OpenCode/AiderHardware-Kosten, dafür kein Token-Preis

Faustregel: Für aktiven Editor-Gebrauch lohnt sich ein Abo, für Loops/Agents im Hintergrund (Ralph, Hermes) wird API-pro-Token schnell teurer als ein Pro-Abo, ist aber transparenter.


11. Sicherheits-Checkliste (übergreifend)

Diese Punkte gelten für ALLE Coding-Agents
  • Niemals API-Keys in Prompts oder committeten Configs ablegen → .env + .gitignore
  • Sensible Repos in einer VM/Container klonen, bevor du Auto-Approve einschaltest
  • Auto-Commit kontrollierengit log --oneline regelmäßig prüfen
  • MCP-Server sind unvertrauter Code – sie sehen Files und Tool-Outputs
  • Drittanbieter-Skills/Plugins vor Aktivierung lesen
  • Messaging-Gateways mit Pairing-Allowlists schützen (OpenClaw, Hermes)
  • Cloud-Agents (Copilot Coding Agent, Codex Cloud) haben Repo-Schreibrechte – PR-Reviews ernst nehmen
  • Prompt-Injection ist real: eingehende Daten (Tickets, Mails, Issues) können den Agent kapern

12. So kombiniere ich sie (Beispiel-Stack)

Ein praktikabler Setup für eine 1-Person-Dev:

┌─────────────────────────────────────────────────────────────────┐
│ Editor (VS Code) │
│ └─ GitHub Copilot für Inline-Completion │
│ └─ Claude Code Extension für Reasoning-heavy Tasks │
├─────────────────────────────────────────────────────────────────┤
│ Terminal │
│ └─ Claude Code CLI für Architektur, große Diffs │
│ └─ Codex CLI für schnelle Mini-Tasks │
│ └─ Open Ralph Wiggum für autonome PRD-Umsetzung │
├─────────────────────────────────────────────────────────────────┤
│ Persönlicher Layer │
│ └─ Hermes (Telegram-Bot) Memory, Erinnerungen, Voice │
├─────────────────────────────────────────────────────────────────┤
│ Cloud (async) │
│ └─ Copilot Coding Agent für Issue-zu-PR-Tasks │
└─────────────────────────────────────────────────────────────────┘

→ Wenn du Hermes und OpenClaw parallel betreibst, lies vorher den Guide OpenClaw + Hermes parallel betreiben – sonst klauen sich die Bots gegenseitig die Telegram-Updates.


13. Weiterführend

Anthropic / Claude

OpenAI / ChatGPT

GitHub / Copilot

Drittanbieter / OSS

Quote

„Pick the smallest agent that fits your loop. Stack only when each layer earns its keep."