Zum Hauptinhalt springen

AutoGPT - Entwicklerhandbuch

Worum geht's?

AutoGPT ist eine Open-Source-Plattform, um kontinuierliche KI-Agenten zu bauen, bereitzustellen und auszufĂŒhren, die mehrstufige Workflows automatisieren. Du stellst einen Agenten visuell zusammen, indem du Blocks miteinander verdrahtest — jeder Block ist eine einzelne, abgegrenzte Aktion — und sie zu einem Graph verbindest. Anschließend fĂŒhrst du ihn bei Bedarf, nach Zeitplan oder als Reaktion auf externe Trigger aus. Dieses Handbuch ist der Einstiegspunkt fĂŒr Entwickelnde: Es erklĂ€rt, was AutoGPT heute ist, wie die Plattform aufgebaut ist, welches Vokabular du brauchst und wo im Repository alles liegt.

Gegen PrimĂ€rquellen geprĂŒft

Dieses Handbuch basiert auf der offiziellen AutoGPT-Dokumentation (agpt.co/docs) und dem Significant-Gravitas/AutoGPT-GitHub-Repository (dev-Branch), geprĂŒft am 25. Juni 2026. Codesignaturen und Dateipfade sind aus dem Repository-Quellcode zitiert; die Plattform entwickelt sich schnell, prĂŒfe daher immer gegen den aktuellen dev-Branch, bevor du dich auf ein bestimmtes Detail verlĂ€sst.

1. Was AutoGPT ist (und was nicht)​

Der Name „AutoGPT“ umfasst zwei verschiedene Projekte, die im selben Repository liegen. Zu wissen, welches davon du gerade vor dir hast, erspart viel Verwirrung.

AutoGPT PlatformAutoGPT Classic
Was es istEine moderne Plattform, um KI-Agenten als visuelle Workflows zu bauen, bereitzustellen und auszufĂŒhrenDer ursprĂŒngliche autonome Standalone-Agent aus dem Jahr 2023
Wie du es nutztWeb-UI (Low-Code-Agent Builder) + ein Server-BackendPython-Toolkit, CLI und ein Referenz-Agent
StatusAktiv weiterentwickelt, der Fokus des ProjektsLegacy / Maintenance, als Referenz erhalten
Liegt inautogpt_platform/classic/ (Forge, Benchmark, Frontend)
LizenzPolyform ShieldMIT

Der Rest dieses Handbuchs dreht sich um die Platform. Classic wird in §6 zusammengefasst.

Mentales Modell

Stell dir die Platform als eine visuelle Programmierumgebung fĂŒr KI-Agenten vor. Statt ein Skript zu schreiben, das ein LLM und einige APIs aufruft, ziehst du Blocks auf eine ArbeitsflĂ€che und verbindest sie. Die Runtime fĂŒhrt diesen Graph fĂŒr dich aus, kĂŒmmert sich um Credentials, Wiederholungen, Zeitplanung und die Abrechnung von Credits und lĂ€sst dich das Ergebnis veröffentlichen, damit andere es ausfĂŒhren können.

2. Die zwei HĂ€lften der Platform​

Die Platform ist aufgeteilt in ein Frontend (wo Menschen Agenten bauen und betreiben) und einen Server (wo Agenten tatsÀchlich laufen).

Frontend​

Eine Next.js-/TypeScript-Webanwendung. Hier kannst du:

FunktionWas sie tut
Agent BuilderEine Low-Code-ArbeitsflÀche, um Agenten durch das Verbinden von Blocks zu entwerfen und zu konfigurieren
Workflow-VerwaltungDen Graph bauen, Ă€ndern und optimieren; jeder Block fĂŒhrt eine einzelne Aktion aus
Deployment-SteuerungDen Lebenszyklus eines Agenten vom Test bis zur Produktion verwalten
Library / einsatzbereite AgentenEinen vorkonfigurierten Agenten auswĂ€hlen und ausfĂŒhren, ohne etwas bauen zu mĂŒssen
Agenten-InteraktionDeine Agenten ausfĂŒhren und ihre Eingaben ĂŒber die UI bereitstellen
Monitoring & AnalyticsLĂ€ufe, Ausgaben und Performance ĂŒber die Zeit verfolgen

Server​

Das Backend ist das „Kraftwerk“, in dem Agenten laufen. Einmal bereitgestellt, kann ein Agent durch externe Quellen (Webhooks, ZeitplĂ€ne, manuelle LĂ€ufe) ausgelöst werden und kontinuierlich arbeiten. Der Server ist eine Reihe von Python-Services und enthĂ€lt:

  • Core-Logik — die Graph-Engine und die Block-Bibliothek, die die AusfĂŒhrung antreiben.
  • Infrastruktur — die unterstĂŒtzenden Services (Datenbank, Queue, Cache, Auth, Datei-Scanning, 
).
  • Marketplace — ein Katalog, in dem du vorgefertigte Agenten finden und bereitstellen kannst.

Unter Docker Compose ist das Backend kein einzelner Prozess, sondern mehrere zusammenwirkende Services — ein REST-API-Server, ein Executor, ein Websocket-Server, ein Datenbank-Manager, ein Scheduler und ein Notification-Server — plus ihre AbhĂ€ngigkeiten (Postgres ĂŒber Supabase, Redis/FalkorDB, RabbitMQ, ClamAV). Du musst nicht ĂŒber jeden einzelnen davon nachdenken, um Agenten zu bauen, aber es ist nĂŒtzlich zu wissen, dass das Backend beim Self-Hosting eine verteilte Menge von Services ist (siehe Self-Hosting).

3. Kernkonzepte​

Diese fĂŒnf Begriffe tauchen ĂŒberall in der UI, der Dokumentation und dem Code auf. Verinnerliche sie, bevor du weitergehst.

KonzeptDefinition
BlockDie kleinste Funktionseinheit — ein Block tut eine Sache (ein LLM aufrufen, eine E-Mail senden, rechnen, eine Webseite lesen). Blocks haben ein typisiertes Eingabe-Schema und ein typisiertes Ausgabe-Schema.
NodeEine konkrete Instanz eines Blocks, die auf der ArbeitsflÀche platziert und deren Eingaben konfiguriert sind. Derselbe Block kann als beliebig viele Nodes erscheinen.
LinkEine Verbindung von einem Ausgabe-Pin einer Node zu einem Eingabe-Pin einer anderen. Über Links fließen Daten durch den Agenten.
GraphDer gesamte Agent: eine Menge von Nodes, die durch Links verbunden sind. „Agent“ und „Graph“ sind faktisch Synonyme — der Graph ist der Workflow des Agenten.
AgentEin Graph, den du ausfĂŒhren, planen, veröffentlichen und teilen kannst. Ein Agent hat Versionen.

Zwei weitere Begriffe fĂŒr die Verteilung:

  • Marketplace — der öffentliche Katalog von Agenten, die andere veröffentlicht haben; durchsuche, teste und stelle sie bereit.
  • Library — deine eigene Sammlung von Agenten (selbst gebaut oder aus dem Marketplace hinzugefĂŒgt), bereit zur AusfĂŒhrung.
            ┌─────────┐      link       ┌──────────────┐     link      ┌──────────────┐
input ───▶ │ Node A │ ───────────────▶│ Node B │──────────────▶│ Node C │ ───▶ output
│ (Block) │ output → input │ (Block) │ │ (Block) │
└─────────┘ └──────────────┘ └──────────────┘
one Graph = one Agent
Wie sich Daten tatsÀchlich bewegen

Die run()-Methode eines Blocks ist ein async Generator: Sie yieldet ein oder mehrere (output_name, value)-Paare. Jeder ausgegebene Wert wandert entlang jedes Links, der an diesen Ausgabe-Pin angehĂ€ngt ist, und landet auf dem verbundenen Eingabe-Pin der nachgelagerten Node. Dieses Streaming-Modell ist der Grund, warum ein einzelner Block mehrere Ergebnisse ĂŒber die Zeit ausgeben kann, nicht nur einen einzigen RĂŒckgabewert. Die Mechanik wird in Building Blocks behandelt.

4. Tech-Stack​

BereichTechnologie
Backend-SprachePython (~69 % des Repos)
Frontend-SpracheTypeScript (~29 %)
ContainerisierungDocker Engine ≄ 20.10, Docker Compose ≄ 2.0
DatenbankPostgreSQL ĂŒber Supabase, angesprochen ĂŒber Prisma
Queue / CacheRabbitMQ, Redis / FalkorDB
Schema/ValidierungPydantic-Modelle fĂŒr das Eingabe- & Ausgabe-Schema jedes Blocks
Standard (Classic)Agent Protocol der AI Engineer Foundation

Der Einsatz von Pydantic ist fĂŒr Entwickelnde wichtig: Das Eingabe- und Ausgabe-Schema eines Blocks sind Pydantic-Modelle, die in JSON Schema umgewandelt und in der Datenbank gespeichert werden. Dieses JSON Schema ist das, was der Agent Builder als Formular rendert und wogegen der Executor zur Laufzeit validiert.

5. Monorepo-Aufbau​

Das Repository ist ein Monorepo. Die zwei Lizenzzonen bilden sich auf zwei Top-Level-Bereiche ab:

AutoGPT/
├── autogpt_platform/ # ← the Platform (Polyform Shield License)
│ ├── backend/
│ │ └── backend/
│ │ ├── blocks/ # the block library — _base.py defines the Block class
│ │ ├── data/ # block.py, model.py (SchemaField, Credentials, 
), graph, execution
│ │ ├── sdk/ # the Block SDK (auto-registration, provider/credentials helpers)
│ │ └── integrations/ # provider definitions, OAuth, webhooks
│ ├── frontend/ # Next.js web app (Agent Builder, Library, Marketplace)
│ ├── docker-compose.yml # the full self-host stack
│ └── .env.default # template you copy to .env
│
├── classic/ # ← AutoGPT Classic (MIT License)
│ ├── forge/ # agent-building toolkit
│ ├── benchmark/ # agbenchmark
│ └── frontend/ # classic GUI
│
├── docs/ # documentation source
└── run # root CLI (./run setup | agent | benchmark) — Classic

Die fĂŒr die Block-Entwicklung relevantesten Dateien — backend/data/block.py, backend/blocks/_base.py und backend/data/model.py — werden in Building Blocks seziert.

6. AutoGPT Classic (Legacy)​

Alles außerhalb von autogpt_platform/ ist das ursprĂŒngliche AutoGPT, unter der MIT-Lizenz. Du wirst es fĂŒr neue Arbeiten selten brauchen, aber zur Einordnung:

  • Forge — ein einsatzbereites Toolkit, das den Boilerplate beim Bau deines eigenen Standalone-Agenten ĂŒbernimmt. Seine Komponenten lassen sich auch einzeln wiederverwenden.
  • agbenchmark — ein Benchmarking-Harness fĂŒr jeden Agenten, der das Agent Protocol spricht; auf PyPI als agbenchmark veröffentlicht.
  • Classic GUI — ein einfaches Frontend, das sich ĂŒber das Agent Protocol mit Agenten verbindet.
  • Root-CLI — ./run setup, ./run agent, ./run benchmark verbinden diese miteinander. FĂŒhre ./run setup einmal aus, um AbhĂ€ngigkeiten zu installieren.

Wenn dein Ziel der Bau moderner Agenten ist, ignoriere Classic und arbeite in autogpt_platform/.

7. Lizenzierung — lies das, bevor du kommerziell baust​

AutoGPT verwendet zwei Lizenzen, aufgeteilt nach Ordner. Das ist wichtig, wenn du planst, es zu hosten oder zu kommerzialisieren:

GeltungsbereichLizenzPraktische Bedeutung
Alles in autogpt_platform/Polyform ShieldSource-available. Du darfst es nutzen, selbst hosten und modifizieren, aber die Shield-Lizenz schrÀnkt das Anbieten als konkurrierendes kommerzielles Produkt/Service ein.
Alles außerhalb von autogpt_platform/ (Classic, Forge, agbenchmark, Classic GUI)MITPermissiv — frei nutzbar, auch kommerziell.
Keine Rechtsberatung

Polyform Shield ist keine OSI-„Open-Source“-Lizenz im strengen Sinne — sie ist source-available mit einer WettbewerbsbeschrĂ€nkung. Bevor du ein kommerzielles Angebot auf Basis der Platform baust, lies den tatsĂ€chlichen Lizenztext im Repository und hole dir deine eigene rechtliche PrĂŒfung ein. Die Zusammenfassung oben dient der Orientierung, sie ist keine rechtliche Stellungnahme.

8. Wie es weitergeht​

Du willst 
Lies
Die Platform auf deinem eigenen Rechner ausfĂŒhrenSelf-Hosting — Anforderungen, Docker-Setup, Ports, Fehlerbehebung
Deinen eigenen Block schreibenBuilding Blocks — die Block-Klasse, Schemas, run(), Credentials und Testing
AutoGPT mit anderen Agenten-Frameworks vergleichenÜberblick zum Agenten-Vergleich

9. Quellen​

  • Significant-Gravitas/AutoGPT — README.md, autogpt_platform/backend/backend/data/block.py, autogpt_platform/backend/backend/blocks/_base.py, autogpt_platform/backend/backend/data/model.py (dev branch, reviewed 2026-06-25)
  • AutoGPT documentation — agpt.co/docs
  • Repository — github.com/Significant-Gravitas/AutoGPT