Cursor + DeepSeek + VS Code Guide
Dieser Guide beantwortet eine sehr praktische Frage: Wie nah kommst du an ein "kostenloses" Coding-Setup mit Cursor und DeepSeek heran, und was ist der Fallback, wenn du in VS Code bleiben oder moeglichst viel selbst hosten willst?
1. Die kurze Antwort​
Cursor​
Ja, Cursor hat offiziell einen kostenlosen Hobby-Plan, aber mit Limits. Auf der Cursor-Preisseite steht aktuell:
- Hobby als Free
- keine Kreditkarte noetig
- begrenzte Agent-Requests
- begrenzte Tab-Completions
Also: "Cursor kostenlos" stimmt, aber nicht unbegrenzt.
DeepSeek​
Bei DeepSeek ist es differenzierter:
- die offizielle DeepSeek-API ist bezahlt
- DeepSeek veroeffentlicht Open-Weight-Modelle, die du selbst betreiben kannst
- damit ist DeepSeek nur dann "kostenlos", wenn du die Inferenz selbst hostest
Stand 22. Juni 2026 listet die DeepSeek-API-Doku bezahlte Token-Preise fuer deepseek-v4-flash und deepseek-v4-pro. Ausserdem sollen deepseek-chat und deepseek-reasoner am 24. Juli 2026 eingestellt werden.
Meine praktische Empfehlung​
Wenn du den guenstigsten sinnvollen Stack willst:
- nutze Cursor Hobby, bis dir die Limits wehtun
- fuer "wirklich gratis" laesst du DeepSeek lokal laufen
- wenn du in VS Code bleiben willst, baust du den Stack mit Continue + Ollama oder Continue + vLLM nach
2. Was "kostenlos" hier wirklich bedeutet​
| Tool | Offiziell kostenlos? | Haken |
|---|---|---|
| Cursor | Ja, Hobby-Plan | Begrenzte Agent-Requests und begrenzte Completions |
| DeepSeek-API | Nein | Token-basiert bezahlt |
| DeepSeek lokal | Ja, Gewichte/Laufzeitpfad koennen kostenlos sein | Du zahlst trotzdem mit eigener Hardware und Strom |
Der wirklich billige Weg ist daher meistens:
- Cursor Free Plan fuer gelegentliche Nutzung
- VS Code + lokales DeepSeek fuer haeufige Nutzung
3. Kann man DeepSeek in Cursor nutzen?​
Oeffentlich ist klar, dass Cursor mehrere modellgestuetzte Features unterstuetzt. Aber die offiziellen Seiten, die ich geprueft habe, stellen vor allem die eigenen Plaene und Cloud-Features in den Vordergrund, nicht eine saubere "Self-Host Cursor"-Story.
Wichtige Realitaetspruefung​
- Cursor ist ein eigener Editor, keine normale VS-Code-Extension
- Cursor ist historisch VS-Code-aehnlich, aber du "installierst Cursor nicht in VS Code"
- wenn du maximale Kontrolle willst, ist VS Code + eigene Extension + lokaler Modell-Endpunkt der transparentere Weg
Meine Einordnung​
Aus der oeffentlichen Cursor-Produktoberflaeche ergibt sich fuer mich:
- Cursor ist am besten als proprietaerer, gehosteter Editor mit lokalem Editor-Charakter zu verstehen
- aber nicht als voll selbst hostbarer AI-Stack
Wenn dein echtes Ziel also ist:
- moeglichst wenig Kosten
- lokale Modellkontrolle
- transparente Infrastruktur
dann ist VS Code die bessere Langfrist-Basis, nicht Cursor.
4. Der saubere VS-Code-Fallback​
Der klarste dokumentierte Fallback, den ich gefunden habe, ist:
- VS Code
- Continue
- DeepSeek lokal ueber Ollama oder hinter einem OpenAI-kompatiblen Server
Continue dokumentiert sich selbst als open-source coding agent mit VS-Code-Extension. Gleichzeitig weist die Doku darauf hin, dass das urspruengliche Repo inzwischen read-only ist, die finale 2.0.0-Version aber weiter nutzbar bleibt.
DeepSeek liefert das Modell, Ollama oder vLLM den Server, Continue die Agent-Oberflaeche in VS Code.
5. Einfachster Self-Hosting-Pfad: Ollama + DeepSeek Coder + VS Code​
Das ist der einfachste Weg auf einer einzelnen Maschine.
5.1 Ollama installieren​
Installiere Ollama und ziehe dann ein DeepSeek-Coder-Modell:
ollama run deepseek-coder
Ollama listet aktuell diese DeepSeek-Coder-Varianten:
deepseek-coder:1.3bdeepseek-coder:6.7bdeepseek-coder:33b
5.2 Welche Groesse solltest du waehlen?​
Das hier ist eine Schlussfolgerung aus der Modellgroesse, keine offizielle Ollama-Hardwaregarantie:
| Modell | Gut fuer |
|---|---|
| 1.3b | Tests, schwache Laptops, sehr niedriger Ressourcenverbrauch |
| 6.7b | Die realistischste lokale Coding-Basis |
| 33b | Ernsthafte lokale Inferenz mit starker Hardware |
Wenn du unsicher bist, starte mit:
ollama run deepseek-coder:6.7b
5.3 Continue in VS Code installieren​
Installiere die Continue-Extension aus dem VS Code Marketplace.
5.4 Continue auf den lokalen Endpunkt zeigen lassen​
Die exakte UI kann sich veraendern, aber die Architektur ist:
- Model-Provider: OpenAI-kompatibel oder lokale API
- Endpoint: dein lokaler Ollama-Server
- Modell:
deepseek-coderoderdeepseek-coder:6.7b
Ein typischer lokaler Endpoint ist:
http://localhost:11434
5.5 Ergebnis​
Du hast dann:
- VS Code als Editor
- Continue als Agent-/Chat-Schicht
- DeepSeek Coder als lokales Coding-Modell
- keine laufende Token-Rechnung
6. Staerkerer Self-Hosting-Pfad: vLLM-Server​
Wenn du etwas Server-artigeres als Ollama willst, nimm vLLM.
Die vLLM-Doku bietet explizit einen OpenAI-kompatiblen Server und listet ausserdem Integrationen fuer Claude Code und Codex.
Das ist wichtig, weil damit ein lokaler Modellserver zu einem Backend werden kann fuer:
- VS-Code-Tools
- Codex-artige Workflows
- Claude-Code-artige Workflows
- eigene Apps
6.1 Grundidee​
Du laesst ein Modell hinter vLLM laufen und stellst eine OpenAI-aehnliche API bereit:
vllm serve <your-model>
Danach verbindest du dein Tool mit diesem lokalen Endpoint, als waere es eine OpenAI-kompatible API.
6.2 Wann vLLM statt Ollama?​
Nimm Ollama, wenn:
- du die schnellste lokale Einrichtung willst
- du auf einer einzelnen Developer-Maschine arbeitest
- du moeglichst wenig Infrastruktur willst
Nimm vLLM, wenn:
- du einen ernsteren lokalen oder Team-Server willst
- du OpenAI-kompatibles Routing fuer mehrere Tools willst
- du groessere Modelle auf staerkerer GPU-Hardware fahren willst
7. VS-Code-Implementierungs-Blueprint​
Wenn du das als reproduzierbares Setup haben willst, dann so:
Option A - am einfachsten​
- VS Code
- Continue-Extension
- Ollama
deepseek-coder:6.7b
Option B - skalierbarer​
- VS Code
- Continue-Extension
- vLLM OpenAI-kompatibler Server
- ein staerkeres selbst gehostetes DeepSeek-Modell
Option C - hybrid​
- Cursor Hobby fuer gelegentliche Premium-UX
- VS Code + lokales DeepSeek fuer haeufige oder billige Nutzung
Dieses Hybrid-Setup ist oft die rationalste Wahl.
8. Kann man Cursor selbst hosten?​
Kurze Antwort​
Nicht in dem Sinn, in dem Leute normalerweise "self-host" meinen.
Was ich verifizieren konnte​
Cursor beschreibt auf seinen oeffentlichen Produkt- und Pricing-Seiten klar:
- gehostete Plaene
- Cloud Agents
- Team Billing
- Admin-/Privacy-Kontrollen
Was ich in den offiziellen oeffentlichen Quellen nicht gefunden habe, ist eine saubere "Cursor vollstaendig on-prem selbst betreiben"-Story.
Praktisches Fazit​
Behandle Cursor als:
- proprietaeres Editor-Produkt
- mit kostenlosem Einstieg
- aber nicht als Grundlage fuer Self-Hosting
Wenn Self-Hosting dein echtes Ziel ist, baue um:
- VS Code
- Ollama oder vLLM
- DeepSeek Open-Weight-Modelle
9. Kann man DeepSeek selbst hosten?​
Ja, mit einer wichtigen Unterscheidung​
Du kannst DeepSeek-Modelle selbst hosten, nicht die komplette kommerzielle DeepSeek-SaaS-Erfahrung.
Die drei realistischen Modi​
| Modus | Was das bedeutet |
|---|---|
| DeepSeek-API | Offizielle gehostete API, bezahlt |
| Ollama | Einfacher lokaler Runtime fuer kleinere lokale DeepSeek-Modelle |
| vLLM | Fortgeschrittener selbst gehosteter Inferenz-Server |
Gute Self-Hosting-Varianten​
Lokaler Laptop / Workstation​
ollama run deepseek-coder:6.7b
Home Lab / GPU-Server​
- ein Modell mit vLLM hosten
- einen OpenAI-kompatiblen Endpoint bereitstellen
- VS Code, Codex-aehnliche Tools oder eigene Apps daran anbinden
Compliance-Hinweis​
Wenn dir Data Residency oder Privacy wichtig sind, ist lokales/selbst gehostetes DeepSeek meist attraktiver als die offizielle gehostete API. Trotzdem musst du selbst entscheiden zu:
- Modellherkunft
- internen Richtlinien
- Netzisolierung
- Prompt- und Code-Retention
10. Minimale Setup-Rezepte​
10.1 Guenstigstes praktisches Setup​
Cursor Hobby + DeepSeek nur bei Bedarf
Gut fuer:
- Ausprobieren
- leichte Nutzung
- keine Infrastruktur
10.2 Wirklich kostenloses Daily-Setup​
VS Code + Continue + Ollama + deepseek-coder:6.7b
Gut fuer:
- taegliches Coding
- keine Token-Kosten
- Local-First-Workflow
10.3 Starkes Self-Hosted-Setup​
VS Code + Continue + vLLM + selbst gehostetes DeepSeek-Modell
Gut fuer:
- Team-Nutzung
- internes API-Routing
- ernsthaftere Infrastruktur
11. Fazit​
Wenn dir jemand gesagt hat "Cursor und DeepSeek sind kostenlos", dann ist die korrekte Version:
- Cursor: Es gibt einen Free-Tier, aber mit Limits
- DeepSeek-API: nicht kostenlos
- DeepSeek lokal / self-hosted: ja, effektiv kostenlos ausser Hardwarekosten
Wenn du den besten pragmatischen Weg willst:
- starte mit Cursor Hobby
- schiebe schwere Arbeit auf VS Code + lokales DeepSeek
- wenn lokale Nutzung ernsthaft wird, wechsle von Ollama zu vLLM
So bekommst du einen Workflow, der billig, kontrollierbar und nicht an einen einzigen gehosteten Editor gekettet ist.