Zum Hauptinhalt springen

Cursor + DeepSeek + VS Code Guide

Worum geht es?

Dieser Guide beantwortet eine sehr praktische Frage: Wie nah kommst du an ein "kostenloses" Coding-Setup mit Cursor und DeepSeek heran, und was ist der Fallback, wenn du in VS Code bleiben oder moeglichst viel selbst hosten willst?

1. Die kurze Antwort​

Cursor​

Ja, Cursor hat offiziell einen kostenlosen Hobby-Plan, aber mit Limits. Auf der Cursor-Preisseite steht aktuell:

  • Hobby als Free
  • keine Kreditkarte noetig
  • begrenzte Agent-Requests
  • begrenzte Tab-Completions

Also: "Cursor kostenlos" stimmt, aber nicht unbegrenzt.

DeepSeek​

Bei DeepSeek ist es differenzierter:

  • die offizielle DeepSeek-API ist bezahlt
  • DeepSeek veroeffentlicht Open-Weight-Modelle, die du selbst betreiben kannst
  • damit ist DeepSeek nur dann "kostenlos", wenn du die Inferenz selbst hostest

Stand 22. Juni 2026 listet die DeepSeek-API-Doku bezahlte Token-Preise fuer deepseek-v4-flash und deepseek-v4-pro. Ausserdem sollen deepseek-chat und deepseek-reasoner am 24. Juli 2026 eingestellt werden.

Meine praktische Empfehlung​

Wenn du den guenstigsten sinnvollen Stack willst:

  1. nutze Cursor Hobby, bis dir die Limits wehtun
  2. fuer "wirklich gratis" laesst du DeepSeek lokal laufen
  3. wenn du in VS Code bleiben willst, baust du den Stack mit Continue + Ollama oder Continue + vLLM nach

2. Was "kostenlos" hier wirklich bedeutet​

ToolOffiziell kostenlos?Haken
CursorJa, Hobby-PlanBegrenzte Agent-Requests und begrenzte Completions
DeepSeek-APINeinToken-basiert bezahlt
DeepSeek lokalJa, Gewichte/Laufzeitpfad koennen kostenlos seinDu zahlst trotzdem mit eigener Hardware und Strom

Der wirklich billige Weg ist daher meistens:

  • Cursor Free Plan fuer gelegentliche Nutzung
  • VS Code + lokales DeepSeek fuer haeufige Nutzung

3. Kann man DeepSeek in Cursor nutzen?​

Oeffentlich ist klar, dass Cursor mehrere modellgestuetzte Features unterstuetzt. Aber die offiziellen Seiten, die ich geprueft habe, stellen vor allem die eigenen Plaene und Cloud-Features in den Vordergrund, nicht eine saubere "Self-Host Cursor"-Story.

Wichtige Realitaetspruefung​

  • Cursor ist ein eigener Editor, keine normale VS-Code-Extension
  • Cursor ist historisch VS-Code-aehnlich, aber du "installierst Cursor nicht in VS Code"
  • wenn du maximale Kontrolle willst, ist VS Code + eigene Extension + lokaler Modell-Endpunkt der transparentere Weg

Meine Einordnung​

Aus der oeffentlichen Cursor-Produktoberflaeche ergibt sich fuer mich:

  • Cursor ist am besten als proprietaerer, gehosteter Editor mit lokalem Editor-Charakter zu verstehen
  • aber nicht als voll selbst hostbarer AI-Stack

Wenn dein echtes Ziel also ist:

  • moeglichst wenig Kosten
  • lokale Modellkontrolle
  • transparente Infrastruktur

dann ist VS Code die bessere Langfrist-Basis, nicht Cursor.


4. Der saubere VS-Code-Fallback​

Der klarste dokumentierte Fallback, den ich gefunden habe, ist:

  • VS Code
  • Continue
  • DeepSeek lokal ueber Ollama oder hinter einem OpenAI-kompatiblen Server

Continue dokumentiert sich selbst als open-source coding agent mit VS-Code-Extension. Gleichzeitig weist die Doku darauf hin, dass das urspruengliche Repo inzwischen read-only ist, die finale 2.0.0-Version aber weiter nutzbar bleibt.

Warum dieser Stack Sinn ergibt

DeepSeek liefert das Modell, Ollama oder vLLM den Server, Continue die Agent-Oberflaeche in VS Code.


5. Einfachster Self-Hosting-Pfad: Ollama + DeepSeek Coder + VS Code​

Das ist der einfachste Weg auf einer einzelnen Maschine.

5.1 Ollama installieren​

Installiere Ollama und ziehe dann ein DeepSeek-Coder-Modell:

ollama run deepseek-coder

Ollama listet aktuell diese DeepSeek-Coder-Varianten:

  • deepseek-coder:1.3b
  • deepseek-coder:6.7b
  • deepseek-coder:33b

5.2 Welche Groesse solltest du waehlen?​

Das hier ist eine Schlussfolgerung aus der Modellgroesse, keine offizielle Ollama-Hardwaregarantie:

ModellGut fuer
1.3bTests, schwache Laptops, sehr niedriger Ressourcenverbrauch
6.7bDie realistischste lokale Coding-Basis
33bErnsthafte lokale Inferenz mit starker Hardware

Wenn du unsicher bist, starte mit:

ollama run deepseek-coder:6.7b

5.3 Continue in VS Code installieren​

Installiere die Continue-Extension aus dem VS Code Marketplace.

5.4 Continue auf den lokalen Endpunkt zeigen lassen​

Die exakte UI kann sich veraendern, aber die Architektur ist:

  • Model-Provider: OpenAI-kompatibel oder lokale API
  • Endpoint: dein lokaler Ollama-Server
  • Modell: deepseek-coder oder deepseek-coder:6.7b

Ein typischer lokaler Endpoint ist:

http://localhost:11434

5.5 Ergebnis​

Du hast dann:

  • VS Code als Editor
  • Continue als Agent-/Chat-Schicht
  • DeepSeek Coder als lokales Coding-Modell
  • keine laufende Token-Rechnung

6. Staerkerer Self-Hosting-Pfad: vLLM-Server​

Wenn du etwas Server-artigeres als Ollama willst, nimm vLLM.

Die vLLM-Doku bietet explizit einen OpenAI-kompatiblen Server und listet ausserdem Integrationen fuer Claude Code und Codex.

Das ist wichtig, weil damit ein lokaler Modellserver zu einem Backend werden kann fuer:

  • VS-Code-Tools
  • Codex-artige Workflows
  • Claude-Code-artige Workflows
  • eigene Apps

6.1 Grundidee​

Du laesst ein Modell hinter vLLM laufen und stellst eine OpenAI-aehnliche API bereit:

vllm serve <your-model>

Danach verbindest du dein Tool mit diesem lokalen Endpoint, als waere es eine OpenAI-kompatible API.

6.2 Wann vLLM statt Ollama?​

Nimm Ollama, wenn:

  • du die schnellste lokale Einrichtung willst
  • du auf einer einzelnen Developer-Maschine arbeitest
  • du moeglichst wenig Infrastruktur willst

Nimm vLLM, wenn:

  • du einen ernsteren lokalen oder Team-Server willst
  • du OpenAI-kompatibles Routing fuer mehrere Tools willst
  • du groessere Modelle auf staerkerer GPU-Hardware fahren willst

7. VS-Code-Implementierungs-Blueprint​

Wenn du das als reproduzierbares Setup haben willst, dann so:

Option A - am einfachsten​

  • VS Code
  • Continue-Extension
  • Ollama
  • deepseek-coder:6.7b

Option B - skalierbarer​

  • VS Code
  • Continue-Extension
  • vLLM OpenAI-kompatibler Server
  • ein staerkeres selbst gehostetes DeepSeek-Modell

Option C - hybrid​

  • Cursor Hobby fuer gelegentliche Premium-UX
  • VS Code + lokales DeepSeek fuer haeufige oder billige Nutzung

Dieses Hybrid-Setup ist oft die rationalste Wahl.


8. Kann man Cursor selbst hosten?​

Kurze Antwort​

Nicht in dem Sinn, in dem Leute normalerweise "self-host" meinen.

Was ich verifizieren konnte​

Cursor beschreibt auf seinen oeffentlichen Produkt- und Pricing-Seiten klar:

  • gehostete Plaene
  • Cloud Agents
  • Team Billing
  • Admin-/Privacy-Kontrollen

Was ich in den offiziellen oeffentlichen Quellen nicht gefunden habe, ist eine saubere "Cursor vollstaendig on-prem selbst betreiben"-Story.

Praktisches Fazit​

Behandle Cursor als:

  • proprietaeres Editor-Produkt
  • mit kostenlosem Einstieg
  • aber nicht als Grundlage fuer Self-Hosting

Wenn Self-Hosting dein echtes Ziel ist, baue um:

  • VS Code
  • Ollama oder vLLM
  • DeepSeek Open-Weight-Modelle

9. Kann man DeepSeek selbst hosten?​

Ja, mit einer wichtigen Unterscheidung​

Du kannst DeepSeek-Modelle selbst hosten, nicht die komplette kommerzielle DeepSeek-SaaS-Erfahrung.

Die drei realistischen Modi​

ModusWas das bedeutet
DeepSeek-APIOffizielle gehostete API, bezahlt
OllamaEinfacher lokaler Runtime fuer kleinere lokale DeepSeek-Modelle
vLLMFortgeschrittener selbst gehosteter Inferenz-Server

Gute Self-Hosting-Varianten​

Lokaler Laptop / Workstation​

ollama run deepseek-coder:6.7b

Home Lab / GPU-Server​

  • ein Modell mit vLLM hosten
  • einen OpenAI-kompatiblen Endpoint bereitstellen
  • VS Code, Codex-aehnliche Tools oder eigene Apps daran anbinden

Compliance-Hinweis​

Wenn dir Data Residency oder Privacy wichtig sind, ist lokales/selbst gehostetes DeepSeek meist attraktiver als die offizielle gehostete API. Trotzdem musst du selbst entscheiden zu:

  • Modellherkunft
  • internen Richtlinien
  • Netzisolierung
  • Prompt- und Code-Retention

10. Minimale Setup-Rezepte​

10.1 Guenstigstes praktisches Setup​

Cursor Hobby + DeepSeek nur bei Bedarf

Gut fuer:

  • Ausprobieren
  • leichte Nutzung
  • keine Infrastruktur

10.2 Wirklich kostenloses Daily-Setup​

VS Code + Continue + Ollama + deepseek-coder:6.7b

Gut fuer:

  • taegliches Coding
  • keine Token-Kosten
  • Local-First-Workflow

10.3 Starkes Self-Hosted-Setup​

VS Code + Continue + vLLM + selbst gehostetes DeepSeek-Modell

Gut fuer:

  • Team-Nutzung
  • internes API-Routing
  • ernsthaftere Infrastruktur

11. Fazit​

Wenn dir jemand gesagt hat "Cursor und DeepSeek sind kostenlos", dann ist die korrekte Version:

  • Cursor: Es gibt einen Free-Tier, aber mit Limits
  • DeepSeek-API: nicht kostenlos
  • DeepSeek lokal / self-hosted: ja, effektiv kostenlos ausser Hardwarekosten

Wenn du den besten pragmatischen Weg willst:

  1. starte mit Cursor Hobby
  2. schiebe schwere Arbeit auf VS Code + lokales DeepSeek
  3. wenn lokale Nutzung ernsthaft wird, wechsle von Ollama zu vLLM

So bekommst du einen Workflow, der billig, kontrollierbar und nicht an einen einzigen gehosteten Editor gekettet ist.

Offizielle Quellen​