Cursor + DeepSeek + VS Code Guide

Worum geht es?

Dieser Guide beantwortet eine sehr praktische Frage: Wie nah kommst du an ein "kostenloses" Coding-Setup mit Cursor und DeepSeek heran, und was ist der Fallback, wenn du in VS Code bleiben oder moeglichst viel selbst hosten willst?

1. Die kurze Antwort

Cursor

Ja, Cursor hat offiziell einen kostenlosen Hobby-Plan, aber mit Limits. Auf der Cursor-Preisseite steht aktuell:

Hobby als Free
keine Kreditkarte noetig
begrenzte Agent-Requests
begrenzte Tab-Completions

Also: "Cursor kostenlos" stimmt, aber nicht unbegrenzt.

DeepSeek

Bei DeepSeek ist es differenzierter:

die offizielle DeepSeek-API ist bezahlt
DeepSeek veroeffentlicht Open-Weight-Modelle, die du selbst betreiben kannst
damit ist DeepSeek nur dann "kostenlos", wenn du die Inferenz selbst hostest

Stand 22. Juni 2026 listet die DeepSeek-API-Doku bezahlte Token-Preise fuer deepseek-v4-flash und deepseek-v4-pro. Ausserdem sollen deepseek-chat und deepseek-reasoner am 24. Juli 2026 eingestellt werden.

Meine praktische Empfehlung

Wenn du den guenstigsten sinnvollen Stack willst:

nutze Cursor Hobby, bis dir die Limits wehtun
fuer "wirklich gratis" laesst du DeepSeek lokal laufen
wenn du in VS Code bleiben willst, baust du den Stack mit Continue + Ollama oder Continue + vLLM nach

2. Was "kostenlos" hier wirklich bedeutet

Tool	Offiziell kostenlos?	Haken
Cursor	Ja, Hobby-Plan	Begrenzte Agent-Requests und begrenzte Completions
DeepSeek-API	Nein	Token-basiert bezahlt
DeepSeek lokal	Ja, Gewichte/Laufzeitpfad koennen kostenlos sein	Du zahlst trotzdem mit eigener Hardware und Strom

Der wirklich billige Weg ist daher meistens:

Cursor Free Plan fuer gelegentliche Nutzung
VS Code + lokales DeepSeek fuer haeufige Nutzung

3. Kann man DeepSeek in Cursor nutzen?

Oeffentlich ist klar, dass Cursor mehrere modellgestuetzte Features unterstuetzt. Aber die offiziellen Seiten, die ich geprueft habe, stellen vor allem die eigenen Plaene und Cloud-Features in den Vordergrund, nicht eine saubere "Self-Host Cursor"-Story.

Wichtige Realitaetspruefung

Cursor ist ein eigener Editor, keine normale VS-Code-Extension
Cursor ist historisch VS-Code-aehnlich, aber du "installierst Cursor nicht in VS Code"
wenn du maximale Kontrolle willst, ist VS Code + eigene Extension + lokaler Modell-Endpunkt der transparentere Weg

Meine Einordnung

Aus der oeffentlichen Cursor-Produktoberflaeche ergibt sich fuer mich:

Cursor ist am besten als proprietaerer, gehosteter Editor mit lokalem Editor-Charakter zu verstehen
aber nicht als voll selbst hostbarer AI-Stack

Wenn dein echtes Ziel also ist:

moeglichst wenig Kosten
lokale Modellkontrolle
transparente Infrastruktur

dann ist VS Code die bessere Langfrist-Basis, nicht Cursor.

4. Der saubere VS-Code-Fallback

Der klarste dokumentierte Fallback, den ich gefunden habe, ist:

VS Code
Continue
DeepSeek lokal ueber Ollama oder hinter einem OpenAI-kompatiblen Server

Continue dokumentiert sich selbst als open-source coding agent mit VS-Code-Extension. Gleichzeitig weist die Doku darauf hin, dass das urspruengliche Repo inzwischen read-only ist, die finale 2.0.0-Version aber weiter nutzbar bleibt.

Warum dieser Stack Sinn ergibt

DeepSeek liefert das Modell, Ollama oder vLLM den Server, Continue die Agent-Oberflaeche in VS Code.

5. Einfachster Self-Hosting-Pfad: Ollama + DeepSeek Coder + VS Code

Das ist der einfachste Weg auf einer einzelnen Maschine.

5.1 Ollama installieren

Installiere Ollama und ziehe dann ein DeepSeek-Coder-Modell:

ollama run deepseek-coder

Ollama listet aktuell diese DeepSeek-Coder-Varianten:

deepseek-coder:1.3b
deepseek-coder:6.7b
deepseek-coder:33b

5.2 Welche Groesse solltest du waehlen?

Das hier ist eine Schlussfolgerung aus der Modellgroesse, keine offizielle Ollama-Hardwaregarantie:

Modell	Gut fuer
1.3b	Tests, schwache Laptops, sehr niedriger Ressourcenverbrauch
6.7b	Die realistischste lokale Coding-Basis
33b	Ernsthafte lokale Inferenz mit starker Hardware

Wenn du unsicher bist, starte mit:

ollama run deepseek-coder:6.7b

5.3 Continue in VS Code installieren

Installiere die Continue-Extension aus dem VS Code Marketplace.

5.4 Continue auf den lokalen Endpunkt zeigen lassen

Die exakte UI kann sich veraendern, aber die Architektur ist:

Model-Provider: OpenAI-kompatibel oder lokale API
Endpoint: dein lokaler Ollama-Server
Modell: deepseek-coder oder deepseek-coder:6.7b

Ein typischer lokaler Endpoint ist:

http://localhost:11434

5.5 Ergebnis

Du hast dann:

VS Code als Editor
Continue als Agent-/Chat-Schicht
DeepSeek Coder als lokales Coding-Modell
keine laufende Token-Rechnung

6. Staerkerer Self-Hosting-Pfad: vLLM-Server

Wenn du etwas Server-artigeres als Ollama willst, nimm vLLM.

Die vLLM-Doku bietet explizit einen OpenAI-kompatiblen Server und listet ausserdem Integrationen fuer Claude Code und Codex.

Das ist wichtig, weil damit ein lokaler Modellserver zu einem Backend werden kann fuer:

VS-Code-Tools
Codex-artige Workflows
Claude-Code-artige Workflows
eigene Apps

6.1 Grundidee

Du laesst ein Modell hinter vLLM laufen und stellst eine OpenAI-aehnliche API bereit:

vllm serve <your-model>

Danach verbindest du dein Tool mit diesem lokalen Endpoint, als waere es eine OpenAI-kompatible API.

6.2 Wann vLLM statt Ollama?

Nimm Ollama, wenn:

du die schnellste lokale Einrichtung willst
du auf einer einzelnen Developer-Maschine arbeitest
du moeglichst wenig Infrastruktur willst

Nimm vLLM, wenn:

du einen ernsteren lokalen oder Team-Server willst
du OpenAI-kompatibles Routing fuer mehrere Tools willst
du groessere Modelle auf staerkerer GPU-Hardware fahren willst

7. VS-Code-Implementierungs-Blueprint

Wenn du das als reproduzierbares Setup haben willst, dann so:

Option A - am einfachsten

VS Code
Continue-Extension
Ollama
deepseek-coder:6.7b

Option B - skalierbarer

VS Code
Continue-Extension
vLLM OpenAI-kompatibler Server
ein staerkeres selbst gehostetes DeepSeek-Modell

Option C - hybrid

Cursor Hobby fuer gelegentliche Premium-UX
VS Code + lokales DeepSeek fuer haeufige oder billige Nutzung

Dieses Hybrid-Setup ist oft die rationalste Wahl.

8. Kann man Cursor selbst hosten?

Kurze Antwort

Nicht in dem Sinn, in dem Leute normalerweise "self-host" meinen.

Was ich verifizieren konnte

Cursor beschreibt auf seinen oeffentlichen Produkt- und Pricing-Seiten klar:

gehostete Plaene
Cloud Agents
Team Billing
Admin-/Privacy-Kontrollen

Was ich in den offiziellen oeffentlichen Quellen nicht gefunden habe, ist eine saubere "Cursor vollstaendig on-prem selbst betreiben"-Story.

Praktisches Fazit

Behandle Cursor als:

proprietaeres Editor-Produkt
mit kostenlosem Einstieg
aber nicht als Grundlage fuer Self-Hosting

Wenn Self-Hosting dein echtes Ziel ist, baue um:

VS Code
Ollama oder vLLM
DeepSeek Open-Weight-Modelle

9. Kann man DeepSeek selbst hosten?

Ja, mit einer wichtigen Unterscheidung

Du kannst DeepSeek-Modelle selbst hosten, nicht die komplette kommerzielle DeepSeek-SaaS-Erfahrung.

Die drei realistischen Modi

Modus	Was das bedeutet
DeepSeek-API	Offizielle gehostete API, bezahlt
Ollama	Einfacher lokaler Runtime fuer kleinere lokale DeepSeek-Modelle
vLLM	Fortgeschrittener selbst gehosteter Inferenz-Server

Gute Self-Hosting-Varianten

Lokaler Laptop / Workstation

ollama run deepseek-coder:6.7b

Home Lab / GPU-Server

ein Modell mit vLLM hosten
einen OpenAI-kompatiblen Endpoint bereitstellen
VS Code, Codex-aehnliche Tools oder eigene Apps daran anbinden

Compliance-Hinweis

Wenn dir Data Residency oder Privacy wichtig sind, ist lokales/selbst gehostetes DeepSeek meist attraktiver als die offizielle gehostete API. Trotzdem musst du selbst entscheiden zu:

Modellherkunft
internen Richtlinien
Netzisolierung
Prompt- und Code-Retention

10. Minimale Setup-Rezepte

10.1 Guenstigstes praktisches Setup

Cursor Hobby + DeepSeek nur bei Bedarf

Gut fuer:

Ausprobieren
leichte Nutzung
keine Infrastruktur

10.2 Wirklich kostenloses Daily-Setup

VS Code + Continue + Ollama + deepseek-coder:6.7b

Gut fuer:

taegliches Coding
keine Token-Kosten
Local-First-Workflow

10.3 Starkes Self-Hosted-Setup

VS Code + Continue + vLLM + selbst gehostetes DeepSeek-Modell

Gut fuer:

Team-Nutzung
internes API-Routing
ernsthaftere Infrastruktur

11. Fazit

Wenn dir jemand gesagt hat "Cursor und DeepSeek sind kostenlos", dann ist die korrekte Version:

Cursor: Es gibt einen Free-Tier, aber mit Limits
DeepSeek-API: nicht kostenlos
DeepSeek lokal / self-hosted: ja, effektiv kostenlos ausser Hardwarekosten

Wenn du den besten pragmatischen Weg willst:

starte mit Cursor Hobby
schiebe schwere Arbeit auf VS Code + lokales DeepSeek
wenn lokale Nutzung ernsthaft wird, wechsle von Ollama zu vLLM

So bekommst du einen Workflow, der billig, kontrollierbar und nicht an einen einzigen gehosteten Editor gekettet ist.

1. Die kurze Antwort​

Cursor​

DeepSeek​

Meine praktische Empfehlung​

2. Was "kostenlos" hier wirklich bedeutet​

3. Kann man DeepSeek in Cursor nutzen?​

Wichtige Realitaetspruefung​

Meine Einordnung​

4. Der saubere VS-Code-Fallback​

5. Einfachster Self-Hosting-Pfad: Ollama + DeepSeek Coder + VS Code​

5.1 Ollama installieren​

5.2 Welche Groesse solltest du waehlen?​

5.3 Continue in VS Code installieren​

5.4 Continue auf den lokalen Endpunkt zeigen lassen​

5.5 Ergebnis​

6. Staerkerer Self-Hosting-Pfad: vLLM-Server​

6.1 Grundidee​

6.2 Wann vLLM statt Ollama?​

7. VS-Code-Implementierungs-Blueprint​

Option A - am einfachsten​

Option B - skalierbarer​

Option C - hybrid​

8. Kann man Cursor selbst hosten?​

Kurze Antwort​

Was ich verifizieren konnte​

Praktisches Fazit​

9. Kann man DeepSeek selbst hosten?​

Ja, mit einer wichtigen Unterscheidung​

Die drei realistischen Modi​

Gute Self-Hosting-Varianten​

Lokaler Laptop / Workstation​

Home Lab / GPU-Server​

Compliance-Hinweis​

10. Minimale Setup-Rezepte​

10.1 Guenstigstes praktisches Setup​

10.2 Wirklich kostenloses Daily-Setup​

10.3 Starkes Self-Hosted-Setup​

11. Fazit​

Offizielle Quellen​

1. Die kurze Antwort

Cursor

DeepSeek

Meine praktische Empfehlung

2. Was "kostenlos" hier wirklich bedeutet

3. Kann man DeepSeek in Cursor nutzen?

Wichtige Realitaetspruefung

Meine Einordnung

4. Der saubere VS-Code-Fallback

5. Einfachster Self-Hosting-Pfad: Ollama + DeepSeek Coder + VS Code

5.1 Ollama installieren

5.2 Welche Groesse solltest du waehlen?

5.3 Continue in VS Code installieren

5.4 Continue auf den lokalen Endpunkt zeigen lassen

5.5 Ergebnis

6. Staerkerer Self-Hosting-Pfad: vLLM-Server

6.1 Grundidee

6.2 Wann vLLM statt Ollama?

7. VS-Code-Implementierungs-Blueprint

Option A - am einfachsten

Option B - skalierbarer

Option C - hybrid

8. Kann man Cursor selbst hosten?

Kurze Antwort

Was ich verifizieren konnte

Praktisches Fazit

9. Kann man DeepSeek selbst hosten?

Ja, mit einer wichtigen Unterscheidung

Die drei realistischen Modi

Gute Self-Hosting-Varianten

Lokaler Laptop / Workstation

Home Lab / GPU-Server

Compliance-Hinweis

10. Minimale Setup-Rezepte

10.1 Guenstigstes praktisches Setup

10.2 Wirklich kostenloses Daily-Setup

10.3 Starkes Self-Hosted-Setup

11. Fazit

Offizielle Quellen