DeepSeek R1: Das Open-Source-Reasoning-Modell, das die KI-Welt auf den Kopf stellt | 27.01.2025
In der internationalen KI-Szene herrscht derzeit Aufregung wie selten zuvor. Während in den USA milliardenschwere Projekte wie „Project Stargate“ angekündigt werden, sorgt in China ein neues Modell namens DeepSeek R1 für Furore. Die Besonderheit: Es ist frei verfügbar, Open Source und offenbar leistungsstark genug, um sich mit den Top-Sprachmodellen großer Unternehmen wie OpenAI zu messen – und das zu einem lächerlich günstigen Preis, teilweise sogar kostenlos. Ich mag KI und habe hier im Blog schon häufig über OpenAI und andere Entwicklungen geschrieben. In diesem Beitrag werfen wir einen Blick darauf, was es mit DeepSeek R1 auf sich hat, wie es sich gegen andere Modelle schlägt und welche neuen Möglichkeiten es bietet.
DeepSeek R1 ist ein Reasoning-Modell, ein Large Language Model (LLM), das sich auf kettengedachtes Schließen (Chain of Thought) spezialisiert hat. Diese speziellen CoT-Modelle sind für komplexe Aufgaben ausgelegt: Mathematik, fortgeschrittenes Coding oder jede andere Problemstellung, bei der logisches Schlussfolgern notwendig ist. Besonders spannend ist, dass DeepSeek R1 komplett Open Source ist. Entwickelt von einer chinesischen Firma (oder als Nebenprojekt eines Hedgefonds), verfolgt das Modell das Ziel, langfristigen sozialen Wert zu schaffen, statt primär auf Profit zu setzen.
Leistungsniveau
In ersten Tests und Benchmarks konnte R1 das Niveau des amerikanischen Modells OpenAI O1 erreichen und in manchen Disziplinen sogar übertreffen. KI-Experten wie Dr. Jim Fan (Nvidia) oder Emad Mustaq (Stability AI) loben das Modell und sehen in ihm einen echten Meilenstein. Auch der Preisvergleich erstaunt: Während man bei OpenAI teils hohe Kosten für den Zugriff auf bestimmte Reasoning-Funktionen zahlt, ist DeepSeek R1 häufig kostenlos oder deutlich günstiger nutzbar.
Ein Alleinstellungsmerkmal von DeepSeek R1 ist seine Trainingsmethode:
Keine klassische Supervised Fine-Tuning-Pipeline
Statt einen Datensatz mit Schritt-für-Schritt-Lösungen (z.B. durch menschliches Labeling) zu verwenden, setzt DeepSeek R1 auf sogenanntes direct reinforcement learning.
Direktes (oder „pures“) Reinforcement Learning
Das Modell erhält Aufgaben, ohne dass es die Lösungswege dazu vorgegeben bekommt. Stattdessen „probiert“ sich R1 an verschiedenen Lösungsansätzen. Die jeweils besten werden mit einem Reward-System belohnt, was das Netz langfristig besser macht. Dieses Vorgehen ähnelt menschlichem Lernen, bei dem ein Ziel selbstständig und iterativ verfolgt wird.
Durch diesen Ansatz hat R1 seine Reasoning-Fähigkeiten offenbar auf eine Art entwickelt, die in vielen Bereichen an ein menschliches Problemlösungsverhalten erinnert. Beim Chat mit R1 kann man den „Gedankengang“ oft live mitverfolgen, was tiefere Einblicke in das Innenleben der KI gibt.
Die wohl schnellste Möglichkeit, R1 auszuprobieren, führt über die offizielle Website deepseek.com. Dort wird ein Chatbot bereitgestellt:
Aktivierung des „DeepThink“-Modus
Damit wird anstelle des Standard-Sprachmodells („DeepSeek V3“) das R1-Modell genutzt, das komplexe Fragen und Aufgaben deutlich besser beantworten kann.
Kostenlos & ohne Abo
Der Account ist gratis, es gibt keinen Plus-Plan. Die Denkprozesse sind im Chat transparent und man kann beobachten, wie das Modell Lösungen erarbeitet.
Wer Bedenken gegenüber einer chinesischen Website hat oder einfach unabhängig arbeiten möchte, kann DeepSeek R1 lokal ausführen:
Kleinere „distilled“ Modelle
Für schwächere Hardware gibt es Varianten mit 7, 32 oder 70 Milliarden Parametern. Diese sind deutlich speicher- und rechenfreundlicher als die „Vollversion“ mit rund 680 Milliarden Parametern, jedoch etwas weniger leistungsfähig.
Software-Tools
Programme wie LM Studio, Ollama oder „Anything LLM“ erlauben es, die Modelle herunterzuladen und lokal zu nutzen. Je größer das Modell, desto mehr Leistung (RAM, GPU, CPU) wird benötigt.
Beispiel: Buchstaben zählen
Eine klassische Testfrage an Sprachmodelle ist das Zählen bestimmter Buchstaben in einem Wort („Wie viele E sind in Erdbeere?“). Auf starker Hardware (Vollversion) klappt dies zuverlässig, bei kleineren Modellen können Fehler auftreten.
Die Veröffentlichung von DeepSeek R1 schlägt hohe Wellen. Manche sprechen von einem „Sputnik-Moment“, da ein chinesisches Open-Source-Modell scheinbar auf Augenhöhe mit teuren, geschlossenen US-Lösungen ist. Dies stellt auch kommerzielle KI-Angebote und GPU-Hersteller wie Nvidia in Frage. Wenn fortschrittliche KI-Modelle zukünftig auf vergleichsweise günstiger Hardware laufen, könnten bisherige Geschäftsmodelle ins Wanken geraten.
OpenAI hat mit O1 bzw. O1 mini zwar eigene Reasoning-Modelle am Start und bietet zusätzliche Funktionen wie „Operator“ (Browser-Automatisierung) an. Dennoch ist der Konkurrenzdruck hoch: DeepSeek R1 ist nicht nur offen und transparent, sondern häufig auch deutlich günstiger oder kostenlos verfügbar. Sam Altman reagierte auf Twitter mit teils kryptischen Aussagen, während Investoren verunsichert sind.
Einen möglichen Wermutstropfen stellt die Zensur bestimmter Themen dar. Berichte deuten darauf hin, dass R1 bei sensiblen Themen (z.B. Taiwan oder historische Ereignisse wie der 15. April 1989) stark eingeschränkt reagiert. Da das Modell jedoch Open Source ist, könnten Forks entstehen, die diese Filter entfernen – ein zweischneidiges Schwert, wie es bereits bei „befreiten“ Versionen von Meta’s Lama zu sehen war.
DeepSeek R1 macht deutlich, dass moderne KI keineswegs nur wenigen Großkonzernen vorbehalten sein muss. Die Zeiten, in denen man tausende GPUs für ein leistungsstarkes Modell brauchte, scheinen sich zu ändern.
Chance für Entwickler und Unternehmen
Dank der MIT-Lizenz und offener Schnittstellen können Start-ups oder etablierte Firmen R1 in ihre Produkte integrieren, ohne hohe Summen für Zugänge oder API-Calls zu zahlen.
KI-Hype und next Steps
Während manche behaupten, die KI sei bald auf ihrem Höhepunkt, sehen andere in DeepSeek R1 erst den Anfang einer neuen Ära. Die Entwicklung ist rasant, und was heute als Durchbruch gefeiert wird, kann morgen von neuen Modellen übertroffen werden.
DeepSeek R1 bietet ein frei verfügbares, hochperformantes Reasoning-Modell, das sich in vielen komplexen Aufgaben mit geschlossenen KI-Lösungen messen kann – und das oft zu einem Bruchteil der Kosten. Die Open-Source-Strategie und die Möglichkeit zum lokalen Betrieb erhöhen nicht nur die Transparenz, sondern verschaffen Entwicklern und Unternehmen mehr Unabhängigkeit.
Ob R1 nun der Startschuss für eine neue Ära der frei verfügbaren KI-Lösungen ist oder „nur“ ein Achtungserfolg in einer sich rasch wandelnden Branche, bleibt abzuwarten. Eines ist jedoch sicher: Mit diesem Modell hat China der globalen KI-Gemeinschaft ein beachtliches Geschenk gemacht – und das Potenzial, die Machtverhältnisse in der KI-Welt zu verändern. Wer in der KI-Welt mitreden will, sollte DeepSeek R1 unbedingt im Auge behalten und ausprobieren, denn selten war es so einfach und bezahlbar, ein leistungsstarkes Reasoning-Modell selbst zu betreiben.