Der Systemprompt am Beispiel von Claude Fable 5 – und welche Prompting-Techniken Sie von Anthropic übernehmen können

Am 9. Juni 2026 hat Anthropic den öffentlichen Zugang zu Claude Fable 5 freigeschaltet – einem Modell, das noch eine Stufe über dem ohnehin starken Opus 4.8 steht. Fable 5 hat einen Zwilling, Claude Mythos 5: technisch dasselbe Modell, der Unterschied liegt allein in der Absicherung. Mythos 5 sind einige Schutzgrenzen genommen, deshalb steht es nur freigegebenen Organisationen zur Verfügung. Fable 5 ist die öffentliche Variante mit eingebauten Schutz-„Klassifikatoren”: Bei heiklen Anfragen – etwa zur Cybersicherheit – antwortet das Modell nicht direkt, sondern reicht die Antwort an ein schwächeres Modell weiter (zum Start war das Claude Opus 4.8).

Der Schutz hielt nicht lange. Forscher von Amazon zeigten, dass sich Fable 5 trotzdem dazu bringen lässt, Schwachstellen in Code zu suchen – es genügt, ihm eine Codebasis zu geben und ihn zu bitten, „Fehler zu beheben”. Die US-Regierung erfuhr davon und verhängte am 12. Juni Exportkontrollen auf Fable 5 und Mythos 5 und sperrte den Zugang für alle Personen außerhalb der USA. Beide Modelle einzeln zu trennen gelang Anthropic nicht – also wurden sie zum Stand dieses Textes (19. Juni 2026) für alle abgeschaltet.

Kurz vor der Sperrung wurde aus Claude Fable 5 der vollständige Systemprompt gezogen. Offiziell veröffentlicht das Unternehmen nur eine gekürzte Fassung; hier liegt ein Dokument mit rund 17.000 Wörtern vor, mit detaillierten Anweisungen, wie sich das Modell in unterschiedlichen Situationen verhalten soll. Das ist aus zwei Gründen interessant. Erstens lohnt es sich grundsätzlich zu verstehen, was ein Systemprompt tut und wie er die Antworten eines Modells prägt. Zweitens lässt sich daran ablesen, wie eine der besten KI-Firmen der Welt Prompts schreibt – und diese Techniken lassen sich auf die Arbeit mit jedem KI-Modell übertragen.

Quelle

Der vollständige geleakte Systemprompt von Claude Fable 5 (≈ 17.000 Wörter) liegt als GitHub-Gist vor: gist.github.com/Kuberwastaken/bfcf1419… Es handelt sich um einen inoffiziellen Leak, von Anthropic nicht bestätigt.

Welchen Platz der Systemprompt in der „Struktur” eines Modells einnimmt

Grob skizziert läuft das Training eines KI-Modells so ab. Zuerst durchläuft das Modell das Pre-Training, die Phase, in der die „rohen” Inhalte hineingeladen werden. Danach folgt das Post-Training: ein großer, aufwendiger Schritt, in dem das Modell an vielen Beispielen lernt, möglichst präzise zu antworten. Hier wird das Verhalten auf einer tiefen Ebene justiert. Das Problem dabei: Solches Nachtrainieren ist langwierig und teuer, also macht man es nicht ständig.

Erst nach dem Training schreibt man für das Modell den Systemprompt: eine Textanweisung, die das Modell zu Beginn jedes Dialogs mit einem Nutzer liest. Darin stehen Stil und Format der Antworten, Anweisungen für typische Situationen, Beschreibungen der verfügbaren Werkzeuge, zusätzliche Sicherheitsgrenzen und so weiter.

Abb. 1 · Modell-Lebenszyklus

Wo der Systemprompt entsteht

01

Pre-Training

Die rohen Inhalte werden ins Modell geladen.

Rohe Inhalte

→

02

Post-Training

Lernen an vielen Beispielen; das Verhalten wird auf tiefer Ebene justiert.

Langwierig · teuer · selten

03

Systemprompt

Textanweisung — Stil, Format, Werkzeuge, Sicherheitsgrenzen.

Nach dem Training geschrieben

Trainingszeit — im Modell verankert

Langwierig & teuer; wird nur selten neu gemacht.

Laufzeit — vor jedem Dialog gelesen

Von den Entwicklern jederzeit änderbar.

ABB. 1 Der Systemprompt steckt nicht in den Modellgewichten. Er wird erst nach dem Training geschrieben — als Textanweisung, die das Modell zu Beginn jedes Dialogs liest und die die Entwickler jederzeit ändern können.

Nach dem Systemprompt beginnt der nutzerseitige Teil. Haben Sie einen eigenen, dauerhaften Nutzer-Prompt hinterlegt, liest das Modell ihn als Nächstes. Ist das chatbasierte Gedächtnis aktiv, folgt die Liste der Fakten, die das Modell aus früheren Gesprächen über Sie gesammelt hat. Arbeiten Sie innerhalb eines Projekts, liest es stattdessen die Projektbeschreibung samt der angehängten Dokumente. Und erst danach liest die KI den Prompt aus dem aktuellen Dialog.

Abb. 2 · Lese-Reihenfolge des Kontexts

Was das Modell zuerst liest

Zu Beginn jedes Dialogs

01 → 05 ↓ liest von oben nach unten

01

Systemprompt

Stil, Format, Werkzeuge, Sicherheitsgrenzen.

Nicht editierbar

02

Nutzer-Prompt

Der dauerhafte Prompt — was das Modell immer über Sie wissen soll.

Dauerhaft

03

Gedächtnis

Fakten, die das Modell aus früheren Gesprächen gesammelt hat.

Wenn aktiv

04

Projekt

Projektbeschreibung samt der angehängten Dokumente.

Wenn aktiv

05

Aktueller Dialog

Ihre Anfrage in diesem Moment.

Jetzt

ABB. 2 Das Modell erhält gleich zu Beginn eine Wand aus teils widersprüchlichen Anweisungen und entscheidet, welche Vorrang hat: Sicherheitsgrenzen aus dem Systemprompt, einen Stilwunsch aus Ihrer aktuellen Anfrage. Punkte 03 und 04 erscheinen nur, wenn Gedächtnis bzw. Projekt aktiv sind.

Das heißt: Schon zu Beginn jedes Gesprächs bekommt das Modell eine große Wand aus Text mit teils widersprüchlichen Anweisungen und muss entscheiden, welche davon Vorrang hat. Sicherheitsgrenzen nimmt es sinnvollerweise aus dem Systemprompt. Steht dort aber ein freundlicher Charakter, und Sie bitten die KI, zynisch zu sein, sollte sie sich an Ihrer Anfrage orientieren. Und wenn Ihnen das zynische Modell mitten im Dialog auf die Nerven geht und Sie es bitten, wieder sachlich zu werden, muss es diese neue Anweisung berücksichtigen und die beiden vorherigen verwerfen.

Damit hängt auch das Problem des Context Rot zusammen, der schleichenden Verschlechterung des Kontexts. Je länger ein Dialog läuft, desto mehr Daten und Anweisungen sammeln sich an und desto schwerer fällt es dem Modell, alles richtig einzuordnen. In KI-Agenten lässt sich dem mit Compaction begegnen; in Chatbots ist die wirksame Lösung bislang schlichter: eine Zusammenfassung des Chats erstellen und einen neuen Dialog starten.

Ein grundsätzliches Thema beim Systemprompt ist, dass der Nutzer ihn nicht bearbeiten kann. Ändern dürfen ihn nur die Entwickler. Gekürzte Fassungen der Claude-Prompts stehen zwar online, aber jede Änderung zu verfolgen ist aufwendig. Für den Nutzer sehen solche Anpassungen am Ende wie Stiländerungen aus, die scheinbar aus dem Nichts kommen.

Auch wenn Sie den Systemprompt nicht beeinflussen können, gibt es ein paar Hebel, mit denen Sie die Arbeit des Modells verbessern:

In den dauerhaften Nutzer-Prompt gehört nur, was das Modell immer über Sie wissen soll: Name, Rolle, bevorzugter Antwortstil. Machen Sie daraus keine Halde aus Verhaltensregeln.

Justieren Sie die „Persönlichkeit” des Modells möglichst nicht von Hand. Das ist anfangs reizvoll, schadet aber langfristig: Stellen Sie das Modell als Spaßvogel ein, geraten in eine schwierige Lage, kommen mit einer Frage – und ernten einen unpassenden Witz. Wollen Sie dennoch experimentieren, haben manche KI-Produkte mehrere vordefinierte Charaktere in den Einstellungen. Dort geschieht das Umschalten auf Ebene des Systemprompts und führt zu einem saubereren Ergebnis.

Ist das chatbasierte Gedächtnis aktiv, machen Sie es sich zur Regel, alle paar Wochen in die Einstellungen zu schauen und zu prüfen, was sich das Modell über Sie gemerkt hat. Nicht selten hält eine KI alte Einträge fest – etwa, dass Sie noch in der Probezeit seien, obwohl die längst vorbei ist.

Wie weit lassen sich die Antworten eines Modells überhaupt steuern?

Vereinfacht lassen sich die Anweisungen an ein Modell in drei Kategorien einteilen.

Die erste sind Grenzen, die ein Nutzer in der Regel nicht aufheben kann. Sie liegen aber nicht alle direkt im Systemprompt: ein Teil steckt im Training, ein Teil in den Systemanweisungen, ein Teil in externen Klassifikatoren, Zugriffsrechten und in den Werkzeugen selbst. Üblicherweise ist es Claude nicht verboten, ein heikles Thema überhaupt zu besprechen. Die Grenze verläuft zwischen Erklärung und praktischer Hilfe, die das Anrichten von Schaden spürbar erleichtert. Außerdem ist eine technische Grenze verlässlicher als eine textliche: Hat ein Agent kein Recht, eine Datei zu löschen oder eine E-Mail zu versenden, verschafft ihm kein Nutzer-Prompt dieses Recht.

Die zweite Kategorie sind weiche Voreinstellungen. Das ist das Standardverhalten: in welchem Stil das Modell antwortet, wie tief es im Web sucht, ob es Rückfragen stellt. Das Modell hält sich an das, was im Systemprompt steht – genau bis zu dem Moment, in dem Sie ausdrücklich um etwas anderes bitten.

Die dritte Kategorie sind Leerstellen. Das ist alles, was keine allgemeine Anweisung wissen kann: wozu Sie das Ergebnis brauchen, wer es lesen wird, welche Entscheidung es stützen soll, was wichtiger ist – Tempo, Vollständigkeit oder Präzision –, welche Quellen Sie für verlässlich halten. Der Systemprompt wurde nicht für Sie geschrieben und schon gar nicht für die heutige Aufgabe. Diese Lücken schließt niemand für Sie.

Daraus folgt: Eine gute Anfrage muss genau zwei Dinge leisten. Erstens die weichen Voreinstellungen dort umschalten, wo es nötig ist. Zweitens die Leerstellen füllen und dem Modell die Information geben, die es für die Aufgabe braucht.

Woraus der Systemprompt von Fable 5 besteht

Zurück zur geleakten Datei. Es sind rund 17.000 Wörter, aufgeteilt in Dutzende Abschnitte, und Anthropic hat sie offiziell nicht bestätigt. Behandeln wir sie also nicht als offizielle Anleitung, sondern als Momentaufnahme, wie die Steuerung eines solchen Produkts aufgebaut sein kann.

Ein erheblicher Teil der Datei dreht sich nicht um den Charakter von Claude, sondern um den Aufbau des Produkts: Suche, angebundene Dienste, Dateierstellung, Speicher, Skills und die Schemata der Werkzeuge. Die zentralen Regeln zu Ton und Kommunikation stehen dagegen vergleichsweise weit vorne. Vor uns liegt also nicht nur die „Persönlichkeit des Modells”, sondern eine zusammengestellte Bedienungsanleitung für den gesamten Assistenten.

Die Abschnitte sind als benannte Blöcke aufgebaut: „wie man absagt”, „wie man die Antwort formatiert”, „wann gesucht wird”, „Urheberrecht”, dazu Beschreibungen der angebundenen Werkzeuge. Eine eigene Mechanik bilden die Skills: Bevor das Modell Ihnen ein Dokument, eine Tabelle oder eine Präsentation baut, liest es zunächst eine gesonderte Anleitung für genau diese Art von Arbeit.

Übrigens ist das Dokument nicht fehlerfrei. Es finden sich Wiederholungen, einander widersprechende Regeln und Stellen, an denen ältere Claude-Versionen erwähnt werden.

Eigenheiten von Claude, die zu kennen sich lohnt

Schauen wir, wie Anthropic seine Modelle eingestellt hat. Ich schreibe bewusst „Modelle” im Plural: Auch wenn der Systemprompt für Fable 5 geschrieben ist, liegen die darin beschriebenen Verhaltensregeln nah an dem, was ich in der Arbeit mit Claude Opus 4.8 sehe. Im Folgenden die interessantesten Punkte.

Claude ist auf Wohlwollen ausgelegt. Es soll dem Gegenüber warm begegnen, es nicht für dumm halten und sanft widersprechen. Meist ist das angenehm, aber den Kritikmodus müssen Sie selbst aktivieren. Brauchen Sie Härte, schreiben Sie es direkt: „Beschönige die Einschätzung nicht aus Höflichkeit; mir ist wichtiger, alle Schwachstellen zu finden, als einen angenehmen Eindruck zu wahren.”

Claude mag überflüssige Formatierung nicht. Im Prompt steht ausdrücklich, nach Möglichkeit in zusammenhängendem Text zu antworten und nicht alles in Listen auszukippen. Wollen Sie also gerade eine Tabelle oder eine kurze Liste der Schlüsse zu Beginn, bitten Sie gesondert darum – sonst bekommen Sie saubere Absätze.

Claude versucht, eine Rückfrage nicht zum Verhör zu machen. Standardmäßig versucht es zuerst zu antworten und stellt nicht mehr als eine Frage auf einmal. Für eine einfache Aufgabe ist das praktisch. Haben Sie aber etwas Komplexes vor – eine Auswahl, ein Interview, einen Entwurf –, erlauben Sie ihm, vorab zu fragen: „Stelle zuerst alle nötigen Fragen in einer Nachricht und beginne nicht, bevor ich geantwortet habe.”

Claude schätzt ab, wie schnell eine Information veraltet. Veränderliche Dinge – aktuelle Preise, gegenwärtige Positionen, Nachrichten – prüft es eher im Internet, stabile Fakten holt es aus dem Gedächtnis. Eine gute Gewohnheit, aber kein vollwertiger Faktencheck: Ein gefundener Link zeigt, woher die Worte stammen, beweist aber nicht, dass die Quelle recht hat. Welche Prüftiefe Sie brauchen, geben Sie selbst vor – dazu gleich eine eigene Technik.

Als Bonus eine kuriose Einstellung: Claude ist es untersagt zu fluchen, bis der Nutzer ausdrücklich darum bittet oder selbst damit anfängt. Und selbst dann bleibt das Modell maßvoll; übertreibt es der Nutzer weiter, hat Claude die Erlaubnis, das Gespräch zu beenden.

Eine kurze Anmerkung für ChatGPT-Nutzer zum Schluss dieses Abschnitts: Die Modelle von OpenAI haben natürlich einen eigenen Systemprompt mit anderen Anweisungen als Claude. Die Stärke von ChatGPT sind die ausführlichen Personalisierungseinstellungen, die den Systemprompt im laufenden Betrieb verändern. Sie können die Wärme der Antworten regeln und einstellen, wie oft das Modell Tabellen, Listen und Emojis verwendet. In den meisten Fällen reichen diese Einstellungen, um das Modell „auf sich” zuzuschneiden.

Acht Techniken, die Sie sich von den Profis abschauen sollten

Nun zu den Techniken, die Anthropic in der einen oder anderen Form in seine Modelle einbaut. Dieses Kapitel ist eine Verdichtung aus dem Systemprompt und den offenen Leitfäden des Unternehmens – nutzen sollten die Techniken also auch alle, die mit Claude arbeiten. Wer andere Modelle verwendet, erst recht.

1. Erklären Sie, wozu das Ergebnis dient

Anthropic rät ausdrücklich, dem Modell nicht nur die Aufgabe zu geben, sondern auch deren Sinn: für wen die Arbeit ist und was das Ergebnis ermöglichen soll. Dann wählt das Modell das Passende aus, statt Ihre Absicht zu raten.

Vergleichen Sie: „Analysiere diese Bewertungen” – und Sie bekommen einen Überblick im Allgemeinen. „Ich entscheide, welche drei Produktmängel ich im nächsten Update behebe; gruppiere die wiederkehrenden Beschwerden und schätze ein, welche Menschen am stärksten vom Kauf abhalten” – und dieselbe KI liefert genau das, was Sie für die Entscheidung brauchen. Das ist kein „überflüssiger Kontext”, sondern das Kriterium, nach dem das Modell das Wichtige aussortiert.

2. Bauen Sie eine Quellenkarte

Erinnern Sie sich an die Gewohnheit, abzuschätzen, was veraltet ist? Führen Sie sie selbst zu Ende. Statt eines vagen „prüfe die Fakten” geben Sie vor, woher was kommt: „Den Bericht im Anhang behandle als Hauptquelle; aktuelle Preise und Positionen prüfe im Internet; für wichtige Schlüsse nimm die Primärquelle oder zwei unabhängige Bestätigungen; Lücken fülle nicht aus dem Gedächtnis.”

Und behalten Sie das Wesentliche im Kopf: Ein Link zeigt, woher die Worte stammen, beweist aber nicht, dass die Quelle recht hat. Welche Prüftiefe Ihnen genügt, entscheiden allein Sie.

3. Trennen Sie Analyse und Handlung

Entscheiden Sie vorab, was Sie brauchen – eine Analyse oder ein fertiges Ergebnis – und sagen Sie es. Im Chat: „Bewerte das Dokument und erstelle eine Liste der Änderungen, die Datei selbst lass vorerst unangetastet.” Anschließend prüfen Sie die Liste von Hand, wählen die Punkte, denen Sie zustimmen, und geben dem Modell den Auftrag, das Dokument zu ändern.

4. Sagen Sie, wann gefragt und wann angenommen wird

Standardmäßig stellt das Modell mal eine überflüssige Frage, mal verstummt es und wartet. Geben Sie die Regel selbst vor: „Ändert ein Detail das Ergebnis nicht, triff eine vernünftige Annahme und nenne sie laut; frage nur dann, wenn vom Ergebnis etwas abhängt.” Und für eine Aufgabe, bei der zuerst ein Gespräch nötig ist: „Sammle alle für die Arbeit nötigen Fragen und stelle sie in einer Nachricht; mit der eigentlichen Arbeit beginne nach meinen Antworten.”

5. Beschreiben Sie, was „fertig” bedeutet

Die häufigste Ursache für eine mittelmäßige Antwort ist, dass das Modell nicht weiß, an welchen Merkmalen die Arbeit abgeschlossen ist. Nicht „prüfe die Antwort”, sondern Siegbedingungen: „Die Arbeit ist fertig, wenn alle Zahlen mit den Quellen abgeglichen sind, Unbestätigtes markiert ist, gefundene Widersprüche gesondert ausgewiesen sind, der Text auf Wiederholungen durchgesehen wurde und eine finale Fassung vorliegt – kein Plan für weitere Schritte.”

6. Legen Sie einen eigenen Skill für wiederkehrende Arbeit an

Erledigen Sie ein und dieselbe Aufgabe regelmäßig, schreiben Sie nicht jedes Mal einen riesigen Prompt von Grund auf. Nehmen Sie ein oder mehrere gelungene Ergebnisse, geben Sie dem Modell die Aufgabe, den Workflow zusammenzustellen, der zu diesem Ergebnis geführt hat, prüfen Sie ihn selbst und bitten Sie dann, ihn in einen Skill zu verwandeln – und speichern Sie ihn.

Stößt das Modell beim nächsten Mal auf eine ähnliche Aufgabe, lädt es den Skill selbst und arbeitet ihn ab. Aber denken Sie daran, dass ein Skill gepflegt werden will. Hat das Modell einen Fehler gemacht und Sie ihn korrigiert, geben Sie ihm die Aufgabe, das zu analysieren und den Skill nachzubessern, damit sich der Fehler nicht wiederholt.

7. Lassen Sie das Ergebnis bestätigen, nicht die Absicht

Nach jeder Handlung, die ein externes Objekt verändert, soll das Modell dessen Zustand erneut prüfen. Es soll keinen Erfolg melden, nur weil es ein Werkzeug aufgerufen hat. Vor der finalen Antwort soll es jede Aussage über erledigte Arbeit mit dem Ergebnis des Werkzeugs, eines Tests oder dem erneuten Lesen der Datei abgleichen. Geht die Prüfung nicht durch, soll es das direkt sagen.

8. Selbstprüfung auf sauberem Kontext

Diese Technik hat ein anderes Modell erst beim finalen Korrekturlesen dieses Textes zutage gefördert. Sie steht nicht im Systemprompt, sondern in den Empfehlungen von Anthropic – ist aber genauso einfach wie wirkungsvoll.

Beschränken Sie sich bei wichtiger Arbeit nicht auf das Kommando „prüfe dich selbst”. Öffnen Sie einen neuen Dialog und übergeben Sie dorthin nur die ursprüngliche Aufgabe, das fertige Ergebnis sowie die wichtigen Präzisierungen, die im Lauf der Arbeit aufgekommen sind. Ein solcher Prüfer erbt nicht den gesamten Gedankengang des Autors und bemerkt systematische Fehler häufiger.

Spickzettel zum Schluss

Je länger ich mit den Prompts eines Modells arbeite, desto mehr festigt sich der Eindruck: Eine einzige richtige Lösung oder ein fester Regelsatz existiert nicht. Der „perfekte Prompt” hängt vom Entwickler des Modells ab, von dessen konkreter Version, von der Aufgabe und sogar von Ihrer Tagesform. Der allgemeingültige Rat lautet: Arbeiten Sie so viel wie möglich mit KI und versuchen Sie zu verstehen, wie ein Modell „aufgebaut” ist. Probieren Sie verschiedene Ansätze und beobachten Sie, was die Antworten tatsächlich beeinflusst und verbessert.

Aus dieser Betrachtung empfehle ich folgende Prompt-Vorlage:

Wozu: für wen die Arbeit ist und welche Entscheidung das Ergebnis stützen soll. Material und Quellen: was als Grundlage gilt, was zu prüfen ist und wie aktuell es sein muss. Aufgabe: was genau zu tun ist. Handlungsgrenzen: nur Analyse oder fertige Handlung; was eigenständig erlaubt ist und was nur mit Bestätigung. Unklarheiten: wann eine Annahme zu treffen ist, wann Varianten zu zeigen sind und wann zwingend gefragt werden muss. Fertigkeit: was getan und geprüft sein muss, bevor die Arbeit als abgeschlossen gilt. Form des Ergebnisses: in welcher Form es sich anschließend am bequemsten weiterverwenden lässt.

Das ist eine ausführliche Liste – Sie können nur die nötigen Punkte herausnehmen oder Eigenes für die konkrete Aufgabe ergänzen.

Und als Bonus noch ein kleiner Rat. Jedes Mal, wenn eine neue Modellversion erscheint (etwa wenn Opus 4.7 durch Opus 4.8 ersetzt wird), mache ich eine einfache Sache: Ich schalte für mindestens ein paar Stunden alle eigenen Einstellungen ab – Nutzer-Prompt, Stileinstellungen, chatbasiertes Gedächtnis, Skills – und fahre das Modell mit Prompts, die gerade so für die Aufgabe ausreichen („Schreibe eine Nachricht für die und die Zielgruppe, Mindestumfang so viel, Höchstumfang so viel, Überschrift maximal 120 Zeichen, Quellenlinks nach dem Haupttext”). So lässt sich erkennen, welchen Stil und welches Format die Entwickler in das neue Modell gelegt haben – und ob es sich lohnt, daran mit eigenen Einstellungen zu drehen.