Nicht jede Regel gehört in den Prompt: KI-Instruktionen und Modell-Gedächtnis steuern

Die Modelle werden klüger, und trotzdem wächst um sie herum eine immer dickere Schicht aus Anweisungen. Genau darin steckt ein Paradox. Je besser die KI von sich aus arbeitet, desto mehr externe Instruktionen legen wir ihr in den Weg, und weil die selten sauber geschrieben sind, bringen sie das Modell ebenso oft durcheinander, wie sie helfen. Ein Beispiel für die schiere Menge: Aus Claude Fable 5 wurde vor der Sperrung der vollständige Systemprompt gezogen, rund 17.000 Wörter, die das Modell liest, bevor Sie ein einziges Wort getippt haben.

Dieser Systemprompt ist nur die erste Schicht. Danach liest das Modell Ihre eigenen Instruktionen, dann das Gedächtnis, das es selbst über Sie führt, und wenn Sie in einem Projekt arbeiten, zusätzlich die Projektanweisung. Den Systemprompt schreiben erfahrene Ingenieure. Alles andere kommt von Ihnen, oder das Modell rät es sich zusammen, mit Fehlern. Heraus kommen schiefe Antworten, unnötige Rückfragen und Dialoge, die Sie neu starten müssen.

Die entscheidende Frage bei der Personalisierung ist deshalb nicht „was schreibe ich“, sondern „wohin gehört es“. Und die zweite: Stimmt noch, was sich das Modell über mich gemerkt hat? Wie ich das in ChatGPT, Claude und den Agenten löse, steht hier.

Sechs Zonen, und wohin was gehört

Ein Prinzip vorweg: Je breiter eine Anweisung wirkt, desto vorsichtiger schreiben Sie sie. Ein Fehler im einmaligen Prompt verdirbt eine Antwort. Ein Fehler in den Einstellungen verdirbt Antworten über Monate, und Sie bringen das seltsame Verhalten kaum mit einer Regel in Verbindung, die Sie vor einem halben Jahr geschrieben und längst vergessen haben. Vielleicht haben Sie sie nicht einmal selbst geschrieben; das Modell hat sich beim Zusammenfassen vertan.

Solcher Zonen gibt es bis zu sechs. Ich zeige sie an ChatGPT und Claude; andere Oberflächen ordnen es anders, das Prinzip bleibt.

Die erste Zone sind die Produkt-Einstellungen. Bei Claude unter Settings, dann General und Capabilities; bei ChatGPT vor allem die „Personalisierung“. Alles, wofür der Anbieter schon einen Schalter gebaut hat: Charakter des Modells, Ausführlichkeit, Denkmodus. Die Regel dazu ist simpel. Gibt es den Schalter, benutzen Sie ihn, statt dasselbe in Textform zu beschreiben. Der fertige Schalter ist vom Entwickler formuliert und an Millionen Nutzern getestet, er greift sauberer als Ihre eigene Formulierung.

Die zweite Zone sind die Nutzer-Instruktionen. Bei ChatGPT das Feld „Über dich“ plus die eigentlichen Anweisungen, bei Claude das Feld für Instruktionen. Wichtig: Diese Anweisungen gelten für alle Chats zugleich, auch für die schon laufenden. Schreiben Sie „antworte knapp“, presst das Modell selbst dort zusammen, wo Sie eine ausführliche Analyse brauchen.

Die dritte Zone ist das Projekt: ein Ordner mit Chats, dem Sie eigene Anweisungen geben und Dateien mit Kontext und Beispielen mitgeben. Bei ChatGPT stellen Sie zusätzlich ein, ob das Modell auf Ihr gesamtes Gedächtnis zugreift oder nur auf das des Projekts. Das ist praktisch. Teilt jemand den Account mit Ihnen, legen Sie ihm ein eigenes Projekt an, schalten das gemeinsame Gedächtnis ab und schreiben in die Anweisung, wer dort arbeitet.

Die vierte Zone ist das Gedächtnis: Fakten über Sie, die der Dienst selbst sammelt. Großartige Funktion, zugleich die tückischste, weil das Modell dieses Feld selbst füllt, oft mit Fehlern.

Die fünfte Zone gibt es voll bislang nur bei Anthropic: Skills. Eigene Anleitungen für einen wiederkehrenden Typ Arbeit, die sich nur einschalten, wenn sie gebraucht werden. Ein fester Rechercheprozess, eine Redigierroutine, ein Faktencheck, einmal beschrieben und danach per Stichwort abgerufen, statt jedes Mal neu getippt.

Die sechste Zone ist der aktuelle Prompt. Alles Einmalige lebt hier und nur hier: die einmalige Rolle, das einmalige Format, die heutige Aufgabe.

Zone

Was gehört hinein

Was besser nicht

01Produkt-Einstellungen

Was gehört hinein

+Wofür es schon einen Schalter gibt: Modellcharakter, Antwortlänge, Denkmodus

Was besser nicht

−Was Sie einmal brauchen – das klärt die normale Anfrage

02Nutzer-Instruktionen

Was gehört hinein

+Stabile Fakten über Sie (Name, Rolle, Tätigkeit) und der Grundstil: Sprache, Anrede, Ton

Was besser nicht

−Regeln für ein einzelnes Projekt, temporäre Aufgaben, lange Verbotslisten

03Projekt

Was gehört hinein

+Kontext einer Arbeit: Zielgruppe, Format, Beispieldateien, eigenes Gedächtnis

Was besser nicht

−Was in allen Chats gelten soll

04Gedächtnis

Was gehört hinein

+Fakten mit langer Haltbarkeit: Werkzeuge, Vorlieben, laufende Projekte – am besten mit Datum

Was besser nicht

−Geheimnisse und Passwörter, temporäre Zustände, Regeln, die strikt gelten müssen

05Skills

Was gehört hinein

+Wiederkehrende Prozesse: Recherche, Post-Redaktion, Faktencheck

Was besser nicht

−Angaben über Sie, Regeln „für alle Fälle“

06Aktueller Prompt

Was gehört hinein

+Alles Einmalige: einmalige Rolle, einmaliges Format, die heutige Aufgabe

Was besser nicht

−Was Sie seit Monaten von Chat zu Chat wiederholen – heben Sie es höher

Ein Rat hält die Tabelle zusammen: Schreiben Sie im Prompt regelmäßig dasselbe, gehört es in eine dauerhaftere Zone. So halte ich es mit meinem eigenen Wissen. Pro Arbeitskontext ein eigener Ordner mit eigenen Instruktionen und Beispieldateien; daneben ein zweites Gehirn, in dem nur das Dauerhafte liegt: Methoden, Frameworks, geprüfte Prompts, Quellen, Vorlagen, über eine Index-Datei auffindbar. Was zu einer einzelnen Kundenarbeit gehört, bleibt im jeweiligen Projekt. Ins zweite Gehirn wandert nur, was ich wiederverwende. Dieselbe Hygiene wie bei den sechs Zonen, nur auf Dateiebene.

Wenn Zonen sich widersprechen

Je näher eine Anweisung an der aktuellen Aufgabe steht, desto schwerer wiegt sie. Bei ChatGPT überschreiben Projektanweisungen offiziell die globalen. Die Bitte im Dialog schlägt beide, samt der gewählten „Persönlichkeit“: Bitten Sie um trockene Antworten, schaltet sich der freundliche Preset für diesen Dialog ab.

Ein tückischer Fall bleibt, und OpenAI benennt ihn in der Hilfe selbst. Eine gespeicherte Erinnerung kann eine Persönlichkeits-Einstellung überstimmen. Das Modell hat vor Wochen notiert „bevorzugt sachliche, professionelle Antworten“, und Ihr fröhlicher Preset zeigt keine Wirkung mehr. Das Ärgerliche daran: Es passiert lautlos. Sie drehen am Schalter, nichts geschieht, und dass eine Zeile im Gedächtnis schuld ist, ahnen Sie kaum.

Also halten Sie die Konflikte von vornherein klein. Sie entstehen fast immer dort, wo jemand riesige Textwände schreibt und versucht, jeden Schritt des Modells zu „programmieren“: wie zu antworten, wann zu stoppen, wann nachzufragen, welche Eigenschaften zu haben, was auf keinen Fall zu tun. Bei frühen KI-Generationen war das nötig, sie ruderten ohne klare Vorgaben. Die heutigen Modelle sind an so vielen Beispielen trainiert, dass sie schon mit sehr schlichten Prompts zurechtkommen. Große Textwände kosten obendrein Kontext; wohin die Tokens verschwinden, habe ich an anderer Stelle gezeigt. Die aktuellen Leitfäden von OpenAI und Anthropic sagen es direkt: Beschreiben Sie das gewünschte Ergebnis, nicht den Weg dorthin. Den größeren Rahmen dazu, weiche Voreinstellungen und die Leerstellen, die nur Sie füllen können, finden Sie im Beitrag zum Systemprompt von Fable 5.

Der Nutzer-Prompt ist ein Vertrag, keine Verfassung

Wenn Textwände nicht funktionieren, wie sehen gute Nutzer-Instruktionen aus? Behandeln Sie sie als kurzen Vertrag mit dem Modell, nicht als Grundgesetz für jede Lebenslage. Drei Regeln helfen dabei.

Erstens: Vorsicht mit „immer“ und „nie“. Die Prompting-Leitfäden von OpenAI raten, absolute Formulierungen den echten Verboten vorzubehalten, dem also, was unter keinen Umständen passieren darf. Für den Rest wirken Bedingungen besser. „Stelle immer Rückfragen“ verhört Sie auch dort, wo alles klar ist. „Frag nur nach, wenn die Antwort ohne die Info merklich schlechter wird“ bringt die Rückfrage genau dann, wenn sie nötig ist. Solche Anstöße gehören zu den Techniken, mit denen Sie mehr aus jeder Antwort holen.

Zweitens: Ein Beispiel schlägt zehn Verbote. Trifft das Modell ein Format nicht, verlängern Sie nicht die Verbotsliste in den Instruktionen. Legen Sie ein Muster eines gelungenen Ergebnisses in den Arbeitsprompt. Eine Struktur nachzubauen fällt dem Modell leichter, als sie aus Regeln zusammenzusetzen.

Drittens: Instruktionen sind kein Materiallager. Verhaltensregeln gehören in die Anweisung; Material, auf das sich das Modell stützen soll, also Stilguides, Glossare, Arbeitsproben, gehört in die Projektdateien oder den konkreten Dialog. Wer beides mischt, bekommt das Schlechteste aus zwei Welten: Die Instruktion bläht sich auf, und das Nachschlagewerk liegt trotzdem am falschen Ort.

Zusammengesetzt sieht das Gerüst guter Instruktionen etwa so aus:

Über mich: wer ich bin und woran ich arbeite, meist zwei, drei Hauptaufgaben.
Stil: Sprache, Anrede, kein Behördendeutsch, Tabellen nur, wenn sie wirklich beim Vergleich helfen.
Zusammenarbeit: fehlt Information, triff eine begründete Annahme und benenne sie; bei Kritik nichts aus Höflichkeit weichspülen.
Was nicht: aus keiner Antwort eine Vorlesung machen, keine Faktenprüfung vortäuschen, ohne die Quelle geöffnet zu haben.

Ihre Füllung sieht anders aus, aber die Größenordnung zählt: 600 bis 800 Zeichen, nicht 6.000.

Zum Kontrast das Gegenbeispiel, wie es in vielen „beste ChatGPT-Einstellung“-Listen steht:

„Du bist ein genialer Weltklasse-Experte. Antworte immer maximal ausführlich. Witzle immer. Frag immer nach. Nutze nie Listen. Lehne nie ab. Sei mein bester Freund, Anwalt, Arzt und Lektor zugleich.“

Hier stimmt fast nichts. Fünf Absolutheiten auf sieben kurze Sätze. Die Forderungen widersprechen sich: „maximal ausführlich“ verträgt sich schlecht mit ständigen Rückfragen. Und der ganze Aufzug gilt für jeden Chat, für das Abendrezept wie für den ernsten Fall. Die neueste Generation (Claude Opus 4.8, Sonnet 5, GPT-5.5) ignoriert schlecht geschriebene Prompts inzwischen oft oder weist auf die Widersprüche hin. Eine Absicherung, ja. Verlassen sollten Sie sich nicht darauf: Das Modell verbrennt Zeit mit Korrekturen, und die Antwort wird am Ende schwächer.

Und wenn man dem Modell eine Persönlichkeit gibt?

Fast jeder hat damit experimentiert. Verständlich, Vorlieben sind verschieden, die einen mögen aufgedreht und witzig, die anderen den ruhigen Zyniker. Nur steckt darin eine Falle. Menschen sind flexibel: Der Spaßvogel weiß, wann er besser schweigt. Modelle sind auf Instruktionstreue getrimmt, und so witzelt der KI-Komiker auch dann, wenn es gar nicht passt. Diesen Punkt habe ich im Systemprompt-Beitrag schon aufgemacht; hier die praktische Seite.

Schauen Sie zuerst auf die fertigen Presets. ChatGPT hat inzwischen einen ganzen Satz getesteter Charaktere in den Einstellungen: professionell, freundlich, effizient, zynisch und weitere. Jeder greift auf Ebene des Systemprompts, mit demselben Werkzeug, mit dem der Entwickler das Modell justiert. Sie ändern den Ton, nicht die Denkweise. Wollen Sie einen Zyniker, nehmen Sie den fertigen: An Millionen Dialogen getestet, kippt er seltener in Unhöflichkeit als einer, den Sie mit eigenen Worten beschreiben. Claude hat keine solchen Presets, ist aus dem geleakten Systemprompt aber erkennbar auf einen warmen, freundlichen Ton gestellt, für die meisten Fälle die beste Einstellung.

Wollen Sie doch experimentieren, beschreiben Sie keine Persönlichkeit im Detail, sondern den bevorzugten Ton als Spanne. „Schreib lebendig, leichte Ironie ist in Alltags- und kreativen Aufgaben willkommen; bei Gesundheit, Geld und Konflikten bleib neutral.“ Das lässt dem Modell den Spielraum, das Register zur Lage zu wählen. Eine Faustregel dazu: Temperament in die Einstellungen, die berufliche Rolle in die Aufgabe. Der stärkste Personalisierer ist zugleich der einfachste, nämlich ein Name. Geben Sie dem Modell einen. Der Effekt auf das Erlebnis ist groß, der auf die Antwortqualität praktisch null.

Gedächtnis: das Notizbuch, das altert

Jetzt zur meistunterschätzten Zone. Über das Gedächtnis kursieren zwei Irrtümer. Die einen glauben, das Modell merke sich jedes Gespräch, die anderen, es merke sich nichts. Die Wahrheit liegt dazwischen. Das Gedächtnis besteht aus zwei Mechanismen: der Suche über Ihre Chats und kurzen Notizen, in die das Modell einträgt, was es über Sie für wichtig hält.

Die Chat-Suche ist ein gewöhnlicher Textsucher. Das Problem: Das Modell trifft nicht immer den Moment, in dem es suchen sollte. Stoßen Sie es an. „Lies alle Chats, in denen wir Thema X bearbeitet haben, sammle den Kontext und suche dann im Netz, was neu dazugekommen ist“ holt den vorhandenen Kontext zuverlässiger hervor als die Hoffnung, das Modell komme von selbst darauf.

Der zweite Mechanismus sind die Notizen, bei ChatGPT „gespeicherte Erinnerungen“. Bei der Chat-Historie merkt sich ChatGPT nicht jedes Detail. Hoffen Sie also nicht, dass es das Entscheidende aus einem drei Monate alten Dialog von selbst herauszieht; Wichtiges lassen Sie ausdrücklich als Notiz speichern. Der unauffälligste Fakt zum ChatGPT-Gedächtnis: Einen Chat zu löschen löscht die Notiz daraus nicht. Das Notizbuch liegt getrennt von der Unterhaltung. Sie löschen den missglückten Dialog, in dem Sie im Ärger etwas Privates geschrieben haben, und die Notiz darüber bleibt und sickert weiter in die Antworten. Aufräumen müssen Sie getrennt: in den Einstellungen unter Personalisierung, oder im Chat mit „vergiss, dass ich …“. Und das Abschalten des Gedächtnisses löscht das Angesammelte nicht, es hört nur auf, es zu benutzen.

Claude verfolgt eine andere Philosophie. Statt einer Streu einzelner Notizen eine Zusammenfassung: Claude setzt etwa einmal am Tag ein knappes Porträt aus allen Gesprächen neu zusammen. Projekt-Chats fließen nicht ins allgemeine Porträt, jedes Projekt hat sein eigenes Gedächtnis (Sie erinnern sich an den Trick mit dem Projekt fürs Mitbenutzen?). Und der Fokus ist enger: Claude merkt sich gezielt das Berufliche, also Rolle, Projekte, Stil, technische Vorlieben, und lässt Alltägliches eher fallen. Nachsehen und bearbeiten können Sie das unter Settings, Capabilities, Memory, oder Sie sagen direkt im Chat, was zu merken und was zu korrigieren ist; die Änderung greift ab dem nächsten Gespräch.

Das ist der Grund, warum ich Dauerhaftes gar nicht erst dem Rateverfahren des Modells überlasse. Was lange gilt, steht in meinem zweiten Gehirn, mit Datum und von mir kontrolliert, getrennt von dem, was sich der Dienst selbst notiert.

Memory-Review: zehn Minuten im Monat

Das Gedächtnis hat eine unangenehme Eigenschaft: Es altert nicht mit Ihnen. Sie wechseln den Job, das Modell kennt die alte Position. Sie schließen ein Projekt ab, es taucht weiter in den Antworten auf. Jede veraltete Notiz mischt sich leise unter, und je länger Sie den Dienst nutzen, desto dicker wird dieser Bodensatz.

Ich habe mir deshalb ein monatliches Review angewöhnt, es kostet zehn Minuten. Gedächtnis öffnen (bei ChatGPT die Speicherverwaltung, bei Claude „Memory“), mit den Augen überfliegen, dann dem Modell zwei Prompts geben:

„Lies, was du über mich gespeichert hast, und schätze ein, welche Information dir fehlt. Stell mir Fragen, drei auf einmal, mit der wichtigsten zuerst; aus meinen Antworten aktualisierst du das Gedächtnis.“

„Lies, was du über mich gespeichert hast, und schätze ein, welche Information veraltet oder unvollständig sein könnte. Stell mir Fragen, drei auf einmal, mit der wichtigsten zuerst; aus meinen Antworten aktualisierst du das Gedächtnis.“

Arbeiten Sie mit zwei oder mehr Modellen, noch ein Kniff. Öffnen Sie einen Chat und schreiben Sie: „Lies, was du über mich weißt, und erstelle meine Meta-Karte.“ Die Meta-Karte kippen Sie in den Chat des anderen Modells und lassen es sein Gedächtnis daran angleichen.

Und die Agenten?

Wie das Gedächtnis in KI-Agenten organisiert ist, habe ich am Aufbau eines KI-Agenten gezeigt. Die Ablage sieht etwas anders aus, das Prinzip bleibt: globale Instruktionen, Projektanweisungen und die Erinnerungen des Modells an Sie sauber trennen. Wer diese drei Ebenen auseinanderhält, hat den größten Teil der Arbeit schon getan.

Der richtige Ort schlägt den längeren Prompt

Am Anfang stand das Paradox: Die Modelle werden klüger, und die Schicht aus Anweisungen um sie herum wird trotzdem dicker. Der Ausweg heißt nicht: längerer Prompt. Er heißt: der richtige Ort für jede Regel, dazu ein Gedächtnis, das zu Ihnen von heute passt. Öffnen Sie jetzt die Speicherverwaltung Ihres meistgenutzten Modells und lesen Sie die ersten zehn Einträge. Wetten, mindestens einer stimmt nicht mehr?

Häufige Fragen

Wohin gehört eine Anweisung, die immer gelten soll? In die Nutzer-Instruktionen, wenn sie Sie als Person betrifft (Sprache, Anrede, Rolle), oder in die Produkt-Einstellungen, wenn es dafür einen Schalter gibt. Alles, was nur zu einer Arbeit gehört, bleibt im Projekt. Faustregel: je breiter die Wirkung, desto knapper und vorsichtiger die Formulierung.

Löscht das Löschen eines Chats auch das, was sich das Modell gemerkt hat? Bei ChatGPT nicht. Die gespeicherten Erinnerungen liegen getrennt vom Chatverlauf und überdauern das Löschen des Gesprächs. Aufräumen müssen Sie sie separat, in den Einstellungen unter Personalisierung oder per „vergiss, dass ich …“.

Wie oft sollte ich das Gedächtnis prüfen? Einmal im Monat reicht meist, rund zehn Minuten. Alte Jobtitel, abgeschlossene Projekte und überholte Vorlieben sammeln sich sonst an und sickern unbemerkt in die Antworten.

Sollte ich dem Modell eine ausführliche Persönlichkeit vorschreiben? Besser nicht. Nehmen Sie ein getestetes Preset oder geben Sie eine Tonspanne vor („lebendig im Alltag, neutral bei Geld und Gesundheit“). Eine starre Detailpersönlichkeit witzelt auch dann, wenn es unpassend ist.

Gilt das für ChatGPT und Claude gleichermaßen? Das Prinzip der Zonen ja. Die Mechanik unterscheidet sich: ChatGPT führt einzelne Notizen und trennt gespeicherte Erinnerungen von der Chat-Historie; Claude baut einmal täglich eine Zusammenfassung und hält das Projekt-Gedächtnis getrennt.

Quellen und Stand

Persönlichkeits-Presets und Gedächtnis von ChatGPT nach dem OpenAI Help Center („Customizing your ChatGPT personality“ und „Memory FAQ“, abgerufen am 3. Juli 2026); die Presets ändern den Ton, nicht die Argumentation, und ein Preset stellt OpenAI gerade ein.
Claude-Gedächtnis (tägliche Zusammenfassung, getrenntes Projekt-Gedächtnis, Bearbeitung unter Settings, Capabilities, Memory) nach dem Claude Help Center (abgerufen am 3. Juli 2026); für alle Nutzer seit März 2026 aktiv.
Empfehlung zu absoluten Formulierungen aus den OpenAI-Prompting-Leitfäden zur GPT-5-Reihe.
Modellstand: allgemein verfügbar sind Claude Opus 4.8, Sonnet 5 und GPT-5.5; GPT-5.6 lief zu diesem Zeitpunkt nur in einer begrenzten Preview.
Der Umfang von rund 17.000 Wörtern für den Fable-5-Systemprompt stammt aus einer geleakten, von Anthropic nicht bestätigten Fassung.