llms.txt: Was die Datei bringt, was Google dazu sagt – und wann Sie eine anlegen sollten

„Sollen wir eine llms.txt anlegen?“ Die Frage kommt in fast jedem Kundenprojekt, meist von jemandem, der auf LinkedIn gelesen hat, ohne diese Datei sei man in KI-Antworten unsichtbar. Die Erwartung dahinter: ein kleiner Eintrag im Wurzelverzeichnis, und schon zitiert ChatGPT die eigene Marke häufiger.

So funktioniert es nicht. Und um zu erklären, warum, muss man zwei Fragen trennen, die ständig vermischt werden. Erstens: Hilft die Datei, in Google oder in KI-Antworten besser zu ranken? Zweitens: Wofür ist sie dann überhaupt gut? Die kurze Antwort vorweg. Fürs Ranking bringt llms.txt nichts, und das sagt Google inzwischen selbst. Als technischer Wegweiser für KI-Werkzeuge kann sie trotzdem sinnvoll sein – für einen bestimmten, klar umrissenen Fall. Diesen Fall arbeite ich hier heraus.

Was llms.txt überhaupt ist

llms.txt ist eine Markdown-Datei im Wurzelverzeichnis einer Domain, also unter ihredomain.de/llms.txt. Sie zählt kuratiert die wichtigsten Seiten auf und beschreibt in ein, zwei Sätzen, worum es geht. Der Zweck: einem Sprachmodell die Orientierung abnehmen, das sonst eine mit Navigation, Werbung und JavaScript überladene HTML-Seite mühsam in Klartext übersetzen müsste.

Eine Analogie hilft. llms.txt ist für ein Sprachmodell das, was ein Inhaltsverzeichnis für einen Sachbuch-Leser ist: ein schneller Überblick, wo das Wichtige steht. Anders als beim Inhaltsverzeichnis muss aber niemand hineinschauen. Kein Modell ist verpflichtet, die Datei zu lesen, und die meisten tun es nicht. Dazu gleich die Zahlen.

Vorgeschlagen hat das Format Jeremy Howard im September 2024, Mitgründer der Forschungslabore fast.ai und Answer.AI. Sein Entwurf kennt zwei Dateien. Die llms.txt verlinkt die zentralen Seiten mit kurzen Beschreibungen. Die optionale llms-full.txt packt den vollständigen Inhalt in eine einzige, lange Markdown-Datei, inklusive Beispielen und Anleitungen. Beide sind als Hilfe zur Laufzeit gedacht, also für den Moment, in dem jemand ein Modell aktiv nach etwas fragt – nicht als Trainings- oder Ranking-Signal. Das ist keine Auslegung von mir, das steht so im Originalvorschlag.

Wichtig ist die Abgrenzung zu zwei Dateien, die Sie kennen. Die robots.txt steuert, welche Bereiche ein Crawler betreten darf; sie enthält Anweisungen. Die llms.txt enthält keine einzige Anweisung – sie erlaubt nichts und verbietet nichts, sie zeigt nur. Die sitemap.xml wiederum listet alle indexierbaren Seiten für Suchmaschinen, im Zweifel Millionen URLs. Die llms.txt ist das Gegenteil: eine strenge Auswahl der wenigen Seiten, die für ein Modell zählen. Wer beide verwechselt und seine ganze Sitemap in die llms.txt kippt, hat das Format missverstanden.

Was Google offiziell sagt

Lange war die Position uneindeutig, und das nährte den Mythos. Im Juni 2026 hat Google im Leitfaden zur Optimierung für generative KI-Funktionen einen eigenen Abschnitt zu llms.txt ergänzt. Der Kern, in Googles eigenen Worten: Man brauche keine maschinenlesbaren Dateien, KI-Textdateien, kein Markup und kein Markdown, um in der Google-Suche aufzutauchen, „denn die Google-Suche selbst nutzt sie nicht“. Und weiter: Wer solche Dateien für andere Systeme pflegen wolle, könne das tun, es „schadet weder Ihrer Sichtbarkeit oder Ihren Rankings in der Google-Suche, noch hilft es, da die Google-Suche sie ignoriert“.

Klarer geht es kaum. Kein Malus, kein Bonus, schlicht kein Faktor. Search Engine Roundtable hat die Klarstellung Mitte Juni aufgegriffen, mit genau dieser Botschaft: „won’t help or hurt“.

Interessant ist die Begründung dahinter, weil sie ein verbreitetes Missverständnis über GEO, die Generative Engine Optimization, ausräumt. Aus Googles Sicht ist die Optimierung für KI-Funktionen keine eigene Disziplin neben SEO. Sie gehört dazu. Die AI Overviews und der AI Mode greifen auf denselben Suchindex und dieselben Ranking-Systeme zurück, über Retrieval-augmented Generation (RAG), also das Nachschlagen aktueller Seiten im Index. Wer für die klassische Suche sauber auffindbar ist, ist es damit auch für die KI-Antworten. Eine Extra-Datei ändert daran nichts.

Wie hartnäckig der Mythos ist, zeigt eine Episode aus Googles eigenem Haus. Im Dezember 2025 tauchte auf Googles Entwickler-Dokumentation kurzzeitig selbst eine llms.txt auf – und war Stunden später wieder weg, die URL gab einen 404 zurück. Der Grund war kein Strategiewechsel. Ein internes Redaktionssystem hatte die Datei automatisch ausgerollt. Gary Illyes stellte auf dem Search Central Live klar, Google unterstütze llms.txt nicht und plane das auch nicht. John Mueller verglich das Format mit dem alten Keywords-Meta-Tag: ein selbst deklariertes Signal, das man ohnehin gegen die echte Seite prüfen müsste – und dann kann man auch gleich die Seite lesen.

Was die Daten über die Nutzung zeigen

Google ist die eine Sache. Aber nutzen wenigstens die anderen – ChatGPT, Perplexity, Claude, Gemini – die Datei? Hier lohnt der Blick in echte Zugriffsdaten statt in Ratgeber-Artikel.

Ahrefs hat rund 137.000 Websites mit llms.txt ausgewertet. Das Ergebnis ist ernüchternd: 97 Prozent der Dateien wurden von keinem Bot je abgerufen. Von den Bots, die überhaupt zugriffen, waren 77 Prozent gar keine KI-Werkzeuge, sondern SEO-Crawler, Profiling-Dienste und Unbekanntes. Auf die KI-Abrufer, die tatsächlich Zitationen erzeugen – der Such-Bot von OpenAI, PerplexityBot, der Crawler von Claude – entfiel rund ein Prozent der Anfragen. Über tausende Seiten hinweg kamen von diesen dreien zusammen nur ein paar hundert Abrufe zusammen.

Die simpelste Prüfung stammt von John Mueller und kostet Sie fünf Minuten: Sehen Sie in Ihre Server-Logs. Fragen Sie sich nicht, ob die Modelle die Datei nutzen könnten, sondern ob sie /llms.txt überhaupt anfordern. In den allermeisten Logs steht: nein. Kein einziges KI-Antwortsystem hat bislang offiziell angekündigt, das Format zu unterstützen. Als Hebel für Zitationen in KI-Antworten ist llms.txt damit, nüchtern betrachtet, Dekoration.

Die Gegenprobe: 2.041 Quellen aus einem echten Projekt

Fremdstudien sind das eine. Ich wollte die Frage an einem laufenden Projekt sehen. Für einen Schweizer Vorsorge- und Finanzkunden habe ich alle 2.041 Quell-Domains genommen, die ChatGPT, Perplexity und die übrigen Modelle von Anfang Juni bis Anfang Juli 2026 tatsächlich für das Promptset dieses Kunden herangezogen haben, gemessen über Peec.ai. Nicht irgendwelche Websites. Genau die Domains, aus denen die Modelle in diesem Markt ihre Antworten speisen. Jede einzelne habe ich auf eine llms.txt geprüft.

Erstes Ergebnis: 510 der 2.041 Domains führten eine, also 25 Prozent. Drei von vier Quellen, auf die sich die Modelle in diesem Sektor stützen, kommen ohne llms.txt aus. Nach Domain-Typ aufgeschlüsselt:

Typ	Domains	mit llms.txt
Corporate	1.073	30 %
Institutionell	445	15 %
Editorial	183	21 %
Reference	164	27 %
Sonstige	129	22 %
UGC	39	26 %

Sieben Wettbewerber-Domains und die Kundenseite selbst lasse ich wegen zu kleiner Basis aus der Quote.

Die eigentliche Frage ist nicht, wer eine Datei hat. Es geht darum, ob sie etwas bringt. Wurden Domains mit llms.txt häufiger abgerufen oder zitiert als solche ohne? Nein. Eher seltener. Die 510 Domains mit Datei wurden im Schnitt sogar weniger oft abgerufen als die ohne (8,5 gegen 13,9 Abrufe je Domain) und nicht häufiger zitiert (mittlere Zitationsrate 0,26 gegen 0,29). Sie stellen ein Viertel aller Quellen, fangen aber nur 17 Prozent der Abrufe ein. Der statistische Zusammenhang zwischen „hat eine llms.txt“ und Sichtbarkeit liegt zwischen minus 0,02 und minus 0,05. Das ist null, mit einem Hauch ins Negative.

Ein ehrliches Wort zur Einordnung. Das ist eine Korrelation, kein Kausalbeweis, und sie hat einen naheliegenden Grund: Die meistzitierten Quellen in diesem Markt sind redaktionelle Seiten und Nachschlagewerke, und gerade die pflegen selten eine llms.txt. Ein Kunde, ein Sektor, ein Monat. Für ein Naturgesetz reicht das nicht. Für eine Richtung schon. Wäre die Datei der Hebel, der Zitationen bringt, müsste er in genau diesen Daten auftauchen. Er tut es nicht.

Das ist der Punkt, an dem viele GEO-Checklisten unehrlich werden. Sie führen llms.txt als Pflichtpunkt, weil er sich leicht abhaken lässt – nicht, weil er wirkt. Was Sichtbarkeit in KI-Antworten wirklich bewegt, sind andere Dinge: saubere Crawlbarkeit, klare Entitäten und Autoritätssignale von Drittquellen. Wie ein Modell seine Quellen tatsächlich auswählt, habe ich an den Rohdaten von ChatGPT nachgezeichnet; die technische Pflicht dahinter steht im Beitrag zum Crawl-Budget. Eine llms.txt kommt in dieser Kette nicht vor.

Wofür die Datei dann taugt

Kein Ranking-Effekt heißt nicht wertlos. Es heißt nur: anderer Zweck. llms.txt hilft dort, wo Sie ein KI-Werkzeug gezielt auf Ihren Inhalt ansetzen – in einem kontrollierten Kontext, nicht im offenen Web.

Der klare Gewinner ist Entwickler-Dokumentation. Wer eine öffentliche API oder ein Produkt anbietet, das andere Entwickler über KI-gestützte Editoren wie Cursor oder Claude einbinden, hat von einer guten llms.txt einen handfesten Nutzen. Der Entwickler bittet sein Werkzeug, Ihre API zu nutzen; das Werkzeug zieht Ihre llms.txt samt der verlinkten Markdown-Seiten in den Kontext und schreibt korrekten Code gegen Ihre Endpunkte. Genau dafür hat Jeremy Howard das Format erdacht, und genau so setzen es Anbieter wie Perplexity, Anthropic, Stripe oder Cloudflare für ihre Docs ein. Peec.ai, das Tool, mit dem ich KI-Sichtbarkeit messe, hat es ebenso gehalten und eine llms.txt für die eigene API gebaut – als Hilfe für KI-Werkzeuge, nicht als SEO-Trick.

Ein Beispiel, das ich durch den Praxisteil trage: die fiktive Rheintal Software GmbH, ein Mittelständler mit einer Lagerverwaltung und einer öffentlichen API. Rheintal hat zwei Zielgruppen. Kunden, die googeln – für die zählt klassische Sichtbarkeit, und da hilft keine llms.txt. Und Entwickler, die die API in ihre Systeme einbauen, oft mit einem KI-Assistenten an der Seite. Für die zweite Gruppe ist eine schlanke llms.txt, die auf die API-Doku zeigt, ein echter Vorteil. Dieselbe Firma, zwei Fälle, eine klare Grenze.

Ein zweiter sinnvoller Fall: Sie wollen eigene KI-Anwendungen mit Ihrem Wissen füttern, etwa einen internen Assistenten oder eine RAG-Lösung. Dann ist eine llms-full.txt eine bequeme, saubere Quelle in einem Stück. Der gemeinsame Nenner beider Fälle: Sie oder Ihr Partner richten ein Werkzeug bewusst auf die Datei. Niemand wartet darauf, dass ein anonymer Crawler sie zufällig entdeckt und Ihre Marke deshalb häufiger nennt.

Praxis: So legen Sie eine an

Wenn Ihr Fall dazu passt, ist die Umsetzung schnell erledigt. Das Format ist bewusst simpel.

Der Aufbau folgt einer festen Reihenfolge: eine H1 mit dem Namen (das einzige Pflichtfeld), darunter ein Zitatblock mit einer Kurzbeschreibung, dann beliebige Abschnitte mit H2-Überschriften, unter denen je eine Liste aus Links im Format [Name](URL): kurze Notiz steht. Ein Abschnitt namens ## Optional hat eine Sonderrolle: Was dort steht, darf ein Modell weglassen, wenn der Platz knapp wird. So sieht das für die Rheintal Software GmbH aus:

# Rheintal Software

> Lagerverwaltung für den Mittelstand. Diese Datei hilft KI-Werkzeugen,
> unsere API und die wichtigsten Hilfeseiten zu finden.

## Dokumentation

- [API-Schnellstart](https://rheintal.example/docs/quickstart.md): Erste Anfrage an die Bestands-API in fünf Minuten.
- [Authentifizierung](https://rheintal.example/docs/auth.md): API-Schlüssel anlegen und Anfragen signieren.
- [Bestände abfragen](https://rheintal.example/docs/inventory.md): Endpunkte für Lagerbestand, Reservierung, Nachbestellung.

## Richtlinien

- [Rückgabebedingungen](https://rheintal.example/rueckgabe.md): Fristen und Ablauf für Retouren.

## Optional

- [Changelog](https://rheintal.example/changelog.md)

Ein echtes Beispiel zum Aufrufen: meine eigene Datei unter eullrich.com/llms.txt. Offen gesagt betreibe ich eine Personenmarke, kein API-Produkt – nach der Logik dieses Artikels bräuchte ich keine. Ich führe trotzdem eine, schlank und kuratiert, und behandle sie als das, was sie ist: einen Testfall. Ich sehe in den Logs nach, ob ein Werkzeug sie je abruft, statt es anzunehmen.

Vier Schritte bringen Sie dahin.

Schritt 1 – Zweck festlegen. Klären Sie, welches Werkzeug die Datei lesen soll und welche Aufgabe es damit lösen wird. Danach richtet sich die Auswahl der Seiten. Ergebnis: ein Satz wie „Ein KI-Coding-Tool soll gegen unsere API entwickeln können“. Fehlt dieser Satz, wird die Datei zur wahllosen Linkliste.

Schritt 2 – Seiten kuratieren. Nehmen Sie die wenigen Seiten, die genau diese Aufgabe stützen, und geben Sie jedem Link eine knappe Beschreibung. Weniger ist mehr. Erwartetes Ergebnis: eine Handvoll Einträge, nicht fünfzig. Häufigster Fehler: die halbe Sitemap hineinkopieren, worauf das Modell im Rauschen das Wichtige nicht mehr findet.

Schritt 3 – Ablegen und ausliefern. Speichern Sie die Datei als reinen Text unter ihredomain.de/llms.txt. Rufen Sie die URL im Browser auf; es muss unformatierter Markdown-Text erscheinen, ausgeliefert als text/plain oder text/markdown. Kommt stattdessen Ihre HTML-Seite oder ein 404, liegt es meist an einer Rewrite-Regel oder einem falschen Pfad.

Schritt 4 – Prüfen, ob sie trägt. Kopieren Sie den Inhalt in ein frisches Chatfenster, schalten Sie die Websuche aus und lassen Sie das Modell ausschließlich anhand der Datei antworten. Beantwortet es Ihre Testfragen korrekt, ist die Datei brauchbar. Stolpert es, fehlt eine Seite oder eine Beschreibung ist zu vage.

Ein Wort zu den .md-Kopien, denn hier geht der häufigste Fehler los. Manche legen zu jedem Blogartikel eine Markdown-Zweitfassung an und verlinken alle aus der llms.txt. Das erzeugt Duplicate Content, verteilt Ranking-Signale auf zwei URLs je Inhalt und verbrennt Crawl-Budget – ein realer Schaden für Ihre klassische Sichtbarkeit, ohne belegbaren Gewinn auf der KI-Seite. Malte Landwehr, CPO von Peec.ai, nennt das für SEO-Zwecke „eine Ablenkung ohne Vorteil“. Markdown-Versionen ja – aber gezielt für Doku-Seiten, die ein KI-Werkzeug wirklich konsumiert, nicht flächendeckend für Marketing-Inhalte.

Häufige Fragen

Schadet eine llms.txt meinem Google-Ranking? Die Datei selbst nicht. Google ignoriert sie, weder Malus noch Bonus. Schaden entsteht erst, wenn Sie von jeder Seite eine zusätzliche .md-Kopie anlegen und verlinken: Das kann als Duplicate Content Ihre klassische Sichtbarkeit drücken.

Nutzen ChatGPT, Perplexity oder Gemini die Datei für Zitationen? Kein Anbieter hat das angekündigt. Die Ahrefs-Auswertung von 137.000 Seiten zeigt rund ein Prozent Abrufe durch KI-Bots, 97 Prozent der Dateien wurden nie gelesen. Für Zitationen in KI-Antworten gibt es keinen belegten Nutzen.

Brauche ich eine .md-Version jeder Seite? Nein. Das ist der teuerste Irrtum rund um llms.txt. Erstellen Sie Markdown-Fassungen nur für die Doku- oder API-Seiten, die ein KI-Werkzeug gezielt lesen soll.

Für wen lohnt sich llms.txt konkret? Für alle, deren Zielgruppe KI-Agenten, Coding-Tools und Entwickler mit API-Zugriff einschließt. Für eine klassische Marketing- oder Shop-Seite, die auf mehr ChatGPT-Nennungen hofft, lohnt sie nicht – dort zählen Crawlbarkeit, klare Entitäten und Drittquellen.

Und, jetzt eine anlegen?

Zurück zur Ausgangsfrage. „Sollen wir eine llms.txt anlegen?“ hängt an einer einzigen Unterfrage: Wer soll sie lesen? Haben Sie eine öffentliche API oder Doku, die Entwickler mit KI-Werkzeugen einbinden, bauen Sie eine schlanke, kuratierte Datei – der Aufwand ist gering, der Nutzen real. Geht es Ihnen dagegen um mehr Sichtbarkeit in KI-Antworten, sparen Sie sich die Datei und stecken die Zeit in die Hebel, die messbar wirken. Der konkrete nächste Schritt kostet fünf Minuten: Öffnen Sie Ihre Server-Logs und zählen Sie, wie oft /llms.txt in den letzten 90 Tagen angefordert wurde. Diese Zahl beendet die Diskussion schneller als jeder LinkedIn-Post.

Quellen · Stand 3. Juli 2026

Googles Position aus dem „AI-optimization guide“ (developers.google.com, abgerufen 3. Juli 2026; Primärquelle, Abschnitt „Mythbusting“, Seite zuletzt am 29. Juni 2026 aktualisiert); die Klarstellung im Search-Central-Changelog datiert auf Mitte Juni 2026, aufgegriffen von Search Engine Roundtable (abgerufen 3. Juli 2026).
Nutzungsdaten aus der Ahrefs-Auswertung von rund 137.000 Websites (ahrefs.com, abgerufen 3. Juli 2026; große Stichprobe, misst Bot-Zugriffe auf die Datei, nicht deren Wirkung auf Antworten).
Fazit, Mueller-Zitat und API-Beispiel aus dem Peec.ai-Blog von Malte Landwehr (Stand 30. Juli 2025; Anbieter-Blog, methodisch offengelegt).
Format und Herkunft aus dem Originalvorschlag von Jeremy Howard (llmstxt.org, 3. September 2024).
Die Episode um Googles eigene, kurzzeitig ausgelieferte llms.txt (Dezember 2025) samt Illyes- und Mueller-Aussagen laut Search Engine Journal (abgerufen 3. Juli 2026).