Wie ChatGPT seine Quellen wählt – und welche GEO-Hebel daraus folgen
„Wie tauchen wir in ChatGPT auf?” Diese Frage höre ich fast jede Woche. Die Standardantwort klingt immer ähnlich: gute Inhalte schreiben, in Vergleichslisten vorkommen, auf Reddit kommentieren. Geübte Routine. Nur woher wollen wir wissen, dass das stimmt? Das meiste davon wird auf Treu und Glauben weitergereicht, ein Experte zitiert den nächsten.
Es gibt einen ehrlicheren Weg, und ein Kollege aus der Branche, Suganthan Mohanadasan, ist ihn gegangen. Er hat nicht die fertigen Antworten ausgewertet, sondern den Datenverkehr darunter gelesen: die JSON-Daten, die ChatGPT an seinen eigenen Browser schickt, bevor eine Zeile Antwort auf dem Bildschirm steht. Dort stehen die internen Etiketten der Maschine. Woher jede Seite stammt. In welche Schublade Ihre Frage fällt. Welche Suchen das System tatsächlich abgesetzt hat. Ich habe seine Befunde mit zwei größeren Auswertungen abgeglichen und übersetze beides hier in konkrete Hebel für GEO, die Generative Engine Optimization, also die Arbeit daran, in KI-Antworten zitiert zu werden.
Zwei Arten von Befund, die man nicht vermischen darf
Vorweg eine Einordnung, denn sie entscheidet über den Wert des Ganzen. In diesen Daten stecken zwei sehr verschiedene Arten von Erkenntnis. Die einen sind strukturell: dass es ein bestimmtes Feld gibt, wie es heißt, welche Werte es annimmt. Ein einziger sauberer Mitschnitt genügt als Beleg, denn ein Feld muss man nur einmal sehen, um zu wissen, dass es existiert. Die anderen sind Häufigkeiten. „Reddit wird am häufigsten zitiert”, „der größte Teil läuft über einen bestimmten Anbieter”. Diese Werte stammen aus wenigen Dutzend Abfragen auf einem einzigen Konto, mit deutlicher Schlagseite Richtung SaaS und Technik.
Lesen Sie die Struktur als Tatsache und die Prozentzahlen als Richtung. Wo eine Häufigkeit einen mechanischen Grund hat, dürfen Sie der Richtung trauen, dem genauen Wert nicht. Für die großen Zahlen ziehe ich deshalb zusätzlich eine Auswertung von Profound heran, die rund 700.000 ChatGPT-Konversationen aus dem vierten Quartal 2025 untersucht hat. Das eine zeigt die Mechanik, das andere die Größenordnung.
Die erste Frage: Sucht ChatGPT überhaupt?
Bevor ChatGPT ins Netz greift, sortiert es Ihre Frage in eine Kategorie. Das Feld dafür heißt „turn_use_case” und kennt sechs Werte, darunter normale Suche, Shopping, Lokales, einen Reasoning-Modus und reine Bildgenerierung. Der Wert, auf den es ankommt, heißt „text”. Fällt Ihre Frage in diese Schublade, sucht das System nicht. Es antwortet aus dem Trainingswissen und hört auf.
Bei harmlosen Fällen leuchtet das ein. „Wie wechsle ich einen Reifen” oder „schreib mir eine Python-Funktion” braucht keine frische Quelle. Stutzig macht ein anderer Fall aus dem Test: „aktuelle Behandlungsleitlinien für Typ-2-Diabetes” landete ebenfalls bei „text”. Eine aktuelle, hochsensible Frage, bei der man eine Recherche erwarten würde, wurde aus dem Gedächtnis beantwortet. Von zehn bewusst aktuellen Fragen lief es dreimal so. Und Profound bestätigt die Größenordnung von der anderen Seite: Nur etwa 18 Prozent aller Konversationen lösen überhaupt eine Websuche aus.
Entscheidend ist die Formulierung, nicht das Thema. „best coffee near me” kippt in die lokale Schiene, „best 4K TVs to buy” schaltet Shopping an, „best 4K TVs with reviews” bleibt eine normale Suche. Dieselbe Sache, drei Wege, je nach Wortwahl.
Das hat eine unbequeme Konsequenz, sobald das Modell aus dem Gedächtnis antwortet. Dann kann es bei Fakten und Quellen danebenliegen. Eine Studie in Advances in Orthopedics aus dem Jahr 2025 prüfte 109 Quellen, die ChatGPT zu gängigen Fragen rund um Knie- und Hüftprothesen angab. Nur 36 Prozent davon waren korrekt oder ließen sich überhaupt einer existierenden Veröffentlichung zuordnen. Der Test lief auf einer Version ohne Websuche, also genau in jenem Modus, in dem das Modell aus dem Training schöpft. Wo nicht gesucht wird, ist auch keine überprüfbare Quelle im Spiel.
Der Hebel daraus: Prüfen Sie, bevor Sie einen Euro in eine Seite stecken, ob die Frage überhaupt eine Suche auslöst. Bei einer Definition oder einer Anleitung kommt keine Seite hinein, so gut sie auch sein mag. Setzen Sie Ihre Arbeit dort an, wo das System wirklich abruft. Für die Fragen, die aus dem Gedächtnis beantwortet werden, bleibt nur der lange Weg über Autorität und Präsenz in künftigen Trainingsdaten, weshalb Crawler wie Common Crawl Ihre Seite sehen können sollten.
Woher die Seiten kommen: vier Kanäle
Jede abgerufene Webseite trägt ein Feld namens „result_source”, und es nimmt einen von vier Werten an. „serp” ist die offene Web-Grundlinie, meist bei Nachrichten zu sehen. „labrador” ist eine Positivliste etablierter Verlage: Reuters, der Guardian, das Wall Street Journal, die Financial Times, Wikipedia, sogar arXiv. Die Textauszüge dort reichen an die tausend Zeichen, praktisch ganze Artikel. „bright” steht für Bright Data, einen kommerziellen Scraper, und dominiert bei Shopping, Finanzen, Wetter und Lokalem. „oxylabs” ist der Rivale Oxylabs und bringt vor allem regionale und lokale Presse.
Den lizenzierten Kanal bestätigt OpenAI von der anderen Seite. Als die ChatGPT-Suche Ende Oktober 2024 startete, nannte OpenAI seine Verlagspartner namentlich: Reuters, die Financial Times, Axel Springer, Le Monde, Condé Nast, die Associated Press. Die Such-Variante war damals ein feinabgestimmtes GPT-4o und griff laut OpenAI auf externe Suchanbieter sowie auf Inhalte der Partner zurück. „labrador” ist also die Lizenzspur, und in die kommt selten jemand, der keine überregionale Zeitung besitzt.
Der weitaus größte Teil der Abrufe läuft über die gescrapte Spur, über Bright Data und Oxylabs. Genau dort spielen die meisten Marken. Die Folge ist unbequem schlicht: Sie müssen sauber auslesbar sein. Ihre Fakten und Zahlen gehören in echten HTML-Text, nicht hinter ein Skript, nicht in ein PDF, nicht in ein Bild gebacken. Die Lizenzspur ist für die meisten geschlossen. Was bleibt, ist der Weg über Drittquellen: PR, Markenerwähnungen, Verlinkungen, Reddit, also die Seiten, die die Scraper ohnehin erreichen. Die technische Pflicht dahinter habe ich im Beitrag zum Crawl Budget beschrieben.
Eine Frage, dutzende Suchen
ChatGPT legt auch offen, welche Suchen es für Sie absetzt, wenn man die Konversation über die eigene API zurückholt. Auf dem schnellen Modell ist das mager: eine umformulierte Anfrage, fertig. Auf dem Reasoning-Modell, gebeten, ein paar Produkte zu vergleichen, lief etwas anderes ab. Aus der einen Frage wurden rund 15 bis 40 Teilsuchen, je nach Komplexität.
Drei Verhaltensweisen fallen auf. Das System feuert gezielte „site:”-Abfragen direkt auf die Preisseiten der Anbieter. Es rät einen Preis und sucht anschließend, um ihn zu bestätigen. Und es zieht immer weitere Kreise, greift Werkzeuge auf, die in Ihrer Frage nie vorkamen, und jagt deren Preise hinterher. Auch das Lesen der Seite ist wörtlich gemeint: Das Modell durchsucht die Seite nach „$”, „€”, sogar nach „Agency”, öffnet die Trefferseite serverseitig und liest den Quelltext nach dem Währungszeichen ab. Mit Ihrer eigenen Seite passiert dasselbe. Eine Frage nach Ihren Preisen löst eine Abfrage wie „site:ihredomain.de/preise” aus, das Modell rät eine Zahl, öffnet die Seite und sucht im HTML nach dem Symbol, um seinen Tipp zu prüfen.
Was heißt das für Sie? Überstehen Sie diese „site:”-Sonde auf Ihrer Preisseite. Schlüsselzahlen in auslesbaren Text, keine Toggles per JavaScript, kein dynamisches Nachladen. Und schreiben Sie für die bereinigte Suchanfrage, die das System wirklich stellt, nicht für den holprigen Satz, den ein Mensch eintippt.
Abgerufen, zitiert, erwähnt – drei Paar Schuhe
Hier wird am meisten durcheinandergebracht, deshalb der genaue Blick. Mit einer Quelle können drei verschiedene Dinge geschehen. Abgerufen heißt, das Modell zieht Ihre Seite in seinen Kontext; das ist das „result_source”-Objekt, und der Leser sieht es nie. Zitiert heißt, es hängt Ihre Seite als Beleg an einen bestimmten Satz, die anklickbare Fußnote. Erwähnt heißt, Ihr Markenname taucht in der Antwort auf, oft als verlinkter Chip, ist aber nicht die Quelle der Aussage. Jeden dieser drei Punkte können Sie einzeln gewinnen oder verlieren.
Wie weit das auseinanderfällt, zeigt ein Vergleich aus dem Test. Reddit wurde 278-mal abgerufen und 11-mal zitiert. YouTube wurde 201-mal abgerufen und kein einziges Mal zitiert. Der Grund ist mechanisch: Eine Zitation muss sich an Text binden, den das Modell wirklich gezogen hat. Von einer YouTube-Seite bekommt es in der Suche die Metadaten, nicht das Transkript. Ein Reddit-Thread steht komplett auf der Seite. Das ist kein Einzelbefund. Ahrefs fand über 1,4 Millionen ChatGPT-Prompts hinweg Reddit mit 1,93 Prozent zitiert, YouTube mit 0,51 Prozent. Zwei weitere Mechaniken liegen darunter. Zitate binden an eine präzise Aussage, also reicht thematische Nähe nicht; Sie müssen der beste Beleg für genau diesen einen Satz sein. Und die Treffer werden je Domain entdoppelt, sodass zwanzig dünne Seiten Ihrer Domain zu einer zusammenfallen. Eine starke Seite je Aussage schlägt einen Stapel schwacher.
Am deutlichsten wird das Spiel an einer Stelle, an der das Reasoning-Modell sein Vorgehen selbst protokolliert. Für einen Vergleich wollte es die Preise der Anbieter aus erster Hand und ging zuerst auf die offizielle Seite. Bei zwei Werkzeugen lag der Preis hinter JavaScript. Das Modell konnte ihn nicht lesen, gab auf und schrieb sinngemäß, es könne ja Drittquellen heranziehen, da die offizielle Seite schwer zu parsen sei. Dann zitierte es G2. Ihre Fakten, fremde Seite, weil Ihre eigene nicht lesbar war. Eine Preisliste in JavaScript rankt also nicht nur schlecht, sie reicht Ihre Zahlen an einen Dritten weiter.
Die Konsequenz ist unbequem: Sich selbst zitieren können Sie nicht. Die Aussage über Sie wird woanders belegt, also verdienen Sie sich Drittabdeckung auf Bewertungsseiten und in Foren, gewinnen Sie auf Text statt auf Video, und legen Sie eine starke Seite hinter jede Aussage. Wie Sie genau die Lücke „wird abgerufen, aber nicht zitiert” finden und schließen, habe ich im Beitrag Abgerufen, aber nicht zitiert ausführlich beschrieben.
Was die großen Zahlen sagen
Hier helfen die 700.000 Konversationen von Profound, weil sie die Mechanik mit Gewicht unterlegen. Wenn gesucht wird, dominiert die erste Frage. In der ersten Runde trug die Antwort zu 12,6 Prozent eine Zitation, und diese erste Runde löst rund 2,5-mal so häufig eine Zitation aus wie die zehnte, fast viermal so häufig wie die zwanzigste. Die Eröffnungsfrage ist die teuerste Lage im Gespräch.
Sucht das System, gibt es sich selten mit einer Quelle zufrieden. Im Schnitt kamen rund sechs verschiedene Quellen je Konversation zusammen, etwa vier je zitierter Runde. Das Modell trianguliert. Der Markt ist dabei breit, aber ungleich: Die zehn größten Domains fingen nur 12 Prozent aller Zitationen ein, bei einem Gini-Wert um 0,8. Wikipedia ist die Standard-Wissensschicht und steckt in etwa jeder sechsten zitierten Konversation, Reddit folgt dahinter. Und Quellen reisen im Rudel. Über Co-Zitationscluster erscheinen Sie neben Ihren Wettbewerbern: eine Karriereseite neben Glassdoor und Indeed, eine Reisemarke neben Kayak und Expedia.
Daraus folgt eine klare Reihenfolge. Gewinnen Sie die erste Frage, also das „Was ist”, „Wie mache ich”, „Was ist das Beste für”, mit dem eine Recherche beginnt, nicht die klärende Rückfrage danach. Seien Sie die Quelle nach Wikipedia, die vertiefte Einordnung oder die aktuelle Zahl, die ein Lexikon nicht liefert. Und kennen Sie Ihre Zitationsnachbarn, um gezielt neben den Domains aufzutauchen, denen Ihr Thema ohnehin vertraut.
Was sich nicht messen lässt
So aufschlussreich der Datenverkehr ist, eine Grenze bleibt hart. Eine sichtbare Rangordnung gibt es nicht. Kein Autoritätswert, kein Vertrauensgewicht, keine Formel erreicht den Browser, denn diese Logik bleibt auf den Servern von OpenAI. Wer Ihnen „die Ranking-Faktoren von ChatGPT” verkauft, verkauft Ihnen Schlangenöl.
Zwei Dinge schränken die Sache zusätzlich ein. Personalisierung ist real und selektiv. Bei einer Frage, die das eigene Arbeitsfeld des Analysten berührte, zog ChatGPT seine früheren Chats heran, mit Quellen, die als „personal_sources” aus Gesprächsverlauf, Gmail und Dateien ausgewiesen waren. Ein Teil mancher Antwort entsteht also aus privaten Daten, für die niemand optimieren kann. Das ist einer der Gründe, warum zwei Menschen verschiedene Antworten bekommen und Sichtbarkeitswerte schwanken. Und das Lokale ist gedeckelt. Ein Konfigurationswert namens „local_results_limit” steht auf 2. Fragen Sie nach dem besten Café in der Nähe, nennt ChatGPT zwei Orte, keine Top 10. Im Lokalen sind Sie unter den ersten beiden oder gar nicht da.
Was Sie diese Woche tun können
Sie brauchen dafür keinen großen Aufbau. Nehmen Sie Ihre wichtigsten Fragen und prüfen Sie, ob ChatGPT dafür überhaupt sucht: Kommt die Antwort mit Quellen unter der Zeile, oder aus dem Gedächtnis? Bei Antworten aus dem Gedächtnis hilft keine Arbeit an der Seite; das ist eine Aufgabe für den langen Atem über Autorität.
Den Kanal hinter jedem Treffer können Sie selbst lesen. Öffnen Sie ChatGPT, dann die Entwicklerwerkzeuge, den Reiter Netzwerk, setzen Sie den Haken bei „Preserve log”, stellen Sie eine Frage und durchsuchen Sie die Antworten nach „result_source”. Wem das Hantieren in der Konsole zu weit geht: Es existiert inzwischen eine kostenlose Chrome-Erweiterung, die den größten Teil dieser Signale auf der eigenen Sitzung mitschneidet und nach Excel exportiert.
Öffnen Sie danach Ihre Preis- und Datenblattseiten und sehen Sie nach, ob die Zahlen wirklich als HTML-Text dastehen, nicht als Bild und nicht per JavaScript nachgeladen. Und nehmen Sie sich fünf Fragen vor, bei denen Sie genannt werden wollen, prüfen Sie, wo Sie abgerufen, aber nicht zitiert werden, und verdienen Sie sich je Aussage eine belastbare Drittquelle.
Sichtbarkeit ist auch hier kein Selbstzweck. ChatGPT ist keine Suchmaschine, also hören Sie auf, es wie eine zu behandeln. Es liest Ihre Seite für die Fakten, sofern es sie parsen kann, und fremde Seiten für die Meinung, und nur dann, wenn die Frage eine Suche wert ist. Bauen Sie genau dafür. Und behandeln Sie all das, meine Einordnung eingeschlossen, als Momentaufnahme eines Systems, das sich wöchentlich verschiebt. Die Struktur hält. Die Zahlen wandern.
Quellen und Stand: Analyse des ChatGPT-Datenverkehrs von Suganthan Mohanadasan (suganthan.com, Stand 27. Juni 2026; rund 1.240 erfasste Quell-Datensätze, einzelnes Pro-Konto, SaaS- und tech-lastig – strukturelle Befunde belastbar, Häufigkeiten nur als Richtung). Populationsdaten zur Zitation aus der Auswertung von Profound (rund 700.000 Konversationen, Q4 2025). Zitationsanteile Reddit 1,93 % vs. YouTube 0,51 % laut Ahrefs (über 1,4 Mio. Prompts). Start und Funktionsweise der ChatGPT-Suche laut OpenAI (Ankündigung vom 31. Oktober 2024). Genauigkeit generierter Quellen 36 % bei 109 geprüften Referenzen laut Schwartzman et al., Advances in Orthopedics 2025 (Modellversion ohne Websuche). Zahlen vor Veröffentlichung gegen die jeweils aktuelle Quelle prüfen.