llms.txt ehrlich erklärt: Was die Datei kann, was sie (noch) nicht kann

llms.txt wird als Sichtbarkeits-Wunder für die KI-Suche verkauft, das die Erkennungsrate verdoppelt. Die Realität 2026: Die großen KI-Anbieter lesen die Datei kaum. Dieser Beitrag zeigt, was llms.txt wirklich ist, wer sie heute nutzt, was AI-Sichtbarkeit tatsächlich beeinflusst und wann sich der geringe Aufwand trotzdem rechnet.

„llms.txt ist die robots.txt für die KI-Ära“ — diesen Satz liest man 2026 in fast jedem SEO-Newsletter, oft begleitet von einer Tabelle, die behauptet, die Datei verdopple die Erkennungsrate Ihres Unternehmens in KI-Systemen. Die Botschaft: Wer keine llms.txt hat, ist für ChatGPT, Perplexity und Gemini unsichtbar.

Die Botschaft ist eingängig. Sie ist auch, gemessen am tatsächlichen Verhalten der großen KI-Anbieter im Frühjahr 2026, irreführend. Die ehrliche Lage ist differenzierter — und für jeden, der gerade überlegt, in „AI-Readiness“ zu investieren, wichtig zu kennen.

Dieser Beitrag erklärt llms.txt sauber, ordnet den realen Adoptions- und Nutzungsstand ein, zeigt wer die Datei heute wirklich liest, und beantwortet die eigentliche Frage: Lohnt sich der Aufwand, und wenn ja, in welchem Kontext.

Was llms.txt ist

llms.txt ist eine einfache Markdown-Textdatei im Root-Verzeichnis einer Website, erreichbar unter https://ihre-domain.de/llms.txt. Die Idee: Statt dass ein Sprachmodell sich durch verschachteltes HTML, JavaScript-Rendering und Cookie-Banner kämpfen muss, findet es in dieser Datei eine klar strukturierte Zusammenfassung — wer das Unternehmen ist, was es anbietet, wie man es erreicht.

Der Vergleich mit robots.txt hinkt allerdings in einem wichtigen Punkt: robots.txt ist ein etablierter Standard, an den sich seriöse Crawler seit Jahrzehnten halten. llms.txt ist ein Vorschlag, dessen Befolgung kein großer KI-Anbieter zugesagt hat. robots.txt sagt Crawlern, was sie nicht lesen sollen — und sie halten sich daran. llms.txt sagt KI-Systemen, was sie wissen sollen — und die meisten lesen es schlicht nicht.

Das Format selbst ist unstrittig nützlich, wenn es gelesen wird: Markdown, Überschriften, kurze Listen, Links. Eine gut gemachte llms.txt ist in fünfzehn Minuten geschrieben. Die Frage ist nicht das Format, sondern die Wirkung.

Der ehrliche Adoptions- und Nutzungsstand 2026

Hier liegt die wichtige Korrektur gegenüber der Hype-Erzählung. Die Datenlage im Frühjahr 2026 ist klar — und ernüchternd.

Verbreitung. Eine Untersuchung von rund 300.000 Domains kommt auf eine Adoptionsrate von etwa 10 Prozent. Nach anderthalb Jahren Diskussion hat also etwa jede zehnte Website eine llms.txt. In konservativen Branchen liegt der Anteil deutlich darunter.

Nutzung durch große KI-Anbieter. Kein großer Anbieter — weder OpenAI noch Google, Anthropic, Meta oder Mistral — hat öffentlich zugesagt, llms.txt in seinen Produktivsystemen zu lesen oder zu berücksichtigen. Googles John Mueller stellte bereits 2025 klar, dass kein Google-Search-System die Datei liest oder darauf reagiert.

Was die Server-Logs zeigen. Auswertungen von Websites mit llms.txt zeigen ein konsistentes Bild: GPTBot ruft die Datei gelegentlich ab, aber selten. ClaudeBot, Google-Extended und PerplexityBot greifen praktisch nicht darauf zu. Eine Analyse über mehr als 500 Millionen KI-Bot-Besuche in einem 90-Tage-Fenster fand nur einige hundert direkte Zugriffe auf llms.txt — vernachlässigbar im Verhältnis zum gesamten KI-Crawler-Verkehr.

Die Schlussfolgerung ist unbequem, aber ehrlich: Die Behauptung, llms.txt verdopple heute die Sichtbarkeit in KI-Systemen, ist durch das tatsächliche Verhalten der großen Anbieter nicht gedeckt. Die in Pitches gezeigten Erkennungsraten-Tabellen (30 Prozent ohne, 78 Prozent mit llms.txt) sind nicht belegt.

Wer llms.txt heute wirklich nutzt

llms.txt ist nicht wirkungslos — aber die reale Nutzung liegt woanders, als der Marketing-Pitch behauptet.

Developer-Werkzeuge. Cursor, GitHub Copilot und ähnliche KI-Coding-Assistenten lesen llms.txt, wenn sie vorhanden ist. Für Software-Anbieter und SaaS-Plattformen, deren Dokumentation von Entwicklern mit KI-Tools konsumiert wird, ist das ein realer Nutzen.

RAG-Frameworks. Systeme, die Inhalte gezielt für eine Retrieval-Pipeline einlesen, nutzen eine vorhandene llms.txt als sauberen Einstiegspunkt.

MCP- und IDE-Agenten. Anthropic selbst stellt für die eigene Dokumentation eine llms.txt bereit — primär für die Nutzung durch IDE-Agenten und MCP-Integrationen, nicht für die Websuche oder das Modelltraining.

Das Muster ist erkennbar: llms.txt wirkt heute dort, wo ein Werkzeug die Datei gezielt anfragt — im Developer- und Tooling-Kontext. Sie wirkt nicht dort, wo der Pitch sie verspricht — in der allgemeinen KI-Suche und im Modelltraining der großen Anbieter.

Was AI-Sichtbarkeit heute tatsächlich beeinflusst

Wenn nicht llms.txt — was macht ein Unternehmen dann heute für KI-Systeme sichtbar? Die ehrliche Antwort ist weniger neu und weniger spektakulär.

Strukturierte Daten (Schema.org / JSON-LD). Das ist der etablierte, tatsächlich genutzte Standard. Suchmaschinen und KI-Systeme, die auf Suchindizes aufsetzen, werten Schema.org-Markup aus. Produkte, Dienstleistungen, Standorte, Öffnungszeiten, Personen — sauber ausgezeichnet, werden sie verlässlich erfasst.

Saubere, semantisch klare Inhalte. Sprachmodelle, die Web-Inhalte verarbeiten, kommen mit klaren, gut strukturierten Texten besser zurecht als mit marketing-verklausuliertem Geschwurbel. Das wirkt heute schon über die Text-Lesefähigkeit aller großen Modelle.

Korrekte Crawler-Berechtigungen. Wer KI-Crawlern den Zugriff über robots.txt nicht versehentlich verbietet, ist überhaupt erst auffindbar. Das ist banal, wird aber regelmäßig falsch konfiguriert.

Etablierte Autorität und Erwähnungen. KI-Systeme, die auf Trainingsdaten und Suchindizes beruhen, bevorzugen Quellen mit Reichweite und Verlinkung. Das ist klassische digitale Präsenz, kein neuer Trick.

Das Unbequeme daran: Diese Maßnahmen sind weniger sexy als „eine Datei, die alles ändert“. Sie sind aber die, die heute tatsächlich wirken. Wer in AI-Sichtbarkeit investieren will, beginnt hier — nicht bei llms.txt.

Lohnt sich llms.txt trotzdem?

Ja — aber aus anderen Gründen als den behaupteten, und mit realistischer Erwartung.

Pro: Der Aufwand ist minimal (fünfzehn Minuten), die Datei schadet nicht, sie wird in Developer-Tooling bereits genutzt, und sie ist eine günstige Vorbereitung für den Fall, dass die großen Anbieter sie künftig doch berücksichtigen. Wer ohnehin an seiner AI-Readiness arbeitet, nimmt llms.txt als kleinen Baustein mit.

Contra einer Überinvestition: llms.txt ist kein Sichtbarkeits-Wunder und rechtfertigt kein eigenes Projekt mit Festpreis. Wer dafür dreistellige Beträge zahlt oder sie als zentrale Maßnahme der KI-Sichtbarkeit verkauft bekommt, zahlt für ein Versprechen, das die Datenlage nicht trägt.

Die ehrliche Einordnung: llms.txt ist ein günstiger, sinnvoller Baustein einer breiteren AI-Readiness-Strategie — nicht deren Kern. Der Kern sind strukturierte Daten, klare Inhalte und korrekte Crawler-Konfiguration. llms.txt ist das Sahnehäubchen, das man mitnimmt, weil es fast nichts kostet, nicht der Kuchen.

Wie man llms.txt richtig macht

Wenn Sie die Datei einrichten — und das spricht nichts dagegen —, ein paar praktische Punkte.

Format. Einfaches Markdown. Eine Überschrift mit dem Firmennamen, ein kurzer Beschreibungsblock, Listen für Leistungen und Kontakt. Kein HTML, kein JSON, kein YAML.

Inhalt. Wer Sie sind (Name, Standort, Branche), was Sie anbieten (fünf bis sieben Kernpunkte), was Sie auszeichnet, wie man Sie erreicht. Knapp und sachlich, nicht werblich.

Zwei Varianten. Eine kurze llms.txt (zwanzig bis fünfzig Zeilen) als Übersicht, optional eine ausführliche llms-full.txt mit Details zu Leistungen, Produkten und häufigen Fragen. Die Kurzversion reicht für die meisten Fälle.

Platzierung. Im Root-Verzeichnis, direkt erreichbar, ohne Weiterleitung.

Pflege. Wie jede strukturierte Information veraltet auch llms.txt. Bei Änderungen an Leistungen oder Kontakt aktualisieren — sonst kommuniziert die Datei im Zweifel Falsches.

Mehr braucht es nicht. Wer mehr Aufwand hineinsteckt, investiert in den falschen Baustein.

Was ich für Sie entwickle

Mein AI-Ready-Service zielt auf die Maßnahmen, die heute tatsächlich wirken — mit llms.txt als kleinem Baustein, nicht als überverkauftem Zentrum.

AI-Ready-Audit — ehrliche Bewertung, wie gut Ihre Website heute von KI-Systemen und Suchmaschinen erfasst wird: Schema.org-Abdeckung, Inhaltsstruktur, Crawler-Konfiguration, vorhandene strukturierte Daten. Ergebnis: eine priorisierte Liste der Maßnahmen mit echtem Effekt.

Strukturierte Daten (Schema.org / JSON-LD) — vollständiges Markup für Produkte, Dienstleistungen, Standorte, Personen. Der Baustein, der heute über Suchmaschinen und text-basierte Modell-Antworten tatsächlich wirkt.

Saubere, KI-lesbare Inhaltsstruktur — Überarbeitung der Service-Beschreibungen hin zu semantisch klaren Texten, die Sprachmodelle korrekt erfassen.

Korrekte Crawler-Konfiguration — robots.txt so gestaltet, dass KI-Crawler nicht versehentlich ausgesperrt werden, mit bewusster Entscheidung darüber, welche Bots Zugriff erhalten sollen.

llms.txt und agents.json — als günstige Vorbereitung mitgenommen, sauber gemacht und gepflegt, mit realistischer Erwartung an ihren heutigen Nutzen.

Pflegekonzept — strukturierte Daten und Beschreibungsdateien veralten ohne Verantwortlichen. Der Pflegeprozess gehört zum Setup.

Der pragmatische Einstieg ist das AI-Ready-Audit — daraus wird klar, welche Bausteine in Ihrem Fall wirklich Wirkung bringen und welche nur Aufwand wären. llms.txt ist dabei fast immer dabei, aber selten der entscheidende Hebel.

Fazit

llms.txt ist ein nützliches, günstiges Format — aber kein Sichtbarkeits-Wunder, und schon gar nicht „die robots.txt für die KI-Ära“ in dem Sinne, dass die großen KI-Anbieter sie befolgen würden. Die Datenlage 2026 ist eindeutig: OpenAI, Google, Anthropic und Perplexity lesen llms.txt in ihren Produktivsystemen kaum. Der reale Nutzen liegt heute im Developer-Tooling — Cursor, Copilot, RAG-Pipelines, MCP- und IDE-Agenten.

Wer seine Sichtbarkeit in KI-Systemen verbessern will, investiert deshalb zuerst in die Maßnahmen, die tatsächlich wirken: strukturierte Daten nach Schema.org, klare und semantisch saubere Inhalte, korrekte Crawler-Berechtigungen. llms.txt nimmt man als günstigen Baustein mit — weil er fast nichts kostet und künftig an Bedeutung gewinnen könnte —, aber nicht als zentrale Maßnahme und schon gar nicht als bezahltes Einzelprojekt.

Die ehrliche Frage ist also nicht „kann ich es mir leisten, keine llms.txt zu haben“, sondern: Ist meine Website über die Bausteine sichtbar, die heute wirklich gelesen werden? Aus dieser Frage wird eine sinnvolle AI-Readiness-Strategie — und llms.txt findet darin ihren angemessenen, kleinen Platz.