KI-Sichtbarkeit messen: KPIs, Methoden & Tools für die Praxis
KI-Sichtbarkeit messen bedeutet, systematisch zu erfassen, wie oft und in welchem Kontext KI-Suchsysteme wie ChatGPT, Perplexity und Google AI Overviews deine Marke erwähnen, zitieren oder verlinken. Die drei zentralen KPIs sind die Citation-Rate (Anteil der Antworten mit Link auf deine Domain), die Mention-Rate (Erwähnungen deiner Marke, auch ohne Link) und der Share of Voice (dein Anteil an allen Marken-Nennungen für ein Themenfeld). Gemessen wird über reproduzierbare Prompt-Tests und spezialisierte Monitoring-Tools wie Profound, Peec oder otterly.ai, ergänzt um die Gen-AI-Segmente der Google Search Console. Anders als klassisches Ranking-Tracking ist KI-Sichtbarkeit nicht-deterministisch — deshalb misst man Häufigkeiten über viele Prompt-Wiederholungen statt einzelner Positionen.
Was bedeutet KI-Sichtbarkeit messen — und warum klassisches Ranking-Tracking nicht reicht
Wer KI-Sichtbarkeit messen will, muss zuerst verstehen, wie sich die Aufgabe von klassischem SEO-Tracking unterscheidet. Bei Google misst du eine Position: Platz 3 für ein Keyword ist Platz 3, heute und morgen. Bei ChatGPT, Perplexity oder Google AI Overviews gibt es keine Position. Es gibt eine Antwort — und die ist bei jeder Anfrage potenziell anders. Dieselbe Frage liefert mal eine Nennung deiner Marke, mal nicht. Das System ist nicht-deterministisch. Deshalb misst du keine einzelne Position, sondern eine Häufigkeit über viele Wiederholungen.
Konkret heißt das: Statt zu fragen „Auf welchem Platz stehe ich?“ fragst du „In wie viel Prozent der Antworten auf relevante Prompts werde ich erwähnt oder zitiert?“. Das ist ein Wahrscheinlichkeitsmaß, kein Rang. Genau das macht das Messen anspruchsvoller — und genau deshalb scheitern viele Unternehmen daran, ihren Erfolg in der KI-Suche zu belegen.
Die drei Sichtbarkeits-Ebenen in KI-Antworten
KI-Antworten zeigen deine Marke auf drei unterschiedlichen Ebenen, die du getrennt messen solltest:
- Zitat (Citation): Die KI verlinkt deine Domain als Quelle. Das ist die wertvollste Ebene, weil sie Traffic und Autorität bringt.
- Erwähnung (Mention): Deine Marke wird namentlich genannt, aber ohne Link. Auch ohne Klick wirkt das auf die Kaufentscheidung — der Nutzer liest deinen Namen im Antwort-Text.
- Empfehlung (Recommendation): Die KI nennt dich nicht nur, sondern empfiehlt dich aktiv („Für X eignet sich besonders …“). Die stärkste Form, schwer zu erzwingen, aber messbar.
Wenn du diese drei Ebenen vermischst, verzerrst du dein Bild. Eine Marke kann oft erwähnt, aber selten verlinkt werden — oder umgekehrt. Beide Fälle erfordern andere Maßnahmen. Wer hier sauber trennt, hat schon den halben Job erledigt. Falls du die strategischen Grundlagen dahinter noch brauchst, lies zuerst unseren Leitfaden zu Generative Engine Optimization — er erklärt, wie KI-Suchsysteme Quellen überhaupt auswählen.
Wir messen deine Citation-Rate, Mentions und den Share of Voice gegen deine Wettbewerber — und zeigen dir die größten Lücken.
Methoden: Prompt-Tests, Citation-Probe und GSC Gen-AI-Segmente
Es gibt drei praktikable Methoden, um KI-Sichtbarkeit zu messen — von manuell-günstig bis automatisiert-skalierbar.
Methode 1: Reproduzierbare Prompt-Tests
Das Fundament. Du definierst ein festes Set an Prompts, das echte Kundenfragen abbildet, und schickst es regelmäßig an die KI-Systeme. Wichtig ist die Reproduzierbarkeit: gleiche Prompts, gleiche Bedingungen, regelmäßige Intervalle. So baust du eine Methodik auf:
- Prompt-Set definieren: 20–50 Fragen, die deine Zielgruppe wirklich stellt — informational („Was ist …“), kommerziell („beste … für …“), vergleichend („X vs. Y“).
- Personalisierung neutralisieren: Im Inkognito-Modus, ausgeloggt, ohne Verlauf testen — sonst misst du deine eigene Filterblase.
- Mehrfach abfragen: Wegen der Nicht-Determiniertheit jeden Prompt mehrfach (z. B. 3–5-mal) ausführen und Häufigkeiten zählen, nicht Einzelantworten.
- Strukturiert protokollieren: Pro Prompt erfassen: Erwähnt ja/nein, Verlinkt ja/nein, Position, Sentiment, welche Wettbewerber genannt wurden.
Methode 2: Citation-Probe (Quellen-Analyse)
Hier drehst du die Frage um: Welche Quellen zitiert die KI für deine Kern-Themen — und warum nicht dich? Du sammelst die tatsächlich verlinkten URLs aus den Antworten und analysierst sie. Tauchen immer dieselben Wettbewerber, Branchenportale oder Reddit-Threads auf, weißt du, wo du präsent sein musst. Die Citation-Probe ist diagnostisch: Sie zeigt nicht nur deinen Stand, sondern den konkreten Weg nach vorn.
So sieht eine durchgerechnete Citation-Probe aus. Angenommen, du testest 50 kommerzielle Prompts rund um „Webagentur Berlin“ und protokollierst jede zitierte Domain. Das fiktive Ergebnis (alle Zahlen nur als Beispiel zur Veranschaulichung der Methode):
| Quelle | Zitate in 50 Prompts | Anteil an allen Citations | Kategorie |
|---|---|---|---|
| wettbewerber-a.de | 22 | 29 % | Competition |
| branchenportal.de | 18 | 24 % | Earned / Directory |
| reddit.com | 14 | 18 % | UGC |
| wettbewerber-b.de | 12 | 16 % | Competition |
| deine-domain.de | 10 | 13 % | Owned |
Die Auswertung liest sich direkt als To-do-Liste: 18 % der Citations gehen an Reddit, also musst du dort mit echten, hilfreichen Beiträgen präsent sein. 24 % gehen an ein Branchenportal — ein Eintrag oder Gastbeitrag dort ist Pflicht. Und Wettbewerber A wird mehr als doppelt so oft zitiert wie du: Lies seine zitierten Seiten und prüfe, welche Frage er beantwortet, die deine Seiten offen lassen. Genau diese Diagnose macht die Citation-Probe wertvoller als jede reine Sichtbarkeits-Zahl. Für ChatGPT- und Perplexity-spezifische Hebel vertiefen das unsere Guides zu ChatGPT SEO und Perplexity SEO.
Methode 3: Google Search Console Gen-AI-Segmente
Seit 2026 liefert die Google Search Console eigene Gen-AI-Performance-Reports. Sie zeigen, wie oft deine URLs in KI-Overviews und im AI Mode erscheinen — aufgeschlüsselt nach Impressionen, Seiten, Ländern, Geräten und Datum. So nutzt du sie konkret: Öffne den Leistungsbericht, filtere auf das Gen-AI-Segment und vergleiche die betroffenen URLs mit deinem klassischen Ranking. Seiten, die in der KI-Suche viele Impressionen, aber wenige Klicks sammeln, sind Kandidaten für zitierfähigere Formulierungen — kurze Definitionen, Listen, klare Zahlen. Seiten, die gar nicht im Gen-AI-Segment auftauchen, obwohl sie klassisch ranken, zeigen dir, wo die KI deine Inhalte (noch) nicht als Antwort-Material erkennt.
Wichtig zu wissen: Die KI-Impressionen sind laut Google bereits in den Gesamtzahlen des Performance-Berichts enthalten; der neue Report ist ein dedizierter Ausschnitt, kein zusätzliches Datensilo. Klickdaten für den reinen AI-Overviews-Anteil sind dabei nur eingeschränkt verfügbar — verlasse dich also nicht auf eine exakte AI-Klickrate, sondern lies die Daten als Trend. Trotzdem ist die GSC die einzige Quelle mit echten First-Party-Daten von Google — sie gehört in jeden Mess-Stack, auch wenn sie nur die Google-Welt abdeckt und ChatGPT oder Perplexity nicht erfasst. Kombiniere sie deshalb immer mit Prompt-Tests, die diese Engines abdecken.
Monitoring-Tools: Profound, Peec und otterly.ai im Vergleich
Manuelle Prompt-Tests sind ideal zum Einstieg, skalieren aber nicht. Wer KI-Sichtbarkeit kontinuierlich messen will, braucht ein spezialisiertes Tool. Drei haben sich im Markt etabliert:
Profound
Die Enterprise-Lösung. Profound trackt Sichtbarkeit über ChatGPT, Perplexity, Google AI Overviews und weitere Engines und bietet ein ausgereiftes Citation-Taxonomie-System, das jede zitierte Quelle automatisch in Kategorien wie Owned, Competition, Earned Media und PR einteilt. Konkret misst das Tool, in welchem Anteil der Antworten deine Marke auftaucht, gegen welche Wettbewerber du in welchen Themen verlierst und welche Drittquellen die KI bevorzugt zitiert — aufgeschlüsselt nach Plattform und Markt. Stark für Marketing-Teams, die „big picture“-Reporting über viele Themen und Länder brauchen und Antwort-Daten über Wochen hinweg vergleichen wollen. Entsprechend ist es das Tool mit dem höchsten Preisniveau der drei.
Peec AI
Der schnell wachsende Herausforderer aus Europa. Peec misst kontinuierlich Share of Voice und Citation-Rate über die großen LLMs und nutzt eine Technik, die das Verhalten echter Nutzer in ChatGPT, Perplexity und AI Overviews simuliert, statt nur die API anzufragen — das liefert realistischere Antworten als ein reiner Modell-Call. Im Dashboard siehst du pro Prompt, ob deine Marke genannt wird, an welcher Position, mit welchem Sentiment und welche Konkurrenten daneben stehen; Verläufe zeigen, ob eine Maßnahme die Sichtbarkeit bewegt hat. Gutes Preis-Leistungs-Verhältnis und ein klar auf Agenturen und Wachstums-Teams zugeschnittenes Dashboard. Sinnvolle Mitte zwischen Einstieg und Enterprise.
otterly.ai
Der zugänglichste Einstieg. otterly.ai ist günstig, schnell aufgesetzt und misst pro hinterlegtem Prompt, ob und wie deine Marke in den KI-Antworten erscheint. Die Kernkennzahl ist der „Share of AI Voice“: der Prozentsatz der Citations, die du gegenüber Wettbewerbern besitzt — plus eine Liste der Prompts, die du gewinnst oder verlierst, und der konkret verlinkten Quell-URLs. Damit deckt es genau die beiden Fragen ab, die am Anfang zählen: Wo bin ich sichtbar, und wer wird statt mir zitiert? Ideal für kleinere Unternehmen und für den ersten Reality-Check, bevor man in eine Enterprise-Suite investiert.
| Tool | Stärke | Passt für |
|---|---|---|
| Profound | Reife Citation-Taxonomie, Enterprise-Reporting | Große Marken, Multi-Markt |
| Peec AI | Share of Voice, realistische Nutzer-Simulation | Agenturen, Wachstums-Teams |
| otterly.ai | Günstig, schnell, Share of AI Voice | KMU, Einstieg |
Ein Tool ersetzt aber keine Strategie. Es zeigt dir die Zahl — die Arbeit, diese Zahl zu verbessern, ist klassisches und generatives SEO in Kombination. Wenn du beides aus einer Hand willst, sprich mit unserer GEO-Agentur in Berlin; für die klassische Such-Seite ist unsere SEO-Agentur der richtige Anlaufpunkt.
Wir optimieren für klassische Suche UND für ChatGPT, Perplexity und Google AI Overviews — aus einer Hand.
Praxis-Workflow: KI-Sichtbarkeit in 5 Schritten messbar machen
Theorie ist gut, ein wiederholbarer Prozess ist besser. So setzt du das Messen der KI-Sichtbarkeit in der Praxis auf — egal ob mit Tool oder zunächst manuell:
- Prompt-Set bauen und einfrieren. Sammle 20–50 echte Kundenfragen aus Vertriebsgesprächen, Support-Tickets und der Search Console. Mische informationale, kommerzielle und vergleichende Prompts und friere das Set ein — ab jetzt änderst du es nur noch dokumentiert, sonst sind deine Messungen nicht mehr vergleichbar.
- Baseline erheben. Führe jeden Prompt drei- bis fünfmal ausgeloggt und im Inkognito-Modus aus und miss Citation-Rate, Mention-Rate und Share of Voice. Das ist dein Nullpunkt. Halte zusätzlich pro Prompt fest, welche URLs zitiert wurden — das ist gleichzeitig deine erste Citation-Probe. Ohne Baseline kannst du keinen Fortschritt belegen.
- Wettbewerber festlegen. Bestimme 3–5 relevante Konkurrenten und tracke sie im selben Prompt-Set mit. Sichtbarkeit ist relativ — dein Wert allein sagt wenig ohne den Vergleich, und erst der Share of Voice macht aus einer Zahl eine Marktposition.
- Lücken priorisieren. Aus der Citation-Probe ableiten, wo du fehlst: Welche Themen, welche Quellen, welche Wettbewerber dominieren? Sortiere nach Geschäftsrelevanz, nicht nach Suchvolumen — ein Prompt, der direkt zu einem Verkauf führt, schlägt zehn informationale Fragen ohne Kaufabsicht.
- Maßnahmen umsetzen. Inhalte zitierfähig machen: klare Definitionen oben auf der Seite, Listen und Tabellen, belegbare Zahlen, strukturierte Daten, Erwähnungen auf den Drittseiten, die in deiner Citation-Probe immer wieder auftauchen. Branchenanalysen (etwa von Ahrefs) legen nahe, dass solche externen Erwähnungen mit KI-Sichtbarkeit zusammenhängen — behandle das als Arbeitshypothese, nicht als Garantie. Mehr Kontext dazu im Vergleich SEO vs. GEO.
- Im Intervall neu messen. Alle 2–4 Wochen das identische Prompt-Set unter identischen Bedingungen wiederholen und die KPIs gegen die Baseline tracken. KI-Sichtbarkeit bewegt sich langsam — gib jeder Maßnahme Zeit, bevor du sie bewertest, und schau auf den Trend über mehrere Messungen statt auf einen einzelnen Sprung.
Warum das wirkt: ein echtes Ergebnis
Dieser Loop ist kein Selbstzweck. Bei der Pflegevermittlung Schweiz haben wir organische Sichtbarkeit komplett von Null aufgebaut — mit genau diesem Prinzip: messen, Lücken schließen, neu messen. Im E-Commerce hat Kiwabo über strukturierte, zitierfähige Inhalte rund +210 % organischen Traffic erreicht, und Airbag24 kam über konsequente Optimierung auf +400 % ROI. Das sind klassische SEO-Ergebnisse — sie belegen, dass der Mess-und-Verbessern-Loop funktioniert, nicht dass diese Zahlen aus KI-Zitaten stammen. Der Punkt: Wer nicht misst, optimiert blind. Die Methodik ist in beiden Welten dieselbe.
Du kannst KI-Sichtbarkeit kostenlos über manuelle Prompt-Tests messen. Definiere 20–50 echte Kundenfragen, schicke sie ausgeloggt und im Inkognito-Modus an ChatGPT, Perplexity und Google, und protokolliere für jede Antwort, ob du erwähnt und/oder verlinkt wirst. Wiederhole jeden Prompt mehrfach und zähle Häufigkeiten statt Einzelantworten. Das ist arbeitsintensiv, aber liefert eine solide Baseline, bevor du in ein Monitoring-Tool investierst.
Die Citation-Rate misst, wie oft die KI deine Domain als verlinkte Quelle nennt, die Mention-Rate misst jede namentliche Erwähnung deiner Marke — mit oder ohne Link. Die Mention-Rate liegt fast immer höher, weil KI-Modelle Marken aus ihrem Trainingswissen nennen, ohne aktiv eine Quelle zu verlinken. Steigende Mentions bei gleichbleibenden Citations sind ein Signal: Deine Marke ist präsent, aber deine Website wird nicht als zitierfähig erkannt. Beide KPIs gehören deshalb getrennt erfasst.
Das hängt von Größe und Budget ab: otterly.ai ist der günstigste und schnellste Einstieg, Peec AI bietet ein starkes Preis-Leistungs-Verhältnis für Agenturen und Wachstums-Teams, und Profound ist die Enterprise-Lösung mit der reifsten Citation-Taxonomie. Für den ersten Reality-Check reicht otterly.ai, für kontinuierliches Wettbewerbs-Monitoring lohnt Peec, und große Marken mit vielen Themen und Märkten fahren mit Profound am besten. Kein Tool ersetzt jedoch die strategische Arbeit, die nötig ist, um die gemessenen Werte zu verbessern.
Ja, teilweise: Seit 2026 hat die Google Search Console eigene Gen-AI-Performance-Reports, die zeigen, wie oft deine URLs in AI Overviews und im AI Mode erscheinen. Aufgeschlüsselt wird nach Impressionen, Seiten, Ländern, Geräten und Datum; vollständige Klickdaten für den reinen AI-Anteil sind nur eingeschränkt verfügbar. Die Daten decken aber nur die Google-Welt ab — ChatGPT, Perplexity oder Claude werden dort nicht erfasst. Die GSC ist daher eine wichtige First-Party-Quelle, aber kein vollständiger Mess-Stack.
KI-Suchsysteme sind nicht-deterministisch — dieselbe Frage kann bei jeder Anfrage eine andere Antwort liefern. Deshalb ist Schwankung normal und kein Messfehler. Die Lösung ist, jeden Prompt mehrfach auszuführen und über viele Wiederholungen Häufigkeiten zu bilden, statt einzelne Antworten zu bewerten. Miss außerdem in festen Intervallen unter gleichen Bedingungen, damit Trends erkennbar werden — eine einzelne Momentaufnahme sagt bei KI-Sichtbarkeit wenig aus.
