Ratgeber · SEO & GEO

11. Juni 2026·Aktualisiert 12. Juni 2026·⏱ 12 Min. Lesezeit

KI-Sichtbarkeit messen: KPIs, Methoden & Tools für die Praxis

David Martin

SEO & Growth Lead

KI-Sichtbarkeit messen bedeutet, systematisch zu erfassen, wie oft und in welchem Kontext KI-Suchsysteme wie ChatGPT, Perplexity und Google AI Overviews deine Marke erwähnen, zitieren oder verlinken. Die drei zentralen KPIs sind die Citation-Rate (Anteil der Antworten mit Link auf deine Domain), die Mention-Rate (Erwähnungen deiner Marke, auch ohne Link) und der Share of Voice (dein Anteil an allen Marken-Nennungen für ein Themenfeld). Gemessen wird über reproduzierbare Prompt-Tests und spezialisierte Monitoring-Tools wie Profound, Peec oder otterly.ai, ergänzt um die Gen-AI-Segmente der Google Search Console. Anders als klassisches Ranking-Tracking ist KI-Sichtbarkeit nicht-deterministisch — deshalb misst man Häufigkeiten über viele Prompt-Wiederholungen statt einzelner Positionen.

Was bedeutet KI-Sichtbarkeit messen — und warum klassisches Ranking-Tracking nicht reicht

Wer KI-Sichtbarkeit messen will, muss zuerst verstehen, wie sich die Aufgabe von klassischem SEO-Tracking unterscheidet. Bei Google misst du eine Position: Platz 3 für ein Keyword ist Platz 3, heute und morgen. Bei ChatGPT, Perplexity oder Google AI Overviews gibt es keine Position. Es gibt eine Antwort — und die ist bei jeder Anfrage potenziell anders. Dieselbe Frage liefert mal eine Nennung deiner Marke, mal nicht. Das System ist nicht-deterministisch. Deshalb misst du keine einzelne Position, sondern eine Häufigkeit über viele Wiederholungen.

Konkret heißt das: Statt zu fragen „Auf welchem Platz stehe ich?“ fragst du „In wie viel Prozent der Antworten auf relevante Prompts werde ich erwähnt oder zitiert?“. Das ist ein Wahrscheinlichkeitsmaß, kein Rang. Genau das macht das Messen anspruchsvoller — und genau deshalb scheitern viele Unternehmen daran, ihren Erfolg in der KI-Suche zu belegen.

Die drei Sichtbarkeits-Ebenen in KI-Antworten

KI-Antworten zeigen deine Marke auf drei unterschiedlichen Ebenen, die du getrennt messen solltest:

Zitat (Citation): Die KI verlinkt deine Domain als Quelle. Das ist die wertvollste Ebene, weil sie Traffic und Autorität bringt.
Erwähnung (Mention): Deine Marke wird namentlich genannt, aber ohne Link. Auch ohne Klick wirkt das auf die Kaufentscheidung — der Nutzer liest deinen Namen im Antwort-Text.
Empfehlung (Recommendation): Die KI nennt dich nicht nur, sondern empfiehlt dich aktiv („Für X eignet sich besonders …“). Die stärkste Form, schwer zu erzwingen, aber messbar.

Wenn du diese drei Ebenen vermischst, verzerrst du dein Bild. Eine Marke kann oft erwähnt, aber selten verlinkt werden — oder umgekehrt. Beide Fälle erfordern andere Maßnahmen. Wer hier sauber trennt, hat schon den halben Job erledigt. Falls du die strategischen Grundlagen dahinter noch brauchst, lies zuerst unseren Leitfaden zu Generative Engine Optimization — er erklärt, wie KI-Suchsysteme Quellen überhaupt auswählen.

Die wichtigsten KPIs: Citation-Rate, Mentions und Share of Voice

Beim KI-Sichtbarkeit messen brauchst du wenige, klar definierte Kennzahlen — nicht zehn Vanity-Metriken. Diese vier bilden das stabile Gerüst:

1. Citation-Rate (Zitier-Quote)

Anteil der KI-Antworten, in denen deine Domain als Quelle verlinkt wird, an allen getesteten Prompts. Formel: Antworten mit Link auf deine Domain ÷ alle relevanten Antworten. Ein illustratives Rechenbeispiel: Bei 100 Prompts erscheinst du 18-mal als verlinkte Quelle — das ergibt eine Citation-Rate von 18 % (die 18 % sind hier nur ein Demowert, kein Branchen-Benchmark). Diese Kennzahl korreliert am direktesten mit Traffic aus KI-Systemen, weil nur ein Link einen Klick auslösen kann. Wichtig ist der Nenner: Zähle nur Prompts, für die deine Marke überhaupt relevant ist — eine Frage nach einem fremden Thema gehört nicht ins Set, sonst drückst du deine Rate künstlich.

2. Mention-Rate (Erwähnungs-Quote)

Anteil der Antworten, in denen dein Markenname genannt wird — mit oder ohne Link. Die Mention-Rate liegt fast immer über der Citation-Rate, weil KI-Modelle Marken aus ihrem Trainingswissen nennen, ohne aktiv eine Quelle zu verlinken. Sie ist der beste Frühindikator: Steigende Mentions ohne steigende Citations heißt, deine Marke ist im Modell präsent, aber deine Website wird nicht als zitierfähige Quelle erkannt. Die Differenz zwischen beiden Raten — nenne sie ruhig „Citation-Gap“ — ist eine der aufschlussreichsten Zahlen im ganzen Report: Ein großer Gap bedeutet, dass du an Marken-Bekanntheit gewinnst, aber deine Inhalte noch nicht zitierfähig genug sind. Ein kleiner Gap heißt, dass jede Erwähnung auch verlinkt wird — der Idealzustand.

3. Share of Voice (Anteil an der Stimme)

Dein Anteil an allen Marken-Nennungen für ein definiertes Themenfeld, im Vergleich zu Wettbewerbern. Wenn für „beste Webagentur Berlin“ in einem Prompt-Set fünf Anbieter genannt werden und du in 30 % der Antworten dabei bist, wäre das ein Share of Voice von 30 % (auch dieser Wert dient nur der Veranschaulichung). Rechnerisch: deine Nennungen ÷ Nennungen aller getrackten Marken zusammen. Diese KPI macht KI-Sichtbarkeit wettbewerbsfähig vergleichbar — du siehst nicht nur, ob du sichtbar bist, sondern wie sichtbar relativ zur Konkurrenz. Anders als die Citation-Rate ist der Share of Voice ein Nullsummenspiel: Gewinnt ein Wettbewerber Anteile, verlieren die anderen. Deshalb ist diese Zahl das ehrlichste Maß für deine Marktposition in der KI-Suche und die Kennzahl, die du im Reporting an die Geschäftsführung stellst.

4. Sentiment & Position in der Antwort

Zwei qualitative Ergänzungen: In welchem Ton wirst du genannt (positiv, neutral, kritisch) und an welcher Stelle der Antwort (erste Erwähnung wiegt schwerer). Die Position ist relevant, weil Nutzer Antworten selten zu Ende lesen — wer im ersten Drittel genannt wird, hat ungleich mehr Wirkung als eine Fußnote ganz unten. Branchenauswertungen (etwa von AirOps) deuten darauf hin, dass ein erheblicher Teil der zitierten Quellen im ersten Drittel der Antwort landet; behandle solche Werte als grobe Orientierung aus Drittquellen, nicht als feste Konstante. Das Sentiment wiederum entscheidet, ob eine Nennung dir nützt oder schadet: Wirst du als Beispiel für ein Problem genannt, ist das eine sichtbare, aber negative Erwähnung — sie gehört im Report rot markiert, nicht als Erfolg verbucht.

KPI	Was sie misst	Wofür gut
Citation-Rate	Antworten mit Link auf deine Domain	Traffic-Potenzial, Quellen-Autorität
Mention-Rate	Namentliche Nennungen (mit/ohne Link)	Marken-Präsenz, Frühindikator
Share of Voice	Anteil vs. Wettbewerber	Wettbewerbsvergleich
Sentiment & Position	Ton und Platzierung der Nennung	Qualität der Sichtbarkeit

Kostenloser KI-Sichtbarkeits-Check

Wie oft nennt ChatGPT deine Marke wirklich?

Wir messen deine Citation-Rate, Mentions und den Share of Voice gegen deine Wettbewerber — und zeigen dir die größten Lücken.

KI-Sichtbarkeit prüfen lassen →

Methoden: Prompt-Tests, Citation-Probe und GSC Gen-AI-Segmente

Es gibt drei praktikable Methoden, um KI-Sichtbarkeit zu messen — von manuell-günstig bis automatisiert-skalierbar.

Methode 1: Reproduzierbare Prompt-Tests

Das Fundament. Du definierst ein festes Set an Prompts, das echte Kundenfragen abbildet, und schickst es regelmäßig an die KI-Systeme. Wichtig ist die Reproduzierbarkeit: gleiche Prompts, gleiche Bedingungen, regelmäßige Intervalle. So baust du eine Methodik auf:

Prompt-Set definieren: 20–50 Fragen, die deine Zielgruppe wirklich stellt — informational („Was ist …“), kommerziell („beste … für …“), vergleichend („X vs. Y“).
Personalisierung neutralisieren: Im Inkognito-Modus, ausgeloggt, ohne Verlauf testen — sonst misst du deine eigene Filterblase.
Mehrfach abfragen: Wegen der Nicht-Determiniertheit jeden Prompt mehrfach (z. B. 3–5-mal) ausführen und Häufigkeiten zählen, nicht Einzelantworten.
Strukturiert protokollieren: Pro Prompt erfassen: Erwähnt ja/nein, Verlinkt ja/nein, Position, Sentiment, welche Wettbewerber genannt wurden.

Methode 2: Citation-Probe (Quellen-Analyse)

Hier drehst du die Frage um: Welche Quellen zitiert die KI für deine Kern-Themen — und warum nicht dich? Du sammelst die tatsächlich verlinkten URLs aus den Antworten und analysierst sie. Tauchen immer dieselben Wettbewerber, Branchenportale oder Reddit-Threads auf, weißt du, wo du präsent sein musst. Die Citation-Probe ist diagnostisch: Sie zeigt nicht nur deinen Stand, sondern den konkreten Weg nach vorn.

So sieht eine durchgerechnete Citation-Probe aus. Angenommen, du testest 50 kommerzielle Prompts rund um „Webagentur Berlin“ und protokollierst jede zitierte Domain. Das fiktive Ergebnis (alle Zahlen nur als Beispiel zur Veranschaulichung der Methode):

Quelle	Zitate in 50 Prompts	Anteil an allen Citations	Kategorie
wettbewerber-a.de	22	29 %	Competition
branchenportal.de	18	24 %	Earned / Directory
reddit.com	14	18 %	UGC
wettbewerber-b.de	12	16 %	Competition
deine-domain.de	10	13 %	Owned

Die Auswertung liest sich direkt als To-do-Liste: 18 % der Citations gehen an Reddit, also musst du dort mit echten, hilfreichen Beiträgen präsent sein. 24 % gehen an ein Branchenportal — ein Eintrag oder Gastbeitrag dort ist Pflicht. Und Wettbewerber A wird mehr als doppelt so oft zitiert wie du: Lies seine zitierten Seiten und prüfe, welche Frage er beantwortet, die deine Seiten offen lassen. Genau diese Diagnose macht die Citation-Probe wertvoller als jede reine Sichtbarkeits-Zahl. Für ChatGPT- und Perplexity-spezifische Hebel vertiefen das unsere Guides zu ChatGPT SEO und Perplexity SEO.

Methode 3: Google Search Console Gen-AI-Segmente

Seit 2026 liefert die Google Search Console eigene Gen-AI-Performance-Reports. Sie zeigen, wie oft deine URLs in KI-Overviews und im AI Mode erscheinen — aufgeschlüsselt nach Impressionen, Seiten, Ländern, Geräten und Datum. So nutzt du sie konkret: Öffne den Leistungsbericht, filtere auf das Gen-AI-Segment und vergleiche die betroffenen URLs mit deinem klassischen Ranking. Seiten, die in der KI-Suche viele Impressionen, aber wenige Klicks sammeln, sind Kandidaten für zitierfähigere Formulierungen — kurze Definitionen, Listen, klare Zahlen. Seiten, die gar nicht im Gen-AI-Segment auftauchen, obwohl sie klassisch ranken, zeigen dir, wo die KI deine Inhalte (noch) nicht als Antwort-Material erkennt.

Wichtig zu wissen: Die KI-Impressionen sind laut Google bereits in den Gesamtzahlen des Performance-Berichts enthalten; der neue Report ist ein dedizierter Ausschnitt, kein zusätzliches Datensilo. Klickdaten für den reinen AI-Overviews-Anteil sind dabei nur eingeschränkt verfügbar — verlasse dich also nicht auf eine exakte AI-Klickrate, sondern lies die Daten als Trend. Trotzdem ist die GSC die einzige Quelle mit echten First-Party-Daten von Google — sie gehört in jeden Mess-Stack, auch wenn sie nur die Google-Welt abdeckt und ChatGPT oder Perplexity nicht erfasst. Kombiniere sie deshalb immer mit Prompt-Tests, die diese Engines abdecken.

💡

Praxis-Tipp: Immer im Inkognito-Modus testen

KI-Systeme personalisieren Antworten anhand deines Verlaufs und Standorts. Wenn du eingeloggt testest, misst du deine eigene Filterblase — nicht das, was ein neuer Interessent sieht. Teste ausgeloggt, im privaten Fenster, und führe jeden Prompt mehrfach aus, um die Nicht-Determiniertheit auszumitteln.

Monitoring-Tools: Profound, Peec und otterly.ai im Vergleich

Manuelle Prompt-Tests sind ideal zum Einstieg, skalieren aber nicht. Wer KI-Sichtbarkeit kontinuierlich messen will, braucht ein spezialisiertes Tool. Drei haben sich im Markt etabliert:

Profound

Die Enterprise-Lösung. Profound trackt Sichtbarkeit über ChatGPT, Perplexity, Google AI Overviews und weitere Engines und bietet ein ausgereiftes Citation-Taxonomie-System, das jede zitierte Quelle automatisch in Kategorien wie Owned, Competition, Earned Media und PR einteilt. Konkret misst das Tool, in welchem Anteil der Antworten deine Marke auftaucht, gegen welche Wettbewerber du in welchen Themen verlierst und welche Drittquellen die KI bevorzugt zitiert — aufgeschlüsselt nach Plattform und Markt. Stark für Marketing-Teams, die „big picture“-Reporting über viele Themen und Länder brauchen und Antwort-Daten über Wochen hinweg vergleichen wollen. Entsprechend ist es das Tool mit dem höchsten Preisniveau der drei.

Peec AI

Der schnell wachsende Herausforderer aus Europa. Peec misst kontinuierlich Share of Voice und Citation-Rate über die großen LLMs und nutzt eine Technik, die das Verhalten echter Nutzer in ChatGPT, Perplexity und AI Overviews simuliert, statt nur die API anzufragen — das liefert realistischere Antworten als ein reiner Modell-Call. Im Dashboard siehst du pro Prompt, ob deine Marke genannt wird, an welcher Position, mit welchem Sentiment und welche Konkurrenten daneben stehen; Verläufe zeigen, ob eine Maßnahme die Sichtbarkeit bewegt hat. Gutes Preis-Leistungs-Verhältnis und ein klar auf Agenturen und Wachstums-Teams zugeschnittenes Dashboard. Sinnvolle Mitte zwischen Einstieg und Enterprise.

otterly.ai

Der zugänglichste Einstieg. otterly.ai ist günstig, schnell aufgesetzt und misst pro hinterlegtem Prompt, ob und wie deine Marke in den KI-Antworten erscheint. Die Kernkennzahl ist der „Share of AI Voice“: der Prozentsatz der Citations, die du gegenüber Wettbewerbern besitzt — plus eine Liste der Prompts, die du gewinnst oder verlierst, und der konkret verlinkten Quell-URLs. Damit deckt es genau die beiden Fragen ab, die am Anfang zählen: Wo bin ich sichtbar, und wer wird statt mir zitiert? Ideal für kleinere Unternehmen und für den ersten Reality-Check, bevor man in eine Enterprise-Suite investiert.

Tool	Stärke	Passt für
Profound	Reife Citation-Taxonomie, Enterprise-Reporting	Große Marken, Multi-Markt
Peec AI	Share of Voice, realistische Nutzer-Simulation	Agenturen, Wachstums-Teams
otterly.ai	Günstig, schnell, Share of AI Voice	KMU, Einstieg

Ein Tool ersetzt aber keine Strategie. Es zeigt dir die Zahl — die Arbeit, diese Zahl zu verbessern, ist klassisches und generatives SEO in Kombination. Wenn du beides aus einer Hand willst, sprich mit unserer GEO-Agentur in Berlin; für die klassische Such-Seite ist unsere SEO-Agentur der richtige Anlaufpunkt.

GEO aus Berlin

Vom Messen zum Ranken in KI-Suchsystemen

Wir optimieren für klassische Suche UND für ChatGPT, Perplexity und Google AI Overviews — aus einer Hand.

Strategiegespräch vereinbaren →

💡

Tool-Auswahl: Erst manuell, dann automatisieren

Starte nicht mit dem teuersten Tool. Miss dein erstes Prompt-Set manuell, lerne deine eigene Datenlage kennen, und automatisiere danach mit otterly.ai (Einstieg), Peec (Mitte) oder Profound (Enterprise). So zahlst du nicht für Features, die du noch nicht brauchst.

Praxis-Workflow: KI-Sichtbarkeit in 5 Schritten messbar machen

Theorie ist gut, ein wiederholbarer Prozess ist besser. So setzt du das Messen der KI-Sichtbarkeit in der Praxis auf — egal ob mit Tool oder zunächst manuell:

Prompt-Set bauen und einfrieren. Sammle 20–50 echte Kundenfragen aus Vertriebsgesprächen, Support-Tickets und der Search Console. Mische informationale, kommerzielle und vergleichende Prompts und friere das Set ein — ab jetzt änderst du es nur noch dokumentiert, sonst sind deine Messungen nicht mehr vergleichbar.
Baseline erheben. Führe jeden Prompt drei- bis fünfmal ausgeloggt und im Inkognito-Modus aus und miss Citation-Rate, Mention-Rate und Share of Voice. Das ist dein Nullpunkt. Halte zusätzlich pro Prompt fest, welche URLs zitiert wurden — das ist gleichzeitig deine erste Citation-Probe. Ohne Baseline kannst du keinen Fortschritt belegen.
Wettbewerber festlegen. Bestimme 3–5 relevante Konkurrenten und tracke sie im selben Prompt-Set mit. Sichtbarkeit ist relativ — dein Wert allein sagt wenig ohne den Vergleich, und erst der Share of Voice macht aus einer Zahl eine Marktposition.
Lücken priorisieren. Aus der Citation-Probe ableiten, wo du fehlst: Welche Themen, welche Quellen, welche Wettbewerber dominieren? Sortiere nach Geschäftsrelevanz, nicht nach Suchvolumen — ein Prompt, der direkt zu einem Verkauf führt, schlägt zehn informationale Fragen ohne Kaufabsicht.
Maßnahmen umsetzen. Inhalte zitierfähig machen: klare Definitionen oben auf der Seite, Listen und Tabellen, belegbare Zahlen, strukturierte Daten, Erwähnungen auf den Drittseiten, die in deiner Citation-Probe immer wieder auftauchen. Branchenanalysen (etwa von Ahrefs) legen nahe, dass solche externen Erwähnungen mit KI-Sichtbarkeit zusammenhängen — behandle das als Arbeitshypothese, nicht als Garantie. Mehr Kontext dazu im Vergleich SEO vs. GEO.
Im Intervall neu messen. Alle 2–4 Wochen das identische Prompt-Set unter identischen Bedingungen wiederholen und die KPIs gegen die Baseline tracken. KI-Sichtbarkeit bewegt sich langsam — gib jeder Maßnahme Zeit, bevor du sie bewertest, und schau auf den Trend über mehrere Messungen statt auf einen einzelnen Sprung.

Warum das wirkt: ein echtes Ergebnis

Dieser Loop ist kein Selbstzweck. Bei der Pflegevermittlung Schweiz haben wir organische Sichtbarkeit komplett von Null aufgebaut — mit genau diesem Prinzip: messen, Lücken schließen, neu messen. Im E-Commerce hat Kiwabo über strukturierte, zitierfähige Inhalte rund +210 % organischen Traffic erreicht, und Airbag24 kam über konsequente Optimierung auf +400 % ROI. Das sind klassische SEO-Ergebnisse — sie belegen, dass der Mess-und-Verbessern-Loop funktioniert, nicht dass diese Zahlen aus KI-Zitaten stammen. Der Punkt: Wer nicht misst, optimiert blind. Die Methodik ist in beiden Welten dieselbe.

Häufige Fragen

Wie kann ich meine KI-Sichtbarkeit messen, ohne ein Tool zu kaufen?

Du kannst KI-Sichtbarkeit kostenlos über manuelle Prompt-Tests messen. Definiere 20–50 echte Kundenfragen, schicke sie ausgeloggt und im Inkognito-Modus an ChatGPT, Perplexity und Google, und protokolliere für jede Antwort, ob du erwähnt und/oder verlinkt wirst. Wiederhole jeden Prompt mehrfach und zähle Häufigkeiten statt Einzelantworten. Das ist arbeitsintensiv, aber liefert eine solide Baseline, bevor du in ein Monitoring-Tool investierst.

Was ist der Unterschied zwischen Citation-Rate und Mention-Rate?

Die Citation-Rate misst, wie oft die KI deine Domain als verlinkte Quelle nennt, die Mention-Rate misst jede namentliche Erwähnung deiner Marke — mit oder ohne Link. Die Mention-Rate liegt fast immer höher, weil KI-Modelle Marken aus ihrem Trainingswissen nennen, ohne aktiv eine Quelle zu verlinken. Steigende Mentions bei gleichbleibenden Citations sind ein Signal: Deine Marke ist präsent, aber deine Website wird nicht als zitierfähig erkannt. Beide KPIs gehören deshalb getrennt erfasst.

Welches Tool eignet sich am besten, um KI-Sichtbarkeit zu messen?

Das hängt von Größe und Budget ab: otterly.ai ist der günstigste und schnellste Einstieg, Peec AI bietet ein starkes Preis-Leistungs-Verhältnis für Agenturen und Wachstums-Teams, und Profound ist die Enterprise-Lösung mit der reifsten Citation-Taxonomie. Für den ersten Reality-Check reicht otterly.ai, für kontinuierliches Wettbewerbs-Monitoring lohnt Peec, und große Marken mit vielen Themen und Märkten fahren mit Profound am besten. Kein Tool ersetzt jedoch die strategische Arbeit, die nötig ist, um die gemessenen Werte zu verbessern.

Zeigt die Google Search Console meine KI-Sichtbarkeit?

Ja, teilweise: Seit 2026 hat die Google Search Console eigene Gen-AI-Performance-Reports, die zeigen, wie oft deine URLs in AI Overviews und im AI Mode erscheinen. Aufgeschlüsselt wird nach Impressionen, Seiten, Ländern, Geräten und Datum; vollständige Klickdaten für den reinen AI-Anteil sind nur eingeschränkt verfügbar. Die Daten decken aber nur die Google-Welt ab — ChatGPT, Perplexity oder Claude werden dort nicht erfasst. Die GSC ist daher eine wichtige First-Party-Quelle, aber kein vollständiger Mess-Stack.

Warum schwankt meine KI-Sichtbarkeit so stark zwischen den Messungen?

KI-Suchsysteme sind nicht-deterministisch — dieselbe Frage kann bei jeder Anfrage eine andere Antwort liefern. Deshalb ist Schwankung normal und kein Messfehler. Die Lösung ist, jeden Prompt mehrfach auszuführen und über viele Wiederholungen Häufigkeiten zu bilden, statt einzelne Antworten zu bewerten. Miss außerdem in festen Intervallen unter gleichen Bedingungen, damit Trends erkennbar werden — eine einzelne Momentaufnahme sagt bei KI-Sichtbarkeit wenig aus.