Глоссарий
LLM-Score
Один показатель 0–100: частота упоминаний, фактическая точность и тональность ответов про бренд.
Посмотрите свой LLM-Score в демо-отчёте.
Определение
LLM-Score — составная метрика 0–100 в Getllmspy: насколько часто и насколько правильно крупные языковые модели — ChatGPT, Gemini, Perplexity, Claude, YandexGPT, Алиса, GigaChat, DeepSeek — называют ваш бренд в типичных вопросах категории. В отличие от классического SEO, это не позиция в выдаче, а присутствие внутри сгенерированного ответа. В метрику входят доля упоминаний по пакету промптов, отсутствие галлюцинаций и тональность.
Ориентиры по шкале
| Диапазон | Интерпретация |
|---|---|
| 0–20 | Бренд практически невидим в нейросетях |
| 21–45 | Редкие упоминания, часто с ошибками |
| 46–65 | Стабильное присутствие в части моделей |
| 66–80 | Хорошая видимость, единичные галлюцинации |
| 81–100 | Лидерская позиция в нише |
Медианный LLM-Score по базе Getllmspy — 38 (данные апрель 2026).
Примеры интерпретации
Балл 34: в отчёте видно, что вас иногда называют, но путают юридическое название и сайт — имеет смысл выровнять карточку организации и поддомены, а не писать длинный лонгрид.
Балл 71: упоминания стабильны, но в два вопроса про гарантию модель отвечает неверно — точечно исправьте страницу «Гарантия» и блок вопросов и ответов, не меняя весь сайт.
Балл 58 у конкурента 72: сравните цитаты: часто разница не в «силе бренда», а в том, что у них свежая страница сравнения с датой обновления, а у вас устаревшая.
Как считается
Пайплайн в общих чертах:
- Пакет промптов — фиксированный набор вопросов категории (без «подставьте сюда имя бренда» в тексте запроса), см. промпт-пак.
- Прогон по моделям — каждая модель из покрытия отвечает тем же шагам; ответы сохраняются как датированные снимки.
- Сигналы на ответ — бинарное/скалярное «упомянут ли бренд уместно», оценка фактической согласованности, тональность, штраф за явные противоречия реальности.
- Нормировка — сигналы приводятся к шкале 0–1 по модели и промпту, взвешиваются по модели (трафик, актуальность для региона) и агрегируются в одно число по бренду и теме.
- Публикация — в отчёте вы видите итог, разрез по моделям и цитаты; число всегда нужно читать вместе с контекстом ответов.
Ниже на странице — учебная формула и визуализация разложения; в продукте коэффициенты могут отличаться, логика — та же.
Упрощённая модель агрегации
Ниже — учебная схема: в продукте веса моделей и нормировки могут отличаться, но логика та же: три сигнала плюс штраф за фактические ошибки.
Базовая формула (схематично)
LLM-Score ≈ 100 × ( α·M + β·C + γ·S − δ·H )
M — доля ответов с корректным упоминанием бренда; C ∈ [0,1] — согласованность с фактами; S — нормированная тональность; H ∈ [0,1] — штраф за галлюцинации; α+β+γ+δ = 1.
Итоговый балл (пример)
72
Учебный пример, не ваш реальный балл.
Упоминание (presence)
Доля ответов, где бренд назван уместно
Фактическая согласованность
Совпадение с известными фактами
Нормированный sentiment
Позитив / нейтрал / негатив
Фрагменты из типичного отчёта
Сводка по моделям
LLM-Score (срез): 67
Δ к прошлой неделе: +5
Сильнее всего: YandexGPT (+12 к цитатам)
Риск: Perplexity — неверный адрес сайта в 2/10 ответах
Цитата из ответа
«В этой категории чаще называют бренды X и Y; ваш бренд упоминается в контексте …» — дословный фрагмент помогает понять, *почему* балл вырос или упал.
Источник: снимок ответа + метка модели и даты
Как это работает на практике
Что открыть в отчёте в первую очередь
- Сводка по моделям — где растёт или падает балл после выката GEO или обновления AEO контента.
- Цитаты — 1–2 предложения из ответа часто объясняют скачок лучше, чем одно число: например, неверный адрес сайта или смешение вас с однофамильцем.
- Разрез по промптам — высокий LLM-Score при провале на 2–3 «денежных» вопросах означает, что усилия лучше направить в эти сценарии, а не «полировать среднее».
Мини-пример интерпретации
Допустим, LLM-Score = 67, а неделю назад было 62: в таблице по моделям видно, что YandexGPT добавил +12 к доле цитат с правильным названием, а Perplexity всё ещё путает домен — тогда приоритет: правки карточки организации и источников, а не новые статьи в блог.
Связанные показатели: GPI для «насколько вы вообще в поле зрения моделей», доля голоса — если важна конкурентная доля упоминаний.
Как читать показатель
Используйте шкалу выше как ориентир и всегда смотрите цитаты в отчёте: высокий балл при токсичном контексте всё равно требует работы с контентом.
LLM-Score и Share of Voice (доля голоса)
LLM-Score учитывает качество и тон, а не только частоту. Share of Voice — про долю упоминаний среди конкурентов; можно иметь высокую SoV и низкий LLM-Score, если модели вас искажают.
Когда использовать
- Еженедельный контроль после изменений llms.txt или схемы.
- Сравнение моделей (ChatGPT против YandexGPT).
- Отчёт руководству: одно число по бренду за месяц.