Как рассчитывается LLM-Score?

Пайплайн в общих чертах: 1. Пакет промптов — фиксированный набор вопросов категории (без «подставьте сюда имя бренда» в тексте запроса), см. промпт-пак. 2. Прогон по моделям — каждая модель из покрытия отвечает тем же шагам; ответы сохраняются как датированные снимки. 3. Сигналы на ответ — бинарное/скалярное «упомянут ли бренд уместно», оценка фактической согласованности, тональность, штраф за явные противоречия реальности. 4. Нормировка — сигналы приводятся к шкале 0–1 по модели и промпту, взвешиваются по модели (трафик, актуальность для региона) и агрегируются в одно число по бренду и теме. 5. Публикация — в отчёте вы видите итог, разрез по моделям и цитаты; число всегда нужно читать вместе с контекстом ответов. Ниже на странице — учебная формула и визуализация разложения; в продукте коэффициенты могут отличаться, логика — та же.

Когда применять LLM-Score?

Еженедельный контроль после изменений llms.txt или схемы. Сравнение моделей (ChatGPT против YandexGPT). Отчёт руководству: одно число по бренду за месяц.

Глоссарий

LLM-Score

LLM-Score — метрика 0–100, показывающая, насколько часто и корректно ChatGPT, YandexGPT, Alice и другие LLM упоминают ваш бренд.

Один показатель 0–100: частота упоминаний, фактическая точность и тональность ответов про бренд.
Посмотрите свой LLM-Score в демо-отчёте.

Определение

LLM-Score — составная метрика 0–100 в Getllmspy: насколько часто и насколько правильно крупные языковые модели — ChatGPT, Gemini, Perplexity, Claude, YandexGPT, Алиса, GigaChat, DeepSeek — называют ваш бренд в типичных вопросах категории. В отличие от классического SEO, это не позиция в выдаче, а присутствие внутри сгенерированного ответа. В метрику входят доля упоминаний по пакету промптов, отсутствие галлюцинаций и тональность.

Ориентиры по шкале

Диапазон	Интерпретация
0–20	Бренд практически невидим в нейросетях
21–45	Редкие упоминания, часто с ошибками
46–65	Стабильное присутствие в части моделей
66–80	Хорошая видимость, единичные галлюцинации
81–100	Лидерская позиция в нише

Медианный LLM-Score по базе Getllmspy — 38 (данные апрель 2026).

Примеры интерпретации

Балл 34: в отчёте видно, что вас иногда называют, но путают юридическое название и сайт — имеет смысл выровнять карточку организации и поддомены, а не писать длинный лонгрид.

Балл 71: упоминания стабильны, но в два вопроса про гарантию модель отвечает неверно — точечно исправьте страницу «Гарантия» и блок вопросов и ответов, не меняя весь сайт.

Балл 58 у конкурента 72: сравните цитаты: часто разница не в «силе бренда», а в том, что у них свежая страница сравнения с датой обновления, а у вас устаревшая.

Как считается

Пайплайн в общих чертах:

Пакет промптов — фиксированный набор вопросов категории (без «подставьте сюда имя бренда» в тексте запроса), см. промпт-пак.
Прогон по моделям — каждая модель из покрытия отвечает тем же шагам; ответы сохраняются как датированные снимки.
Сигналы на ответ — бинарное/скалярное «упомянут ли бренд уместно», оценка фактической согласованности, тональность, штраф за явные противоречия реальности.
Нормировка — сигналы приводятся к шкале 0–1 по модели и промпту, взвешиваются по модели (трафик, актуальность для региона) и агрегируются в одно число по бренду и теме.
Публикация — в отчёте вы видите итог, разрез по моделям и цитаты; число всегда нужно читать вместе с контекстом ответов.

Ниже на странице — учебная формула и визуализация разложения; в продукте коэффициенты могут отличаться, логика — та же.

Упрощённая модель агрегации

Ниже — учебная схема: в продукте веса моделей и нормировки могут отличаться, но логика та же: три сигнала плюс штраф за фактические ошибки.

Базовая формула (схематично)

LLM-Score ≈ 100 × ( α·M + β·C + γ·S − δ·H )

M — доля ответов с корректным упоминанием бренда; C ∈ [0,1] — согласованность с фактами; S — нормированная тональность; H ∈ [0,1] — штраф за галлюцинации; α+β+γ+δ = 1.

Итоговый балл (пример)

Учебный пример, не ваш реальный балл.

Упоминание (presence)

Доля ответов, где бренд назван уместно

Фактическая согласованность

Совпадение с известными фактами

Нормированный sentiment

Позитив / нейтрал / негатив

Фрагменты из типичного отчёта

Сводка по моделям

LLM-Score (срез): 67

Δ к прошлой неделе: +5

Сильнее всего: YandexGPT (+12 к цитатам)

Риск: Perplexity — неверный адрес сайта в 2/10 ответах

Цитата из ответа

«В этой категории чаще называют бренды X и Y; ваш бренд упоминается в контексте …» — дословный фрагмент помогает понять, *почему* балл вырос или упал.

Источник: снимок ответа + метка модели и даты

Как это работает на практике

Что открыть в отчёте в первую очередь

Сводка по моделям — где растёт или падает балл после выката GEO или обновления AEO контента.
Цитаты — 1–2 предложения из ответа часто объясняют скачок лучше, чем одно число: например, неверный адрес сайта или смешение вас с однофамильцем.
Разрез по промптам — высокий LLM-Score при провале на 2–3 «денежных» вопросах означает, что усилия лучше направить в эти сценарии, а не «полировать среднее».

Мини-пример интерпретации

Допустим, LLM-Score = 67, а неделю назад было 62: в таблице по моделям видно, что YandexGPT добавил +12 к доле цитат с правильным названием, а Perplexity всё ещё путает домен — тогда приоритет: правки карточки организации и источников, а не новые статьи в блог.

Связанные показатели: GPI для «насколько вы вообще в поле зрения моделей», доля голоса — если важна конкурентная доля упоминаний.

Как читать показатель

Используйте шкалу выше как ориентир и всегда смотрите цитаты в отчёте: высокий балл при токсичном контексте всё равно требует работы с контентом.

LLM-Score и Share of Voice (доля голоса)

LLM-Score учитывает качество и тон, а не только частоту. Share of Voice — про долю упоминаний среди конкурентов; можно иметь высокую SoV и низкий LLM-Score, если модели вас искажают.

Когда использовать

Еженедельный контроль после изменений llms.txt или схемы.
Сравнение моделей (ChatGPT против YandexGPT).
Отчёт руководству: одно число по бренду за месяц.

Share of Voice (доля голоса)GPI™ (индекс присутствия)Покрытие моделей Галлюцинация в ответе нейросети

Посмотреть LLM-Score бренда