Аналитика12 мин чтения

Модель Киркпатрика: оценка обучения на практике — 4 уровня с примерами

Коротко о статье

Модель Киркпатрика — золотой стандарт оценки корпоративного обучения. В статье подробно разбираем каждый из четырёх уровней: реакция, усвоение, поведение и результаты. Для каждого уровня — что измерять, какие инструменты использовать, когда проводить замеры и каких ошибок избегать. Отдельно рассматриваем New World Kirkpatrick Model, связку уровней с данными LMS и пошаговую дорожную карту внедрения.

Компания инвестировала в обучение полтора миллиона рублей за квартал, провела двадцать тренингов и получила средний балл удовлетворённости 4,7 из 5. Руководство довольно — цифры выглядят красиво. Но через полгода продажи не выросли, ошибки на производстве не сократились, а текучесть осталась на прежнем уровне. Что пошло не так?

Проблема — в подмене оценки замером. Удовлетворённость участников — это не эффективность обучения. Чтобы понять, действительно ли программа работает, нужна системная рамка, которая связывает эмоции участников с бизнес-результатами. Такую рамку в 1959 году предложил Дональд Киркпатрик, и за шесть десятилетий она стала отраслевым стандартом: по данным ATD, модель Киркпатрика используют более 70 % крупных компаний с формализованной L&D-функцией.

Суть модели: четыре уровня как цепочка доказательств

Модель Киркпатрика — не просто классификация метрик. Это логическая цепочка: каждый следующий уровень подтверждает, что результаты предыдущего не случайны.

  • Уровень 1 — Реакция. Понравилось ли участникам? Считали ли они обучение полезным?
  • Уровень 2 — Усвоение. Научились ли чему-то? Приобрели ли нужные знания и навыки?
  • Уровень 3 — Поведение. Применяют ли полученное на рабочем месте?
  • Уровень 4 — Результаты. Повлияло ли изменённое поведение на бизнес-показатели?

Ключевая идея: высокие оценки на уровне 1 не гарантируют усвоение, усвоение не гарантирует изменение поведения, а изменение поведения не гарантирует бизнес-результат. Только последовательный замер на всех четырёх уровнях даёт полную картину. Именно поэтому ограничиваться анкетами удовлетворённости — значит не оценивать обучение вовсе.

Краткий гайд: 4 уровня модели Киркпатрика

1/6

Уровень 1 — Реакция

Удовлетворённость, релевантность и вовлечённость. Измеряйте анкетами и NPS в первые 24 часа после обучения.

5–7 вопросов, не больше

Уровень 1 — Реакция: больше, чем «понравилось / не понравилось»

Что измерять

Реакция — самый простой и самый массово собираемый уровень. Но простота обманчива: если замерять только общую удовлетворённость, данные бесполезны. Полноценная оценка реакции включает три компонента:

  • Удовлетворённость. Насколько участники довольны форматом, подачей, организацией. Измеряется по шкале 1–5 или 1–10.
  • Релевантность. Считают ли участники, что содержание применимо к их работе. Это критически важный предиктор: если человек не видит связи с задачами, он не будет применять материал.
  • Вовлечённость. Насколько активно участники взаимодействовали с контентом: процент просмотренных модулей, время на платформе, количество взаимодействий.

Инструменты

  • Post-тренинговые анкеты (5–10 вопросов, не более — иначе completion rate падает ниже 50 %)
  • NPS курса («С какой вероятностью вы порекомендуете этот курс коллегам?»)
  • Встроенная аналитика LMS: процент завершения, среднее время на модуль, точки отсева
  • Пульс-опросы через 3–5 дней после завершения (позволяют отсечь эффект «свежих впечатлений»)

Когда проводить замер

Анкета удовлетворённости — сразу после обучения (в течение 24 часов). Вопросы о релевантности — через 3–5 рабочих дней, когда участник вернулся к задачам и может оценить применимость.

Типичные ошибки

Замер только общей оценки. Средний балл 4,5 ничего не говорит, если вы не знаете, что именно понравилось. Детализируйте: контент, спикер, формат, темп, практические задания.

Слишком длинные анкеты. Двадцать вопросов после трёхчасового тренинга — верный способ получить формальные ответы. Оптимум: 5–7 закрытых вопросов и одно открытое поле.

Отсутствие действий по результатам. Если данные уровня 1 не приводят к изменениям в следующих потоках, участники перестают отвечать честно. Покажите команде, что обратная связь работает: «На основе ваших отзывов мы сократили модуль X и добавили практику Y».

Запустите HR-платформу за 1 день

Оценка 360°, обучение, ИПР, геймификация и аналитика — всё в одном

Записаться на демо

Уровень 2 — Усвоение: проверяем, что знания приобретены

Что измерять

Уровень 2 отвечает на вопрос: произошло ли обучение? Три компонента оценки:

  • Знания. Фактическая информация, которую участник может воспроизвести: правила, процедуры, стандарты.
  • Навыки. Способность выполнить задачу: провести переговоры по скрипту, оформить документ, решить кейс.
  • Установки. Изменение отношения: готовность применять новый подход, уверенность в своих силах.

Инструменты

  • Pre-test / post-test. Главный инструмент. Один и тот же тест до и после обучения показывает дельту — реальный прирост. Без pre-test вы измеряете не эффект обучения, а исходный уровень подготовки. Подробнее о проектировании тестов — в материале о тестировании знаний после обучения.
  • Практические задания и кейсы. Навыки нельзя проверить тестом с вариантами ответов. Используйте симуляции, ролевые игры, разбор рабочих ситуаций.
  • Демонстрация навыков. Участник показывает выполнение задачи в контролируемых условиях: звонок клиенту при наблюдателе, сборка узла на тренировочном стенде.
  • Самооценка + оценка наставника. Комбинация субъективной и экспертной оценки даёт более устойчивый результат.

Когда проводить замер

Post-test — сразу после завершения программы. Повторный замер через 30 дней покажет, сколько знаний сохранилось (кривая забывания Эббингауза работает безотказно: без подкрепления за месяц теряется до 80 % информации).

Типичные ошибки

Отсутствие pre-test. Без базовой линии невозможно отделить эффект обучения от исходных компетенций. Если 90 % участников сдали post-test на отлично, но и до обучения знали материал на 85 % — программа не сработала.

Тесты на запоминание вместо понимания. Вопросы типа «В каком году принят закон X?» проверяют память, а не способность применять знания. Проектируйте вопросы на уровне применения и анализа.

Игнорирование навыковой компоненты. Знание скрипта продаж не означает умение вести переговоры. Если программа нацелена на развитие навыков, оценивайте навыки, а не только знания.

Уровень 3 — Поведение: от учебной аудитории к рабочему месту

Что измерять

Уровень 3 — самый сложный и самый ценный. Он показывает, происходит ли трансфер обучения: переносят ли участники знания и навыки в реальную работу. По данным исследований, без системной поддержки только 15–20 % обученных применяют новые навыки через три месяца.

  • Частота применения. Как часто сотрудник использует новые подходы, инструменты, процедуры.
  • Качество применения. Насколько корректно применяются навыки — соблюдается ли стандарт, используется ли полный алгоритм.
  • Устойчивость изменений. Сохраняются ли новые паттерны через 60–90 дней или происходит откат к старому поведению.

Инструменты

  • Наблюдение руководителя. Структурированный чек-лист наблюдений: менеджер фиксирует, применяет ли сотрудник конкретные навыки в рабочих ситуациях. Чек-лист должен содержать наблюдаемые поведенческие индикаторы, а не абстрактные оценки.
  • Обратная связь 360°. Коллеги, подчинённые и клиенты оценивают изменения в поведении. Инструмент особенно полезен для soft skills: коммуникация, лидерство, работа в команде.
  • Анализ рабочих показателей. Если обучение было направлено на конкретный процесс (например, обработка заявок), сравните метрики процесса до и после: скорость, качество, количество ошибок.
  • Самоотчёт с верификацией. Участник заполняет дневник применения, руководитель подтверждает или корректирует. Работает лучше, чем чистый самоотчёт, который склонен к завышению.

Когда проводить замер

Первый замер — через 30 дней. Второй — через 60–90 дней. Два замера позволяют отличить краткосрочный энтузиазм от устойчивого изменения поведения. Если показатели на 30-й день высокие, а на 90-й упали — проблема в отсутствии подкрепления, а не в качестве обучения.

Типичные ошибки

Пропуск уровня. Компании часто перескакивают с уровня 2 сразу на уровень 4: «Обучили, тест сдали, смотрим на бизнес-результаты». Но если поведение не изменилось, бизнес-результаты не изменятся — и вы не поймёте, почему.

Отсутствие поддерживающей среды. Сотрудник может хотеть применять новые навыки, но рабочая среда этому препятствует: руководитель не знает о программе, процессы не перестроены, инструменты не обновлены. Оценка поведения должна включать анализ барьеров.

Единичный замер. Одно наблюдение через месяц — это снимок, а не тренд. Без повторных замеров вы не отличите устойчивое изменение от временного всплеска.

Уровень 4 — Результаты: связь с бизнесом

Что измерять

Уровень 4 переводит обучение на язык бизнеса. Здесь оцениваются итоговые показатели, на которые обучение должно было повлиять:

  • Финансовые метрики. Рост выручки, снижение затрат, увеличение маржинальности. Детальный разбор расчёта — в статье о ROI обучения сотрудников.
  • Операционные метрики. Сокращение времени обработки, снижение процента брака, уменьшение количества инцидентов.
  • HR-метрики. Снижение текучести, рост вовлечённости, сокращение time-to-productivity.
  • Клиентские метрики. Рост NPS, снижение количества жалоб, увеличение повторных покупок.

Инструменты

  • Контрольные группы. Идеальный, но редко применяемый метод: сравниваем результаты обученной группы и необученной. Требует достаточного размера выборки и сопоставимости групп.
  • Анализ трендов. Сравнение показателей до и после обучения с учётом сезонности и внешних факторов. Менее точен, чем контрольные группы, но практичнее.
  • Изоляция эффекта обучения. Метод экспертных оценок: руководители оценивают, какая доля улучшения обусловлена обучением, а какая — другими факторами (новый инструмент, изменение рынка, кадровые перестановки). Субъективно, но лучше, чем приписывать весь эффект обучению.
  • Аналитические дашборды. Автоматизированный сбор данных через аналитические инструменты позволяет отслеживать динамику в реальном времени и сопоставлять с периодами обучения.

Когда проводить замер

Минимальный горизонт — 3 месяца после завершения программы. Для стратегических программ (развитие лидерства, трансформация культуры) — 6–12 месяцев. Бизнес-результаты инерционны: даже если поведение изменилось на следующий день, финансовые метрики отреагируют с задержкой.

Типичные ошибки

Приписывание всего эффекта обучению. Если продажи выросли на 15 % после тренинга, это не значит, что тренинг дал 15 %. Возможно, одновременно изменились цены, маркетинг или сезонность. Всегда изолируйте эффект.

Слишком ранний замер. Оценивать бизнес-результат через неделю после тренинга — бессмысленно. Дайте время на изменение поведения (уровень 3), которое приведёт к изменению результатов.

Несогласованность целей. Если цели обучения не были привязаны к конкретным бизнес-метрикам на этапе проектирования, на уровне 4 вы не будете знать, что измерять. Связка «цель обучения → поведенческий индикатор → бизнес-метрика» должна быть определена до начала программы.

New World Kirkpatrick Model: что изменилось

В 2010-х Джим и Венди Киркпатрик — сын и невестка Дональда — обновили модель, добавив два важных дополнения.

Перевёрнутый порядок проектирования

Классическая модель предполагает оценку снизу вверх: от реакции к результатам. New World Model предлагает проектировать обучение сверху вниз: сначала определите бизнес-результат (уровень 4), затем — какое поведение к нему приведёт (уровень 3), затем — какие знания и навыки нужны (уровень 2), и только потом — как сделать обучение вовлекающим (уровень 1). Такой подход гарантирует, что каждый элемент программы работает на конечную цель.

Опережающие индикаторы (Leading Indicators)

На уровне 3 появляются промежуточные метрики, которые предсказывают изменение поведения до того, как оно произойдёт:

  • Уверенность (Confidence). Насколько участник уверен, что сможет применить полученное. Замеряется сразу после обучения. Низкая уверенность — сигнал, что нужна дополнительная практика или поддержка.
  • Приверженность (Commitment). Намерение участника применять новые навыки. Замеряется через структурированный план действий: участник фиксирует, что конкретно он будет делать иначе, когда и в каких ситуациях.

Эти индикаторы позволяют прогнозировать трансфер обучения и вмешиваться до того, как проблема станет очевидной на уровне бизнес-результатов.

Необходимые драйверы

New World Model признаёт, что обучение само по себе не меняет поведение — нужна поддерживающая среда. Модель выделяет пять драйверов: подкрепление (напоминания, follow-up сессии), поощрение (признание, бонусы), вознаграждение (привязка к KPI), мониторинг (наблюдение, обратная связь) и коррекция (помощь при трудностях). Без этих драйверов даже идеально спроектированная программа не даст результата на уровне 3.

Практическая дорожная карта внедрения

Внедрять модель Киркпатрика целиком за один квартал — утопия. Реалистичный план рассчитан на 4–6 месяцев.

Этап 1. Аудит текущего состояния (2–3 недели)

Определите, на каком уровне вы оцениваете обучение сейчас. Большинство компаний стабильно работают на уровне 1 и частично на уровне 2. Зафиксируйте текущие инструменты, процессы и метрики. Проанализируйте, какие данные уже доступны в LMS и HR-системах — часто оказывается, что данные есть, но никто их не использует. Комплексный взгляд на доступную аналитику обучения поможет определить точку старта.

Этап 2. Пилотная программа (4–6 недель)

Выберите одну обучающую программу с чёткой привязкой к бизнес-результату — например, тренинг для отдела продаж, где результат можно измерить в рублях. Определите метрики всех четырёх уровней до начала обучения. Проведите pre-test. Запустите программу и соберите данные уровней 1 и 2. Настройте замеры уровней 3 и 4 на горизонте 30–90 дней.

Этап 3. Настройка инфраструктуры (3–4 недели параллельно с пилотом)

Автоматизируйте сбор данных уровней 1 и 2 через LMS: автоматические анкеты после завершения модуля, встроенные тесты, трекинг вовлечённости. Создайте шаблоны чек-листов наблюдений для уровня 3. Интегрируйте данные обучения с HR-метриками для уровня 4. Платформа HRBP.ru закрывает сбор данных по первым трём уровням и предоставляет аналитику для связки с бизнес-показателями.

Этап 4. Масштабирование (6–8 недель)

Распространите модель оценки на ключевые программы: обязательное обучение, адаптация, развитие руководителей. Не пытайтесь оценить всё — начните с программ, где цена ошибки максимальна и бизнес-результат наиболее очевиден. Постепенно расширяйте охват.

Этап 5. Регулярный цикл (постоянно)

Включите результаты оценки в квартальные отчёты L&D. Используйте данные для итерации программ: что усилить, что сократить, что убрать. Делитесь результатами с бизнес-заказчиками — это формирует культуру data-driven обучения.

Как LMS-данные работают на каждом уровне

Современная LMS — не просто хранилище курсов. Это источник данных для всех четырёх уровней Киркпатрика.

Уровень 1. Автоматические опросы после модуля, NPS-замеры, аналитика вовлечённости (время, глубина просмотра, процент завершения).

Уровень 2. Результаты pre- и post-тестов, прогресс по учебным целям, сравнение когорт. Хорошая платформа позволяет видеть не только итоговый балл, но и разбивку по темам — чтобы точечно усиливать слабые места.

Уровень 3. Трекинг выполнения посттренинговых заданий, чек-листы наблюдений, интеграция с рабочими процессами. Например, если после тренинга сотрудник должен провести пять продаж по новому скрипту, LMS может отслеживать прогресс через связку с CRM.

Уровень 4. Дашборды, объединяющие данные обучения с бизнес-метриками: корреляция между завершением программы и KPI подразделения, динамика показателей по когортам, расчёт ROI на основе автоматически собранных данных.

Частые вопросы при внедрении

Обязательно ли оценивать все четыре уровня для каждой программы? Нет. Полная оценка на всех четырёх уровнях оправдана для стратегических и дорогостоящих программ. Для регулярного обязательного обучения (охрана труда, комплаенс) достаточно уровней 1 и 2. Правило Филлипса: уровень 1 — для 100 % программ, уровень 2 — для 60 %, уровень 3 — для 30 %, уровень 4 — для 10–15 %.

Что делать, если на уровне 3 результаты низкие, а на уровне 2 — высокие? Это классический разрыв трансфера. Причины: отсутствие поддержки руководителя, несовместимость новых навыков с текущими процессами, нехватка возможностей для практики. Решение — работа с драйверами поведения из New World Model: подкрепление, мониторинг, устранение барьеров.

Сколько стоит внедрение модели? Основные затраты — не на инструменты, а на время людей: проектирование метрик, настройка процессов, обучение руководителей наблюдению. При наличии современной LMS с встроенной аналитикой дополнительные затраты на инфраструктуру минимальны.

Как убедить руководство? Начните с пилота на одной программе и покажите конкретный результат на языке бизнеса. «Тренинг по продажам стоил 400 000 ₽, обученная группа принесла на 2,1 млн ₽ больше контрольной, ROI — 425 %» — это аргумент, который работает.

Главное

Модель Киркпатрика — не теоретическая конструкция, а рабочий инструмент, который при системном применении превращает обучение из центра затрат в центр прибыли. Начните с аудита текущего состояния, запустите пилот на одной программе, автоматизируйте сбор данных через LMS и постепенно наращивайте глубину оценки. Четыре уровня — это не потолок, а фундамент для принятия решений, основанных на данных, а не на интуиции.

Запустите HR-платформу за 1 день

Оценка 360°, обучение, ИПР, геймификация и аналитика — всё в одном

Записаться на демо
Эрнест Бархударян

Автор статьи

Эрнест Бархударян

CEO HRBP.ru

17 лет в IT: запускал и масштабировал продукты для десятков компаний. В большинстве из них онбординг, обучение и оценка в разных системах — и непонятно как развивать навыки персонала, чтобы люди росли внутри компании. Разработал и запустил HRBP.ru — платформу, в которой сам хотел бы работать. Эксперт РБК Компании.

Похожие статьи

Популярное в блоге