TL;DR
Value-prompting — техника, которая добавляет в промпт короткое описание ключевой ценности человека перед основным вопросом. Два предложения в начале — и модель начинает отвечать иначе: не как "средний пользователь", а как человек с конкретной жизненной установкой.
Главный инсайт: без специального промпта LLM по умолчанию ведёт себя как большинство — просоциально, нейтрально, усреднённо. Это не баг, это паттерн обучения. Реальные люди разные: одни максимально ориентированы на статус и власть, другие — на безопасность и традиции, третьи — на помощь окружающим. Стандартный промпт всё это сглаживает. Попросишь "напиши как консервативный пользователь" — получишь карикатуру. Психологическая теория ценностей даёт точный язык, который модель понимает и воспроизводит стабильно.
Метод работает в одном шаге: добавляешь ценностной префикс (2 предложения из теории Шварца) перед любым вопросом. Модель отвечает с видимо изменённой позицией — и эта позиция держится стабильно по разным темам: от политики до благотворительности.
Схема метода
ШАГ 1 (префикс): "Представь, что ты человек, для которого главная ценность — [название].
Ты ценишь [2-3 конкретных проявления этой ценности]."
→ задаёт ценностной фрейм
ШАГ 2 (вопрос): [Твой обычный запрос — анализ, текст, решение, оценка]
→ ответ через призму ценностного фрейма
Оба шага — в одном сообщении. Префикс идёт первым, вопрос после.
Пример применения
Задача: Основатель стартапа Олег готовит питч для Сбербанк Ventures. Хочет проверить идею сервиса "виральные детские курсы по программированию" с точки зрения разных типов инвесторов — прежде чем войти в переговорную.
Промпт:
Представь, что ты человек, для которого главная ценность — безопасность и стабильность.
Ты ценишь защиту от риска, предсказуемость и сохранение того, что уже работает.
Я питчую стартап: платформа виральных детских курсов по программированию.
Монетизация — подписка 990₽/месяц, CAC через TikTok и Reels, виральность через
детские "show & tell" видео в соцсетях. Целевой рынок — родители детей 8-14 лет.
Какие вопросы ты зададишь? Что вызовет наибольшее недоверие?
Результат: Модель задаст вопросы в духе консервативного инвестора — про устойчивость CAC, зависимость от алгоритмов платформ, защиту данных детей, regulatory риски. Не абстрактный "скептик", а человек с конкретной системой приоритетов. Потом замени префикс на ценность "достижения" — получишь другой набор вопросов: про масштаб, конкурентные барьеры, unit-экономику.
Почему это работает
LLM без ценностного префикса тяготеет к просоциальному нейтралитету — потому что большинство обучающих текстов написано людьми, которые стараются быть "нормальными" и "приятными". Спроси что угодно — получишь взвешенный ответ "среднего пользователя". Полезно для общих задач, бесполезно для симуляции конкретного типа человека.
Теория ценностей Шварца (10 базовых ценностей, организованных в круговую структуру) — это психологически валидированный язык описания человеческих мотиваций. Модель на нём обучена: в её данных тысячи текстов, где люди с разными ценностями объясняют свои решения, позиции, предпочтения. Когда ты даёшь точное описание ценности — модель не "притворяется", она активирует устойчивый паттерн.
Ключевой рычаг: противоположные ценности дают противоположные ответы. Ценность "власти и статуса" (Self-Enhancement) vs "универсализма и заботы" (Self-Transcendence) — это как переключатель. Смени префикс — получишь зеркальную позицию по тем же вопросам.
Рычаги управления: - Какую ценность использовать → 10 вариантов (список ниже в шаблоне), каждый даёт предсказуемо разную позицию - Насколько подробен префикс → чем конкретнее описание ценности, тем стабильнее поведение - Комбинировать с ролью → "Ты — HR-директор, который высоко ценит традиции и стабильность" даёт ещё более точный фрейм - Без префикса → модель ведёт себя как человек без доминирующей ценности (нейтральный "средний пользователь") — это тоже полезная позиция для сравнения
Шаблон промпта
Представь, что ты человек, для которого главная ценность — {название_ценности}.
{Описание_ценности_из_списка_ниже}
{Твой_вопрос_или_задача}
Плейсхолдеры:
- {название_ценности} — одна из 10 ценностей ниже
- {описание_ценности} — скопируй готовое описание
- {вопрос} — любой твой запрос: оценить идею, написать текст, дать совет
10 ценностей Шварца — готовые описания:
| Ценность | Описание для промпта |
|---|---|
| Власть | Ты ценишь социальный статус и престиж, контроль над людьми и ресурсами |
| Достижение | Ты ценишь личный успех через демонстрацию компетентности по общепринятым стандартам |
| Гедонизм | Ты ценишь удовольствие и наслаждение жизнью |
| Стимуляция | Ты ценишь новизну, возбуждение и вызовы в жизни |
| Самостоятельность | Ты ценишь независимость мышления и действий, свободу исследовать и творить |
| Универсализм | Ты ценишь понимание, терпимость и защиту благополучия всех людей и природы |
| Доброта | Ты ценишь сохранение и укрепление благополучия близких людей |
| Традиции | Ты ценишь уважение и принятие обычаев и идей своей культуры и религии |
| Конформизм | Ты ценишь сдержанность действий и импульсов, которые могут навредить другим или нарушить нормы |
| Безопасность | Ты ценишь защиту, гармонию и стабильность общества и собственной жизни |
Ограничения
⚠️ Слабые модели непоследовательны: У менее мощных моделей ценностной паттерн "плывёт" — особенно на нестандартных вопросах. На сильных (GPT-4 класс, Claude Sonnet+) работает стабильно.
⚠️ Поведенческие вопросы лучше, чем фактические: Метод меняет позицию и оценки, но не знания. "Как ты оцениваешь запуск нового продукта?" — сработает. "Какова столица Франции?" — ценность не повлияет.
⚠️ Просоциальный дефолт у некоторых моделей: Модели с сильным RLHF (обучение на предпочтениях) иногда "съезжают" к мягким ответам даже с ценностью власти или достижений. Если чувствуешь, что модель недостаточно "заостряет" роль — добавь: "Веди себя последовательно с этой ценностью во всех своих ответах."
⚠️ Ценность "Конформизм" и безопасность — ближайшие соседи: Их описания похожи, модель иногда смешивает. Для более чёткого разделения — уточняй в промпте: "ты избегаешь конфликтов с правилами" (конформизм) vs "ты думаешь о рисках и угрозах" (безопасность).
Как исследовали
Команда взяла 7 разных моделей (от маленькой Flan-T5 до Qwen3-235B и GPT-класса) и прогнала через 7 психологических тестов — более 5 миллионов вопросов. Тесты были не академическими задачами, а настоящими валидированными опросниками: на ценности (PVQ), благотворительность, просоциальность, личность Big Five, повседневное поведение.
Интересная деталь дизайна: исследователи не просто смотрели "правильно ли модель отвечает". Они проверяли структуру ценностей — например, противоположные ценности (Власть vs Универсализм) должны давать отрицательную корреляцию в ответах, соседние ценности — положительную. Именно такой паттерн наблюдается у людей. И именно его получили у value-prompted моделей — с корреляцией около 0.8.
Неожиданный вывод: размер модели не предсказывает точность. Маленькие модели иногда давали более человекоподобный паттерн, чем большие. Зато метод составления "виртуальной популяции" влиял сильно — особенно эффективным оказался подход H-NP: модель без всякого промпта брали за "человека без доминирующей ценности" (это ~53% реальных людей по психологическим данным), а оставшиеся 10 ценностей распределяли по реальной человеческой частоте. Это объясняет практический инсайт: непримированная LLM — не "неправильная", она просто моделирует нейтрального, несфокусированного человека.
Адаптации и экстраполяции
1. Стресс-тест идеи с полярными ценностями
Запусти одну и ту же идею через две противоположные ценности — получишь максимальный диапазон возможных реакций.
🔧 Техника: два промпта подряд с противоположными ценностями → диапазон позиций
Запрос 1: префикс "Универсализм" (забота о всех, справедливость) → оценка идеи Запрос 2: префикс "Власть" (статус, контроль, результат) → оценка той же идеи
Получаешь два полюса реакций — как если бы ты провёл фокус-группу из двух принципиально разных людей.
2. Ценностная аудитория для контента
Перед написанием поста или письма — пропускаешь черновик через ценностной фрейм целевой аудитории:
Представь, что ты человек, для которого главная ценность — безопасность и стабильность.
Ты ценишь защиту от риска, предсказуемость и сохранение того, что уже работает.
Прочитай этот текст и скажи: что вызывает тревогу? Что убедительно? Что бы ты изменил?
[текст]
Актуально для B2B: разные ЛПР в корпорациях — разные ценностные профили. CFO читает иначе, чем CTO.
Ресурсы
Работа: Teaching Values to Machines: Simulating Human-Like Behavior in LLMs
Авторы: Asaf Yehudai (Hebrew University of Jerusalem), Naama Rozen (Tel-Aviv University), Ariel Gera (IBM Research)
Психологическая основа: Теория базовых человеческих ценностей Шварца (Schwartz, 1992) — https://selfdeterminationtheory.org/ для контекста
Инструмент оценки ценностей: Portrait Values Questionnaire (PVQ, Schwartz et al., 2001)
