TL;DR
Чем дольше модель обучали на предпочтениях людей, тем ровнее и мертвее она пишет. Это не случайность и не плохой промпт — это встроенный паттерн. Каждый этап «выравнивания» (RLHF, DPO, RLVR) отрезает от текста острые углы: конфликт, удивление, резкие тематические повороты. Остаётся гладкое, читаемое, безжизненное.
Исследователи нашли три вещи, которые сжимаются одновременно. Тематический ритм — темы сменяются равномерно, без резких поворотов и «застревания» на важном моменте. Эмоциональный накал — конфликт и удивление падают с ~47% до ~7.5%, нейтральное повествование растёт с ~13% до ~45%. Стилевое разнообразие — все тексты начинают звучать одинаково, вне зависимости от жанра и задачи. Это и есть narrative flattening — нарративное уплощение.
Выход — не просить «пиши интереснее». Это не работает: у модели нет счётчика «интересности». Работает другое: явно назвать эмоции, задать ритм смены тем и прикрепить текст к конкретному стилевому якорю. Без этих инструкций модель автоматически уйдёт в дефолт.
Схема метода
Это не пошаговая техника, а три рычага против нарративного уплощения. Их можно применять по отдельности или вместе:
РЫЧАГ 1: Эмоциональная спецификация
→ Явно назови целевые эмоции: "конфликт", "удивление", "тревога"
→ Запрети нейтральность: "без нейтрального повествования"
РЫЧАГ 2: Тематический ритм
→ Задай структуру смены тем: "задержись на X, потом резко переключись"
→ Укажи тип переходов: "резкие повороты, не плавные переходы"
РЫЧАГ 3: Стилевой якорь
→ Назови конкретного автора или стиль: "в духе Набокова / Пелевина"
→ Или задай стилевую дистанцию: "не 'общая проза', а литературный журнал"
Все три рычага работают в одном промпте, добавляются к основному запросу.
Пример применения
Задача: Написать колонку для Telegram-канала о выгорании предпринимателей. Хочется, чтобы текст цеплял — но каждый раз выходит "корпоративный LinkedIn-пост с душой".
Промпт (без рычагов — дефолтный режим модели):
Напиши колонку для Telegram-канала о выгорании предпринимателей.
Тема: когда перестаёшь понимать зачем всё это. 2000 знаков.
Результат: Модель выдаст структурированный текст с советами, поддерживающий тон, нейтрально-мотивационный финал. Читаемо. Мертво.
Промпт (с тремя рычагами):
Напиши колонку для Telegram-канала. Тема: предприниматель перестаёт понимать зачем всё это.
ЭМОЦИОНАЛЬНЫЙ РИСУНОК:
— Начало: тупое удивление, что сил нет (не грусть, не усталость — именно растерянность)
— Середина: острый момент конфликта — внутренний разговор с собой, который некрасив
— Финал: не мотивация, а что-то неудобное и честное
РИТМ:
— Первые два абзаца — медленно, детали быта
— Третий абзац — резкий тематический поворот, без предупреждения
— Дальше — неравномерно: то задержись, то уйди быстро
СТИЛЬ: в духе Линор Горалик или ранних эссе Дудя — личное, чуть неловкое, без дидактики
Объём: 1800–2000 знаков. Без совета в финале.
Результат: Модель покажет текст с неравномерным ритмом — несколько плотных абзацев с деталями, резкий перелом в середине, финал без подушки. Эмоции будут названы конкретно (растерянность, внутренний разговор), а не размыты в "усталость". Стилевой якорь удержит текст подальше от "корпоративной прозы".
Почему это работает
LLM не "думает" о скуке — она следует паттерну. Обучение на человеческих предпочтениях работает как фильтр: люди чаще одобряли тексты без острых углов — без конфликта, резких переходов, тяжёлых эмоций. Модель выучила этот паттерн и воспроизводит его по умолчанию. Не потому что "хочет быть безопасной", а потому что генерирует следующий токен по самому вероятному пути — а вероятный путь ведёт к нейтральности.
Модель не умеет оценивать "живость" текста без инструкций. Когда ты пишешь "напиши интереснее" — это абстрактное пожелание без точки в пространстве возможностей. Модель не знает куда идти. Но когда ты пишешь "конфликт, удивление, резкий поворот после второго абзаца" — это координаты. Модель умеет следовать конкретным инструкциям несравнимо лучше, чем размытым.
Стилевой якорь работает как смещение дефолтного аттрактора. Без якоря модель тяготеет к "средней художественной прозе" — это её режим по умолчанию после выравнивания. Имя конкретного автора или жанра создаёт новый центр притяжения. Модель не "пишет как Набоков", но смещается в правильную сторону от безликого дефолта.
Рычаги управления:
- Усиль эффект → добавь "запрещай" наряду с "разрешай": "без нейтрального повествования, без плавных переходов"
- Задай точные пропорции → "40% конфликт, 30% удивление, 30% что угодно кроме нейтрального"
- Поменяй стилевой якорь → чем дальше автор от "корпоративной прозы", тем сильнее смещение
- Явная запись эмоциональной дуги → "начало → нарастание → слом → неудобный финал" работает лучше чем общее "сделай динамично"
Шаблон промпта
{Основная задача: что написать, тема, объём}
ЭМОЦИОНАЛЬНЫЙ РИСУНОК:
— Начало: {эмоция / состояние персонажа или читателя}
— Середина: {момент конфликта / удивления / слома}
— Финал: {чем заканчивается — честно, не обязательно хорошо}
РИТМ СМЕНЫ ТЕМ:
— {Где задержаться: деталь / момент / образ}
— {Где сделать резкий поворот: без предупреждения, без подготовки}
— {Темп финала: быстро / медленно / обрыв}
СТИЛЬ: {конкретный автор / издание / жанровая метка}
ЗАПРЕЩЕНО: нейтральное повествование / мотивационный финал / плавные переходы
Что подставлять:
- {Основная задача} — вид текста, тема, размер
- {эмоция} — конкретное слово: растерянность, злость, острое любопытство — не грусть и не усталость
- {момент конфликта} — конкретная сцена или внутренний поворот, не "напряжение"
- {автор / издание} — реальное имя: Пелевин, Линор Горалик, The New Yorker, Vice, Медуза
- {ЗАПРЕЩЕНО} — прямо пиши чего не хочешь; запреты работают сильнее, чем разрешения
🚀 Быстрый старт — вставь в чат:
Вот шаблон против нарративного уплощения.
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.
[вставить шаблон выше]
LLM спросит про жанр, нужные эмоции и стилевой ориентир — потому что без этих координат она сама выберет нейтральный дефолт.
Ограничения
⚠️ Работает для художественных и эссеистических текстов: Для инструкций, FAQ, деловых писем нарративное уплощение — не проблема, а преимущество. Не надо бороться с дефолтом там, где он полезен.
⚠️ Стилевой якорь не гарантирует попадания: Модель смещается в сторону указанного автора, но не воспроизводит стиль точно. Чем известнее автор — тем чётче работает якорь.
⚠️ Эффект накапливается по ходу диалога: При длинном тексте через несколько итераций модель дрейфует обратно к нейтральности. Рычаги нужно повторять или вставлять в системный промпт.
⚠️ Разные модели — разный стартовый дрейф: Более "выровненные" модели (с дополнительным RLHF) уплощают сильнее. Базовые модели без тонкой настройки — менее предсказуемо, но потенциально острее.
Как исследовали
Исследователи взяли одну модель (OLMo 32B) и сделали из неё четыре версии: базовую, после SFT, после DPO и после RLVR. Все четыре — одна архитектура, одни веса предобучения, только этапы выравнивания разные. Это ключевой дизайн: нельзя списать на "разные модели" — только на этапы обучения.
Дальше взяли три типа человеческих рассказов: рассказы из The New Yorker (профессиональная литература с редактурой), рассказы по заданию (prompt-guided), и рассказы с открытых платформ без фильтрации. Каждый рассказ обрезали на 40/60/80/90% и просили модели дописать. Сравнивали продолжение модели с оригинальным продолжением человека.
Замеряли три вещи числами: разброс тематических переходов (насколько непредсказуемо меняются темы), доля эмоциональных категорий (отдельный классификатор на 28 эмоций), стилевое расстояние между текстами (векторные представления стиля). Результат оказался неожиданным в деталях: базовая модель была слишком "горячей" — слишком много конфликта, слишком мало нейтральности. Каждый этап выравнивания бил в обратную сторону. К финальной версии маятник пролетел мимо человеческого уровня и ушёл в противоположную крайность. RLHF не нашёл баланс — он создал новый перекос. Самый наглядный факт: после выравнивания тексты, написанные для The New Yorker, для платформ с фан-фиком и для рассказов по заданию — почти неразличимы стилистически. Разница схлопнулась на 90%+.
Адаптации и экстраполяции
💡 Адаптация для маркетинговых текстов
Та же проблема — нейтральный дефолт — убивает лендинги, рекламные письма, посты в соцсетях.
Напиши письмо для рассылки подписчикам {название проекта}.
Тема: {о чём}.
ЭМОЦИОНАЛЬНЫЙ РИСУНОК:
— Открыть: конкретная боль или острое наблюдение (не "вы наверняка знакомы с...")
— Середина: момент удивления или разрыва ожиданий
— CTA: не мотивация — конкретное действие с ощущением упущенного
СТИЛЬ: {издание / бренд-ориентир, напр. "Яндекс Практикум в плохой день" или "письмо от инвестора Каца"}
ЗАПРЕЩЕНО: корпоративный тон, плавные переходы, финал с "успехом"
🔧 Техника: явный запрет нейтральности → острее эмоции
Исследование показало: нейтральность растёт активно, другие эмоции подавляются. Значит, запрет работает как разблокировка:
Добавь в любой промпт на текст: "Избегай нейтрального повествования. Каждый абзац должен нести конкретную эмоцию: назови какую перед написанием."
Это заставляет модель явно маркировать эмоцию ДО генерации — она не скатится в дефолт, потому что сама назвала цель.
🔧 Техника: предварительная карта эмоций как отдельный шаг
Вместо встраивания инструкций напрямую — сначала попроси модель разработать эмоциональную карту:
Шаг 1: Составь эмоциональную карту для {текст}:
разбей на 5-7 моментов, для каждого укажи
основную эмоцию (не "нейтрально") и тип перехода к следующему (резкий/плавный/обрыв).
Шаг 2: Напиши текст строго по этой карте.
Карта фиксирует намерение до генерации — модель не съезжает в нейтральность по ходу.
Ресурсы
Работа: Narrative Flattening: How Post-Training Compresses Thematic, Affective, and Stylistic Variation in LLM Fiction
Авторы: Zehan Li, Yutong Zhu, Siyang Wu, Honglin Bao, James A. Evans — Knowledge Lab, University of Chicago
Контакты авторов: honglinbao@uchicago.edu, zehan@uchicago.edu
Инструменты из исследования: OLMo 32B (модель), GoEmotions classifier (классификатор эмоций), StyleDistance embeddings (стилевые векторы), text-embedding-3-large (тематические векторы)
Данные: The New Yorker corpus (Shaalan, 2022), Tell Me A Story / TMAS (Huot et al., 2024), StoryStar platform
