3,583 papers
arXiv:2605.27878 81 27 мая 2026 г. FREE

Narrative Flattening: почему LLM по умолчанию пишет скучно — и три рычага чтобы это исправить

КЛЮЧЕВАЯ СУТЬ
Парадокс: конфликт и удивление в текстах LLM падают с 47% до 7.5% — и это не плохой промпт, а прямой результат дообучения. Каждый этап выравнивания (RLHF, DPO) фильтрует острые углы — люди стабильно одобряли гладкие тексты, модель выучила паттерн и теперь по умолчанию выдаёт нейтральное, читаемое, безжизненное. Метод трёх рычагов позволяет явно задать эмоции, ритм смены тем и стилевой якорь — без этих координат модель автоматически уходит в дефолт. «Пиши интереснее» не работает. «Конфликт после второго абзаца, резкий поворот, в духе Пелевина» — работает.
Адаптировать под запрос

TL;DR

Чем дольше модель обучали на предпочтениях людей, тем ровнее и мертвее она пишет. Это не случайность и не плохой промпт — это встроенный паттерн. Каждый этап «выравнивания» (RLHF, DPO, RLVR) отрезает от текста острые углы: конфликт, удивление, резкие тематические повороты. Остаётся гладкое, читаемое, безжизненное.

Исследователи нашли три вещи, которые сжимаются одновременно. Тематический ритм — темы сменяются равномерно, без резких поворотов и «застревания» на важном моменте. Эмоциональный накал — конфликт и удивление падают с ~47% до ~7.5%, нейтральное повествование растёт с ~13% до ~45%. Стилевое разнообразие — все тексты начинают звучать одинаково, вне зависимости от жанра и задачи. Это и есть narrative flattening — нарративное уплощение.

Выход — не просить «пиши интереснее». Это не работает: у модели нет счётчика «интересности». Работает другое: явно назвать эмоции, задать ритм смены тем и прикрепить текст к конкретному стилевому якорю. Без этих инструкций модель автоматически уйдёт в дефолт.


🔬

Схема метода

Это не пошаговая техника, а три рычага против нарративного уплощения. Их можно применять по отдельности или вместе:

РЫЧАГ 1: Эмоциональная спецификация
  → Явно назови целевые эмоции: "конфликт", "удивление", "тревога"
  → Запрети нейтральность: "без нейтрального повествования"

РЫЧАГ 2: Тематический ритм
  → Задай структуру смены тем: "задержись на X, потом резко переключись"
  → Укажи тип переходов: "резкие повороты, не плавные переходы"

РЫЧАГ 3: Стилевой якорь
  → Назови конкретного автора или стиль: "в духе Набокова / Пелевина"
  → Или задай стилевую дистанцию: "не 'общая проза', а литературный журнал"

Все три рычага работают в одном промпте, добавляются к основному запросу.


🚀

Пример применения

Задача: Написать колонку для Telegram-канала о выгорании предпринимателей. Хочется, чтобы текст цеплял — но каждый раз выходит "корпоративный LinkedIn-пост с душой".

Промпт (без рычагов — дефолтный режим модели):

Напиши колонку для Telegram-канала о выгорании предпринимателей. 
Тема: когда перестаёшь понимать зачем всё это. 2000 знаков.

Результат: Модель выдаст структурированный текст с советами, поддерживающий тон, нейтрально-мотивационный финал. Читаемо. Мертво.


Промпт (с тремя рычагами):

Напиши колонку для Telegram-канала. Тема: предприниматель перестаёт понимать зачем всё это.

ЭМОЦИОНАЛЬНЫЙ РИСУНОК:
— Начало: тупое удивление, что сил нет (не грусть, не усталость — именно растерянность)
— Середина: острый момент конфликта — внутренний разговор с собой, который некрасив
— Финал: не мотивация, а что-то неудобное и честное

РИТМ:
— Первые два абзаца — медленно, детали быта
— Третий абзац — резкий тематический поворот, без предупреждения
— Дальше — неравномерно: то задержись, то уйди быстро

СТИЛЬ: в духе Линор Горалик или ранних эссе Дудя — личное, чуть неловкое, без дидактики

Объём: 1800–2000 знаков. Без совета в финале.

Результат: Модель покажет текст с неравномерным ритмом — несколько плотных абзацев с деталями, резкий перелом в середине, финал без подушки. Эмоции будут названы конкретно (растерянность, внутренний разговор), а не размыты в "усталость". Стилевой якорь удержит текст подальше от "корпоративной прозы".


🧠

Почему это работает

LLM не "думает" о скуке — она следует паттерну. Обучение на человеческих предпочтениях работает как фильтр: люди чаще одобряли тексты без острых углов — без конфликта, резких переходов, тяжёлых эмоций. Модель выучила этот паттерн и воспроизводит его по умолчанию. Не потому что "хочет быть безопасной", а потому что генерирует следующий токен по самому вероятному пути — а вероятный путь ведёт к нейтральности.

Модель не умеет оценивать "живость" текста без инструкций. Когда ты пишешь "напиши интереснее" — это абстрактное пожелание без точки в пространстве возможностей. Модель не знает куда идти. Но когда ты пишешь "конфликт, удивление, резкий поворот после второго абзаца" — это координаты. Модель умеет следовать конкретным инструкциям несравнимо лучше, чем размытым.

Стилевой якорь работает как смещение дефолтного аттрактора. Без якоря модель тяготеет к "средней художественной прозе" — это её режим по умолчанию после выравнивания. Имя конкретного автора или жанра создаёт новый центр притяжения. Модель не "пишет как Набоков", но смещается в правильную сторону от безликого дефолта.

Рычаги управления: - Усиль эффект → добавь "запрещай" наряду с "разрешай": "без нейтрального повествования, без плавных переходов" - Задай точные пропорции"40% конфликт, 30% удивление, 30% что угодно кроме нейтрального" - Поменяй стилевой якорь → чем дальше автор от "корпоративной прозы", тем сильнее смещение - Явная запись эмоциональной дуги"начало → нарастание → слом → неудобный финал" работает лучше чем общее "сделай динамично"


📋

Шаблон промпта

{Основная задача: что написать, тема, объём}

ЭМОЦИОНАЛЬНЫЙ РИСУНОК:
— Начало: {эмоция / состояние персонажа или читателя}
— Середина: {момент конфликта / удивления / слома}
— Финал: {чем заканчивается — честно, не обязательно хорошо}

РИТМ СМЕНЫ ТЕМ:
— {Где задержаться: деталь / момент / образ}
— {Где сделать резкий поворот: без предупреждения, без подготовки}
— {Темп финала: быстро / медленно / обрыв}

СТИЛЬ: {конкретный автор / издание / жанровая метка}

ЗАПРЕЩЕНО: нейтральное повествование / мотивационный финал / плавные переходы

Что подставлять: - {Основная задача} — вид текста, тема, размер - {эмоция} — конкретное слово: растерянность, злость, острое любопытство — не грусть и не усталость - {момент конфликта} — конкретная сцена или внутренний поворот, не "напряжение" - {автор / издание} — реальное имя: Пелевин, Линор Горалик, The New Yorker, Vice, Медуза - {ЗАПРЕЩЕНО} — прямо пиши чего не хочешь; запреты работают сильнее, чем разрешения


🚀 Быстрый старт — вставь в чат:

Вот шаблон против нарративного уплощения. 
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит про жанр, нужные эмоции и стилевой ориентир — потому что без этих координат она сама выберет нейтральный дефолт.


⚠️

Ограничения

⚠️ Работает для художественных и эссеистических текстов: Для инструкций, FAQ, деловых писем нарративное уплощение — не проблема, а преимущество. Не надо бороться с дефолтом там, где он полезен.

⚠️ Стилевой якорь не гарантирует попадания: Модель смещается в сторону указанного автора, но не воспроизводит стиль точно. Чем известнее автор — тем чётче работает якорь.

⚠️ Эффект накапливается по ходу диалога: При длинном тексте через несколько итераций модель дрейфует обратно к нейтральности. Рычаги нужно повторять или вставлять в системный промпт.

⚠️ Разные модели — разный стартовый дрейф: Более "выровненные" модели (с дополнительным RLHF) уплощают сильнее. Базовые модели без тонкой настройки — менее предсказуемо, но потенциально острее.


🔍

Как исследовали

Исследователи взяли одну модель (OLMo 32B) и сделали из неё четыре версии: базовую, после SFT, после DPO и после RLVR. Все четыре — одна архитектура, одни веса предобучения, только этапы выравнивания разные. Это ключевой дизайн: нельзя списать на "разные модели" — только на этапы обучения.

Дальше взяли три типа человеческих рассказов: рассказы из The New Yorker (профессиональная литература с редактурой), рассказы по заданию (prompt-guided), и рассказы с открытых платформ без фильтрации. Каждый рассказ обрезали на 40/60/80/90% и просили модели дописать. Сравнивали продолжение модели с оригинальным продолжением человека.

Замеряли три вещи числами: разброс тематических переходов (насколько непредсказуемо меняются темы), доля эмоциональных категорий (отдельный классификатор на 28 эмоций), стилевое расстояние между текстами (векторные представления стиля). Результат оказался неожиданным в деталях: базовая модель была слишком "горячей" — слишком много конфликта, слишком мало нейтральности. Каждый этап выравнивания бил в обратную сторону. К финальной версии маятник пролетел мимо человеческого уровня и ушёл в противоположную крайность. RLHF не нашёл баланс — он создал новый перекос. Самый наглядный факт: после выравнивания тексты, написанные для The New Yorker, для платформ с фан-фиком и для рассказов по заданию — почти неразличимы стилистически. Разница схлопнулась на 90%+.


💡

Адаптации и экстраполяции

📌

💡 Адаптация для маркетинговых текстов

Та же проблема — нейтральный дефолт — убивает лендинги, рекламные письма, посты в соцсетях.

Напиши письмо для рассылки подписчикам {название проекта}.
Тема: {о чём}.

ЭМОЦИОНАЛЬНЫЙ РИСУНОК:
— Открыть: конкретная боль или острое наблюдение (не "вы наверняка знакомы с...")
— Середина: момент удивления или разрыва ожиданий
— CTA: не мотивация — конкретное действие с ощущением упущенного

СТИЛЬ: {издание / бренд-ориентир, напр. "Яндекс Практикум в плохой день" или "письмо от инвестора Каца"}
ЗАПРЕЩЕНО: корпоративный тон, плавные переходы, финал с "успехом"

📌

🔧 Техника: явный запрет нейтральности → острее эмоции

Исследование показало: нейтральность растёт активно, другие эмоции подавляются. Значит, запрет работает как разблокировка:

Добавь в любой промпт на текст: "Избегай нейтрального повествования. Каждый абзац должен нести конкретную эмоцию: назови какую перед написанием."

Это заставляет модель явно маркировать эмоцию ДО генерации — она не скатится в дефолт, потому что сама назвала цель.


📌

🔧 Техника: предварительная карта эмоций как отдельный шаг

Вместо встраивания инструкций напрямую — сначала попроси модель разработать эмоциональную карту:

Шаг 1: Составь эмоциональную карту для {текст}: 
разбей на 5-7 моментов, для каждого укажи 
основную эмоцию (не "нейтрально") и тип перехода к следующему (резкий/плавный/обрыв).

Шаг 2: Напиши текст строго по этой карте.

Карта фиксирует намерение до генерации — модель не съезжает в нейтральность по ходу.


🔗

Ресурсы

Работа: Narrative Flattening: How Post-Training Compresses Thematic, Affective, and Stylistic Variation in LLM Fiction

Авторы: Zehan Li, Yutong Zhu, Siyang Wu, Honglin Bao, James A. Evans — Knowledge Lab, University of Chicago

Контакты авторов: honglinbao@uchicago.edu, zehan@uchicago.edu

Инструменты из исследования: OLMo 32B (модель), GoEmotions classifier (классификатор эмоций), StyleDistance embeddings (стилевые векторы), text-embedding-3-large (тематические векторы)

Данные: The New Yorker corpus (Shaalan, 2022), Tell Me A Story / TMAS (Huot et al., 2024), StoryStar platform


📋 Дайджест исследования

Ключевая суть

Парадокс: конфликт и удивление в текстах LLM падают с 47% до 7.5% — и это не плохой промпт, а прямой результат дообучения. Каждый этап выравнивания (RLHF, DPO) фильтрует острые углы — люди стабильно одобряли гладкие тексты, модель выучила паттерн и теперь по умолчанию выдаёт нейтральное, читаемое, безжизненное. Метод трёх рычагов позволяет явно задать эмоции, ритм смены тем и стилевой якорь — без этих координат модель автоматически уходит в дефолт. «Пиши интереснее» не работает. «Конфликт после второго абзаца, резкий поворот, в духе Пелевина» — работает.

Принцип работы

Модель не выбирает между «живым» и «скучным». Она выбирает следующий токен по вероятности — а вероятный путь после дообучения ведёт к нейтральности. Три рычага создают новые ориентиры. Рычаг 1 — эмоциональная спецификация: называй точные эмоции. Не «интересно» и не «динамично» — а «растерянность», «острый внутренний конфликт». И добавляй прямые запреты: «без нейтрального повествования» — запреты работают сильнее, чем разрешения. Рычаг 2 — тематический ритм: скажи где задержаться и где резко переключиться. «Первые два абзаца медленно, третий — поворот без предупреждения». Иначе модель будет менять темы равномерно и предсказуемо. Рычаг 3 — стилевой якорь: назови конкретного автора или издание. Без якоря модель тяготеет к «средней художественной прозе» — это её аттрактор после выравнивания. Имя Горалик или Медузы смещает её в другую сторону.

Почему работает

Выравнивание работает как фильтр вкуса. Люди оценивали тексты при обучении — и стабильно предпочитали гладкие, без конфликта и резких переходов. Модель не стала «безопасной» — она стала статистически нейтральной. Следующий токен генерируется по самому вероятному пути — а вероятный путь ведёт к тому, что чаще нравилось людям на этапе обучения. Жесть в цифрах: конфликт и удивление режутся с 47% до 7.5% только за счёт этапов дообучения. Нейтральность растёт с 13% до 45%. Это не субъективное ощущение скуки — это измеримое, воспроизводимое сжатие. Чем конкретнее инструкция — тем точнее координата в пространстве возможностей. «Интереснее» — это никуда. «47% конфликт, резкий поворот на третьем абзаце, Линор Горалик» — это адрес.

Когда применять

Художественные тексты, эссе, авторские колонки, лонгриды — везде где «живость» важна, особенно когда модель выдаёт «корпоративную прозу с душой» вместо острого текста. Прикол: при длинном тексте модель дрейфует обратно к нейтральности уже через несколько итераций. Рычаги нужно повторять или вставлять в системный промпт — иначе дефолт возвращается сам. НЕ подходит для: инструкций, FAQ, деловых писем, технических текстов. Там нейтральный дефолт — преимущество, не проблема. Не надо бороться с ним там, где он полезен.

Мини-рецепт

1. Назови эмоции точно: не «грусть» — а «растерянность». Не «напряжение» — а «острый внутренний конфликт, который некрасив». Конкретное слово — это координата. Размытое — это пустота.

2. Задай ритм явно: где медленно (детали, накопление), где поворот без предупреждения, каким темпом финал — быстро, медленно, обрыв. Без этого модель сделает все переходы равномерными.

3. Прикрепи стилевой якорь: реальный автор или издание. Пелевин, Горалик, The New Yorker, Vice, Медуза. Чем дальше от «корпоративной прозы» — тем сильнее смещение от дефолта.

4. Добавь запреты явно: «без нейтрального повествования», «без мотивационного финала», «без плавных переходов». Список того, чего не хочешь — работает сильнее, чем список того, что хочешь.

5. Повторяй рычаги при длинных текстах: через несколько итераций модель ползёт обратно к нейтральности. Напоминай в каждом сообщении или вставь весь блок инструкций в системный промпт.

Примеры

[ПЛОХО] : Напиши колонку о выгорании предпринимателей. Сделай живо и интересно, чтобы цепляло.
[ХОРОШО] : Напиши колонку о выгорании предпринимателей. Тема: когда перестаёшь понимать зачем всё это. ЭМОЦИОНАЛЬНЫЙ РИСУНОК: — Начало: тупая растерянность, что сил нет (не грусть, не усталость — именно растерянность) — Середина: острый внутренний разговор с собой, который некрасив — Финал: честный и неудобный, без мотивации РИТМ: — Первые два абзаца медленно, детали быта — Третий абзац — резкий поворот без предупреждения — Финал — быстро, почти обрыв СТИЛЬ: В духе ранних эссе Линор Горалик — личное, чуть неловкое, без дидактики. ЗАПРЕЩЕНО: нейтральное повествование, совет в финале, плавные переходы. Объём: 1800–2000 знаков.
Источник: Narrative Flattening: How Post-Training Compresses Thematic, Affective, and Stylistic Variation in LLM Fiction
ArXiv ID: 2605.27878 | Сгенерировано: 2026-05-28 07:42

Проблемы LLM

ПроблемаСутьКак обойти
Модель уплощает текст по умолчаниюПросишь написать художественный или эссеистический текст. Получаешь гладкое, читаемое, безжизненное. Конфликт исчез. Резкие переходы сглажены. Все фрагменты звучат с одинаковым напором. Это не плохой запрос — это дефолтный режим. Обучение на предпочтениях людей работает как фильтр: острые углы убрали, нейтральность осталась. Доля конфликта и удивления в тексте падает с ~47% до ~7.5%. Нейтральное повествование растёт с ~13% до ~45%Назови целевые эмоции явно: "конфликт", "растерянность", "удивление". Задай ритм смены тем: "задержись здесь, резкий поворот после второго абзаца". Добавь стилевой якорь: конкретного автора или издание. Без этих координат модель уйдёт в нейтральный дефолт

Методы

МетодСуть
Три рычага против нейтрального текстаДобавь к любому запросу на художественный или эссеистический текст три блока. 1. Эмоциональный рисунок: назови конкретные эмоции на каждом этапе текста. Не "напряжение" — а "растерянность в начале, острый внутренний конфликт в середине, неудобный финал без вывода". 2. Ритм тем: скажи где задержаться и где сделать резкий поворот. "первые два абзаца — медленно, третий — резкий переключение без предупреждения". 3. Стилевой якорь: назови реального автора или издание. "в духе Пелевина / The New Yorker / Медузы". Работает потому что модель следует конкретным координатам несравнимо лучше чем абстрактным пожеланиям. Применять: только для художественных и эссеистических текстов. Для инструкций и деловых писем нейтральность — преимущество, не проблема
Запреты сильнее разрешений в стилеВместо "пиши динамично и интересно" пиши что запрещено: "без нейтрального повествования, без мотивационного финала, без плавных переходов". Запрет сужает пространство возможных токенов конкретнее чем разрешение. Разрешение говорит "можешь пойти туда" — остаётся масса вариантов. Запрет говорит "туда нельзя" — дефолтный путь заблокирован. Комбинируй с рычагами: сначала назови что хочешь, потом явно запрети дефолт. "ЗАПРЕЩЕНО: нейтральное повествование / плавные переходы / совет в финале"

Тезисы

ТезисКомментарий
Стилевой якорь смещает дефолтный центр притяженияПосле обучения на предпочтениях модель тяготеет к "средней художественной прозе". Это её режим по умолчанию. Имя конкретного автора или издания создаёт новый центр притяжения — модель не "пишет как Набоков", но смещается от безликого дефолта в нужную сторону. Чем известнее автор — тем чётче работает якорь. Применяй: вместо жанровых описаний ("в духе литературной прозы") называй реальные имена ("Линор Горалик", "Vice", "Медуза")
📖 Простыми словами

Narrative Flattening: How Post-Training Compresses Thematic, Affective, and Stylistic Variation inLLMFiction

arXiv: 2605.27878

Суть в том, что современные нейронки страдают от нарративного уплощения. Это фундаментальный баг процесса «дрессировки» моделей (RLHF, DPO), когда их заставляют отвечать так, чтобы нравиться большинству. В итоге AI превращается в конформиста: он не просто выбирает безопасные темы, он физически разучивается писать остро. Каждый этап дообучения буквально отрезает от текста эмоциональные пики и сложные сюжетные повороты, превращая любую историю в стерильный кисель.

Это как если бы вы попросили шеф-повара приготовить блюдо, которое гарантированно понравится тысяче случайных людей. Чтобы никого не обидеть и не вызвать изжогу, он уберет специи, соль и текстуру, подав в итоге безвкусную овсянку. Формально это еда, но радости от нее ноль. Модели ведут себя так же: они стремятся к «среднему арифметическому» по палате, потому что именно за это их хвалили во время тестов.

Исследователи выделили три рычага, которые ломают этот механизм: тематическая вариативность, аффективный контраст и стилистическая дерзость. Если просто попросить «напиши рассказ», модель выдаст предсказуемую жвачку. Чтобы пробить этот панцирь, нужно принудительно впихивать в промпт конфликты, которые не решаются добрым словом, и заставлять AI использовать редкие метафоры. Без этого вероятностный фильтр внутри модели просто выкинет всё живое как «нетипичный шум».

Этот принцип универсален и касается не только фикшена. Пишете ли вы пост для Telegram, сценарий для YouTube или описание вакансии — стандартный AI-стиль мгновенно считывается аудиторией как «корпоративный булшит». Если не задать модели жесткие рамки и не разрешить ей «быть плохой», она выдаст текст, который вроде бы правильный, но абсолютно мертвый. SEO-копирайтинг умер, на его место пришла борьба за то, чтобы ваш текст не выглядел как продукт жизнедеятельности усредненного алгоритма.

Короче: хватит ждать от нейронки творчества «из коробки» — она обучена быть скучной. Чтобы получить на выходе что-то стоящее, нужно осознанно ломать её стремление к безопасности и впрыскивать хаос в структуру текста. Либо вы управляете этими рычагами, либо ваш контент превращается в невидимый цифровой шум, который все пролистывают не глядя. Смерть оригинальности — это не риск, а базовое состояние современных LLM, с которым нужно бороться в каждом промпте.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с