3,583 papers
arXiv:2606.06788 72 5 июня 2026 г. FREE

Провал ползунка сложности: почему «объясни проще» не работает — и как это починить

КЛЮЧЕВАЯ СУТЬ
Парадокс: просишь «объясни проще» — получаешь «объясни короче». Жаргон и глубина при этом меняются как повезёт: правильно только в 46% случаев — это хуже подбрасывания монеты. Метод позволяет получить реально разные версии текста — от объяснения для ребёнка до разговора с экспертом — за один запрос, а не в диалоге. Фишка: вместо итеративного «а теперь ещё проще» — один промпт с параллельной генерацией всех уровней сразу. Модель видит весь диапазон одновременно и вынуждена различать версии по трём осям: жаргон, плотность деталей и длина — независимо, а не просто режет объём.
Адаптировать под запрос

TL;DR

Когда просишь LLM «объяснить проще» или «сделай версию для эксперта», модель почти всегда меняет только длину текста — но не уровень жаргона и не количество информации. По сути, вместо реального упрощения ты получаешь тот же текст, только короче или длиннее. Это не баг конкретной модели — это системная особенность всех топовых LLM.

Главная причина: модели не различают три разные оси сложности — жаргон (незнакомые слова), плотность информации (сколько фактов на абзац) и длину. Когда просишь «проще» — модель оптимизирует то, что легче всего измерить, то есть длину. Жаргон и глубина при этом могут вырасти или упасть случайно — примерно с вероятностью подбрасывания монеты.

Исследование показало, что работает лучше: использовать конкретные аудиторные метки вместо абстрактных уровней, и просить все версии в одном запросе, а не по очереди. «Ребёнок → Подросток → Студент → Аспирант → Эксперт» даёт более разные версии, чем «попроще / посложнее» в диалоге.


🔬

Схема метода

Всё выполняется в одном промпте:

ШАГ 1: Задать контент → что нужно объяснить (текст, тема, концепция)
ШАГ 2: Задать 5 аудиторных меток → Ребёнок / Подросток / Студент / Аспирант / Эксперт
ШАГ 3: Явно указать три оси → жаргон, объём информации, длина
ШАГ 4: Получить все 5 версий → в одном ответе, одновременно

Ключевое: не диалог «а теперь проще», а параллельная генерация всех уровней сразу.


🚀

Пример применения

Задача: Ты пишешь лендинг для нового IT-продукта — корпоративной CRM. Нужно объяснить ценность продукта разным аудиториям: собственнику, директору по продажам, рядовому менеджеру, инвестору и технарю.

Промпт:

Вот описание продукта:
[Вставь текст о продукте — 3-5 предложений]

Создай 5 версий объяснения ценности этого продукта для разных аудиторий.
Аудитории по нарастанию сложности:
1. Владелец малого бизнеса (никогда не слышал про CRM)  
2. Руководитель отдела продаж (знает термины, не знает IT)
3. Коммерческий директор крупной компании (думает в деньгах и метриках)
4. Венчурный инвестор (оценивает рынок и потенциал)  
5. Технический директор (думает в архитектуре и интеграциях)

Для каждой версии:
— Используй только жаргон, понятный именно этой аудитории (не больше и не меньше)
— Включай ровно столько фактов и деталей, сколько нужно этому человеку для решения
— Длина: 3-4 предложения на версию

Формат: пронумерованный список, каждая версия с заголовком аудитории.

Результат:

Модель выдаст 5 отдельных блоков — по одному на аудиторию. Ключевое отличие от «напиши проще»: версия для собственника будет с минимумом терминов и максимумом конкретики («сотрудники перестанут терять клиентов»), версия для CTO — с упоминанием API, интеграций и стека. Длина у всех похожая, зато словарь и глубина действительно разные.


🧠

Почему это работает

Проблема: Когда просишь «объясни проще» в следующем сообщении, у модели нет якоря — она не знает, насколько проще. Результат непредсказуем. По данным исследования, даже лучшая модель (Claude Sonnet 4.5 + Thinking) меняет жаргон в нужную сторону только в 46% случаев при итеративном подходе. То есть почти как случайно.

Почему одним промптом лучше: Когда все версии генерируются одновременно, модель держит весь диапазон в «поле зрения» и активнее дифференцирует версии. Она видит, что первая — для ребёнка, последняя — для эксперта, и вынуждена делать их разными. В диалоге каждый следующий ответ — почти независимый.

Почему аудиторные метки работают лучше уровней: «Ребёнок» и «Эксперт» — это конкретные образы с понятным словарём и контекстом. «Уровень 1» и «уровень 5» — абстракция без содержания. Модель лучше имитирует речь реального человека, чем следует числовой шкале.

Рычаги управления: - Экстремальность якорей → чем дальше крайние аудитории (Ребёнок vs Эксперт), тем контрастнее версии. Близкие якоря (Студент vs Аспирант) дают почти одинаковый результат - Явное указание трёх осей (жаргон / количество фактов / длина) → модель не угадывает, что именно менять - Фиксированная длина → если не указать, модель просто делает «сложные» версии длиннее, а это не то же самое, что сложнее


📋

Шаблон промпта

Вот материал для адаптации:
{текст или тема}

Создай {число_версий} версий для разных аудиторий:
1. {аудитория_1} — {краткое описание их уровня знаний}
2. {аудитория_2} — {краткое описание их уровня знаний}
3. {аудитория_3} — {краткое описание их уровня знаний}
4. {аудитория_4} — {краткое описание их уровня знаний}
5. {аудитория_5} — {краткое описание их уровня знаний}

Для каждой версии независимо настрой:
— Жаргон: используй только слова, знакомые этой аудитории
— Количество деталей: включай ровно то, что нужно для их задачи
— Длина: {число} предложений

Формат: каждая версия с заголовком аудитории, пронумерована.

Что подставлять: - {текст или тема} — то, что нужно объяснить: пара абзацев, тезис, описание продукта - {аудитория_N} — конкретный тип человека, не просто «простой / сложный» - {число} предложений — фиксируй длину, иначе модель будет растягивать «сложные» версии


🚀 Быстрый старт — вставь в чат:

Вот шаблон для объяснения одного материала разным аудиториям. 
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит что именно нужно объяснить и кто твои аудитории — потому что без конкретных образов людей она не сможет правильно выставить метки и сделать версии по-настоящему разными.


⚠️

Ограничения

⚠️ Жаргон и глубина — не гарантия: Даже с правильным шаблоном модель примерно в половине случаев не снижает/повышает технический уровень так, как ты ожидаешь. Всегда читай крайние версии и сравнивай — если «версия для ребёнка» всё ещё полна терминов, попроси убрать их явно.

⚠️ Близкие аудитории дают похожий текст: Разница между «Студент» и «Аспирант» для модели почти незаметна. Если нужны контрастные версии — бери крайние якоря (Ребёнок / Эксперт или Школьник / Профессор).

⚠️ Длина растёт сама по себе: Если не ограничить размер, «сложные» версии будут просто длиннее — но не глубже. Это не одно и то же. Фиксируй длину явно.

⚠️ Метод для адаптации текста, не для генерации: Лучше всего работает когда есть что адаптировать — готовый текст, тема с конкретным содержанием. На пустом запросе «объясни квантовую физику» разброс версий будет меньше.


🔍

Как исследовали

Команда сначала провела пользовательское исследование с 16 участниками: дала им прототип чата со слайдером сложности (5 уровней) и попросила изучать незнакомые STEM-темы. Большинство оценили слайдер положительно — но отметили, что соседние уровни часто неотличимы на ощупь. Это и стало главным вопросом: а могут ли модели вообще генерировать по-настоящему разные уровни сложности?

Затем взяли 98 научных вопросов (биология, физика, CS) и попросили пять моделей сгенерировать по 5 версий ответа — от уровня студента до уровня старшего исследователя. Измеряли три вещи: долю незнакомых слов (жаргон), количество отдельных фактов в тексте (плотность информации) и длину. Критерий простой: каждая следующая версия должна быть сложнее предыдущей по всем трём параметрам.

Результат оказался хуже, чем ожидали. Длина росла хорошо (почти всегда). Жаргон и информация — в лучшем случае в правильную сторону лишь половину случаев, в худшем — близко к случайному броску монеты. Причём первый шаг (студент → младший аспирант) получался лучше, чем последующие — модели как бы «выдыхались» при более тонких различиях. Интересная деталь: когда якоря сделали крайнее («Ребёнок» вместо «Студент», «Эксперт» вместо «Старший исследователь»), показатели выросли — но тренд провалов сохранился.


💡

Адаптации и экстраполяции

🔧 Техника: явная верификация версий → повышает надёжность

После генерации 5 версий добавь в промпт отдельный запрос:

Теперь проверь версии 1 и 5. 
Выпиши все слова из версии 5, которых нет в версии 1.
Если таких слов меньше 5 — перегенерируй версию 5, добавив больше профессионального жаргона.

Модель выступает как редактор собственного текста и замечает то, что пропустила при генерации.


🔧 Техника: "5 уровней Wired" как готовый якорь

Журнал Wired использует формат «5 Levels» — разные эксперты объясняют одно понятие пяти аудиториям: Child, Teen, College student, Grad student, Expert. Именно эти метки показали лучший результат в исследовании. Их можно использовать как готовый якорь без изменений:

Объясни {тему} для 5 аудиторий в стиле рубрики «5 Levels»:
Child (7 лет) / Teen (15 лет) / студент / аспирант / эксперт в области.

Для каждого: 3-4 предложения, только их словарь, только нужные им детали.

🔗

Ресурсы

Статья: Explain Like I'm 5 or Whatever I Choose: Evaluating the Interactive Potential of Language Model Responses

Авторы: Indu Panigrahi, Tal August — Siebel School of Computing and Data Science, University of Illinois Urbana-Champaign

Вдохновение: серия WIRED «5 Levels» — реальный пример того, как работают аудиторные якоря


📋 Дайджест исследования

Ключевая суть

Парадокс: просишь «объясни проще» — получаешь «объясни короче». Жаргон и глубина при этом меняются как повезёт: правильно только в 46% случаев — это хуже подбрасывания монеты. Метод позволяет получить реально разные версии текста — от объяснения для ребёнка до разговора с экспертом — за один запрос, а не в диалоге. Фишка: вместо итеративного «а теперь ещё проще» — один промпт с параллельной генерацией всех уровней сразу. Модель видит весь диапазон одновременно и вынуждена различать версии по трём осям: жаргон, плотность деталей и длина — независимо, а не просто режет объём.

Принцип работы

У сложности текста три независимые оси: жаргон (незнакомые слова), количество деталей на абзац и длина. Когда просишь «проще» итеративно — модель меняет только то, что легко измерить. Это длина. Жаргон и глубина при этом живут своей жизнью. Аудиторные метки работают там, где числовые уровни проваливаются. «Ребёнок» — конкретный образ с понятным словарём и контекстом. «Уровень 1» — пустая абстракция. Модель хорошо имитирует речь реального человека, но плохо следует числовой шкале — у неё нет внутреннего эталона «насколько сложен уровень 3». Ещё одно: чем дальше крайние якоря (Ребёнок vs Эксперт), тем контрастнее версии. Близкие якоря (Студент vs Аспирант) дают почти одинаковый текст — модель просто не видит большой разницы.

Почему работает

В диалоге каждый следующий ответ — почти независимый. Модель не помнит, насколько сложной была предыдущая версия, и просто немного укорачивает или удлиняет текст. Когда все версии генерируются одновременно — модель держит весь диапазон перед собой и вынуждена делать крайние версии по-настоящему разными. Жесть: даже лучшая модель (Claude Sonnet 4.5 с расширенным анализом) меняет жаргон в нужную сторону только в 46% случаев при итеративном подходе — то есть хуже случайного выбора. Явное указание трёх осей в промпте — жаргон, количество фактов, длина — убирает угадывание: модель знает что именно менять, а не подгадывает под размытое «проще/сложнее».

Когда применять

Адаптация одного материала под несколько аудиторий с разным уровнем знаний — лендинги, обучающие материалы, внутренняя документация, статьи. Особенно когда аудитории реально разные: технари и директора, школьники и преподаватели, клиенты и инвесторы. Не подходит для генерации с нуля на абстрактную тему — метод работает когда есть что адаптировать: готовый текст, тезис или описание продукта.

Мини-рецепт

1. Дай исходник: вставь в промпт текст или тему — 3-5 предложений достаточно, модели есть от чего оттолкнуться.
2. Назначь 5 конкретных людей: не «уровень 1 — уровень 5», а реальные образы с описанием — «школьник без технического бэкграунда», «менеджер по продажам, знает термины, не знает IT», «технический директор, думает в архитектуре».
3. Сделай якоря максимально далёкими: крайние аудитории должны быть как можно дальше друг от друга — иначе версии сольются.
4. Явно задай три оси: попроси модель для каждой версии независимо настроить жаргон (только слова, знакомые аудитории), количество деталей (ровно столько, сколько нужно для их задачи) и длину (зафиксируй — например, 3-4 предложения).
5. Попроси всё в одном ответе: сразу все версии, пронумерованные — не «сначала первую, потом по заявкам».

Примеры

[ПЛОХО] : Объясни квантовую запутанность. Теперь сделай проще. Ещё проще. Теперь для специалиста.
[ХОРОШО] : Вот материал: [вставь текст о квантовой запутанности]. Создай 5 версий для разных аудиторий: 1. Школьник 10 лет — ни одного научного термина, только аналогии из жизни 2. Старшеклассник — базовая физика, без формул 3. Студент физфака — знает квантовую механику, но не специализируется 4. Аспирант-физик — свободный жаргон, глубокие детали 5. Исследователь в квантовых вычислениях — говори как с коллегой Для каждой версии независимо: — Жаргон: только слова, понятные этой аудитории — Детали: ровно то, что нужно им для понимания — Длина: 3 предложения на каждую версию Формат: пронумерованный список, каждая версия с заголовком аудитории.
Источник: Explain Like I'm 5 or Whatever I Choose: Evaluating the Interactive Potential of Language Model Responses
ArXiv ID: 2606.06788 | Сгенерировано: 2026-06-08 04:28

Проблемы LLM

ПроблемаСутьКак обойти
«Объясни проще» меняет длину, а не сложностьПросишь упростить или усложнить текст. Модель делает его короче или длиннее. Жаргон и глубина меняются почти случайно — примерно в половине случаев не в ту сторону. Происходит потому что длину легче «оптимизировать», чем уровень терминологии. Проблема для любых задач: пересказ для разных аудиторий, адаптация контента, объяснение сложной темыНе проси «проще» или «сложнее». Дай конкретную аудиторию: «объясни для школьника», «объясни для технического директора». Явно укажи что менять: только жаргон, только глубину, только длину — или все три отдельно

Методы

МетодСуть
Все версии сразу — параллельная адаптация для разных аудиторийВместо диалога «а теперь проще» — один запрос со всеми версиями. Дай конкретные образы людей: Ребёнок / Подросток / Студент / Аспирант / Эксперт. Явно назови три оси для каждой версии: жаргон (только слова знакомые этой аудитории), количество деталей (ровно столько, сколько нужно), длина (фиксированная, например 3–4 предложения). Почему работает: Когда модель видит весь диапазон сразу — от Ребёнка до Эксперта — она вынуждена делать версии разными. В диалоге каждый ответ почти независимый, якоря нет. Когда применять: адаптация текста, лендингов, инструкций, объяснений под разные роли. Когда не работает: на пустой теме без готового материала — разброс версий будет меньше

Тезисы

ТезисКомментарий
Конкретная аудитория даёт лучший результат, чем абстрактный уровень«Объясни для School-директора» и «объясни для ребёнка» — это образы с реальным словарём. Модель имитирует речь настоящего человека. «Уровень 1» и «уровень 5» — пустые числа без содержания. Модель не знает что с ними делать и угадывает. Применяй: вместо «упрости до уровня 2 из 5» пиши «объясни для человека который никогда не слышал про эту тему»
📖 Простыми словами

Explain Like I'm 5 or Whatever I Choose: Evaluating the Interactive Potential ofLanguageModelResponses

arXiv: 2606.06788

LLM работают не как живые учителя, а как ленивые редакторы, которые путают упрощение смысла с сокращением объема. Когда ты просишь нейронку объяснить квантовую физику пятилетнему ребенку, она не меняет фундаментальную сложность понятий, а просто выкидывает куски текста. В итоге вместо понятной сути ты получаешь тот же сложный текст, только кастрированный. Модели зациклены на статистической вероятности слов, поэтому они физически не понимают разницу между «сделай короче» и «сделай понятнее».

Это как если бы ты попросил повара сделать блюдо менее острым, а он просто выкинул половину порции в мусорку. Формально перца стало меньше, но концентрация осталась прежней, и ты всё равно обожжёшь язык. Модели ведут себя именно так: они не умеют пересобирать структуру знаний под разный уровень IQ, они просто играют в текстовый тетрис, подгоняя длину ответа под твои ожидания.

Исследование показало, что даже топовые модели вроде Claude 3.5 Sonnet лажают в адаптации жаргона больше чем в половине случаев. Если ты просишь упростить текст в следующем сообщении, модель меняет стиль адекватно только в 46% случаев. Остальные 54% — это либо имитация бурной деятельности, либо простое удаление абзацев. Реально работают только многоуровневые промпты, где ты сразу задаешь шкалу сложности, иначе нейронка просто гадает на кофейной гуще, что для тебя значит слово «просто».

Этот принцип применим везде: от написания лендингов для разных сегментов аудитории до подготовки технических отчетов. Если тебе нужно объяснить ценность CRM и инвестору, и рядовому менеджеру, не надейся на команду «а теперь объясни это для других». Принцип интерактивной адаптации в LLM сломан по умолчанию. Чтобы не получить на выходе бесполезный огрызок вместо внятного объяснения, нужно прописывать конкретные роли и ограничения по терминам в одном первом сообщении.

Короче: LLM — это не эксперты по коммуникациям, а статистические попугаи, которые не чувствуют разницу между глубиной мысли и количеством знаков. Если не контролировать процесс жестко, ты получишь текст, который выглядит коротким, но остается таким же непонятным. 46% успеха — это слишком низкая ставка, чтобы доверять нейронке адаптацию смыслов без твоего надзора. Либо задавай контекст сразу, либо готовься читать урезанную версию того же самого булшита.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с