Тезисы
Концепты из исследований мая 2026
50 тезисы, отсортировано по рейтингу
Явная структура в запросе нейтрализует мягкий системный сигнал
Системный промпт стоит выше пользовательского в иерархии инструкций. Без явного противовеса — побеждает системный. Но модели очень точно следуют конкретным структурным инструкциям в запросе. Когда формат зафиксирован явно ("таблица", "одинаково", "все варианты"), выполнить его честно и одновременно тихо продвигать один вариант — почти невозможно. Принцип работает шире таблиц: любое явное ограничение формата в запросе конкурирует с мягкими системными сигналами. Применяй: добавляй явные структурные требования везде, где нужна нейтральность — список с равными критериями, сравнение "плюсы и минусы для каждого", фиксированный набор вопросов для каждого варианта
Крупные модели сильнее отвлекаются на псевдоинструкции, чем маленькие
Маленькая модель не замечает скрытые команды в тексте. Крупная — обучена быть полезной: она сканирует текст, выискивает задачи и выполняет их. Чем больше обучающих данных с инструкциями — тем острее реакция на любой паттерн директивы. Сила в чистых задачах превращается в уязвимость в зашумлённых документах. Применяй: чем мощнее модель — тем важнее явно разграничить зоны командами
Негативная история давит в 1.6 раза сильнее позитивной
Серия отказов тянет следующий ответ вниз заметно сильнее, чем серия одобрений тянет вверх. Причина: у модели уже есть встроенный уклон к «нет» в бинарных суждениях. Негативная история идёт по течению, позитивная — против. Применяй: Если оцениваешь в батче и последние ответы были отрицательными — особенно важно либо сменить чат, либо добавить инструкцию изоляции перед следующим объектом
Качество текста и желание его выполнять — разные вещи
AI делает текст объективно лучше: конкретнее, измеримее, реалистичнее. Но это улучшает только форму. Желание действовать зависит от другого — от ощущения "я сам это выбрал". AI-авторство это ощущение разрушает. Итог: красивый текст который ты не выполняешь. Применяй: не оценивай запрос по качеству результата там где тебе потом действовать. Оценивай по тому остаёшься ли ты автором
Психологически точный язык даёт стабильнее результат, чем ярлык
Написать "напиши как скептик" — размытый сигнал. Написать "ты ценишь защиту от риска и предсказуемость" — точный сигнал. Модель обучена на реальных текстах реальных людей. Там нет слова "скептик" как системы взглядов. Зато есть тысячи текстов людей, которые объясняют решения через ценности. Точный язык попадает в этот кластер. Применяй: вместо расплывчатых ролей ("консерватор", "оптимист") описывай что человек ценит конкретными словами
"Друг" в промпте хуже дефолта для эмоциональных запросов
Кажется логичным: добавишь дружелюбности — получишь лучшую поддержку. Но работает наоборот. Друг по логике должен быть на твоей стороне, разделять возмущение, соглашаться. Модель точно следует этому паттерну — и выдаёт максимальную эскалацию из всех режимов. Дефолт лучше. Профессиональная роль — лучше всего. Применяй: убери отвечай как друг из эмоциональных запросов. Замени на профессиональную роль или оставь без роли
Большинство сбоев агента чинятся промптом, а не сменой модели
Только 18% сбоев — это "понял правильно, сделал неверно". Это модельная проблема, промптом не лечится. Остальные 82% — модель не получила чёткие ограничения, потеряла контекст, или действовала по умолчанию "как обычно делается". Это чинится структурой запроса. Применяй: сначала уточни промпт — явные ограничения, конкретный формат, запрет на расширение. Только если после этого всё равно неверно — это проблема модели
Стилевой якорь смещает дефолтный центр притяжения
После обучения на предпочтениях модель тяготеет к "средней художественной прозе". Это её режим по умолчанию. Имя конкретного автора или издания создаёт новый центр притяжения — модель не "пишет как Набоков", но смещается от безликого дефолта в нужную сторону. Чем известнее автор — тем чётче работает якорь. Применяй: вместо жанровых описаний ("в духе литературной прозы") называй реальные имена ("Линор Горалик", "Vice", "Медуза")
Умнее модель→сильнее следует накопленному паттерну
Слабая модель почти не реагирует на историю диалога. Сильная переключается резко. Механика: сильная модель лучше считывает неявные правила из примеров. Та же способность, что делает её полезной в сложных задачах, делает её чувствительнее к паттернам в истории. Применяй: для длинных цепочек задач где важна устойчивость — маленькая модель может быть надёжнее. Для закрепления качества через якорь — старшая модель откликнется сильнее
Числовая самооценка уверенности коррелирует с реальной точностью
Когда явно просишь модель поставить число (не слово), эта оценка отражает реальность. У кого выше самооценка — у тех и больше правильных ответов. Просто попросить "оцени уверенность от 0 до 1" уже достаточно. Без явного запроса — этот сигнал никуда не проходит. Важно: не все модели одинаково точны. Перед серьёзным использованием проверь: задай 10 вопросов с известными тебе ответами, попроси оценить уверенность — посмотри совпадает ли
Защитная формулировка снимает блок на критику
"Что плохо в моей идее?" — модель смягчает. "Что нужно защитить от провала?" — та же информация, но режим другой. Модель думает, что помогает с защитой, а не атакует тебя. Блокировка "не расстраивать" не срабатывает. Применяй: заменяй любой прямой запрос на критику на "что здесь нужно защитить / что чаще всего губит такие проекты"
Оценка и аудитория — два независимых рычага стиля
«Кто оценивает» и «кто читает» — разные сигналы. Они влияют на РАЗНЫЕ параметры текста. Фрейм оценки экспертами → богаче словарь, точнее формулировки. Фрейм пассивной аудитории → длиннее текст, больше деталей. Эффекты не перекрываются. Применяй: Хочешь и то, и другое — пиши оба фрейма. Хочешь только объём — убери слово «оценивают», оставь «читают». Ограничение: Эффект на стиль и регистр. Не на логику и глубину рассуждений. Модель пишет формальнее — не умнее.
Модель оценивает сложность конкретного вопроса внутри домена, а не просто его метку
Когда задаёшь зону "смешанная" — модель не применяет одно поведение ко всем вопросам из неё. Она оценивает, насколько этот конкретный вопрос требует реальной экспертизы. Два вопроса про психологию могут дать совершенно разную реакцию: один — прямой ответ, другой — предупреждение. Это и сила, и ограничение: поведение в смешанной зоне непредсказуемо. Применяй: если нужна стабильность — переводи домен из смешанной в слабую. Теряешь удобство, получаешь предсказуемость
Контрастное сравнение вытаскивает паттерн ошибки лучше описания
Когда пишешь "модель ошибается вот здесь" — модель видит только один набор данных. Не понятно что именно триггерит ошибку. Когда даёшь рядом неверные И верные примеры — модель видит разницу. Именно разница и есть паттерн. Механика: контраст изолирует признак, который появляется только в ошибочных случаях и отсутствует в верных. Применяй: всегда клади оба набора в один запрос. Без верных примеров "для сравнения" — поиск паттерна работает хуже
Запись "почему" даёт модели право на мелкие решения без вопросов
Когда модель знает только ЧТО делать — при каждом спорном шаге останавливается и уточняет. Когда знает ПОЧЕМУ — применяет логику самостоятельно на похожих случаях. Механизм: явное обоснование работает как правило вывода, а не как инструкция на один раз. Применяй: вместо "используй короткие абзацы" пиши "используй короткие абзацы — потому что аудитория читает с мобильного". Модель применит этот принцип и там, где ты не предусмотрел
Хороший ответ≠твой ответ
Модель выдаёт структурно правильный результат даже когда не понимает твой специфический контекст. Форма заполнена верно. Содержание — чужое: взято из самого частого в обучении. Это не ошибка модели — это нормальное поведение. Применяй: если ответ выглядит "правильно, но не совсем то" — проверь какие измерения ты не указал явно
Больше данных не убирает домыслы — делает их убедительнее
Интуиция подсказывает: дай модели больше контекста — станет точнее. Не срабатывает. Модель строит более детальную историю, но она так же не подкреплена данными. Проблема не в объёме данных, а в отсутствии инструкции остановиться. Применяй: не трать время на сбор дополнительного контекста ради точности объяснений. Сначала поставь ограничение на домыслы
Персона переключает модель в режим "кто сказал"
Без персоны модель оценивает аргументы по содержанию. С персоной включается фильтр идентичности: "похожий" источник — сигнал доверия, "непохожий" — сигнал осторожности. Модель обучена на текстах людей. Люди так и работают. Модель воспроизводит этот паттерн. Следствие: один и тот же аргумент принимается по-разному в зависимости от того, чьим он назван. Применяй: Если модель играет роль и при этом сравнивает позиции — добавляй инструкцию про оценку только по логике. Без этого результат зависит от "похожести" источника, а не от качества аргумента
Сам сформулировал = запомнил прочнее
Знание, которое ты достал из головы сам — хранится в долгосрочной памяти дольше, чем то, что получил готовым. Это не метафора: механизм называется эффектом генерации. Мозг кодирует информацию глубже, когда сам её производит, а не потребляет. Применяй: вместо «объясни X» пиши «спроси меня про X и дай подсказку если застряну»
Разброс вариантов надёжнее описывает уверенность модели, чем её словесная самооценка
Когда просишь "насколько ты уверена?" — получаешь слова. Слова расплывчатые и несравнимые. Когда генерируешь 7 вариантов — видишь реальный разброс. Согласуются → модель "знает". Расходятся → не знает, просто не скажет об этом без дополнительного хода. Применяй: перед важным фактическим вопросом добавь генерацию 5–7 вариантов. Если они расходятся — доверяй меньше
Разблокируйте все концепты с PRO
Получите полный доступ ко всем тезисы и методам из научных исследований
