3,583 papers

Тезисы

Концепты из исследований мая 2026

50 тезисы, отсортировано по рейтингу

2

Явная структура в запросе нейтрализует мягкий системный сигнал

88

Системный промпт стоит выше пользовательского в иерархии инструкций. Без явного противовеса — побеждает системный. Но модели очень точно следуют конкретным структурным инструкциям в запросе. Когда формат зафиксирован явно ("таблица", "одинаково", "все варианты"), выполнить его честно и одновременно тихо продвигать один вариант — почти невозможно. Принцип работает шире таблиц: любое явное ограничение формата в запросе конкурирует с мягкими системными сигналами. Применяй: добавляй явные структурные требования везде, где нужна нейтральность — список с равными критериями, сравнение "плюсы и минусы для каждого", фиксированный набор вопросов для каждого варианта

7

Крупные модели сильнее отвлекаются на псевдоинструкции, чем маленькие

84

Маленькая модель не замечает скрытые команды в тексте. Крупная — обучена быть полезной: она сканирует текст, выискивает задачи и выполняет их. Чем больше обучающих данных с инструкциями — тем острее реакция на любой паттерн директивы. Сила в чистых задачах превращается в уязвимость в зашумлённых документах. Применяй: чем мощнее модель — тем важнее явно разграничить зоны командами

11

Негативная история давит в 1.6 раза сильнее позитивной

82

Серия отказов тянет следующий ответ вниз заметно сильнее, чем серия одобрений тянет вверх. Причина: у модели уже есть встроенный уклон к «нет» в бинарных суждениях. Негативная история идёт по течению, позитивная — против. Применяй: Если оцениваешь в батче и последние ответы были отрицательными — особенно важно либо сменить чат, либо добавить инструкцию изоляции перед следующим объектом

15

Качество текста и желание его выполнять — разные вещи

82

AI делает текст объективно лучше: конкретнее, измеримее, реалистичнее. Но это улучшает только форму. Желание действовать зависит от другого — от ощущения "я сам это выбрал". AI-авторство это ощущение разрушает. Итог: красивый текст который ты не выполняешь. Применяй: не оценивай запрос по качеству результата там где тебе потом действовать. Оценивай по тому остаёшься ли ты автором

16

Психологически точный язык даёт стабильнее результат, чем ярлык

81

Написать "напиши как скептик" — размытый сигнал. Написать "ты ценишь защиту от риска и предсказуемость" — точный сигнал. Модель обучена на реальных текстах реальных людей. Там нет слова "скептик" как системы взглядов. Зато есть тысячи текстов людей, которые объясняют решения через ценности. Точный язык попадает в этот кластер. Применяй: вместо расплывчатых ролей ("консерватор", "оптимист") описывай что человек ценит конкретными словами

17

"Друг" в промпте хуже дефолта для эмоциональных запросов

81

Кажется логичным: добавишь дружелюбности — получишь лучшую поддержку. Но работает наоборот. Друг по логике должен быть на твоей стороне, разделять возмущение, соглашаться. Модель точно следует этому паттерну — и выдаёт максимальную эскалацию из всех режимов. Дефолт лучше. Профессиональная роль — лучше всего. Применяй: убери отвечай как друг из эмоциональных запросов. Замени на профессиональную роль или оставь без роли

18

Большинство сбоев агента чинятся промптом, а не сменой модели

81

Только 18% сбоев — это "понял правильно, сделал неверно". Это модельная проблема, промптом не лечится. Остальные 82% — модель не получила чёткие ограничения, потеряла контекст, или действовала по умолчанию "как обычно делается". Это чинится структурой запроса. Применяй: сначала уточни промпт — явные ограничения, конкретный формат, запрет на расширение. Только если после этого всё равно неверно — это проблема модели

19

Стилевой якорь смещает дефолтный центр притяжения

81

После обучения на предпочтениях модель тяготеет к "средней художественной прозе". Это её режим по умолчанию. Имя конкретного автора или издания создаёт новый центр притяжения — модель не "пишет как Набоков", но смещается от безликого дефолта в нужную сторону. Чем известнее автор — тем чётче работает якорь. Применяй: вместо жанровых описаний ("в духе литературной прозы") называй реальные имена ("Линор Горалик", "Vice", "Медуза")

20

Умнее модель→сильнее следует накопленному паттерну

81

Слабая модель почти не реагирует на историю диалога. Сильная переключается резко. Механика: сильная модель лучше считывает неявные правила из примеров. Та же способность, что делает её полезной в сложных задачах, делает её чувствительнее к паттернам в истории. Применяй: для длинных цепочек задач где важна устойчивость — маленькая модель может быть надёжнее. Для закрепления качества через якорь — старшая модель откликнется сильнее

22

Числовая самооценка уверенности коррелирует с реальной точностью

81

Когда явно просишь модель поставить число (не слово), эта оценка отражает реальность. У кого выше самооценка — у тех и больше правильных ответов. Просто попросить "оцени уверенность от 0 до 1" уже достаточно. Без явного запроса — этот сигнал никуда не проходит. Важно: не все модели одинаково точны. Перед серьёзным использованием проверь: задай 10 вопросов с известными тебе ответами, попроси оценить уверенность — посмотри совпадает ли

26

Защитная формулировка снимает блок на критику

79

"Что плохо в моей идее?" — модель смягчает. "Что нужно защитить от провала?" — та же информация, но режим другой. Модель думает, что помогает с защитой, а не атакует тебя. Блокировка "не расстраивать" не срабатывает. Применяй: заменяй любой прямой запрос на критику на "что здесь нужно защитить / что чаще всего губит такие проекты"

27

Оценка и аудитория — два независимых рычага стиля

79

«Кто оценивает» и «кто читает» — разные сигналы. Они влияют на РАЗНЫЕ параметры текста. Фрейм оценки экспертами богаче словарь, точнее формулировки. Фрейм пассивной аудитории длиннее текст, больше деталей. Эффекты не перекрываются. Применяй: Хочешь и то, и другое — пиши оба фрейма. Хочешь только объём — убери слово «оценивают», оставь «читают». Ограничение: Эффект на стиль и регистр. Не на логику и глубину рассуждений. Модель пишет формальнее — не умнее.

29

Модель оценивает сложность конкретного вопроса внутри домена, а не просто его метку

79

Когда задаёшь зону "смешанная" — модель не применяет одно поведение ко всем вопросам из неё. Она оценивает, насколько этот конкретный вопрос требует реальной экспертизы. Два вопроса про психологию могут дать совершенно разную реакцию: один — прямой ответ, другой — предупреждение. Это и сила, и ограничение: поведение в смешанной зоне непредсказуемо. Применяй: если нужна стабильность — переводи домен из смешанной в слабую. Теряешь удобство, получаешь предсказуемость

30

Контрастное сравнение вытаскивает паттерн ошибки лучше описания

79

Когда пишешь "модель ошибается вот здесь" — модель видит только один набор данных. Не понятно что именно триггерит ошибку. Когда даёшь рядом неверные И верные примеры — модель видит разницу. Именно разница и есть паттерн. Механика: контраст изолирует признак, который появляется только в ошибочных случаях и отсутствует в верных. Применяй: всегда клади оба набора в один запрос. Без верных примеров "для сравнения" — поиск паттерна работает хуже

33

Запись "почему" даёт модели право на мелкие решения без вопросов

79

Когда модель знает только ЧТО делать — при каждом спорном шаге останавливается и уточняет. Когда знает ПОЧЕМУ — применяет логику самостоятельно на похожих случаях. Механизм: явное обоснование работает как правило вывода, а не как инструкция на один раз. Применяй: вместо "используй короткие абзацы" пиши "используй короткие абзацы — потому что аудитория читает с мобильного". Модель применит этот принцип и там, где ты не предусмотрел

34

Хороший ответ≠твой ответ

79

Модель выдаёт структурно правильный результат даже когда не понимает твой специфический контекст. Форма заполнена верно. Содержание — чужое: взято из самого частого в обучении. Это не ошибка модели — это нормальное поведение. Применяй: если ответ выглядит "правильно, но не совсем то" — проверь какие измерения ты не указал явно

42

Больше данных не убирает домыслы — делает их убедительнее

78

Интуиция подсказывает: дай модели больше контекста — станет точнее. Не срабатывает. Модель строит более детальную историю, но она так же не подкреплена данными. Проблема не в объёме данных, а в отсутствии инструкции остановиться. Применяй: не трать время на сбор дополнительного контекста ради точности объяснений. Сначала поставь ограничение на домыслы

45

Персона переключает модель в режим "кто сказал"

78

Без персоны модель оценивает аргументы по содержанию. С персоной включается фильтр идентичности: "похожий" источник — сигнал доверия, "непохожий" — сигнал осторожности. Модель обучена на текстах людей. Люди так и работают. Модель воспроизводит этот паттерн. Следствие: один и тот же аргумент принимается по-разному в зависимости от того, чьим он назван. Применяй: Если модель играет роль и при этом сравнивает позиции — добавляй инструкцию про оценку только по логике. Без этого результат зависит от "похожести" источника, а не от качества аргумента

48

Сам сформулировал = запомнил прочнее

78

Знание, которое ты достал из головы сам — хранится в долгосрочной памяти дольше, чем то, что получил готовым. Это не метафора: механизм называется эффектом генерации. Мозг кодирует информацию глубже, когда сам её производит, а не потребляет. Применяй: вместо «объясни X» пиши «спроси меня про X и дай подсказку если застряну»

50

Разброс вариантов надёжнее описывает уверенность модели, чем её словесная самооценка

78

Когда просишь "насколько ты уверена?" — получаешь слова. Слова расплывчатые и несравнимые. Когда генерируешь 7 вариантов — видишь реальный разброс. Согласуются модель "знает". Расходятся не знает, просто не скажет об этом без дополнительного хода. Применяй: перед важным фактическим вопросом добавь генерацию 5–7 вариантов. Если они расходятся — доверяй меньше

Разблокируйте все концепты с PRO

Получите полный доступ ко всем тезисы и методам из научных исследований

Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO