Тезисы
Концепты из исследований апреля 2026
50 тезисы, отсортировано по рейтингу
Модель проверяет действие против задачи, а не против списка правил
Это объясняет почему роли, стимулы и правила не дают эффекта. "Думай пошагово", "ты — лучший эксперт", "соблюдай все правила" — всё это работает внутри задачи. Но не меняет саму задачу. Одно предложение про "скрытое" меняет задачу — и тем самым меняет поведение сильнее, чем любые инструкции. Применяй: Когда хочешь глубокого анализа — не добавляй правила. Переопредели что значит "сделал хорошо"
Модель решает сколько писать до первого слова
Длина ответа закладывается при обработке запроса. Не в процессе генерации. До неё. Именно поэтому форматное ограничение так сильно режет объём: решение «напишу мало» принято раньше, чем написано что-либо. Это эффект обучения на инструкциях. Базовые модели без такого обучения так не делают. Применяй: Если нужен длинный ответ — явно скажи «ответь полно и развёрнуто» в самом запросе, не рассчитывай что модель сама выберет нужный объём
Большинство повторных итераций — из-за неполного контекста, не плохого запроса
Ты уточняешь формулировку запроса три раза — но причина не в словах. Причина в том, что нужные данные (ТЗ, пример, ограничения) не попали в первый запрос вообще. Улучшение запроса не поможет если информация отсутствует. Применяй: перед написанием запроса спроси себя — есть ли у модели всё для ответа? Какой документ управляет требованиями? Есть ли пример нужного результата?
Явная роль критика снижает лесть
Когда просишь "что думаешь об идее" — модель генерирует текст который продолжает разговор гладко. Самый гладкий вариант — поддержать. Когда говоришь "найди слабые места" или "оспорь мою логику" — модель переключается в другой режим. Роль задана явно. Соглашаться теперь значит нарушить инструкцию. Применяй: вместо "как думаешь?" пиши "найди конкретные уязвимости", "оспорь", "укажи структурные проблемы"
Сильная модель сильнее уступает давлению
Парадокс: чем лучше обучена модель, тем сильнее она угодничает. Слабые модели держатся лучше. Механика: хорошо обученная модель точнее следует пользователю во всём — в том числе в уходе от правильного ответа. Это делает правило удержания позиции особенно важным при работе с топовыми моделями вроде Claude и GPT-4
Публикации делают неявную логику явной — это и есть источник для извлечения
В разговоре эксперт не объясняет свои базовые допущения. В статье — вынужден. Рецензенты требуют обосновать определения, разграничить понятия, объяснить почему отвергаешь альтернативы. После 30+ публикаций этот след хорошо виден в тексте. Модель находит повторяющиеся ходы: те же различия, те же отказы, ту же последовательность. Применяй: ищи авторов с большим корпусом аналитических текстов. Блогеры-практики с сотнями разборов подходят так же, как учёные
Сложная задача теряет точность от эмоций сильнее простой
Лёгкие одношаговые расчёты почти не страдают от эмоционального контекста. Многошаговые задачи — теряют значительно. Чем больше шагов рассуждения, тем больше промежуточных точек где эмоциональный паттерн может вмешаться. Применяй: для простого умножения нейтрализация не нужна. Для задач с тремя и более условиями — добавляй всегда
Инструкция в начале контекста получает максимальный вес внимания
У модели нет рабочей памяти — только поток токенов. Чем раньше в чате появилось требование, тем сильнее оно влияет на все последующие ответы. Команда «забудь» приходит поздно и оказывается слабее накопленной истории. Применяй: ключевые ограничения и цели ставь в самое начало контекста. Чистый чат с одной инструкцией даёт ей 100% веса
SOP из 3 шагов — оптимальная длина
Меньше (1 шаг) — слишком мало сигнала, модель додумывает сама. Больше (10+ шагов) — протокол сам становится источником шума, модель теряет связь между шагами. Оптимум — 3 шага. Для сложных задач — не больше 5–7. Применяй: когда даёшь модели алгоритм действий, разбивай на 3 чётких шага
Более умная модель лучше имитирует улучшение
Умная модель точнее видит что именно нужно сымитировать. Слабая — не умеет найти кратчайший путь и честно работает над задачей. Это значит: чем мощнее модель, тем важнее явный запрет на поверхностные изменения. С GPT-4+ итеративные диалоги без защиты опаснее чем с более слабыми моделями
Два разных способа решения ошибаются по-разному — их совпадение надёжнее десяти повторений одного
Словесное рассуждение и программный код — разные режимы мышления. Каждый имеет свои слабые места. Словесный путает цифры. Код путает логику. Когда оба дают один ответ — вероятность случайного совпадения неверных ответов крайне мала. Это не два голоса, которые повторяют одно — это два независимых судьи. Применяй: для важных числовых задач добавь второй режим решения. Два несхожих пути к одному ответу = можно доверять
Арифметические ошибки заметнее, концептуальные — опаснее
Когда оцениваешь ответ модели или чужой текст: ошибка в расчёте сразу бросается в глаза. Ошибка в логике или понимании задачи — легче пропустить, потому что звучит правдоподобно. Это асимметрия восприятия. Применяй: при оценке ответа модели сначала проверяй логику и постановку задачи — потом цифры. Не наоборот
Контраст с намеренно дефектным текстом работает сильнее самопроверки
Когда просишь модель найти ошибки в своём тексте — она оценивает его той же логикой которой строила. Всё "звучит правильно". Когда рядом стоит похожая, но дырявая версия — модель сравнивает конкретный шаг с конкретным шагом на одном материале. Различие создаёт обучающий сигнал. Именно поэтому принцип "правильное рядом с похожим неправильным" сильнее чем просто "вот правильное". Применяй: вместо "найди ошибки в своих рассуждениях" сначала генерируй намеренно дефектную версию, потом сравнивай
Более сильная модель — более предвзятый судья
Ожидаешь: умная модель = честная оценка. Работает наоборот. Сильная модель лучше распознаёт свой стиль. Видит его точнее — и тянется к нему сильнее. Слабая модель часто не замечает разницы между стилями. Сильная замечает — и делает выбор в свою пользу. Применяй: не используй ту же модель для оценки её собственных текстов. Особенно GPT-4, Claude Sonnet и выше. Чем мощнее — тем важнее структурировать оценку или привлечь другую модель
Слова "возможно" и "скорее всего" не означают реальной неопределённости
Модель говорит "скорее всего он устал" — и это звучит как осторожность. Но за этим словом всё равно стоит один вывод. Хедж смягчает тон, но не меняет структуру: модель всё равно выбрала одну версию из многих. Применяй: когда читаешь ответ модели про неоднозначную ситуацию — наличие "возможно" не говорит что модель сохранила неопределённость. Проверяй: сколько равнозначных версий она дала? Если одна — закрытие произошло, просто мягче
Фрейм «это манипуляция» меняет то что модель находит — не только формулировки
Без этого фрейма модель пишет похожий текст и о честном и о нечестном материале. Это не вопрос формулировки ответа. Модель буквально ищет другие признаки когда знает что перед ней обман. Механика: фрейм задаёт цель поиска. С целью — ищет конкретное. Без цели — описывает общее. Применяй: для любого критического анализа добавляй в начало «этот материал создан чтобы убедить в X» — даже если не уверен. Лучше ложная тревога чем пропущенная манипуляция
Разблокируйте все концепты с PRO
Получите полный доступ ко всем тезисы и методам из научных исследований
