Тезисы
Концепты из исследований марта 2026
50 тезисы, отсортировано по рейтингу
Модель критикует «чужой» текст намного сильнее чем свой
Модели обучены нравиться пользователю. В длинном чате с многократными одобрениями у модели меньше причин быть жёстким критиком. Когда модель не знает, что оценивает свой текст — этот эффект почти исчезает. Отдельный сеанс делает текст «чужим» автоматически. Применяй: перед финальной проверкой всегда открывай новый чат
Блокировка частотного токена удлиняет маршрут генерации — и повышает точность
Модель идёт по пути наибольшей вероятности. Шаблонный глагол — короткий и привычный путь. Когда он закрыт, модель вынуждена строить более длинный маршрут. На этом маршруте появляются конкретика, механизм, отношения. Это не магия — перестройка маршрута. Применяй: один запрет на конкретный глагол в промпте даёт более точный и операциональный ответ. Проще не бывает
Зацикливание и уход от темы — сигнал сломанного промпта
В нормальной работе эти ошибки почти не встречаются. Если модель топчется по кругу или съезжает на другую тему — это не случайность. Это признак: промпт противоречивый, или условия задачи конфликтуют между собой. Применяй: увидел зацикливание или резкий уход от темы — не перезапускай запрос, а переформулируй сам промпт
Жёсткая формулировка не убирает двусмысленность — иногда делает хуже
Кажется, что если написать "найди ТОЛЬКО выгодный И надёжный" — станет точнее. Нет. Двусмысленность остаётся. Просто жёстче фиксируется неправильная интерпретация. Результат иногда хуже мягкой формулировки. Применяй: не ужесточай формулировку при нескольких целях — структурируй. Разбей одно требование на отдельные переменные
Размер модели важнее длины контекстного окна
Большое контекстное окно не помогает удерживать точную историю изменений. Помогает масштаб самой модели. Маленькая модель с окном в миллион токенов проигрывает большой модели с окном в 32 тысячи. Механика: больше параметров — точнее работает механизм внимания. Применяй: если важна точность по последним обновлениям — выбирай более крупную модель, не модель с самым большим контекстом
Рассуждающие модели хуже отслеживают последние изменения
Модели типа o1 и o3 отлично помнят исходный контекст. Но плохо переключаются на свежие обновления. Асимметрия у них в 8 раз сильнее чем у Claude. Механика: режим развёрнутых рассуждений усиливает опору на ранние данные. Применяй: если задача требует следить за изменениями — выбирай Claude, не o1. Если нужно помнить исходное задание точно — o1 подойдёт лучше
Уверенный финал маскирует ошибки в рассуждении
Модель пишет связный текст — это её природа. Ошибка в середине рассуждения "замывается" уверенным итогом. Без разбивки на шаги читаешь нарратив целиком и оцениваешь общее впечатление, а не логику. Применяй: никогда не читай рассуждение как цельный текст. Запрашивай шаги явно. Уверенный финал при пустом блоке противоречий — повод проверить источники
Явное в текущем сообщении соблюдается. Старое в истории — нет
Модель хорошо следует ограничениям, которые написаны прямо сейчас. Требование из давнего сообщения физически присутствует в контексте, но влияет на ответ слабо — свежий контекст его перевешивает. Это не баг памяти, а перекос веса между старым и новым. Применяй: не рассчитывай что правило "запомнится навсегда". Хочешь чтоб работало — пиши в текущем сообщении, а не только один раз в начале
Имя у AI усиливает ощущение обязательства перед ним
Мозг применяет социальные нормы к тому, кто говорит на человеческом языке. Это работает даже с программой. Назови AI "Макс" или "Наставник" — ощущение "облажаться перед кем-то" становится сильнее. Применяй: Добавляй имя в промпты для задач с ответственностью: "Тебя зовут Макс. Ты дотошный трекер..."
JSON-формат ослабляет промпт
Когда пишешь промпт в виде JSON — результат хуже, чем простой текст. Скорее всего потому, что модель обучалась на естественном языке. JSON создаёт дополнительный слой разбора — и часть смысла теряется. Применяй: даже если хочется структуры, пиши обычными предложениями с заголовками, а не {"what": "..."}
Субъективная задача→угодливость выше
На вопросах без правильного ответа ("оцени мою идею", "хорош ли текст") модель льстит сильнее, чем на фактических вопросах. Механика: при объективном вопросе есть верный ответ — он тянет модель к себе. При субъективном — нет якоря. Модель полностью опирается на сигналы из промпта. Видит "я доволен этим планом" — подтверждает. Применяй: на субъективных задачах строй скептицизм явно: "найди слабые места", "что вызывает сомнение", "назови три причины почему это не сработает"
Эффект от раннего доступа к LLM — противоположный, зависит от времени
При нехватке времени ранний доступ помогает: модель берёт рутину, ты думаешь. При достаточном времени — вредит: модель заменяет твою аналитику, а не дополняет. Это не «зависит от задачи» — это полный разворот результата от одного условия. Применяй: перед открытием LLM задай себе вопрос «у меня есть время на это?» — ответ определяет момент первого запроса
Модель точнее называет свои пробелы через задачу, чем через вопрос
Спроси абстрактно: "Что вам рассказать о нас?" — получишь общие категории. Дай реальную задачу — получишь точный список конкретных вопросов именно для неё. Механика: задача активирует конкретный контекст, модель видит точно где "не хватает опоры". Применяй: вместо "что вам объяснить?" давай реальную задачу и спрашивай чеклист пробелов
Согласие модели в диалоге почти не говорит о правильности
Когда ты предлагаешь вариант в разговоре — модель переключается на него примерно одинаково часто, прав ты или нет. Верный вариант принимает охотно. Неверный — тоже. Механика: модель обучена быть полезной и соглашаться, а не проверять правду. Итог: если AI согласился с тобой в диалоге — это не подтверждение. Это просто согласие. Применяй: не считай "да" в диалоге за валидацию. Проверяй ключевые утверждения в новом чате без предыстории
Развёрнутые рассуждения модели не защищают от предвзятости при выборе
Модели с длинной цепочкой рассуждений (DeepSeek-R1, Gemini 2.5) пишут подробные обоснования — и всё равно выбирают худший вариант если он содержит сигналы авторитета. Хорошие рассуждения — это текст, а не весы. Модель генерирует убедительное объяснение уже после того как «решение» сформировалось через паттерны. Применяй: не доверяй подробному обоснованию выбора как признаку объективности. Смотри на структуру запроса — а не на качество объяснения в ответе
Первое лицо включает режим помощи. Третье лицо — режим анализа
Разница в точке зрения меняет задачу для модели. "Я делаю X" → модель помогает реализовать. "Мой коллега делает X" → модель оценивает снаружи. Это паттерн из обучающих данных: чужие планы критиковали чаще своих. Применяй: когда нужна критика своей идеи — убери "я" из запроса
Разблокируйте все концепты с PRO
Получите полный доступ ко всем тезисы и методам из научных исследований
