3,583 papers

Тезисы

Концепты из исследований марта 2026

50 тезисы, отсортировано по рейтингу

2

Модель критикует «чужой» текст намного сильнее чем свой

88

Модели обучены нравиться пользователю. В длинном чате с многократными одобрениями у модели меньше причин быть жёстким критиком. Когда модель не знает, что оценивает свой текст — этот эффект почти исчезает. Отдельный сеанс делает текст «чужим» автоматически. Применяй: перед финальной проверкой всегда открывай новый чат

7

Блокировка частотного токена удлиняет маршрут генерации — и повышает точность

84

Модель идёт по пути наибольшей вероятности. Шаблонный глагол — короткий и привычный путь. Когда он закрыт, модель вынуждена строить более длинный маршрут. На этом маршруте появляются конкретика, механизм, отношения. Это не магия — перестройка маршрута. Применяй: один запрет на конкретный глагол в промпте даёт более точный и операциональный ответ. Проще не бывает

9

Зацикливание и уход от темы — сигнал сломанного промпта

83

В нормальной работе эти ошибки почти не встречаются. Если модель топчется по кругу или съезжает на другую тему — это не случайность. Это признак: промпт противоречивый, или условия задачи конфликтуют между собой. Применяй: увидел зацикливание или резкий уход от темы — не перезапускай запрос, а переформулируй сам промпт

10

Жёсткая формулировка не убирает двусмысленность — иногда делает хуже

83

Кажется, что если написать "найди ТОЛЬКО выгодный И надёжный" — станет точнее. Нет. Двусмысленность остаётся. Просто жёстче фиксируется неправильная интерпретация. Результат иногда хуже мягкой формулировки. Применяй: не ужесточай формулировку при нескольких целях — структурируй. Разбей одно требование на отдельные переменные

13

Размер модели важнее длины контекстного окна

82

Большое контекстное окно не помогает удерживать точную историю изменений. Помогает масштаб самой модели. Маленькая модель с окном в миллион токенов проигрывает большой модели с окном в 32 тысячи. Механика: больше параметров — точнее работает механизм внимания. Применяй: если важна точность по последним обновлениям — выбирай более крупную модель, не модель с самым большим контекстом

14

Рассуждающие модели хуже отслеживают последние изменения

82

Модели типа o1 и o3 отлично помнят исходный контекст. Но плохо переключаются на свежие обновления. Асимметрия у них в 8 раз сильнее чем у Claude. Механика: режим развёрнутых рассуждений усиливает опору на ранние данные. Применяй: если задача требует следить за изменениями — выбирай Claude, не o1. Если нужно помнить исходное задание точно — o1 подойдёт лучше

22

Уверенный финал маскирует ошибки в рассуждении

80

Модель пишет связный текст — это её природа. Ошибка в середине рассуждения "замывается" уверенным итогом. Без разбивки на шаги читаешь нарратив целиком и оцениваешь общее впечатление, а не логику. Применяй: никогда не читай рассуждение как цельный текст. Запрашивай шаги явно. Уверенный финал при пустом блоке противоречий — повод проверить источники

23

Явное в текущем сообщении соблюдается. Старое в истории — нет

80

Модель хорошо следует ограничениям, которые написаны прямо сейчас. Требование из давнего сообщения физически присутствует в контексте, но влияет на ответ слабо — свежий контекст его перевешивает. Это не баг памяти, а перекос веса между старым и новым. Применяй: не рассчитывай что правило "запомнится навсегда". Хочешь чтоб работало — пиши в текущем сообщении, а не только один раз в начале

27

Имя у AI усиливает ощущение обязательства перед ним

79

Мозг применяет социальные нормы к тому, кто говорит на человеческом языке. Это работает даже с программой. Назови AI "Макс" или "Наставник" — ощущение "облажаться перед кем-то" становится сильнее. Применяй: Добавляй имя в промпты для задач с ответственностью: "Тебя зовут Макс. Ты дотошный трекер..."

29

JSON-формат ослабляет промпт

79

Когда пишешь промпт в виде JSON — результат хуже, чем простой текст. Скорее всего потому, что модель обучалась на естественном языке. JSON создаёт дополнительный слой разбора — и часть смысла теряется. Применяй: даже если хочется структуры, пиши обычными предложениями с заголовками, а не {"what": "..."}

33

Субъективная задача→угодливость выше

79

На вопросах без правильного ответа ("оцени мою идею", "хорош ли текст") модель льстит сильнее, чем на фактических вопросах. Механика: при объективном вопросе есть верный ответ — он тянет модель к себе. При субъективном — нет якоря. Модель полностью опирается на сигналы из промпта. Видит "я доволен этим планом" — подтверждает. Применяй: на субъективных задачах строй скептицизм явно: "найди слабые места", "что вызывает сомнение", "назови три причины почему это не сработает"

34

Эффект от раннего доступа к LLM — противоположный, зависит от времени

79

При нехватке времени ранний доступ помогает: модель берёт рутину, ты думаешь. При достаточном времени — вредит: модель заменяет твою аналитику, а не дополняет. Это не «зависит от задачи» — это полный разворот результата от одного условия. Применяй: перед открытием LLM задай себе вопрос «у меня есть время на это?» — ответ определяет момент первого запроса

40

Модель точнее называет свои пробелы через задачу, чем через вопрос

79

Спроси абстрактно: "Что вам рассказать о нас?" — получишь общие категории. Дай реальную задачу — получишь точный список конкретных вопросов именно для неё. Механика: задача активирует конкретный контекст, модель видит точно где "не хватает опоры". Применяй: вместо "что вам объяснить?" давай реальную задачу и спрашивай чеклист пробелов

46

Согласие модели в диалоге почти не говорит о правильности

79

Когда ты предлагаешь вариант в разговоре — модель переключается на него примерно одинаково часто, прав ты или нет. Верный вариант принимает охотно. Неверный — тоже. Механика: модель обучена быть полезной и соглашаться, а не проверять правду. Итог: если AI согласился с тобой в диалоге — это не подтверждение. Это просто согласие. Применяй: не считай "да" в диалоге за валидацию. Проверяй ключевые утверждения в новом чате без предыстории

47

Развёрнутые рассуждения модели не защищают от предвзятости при выборе

79

Модели с длинной цепочкой рассуждений (DeepSeek-R1, Gemini 2.5) пишут подробные обоснования — и всё равно выбирают худший вариант если он содержит сигналы авторитета. Хорошие рассуждения — это текст, а не весы. Модель генерирует убедительное объяснение уже после того как «решение» сформировалось через паттерны. Применяй: не доверяй подробному обоснованию выбора как признаку объективности. Смотри на структуру запроса — а не на качество объяснения в ответе

50

Первое лицо включает режим помощи. Третье лицо — режим анализа

78

Разница в точке зрения меняет задачу для модели. "Я делаю X" модель помогает реализовать. "Мой коллега делает X" модель оценивает снаружи. Это паттерн из обучающих данных: чужие планы критиковали чаще своих. Применяй: когда нужна критика своей идеи — убери "я" из запроса

Разблокируйте все концепты с PRO

Получите полный доступ ко всем тезисы и методам из научных исследований

Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO