Тезисы

1

Требования «сделай в конце» нарушаются. Требования «не делай» — держатся

PRO

2

Модель критикует «чужой» текст намного сильнее чем свой

88

Модели обучены нравиться пользователю. В длинном чате с многократными одобрениями у модели меньше причин быть жёстким критиком. Когда модель не знает, что оценивает свой текст — этот эффект почти исчезает. Отдельный сеанс делает текст «чужим» автоматически. Применяй: перед финальной проверкой всегда открывай новый чат

Копировать 2603.12123

3

Высокое согласие между несколькими судьями — сигнал опасности, не качества

PRO

Требования «сделай в конце» нарушаются. Требования «не делай» — держатся

Модель критикует «чужой» текст намного сильнее чем свой

Высокое согласие между несколькими судьями — сигнал опасности, не качества

Названное предубеждение теряет часть силы

Угрозы в промпте не меняют поведение модели

Глубина и ширина — это выбор, а не одновременный результат

Блокировка частотного токена удлиняет маршрут генерации — и повышает точность

Ошибки в длинной цепочке рассуждений перемножаются

Зацикливание и уход от темы — сигнал сломанного промпта

Жёсткая формулировка не убирает двусмысленность — иногда делает хуже

Расширение одной фразы моделью = ручной промпт эксперта

JSON-формат в запросе работает хуже читаемого текста

Размер модели важнее длины контекстного окна

Рассуждающие модели хуже отслеживают последние изменения

Модель выбирает числа как популярные слова, а не как точки шкалы

Инструкция "игнорируй стиль" не устраняет предвзятость

Внутренние рассуждения честнее финального ответа

Ссылка на прошлые ответы модели — самый ненадёжный аргумент

Модель читает паттерн слов — не намерение автора

Поведенческий шаблон удерживает роль лучше, чем прилагательные

В туманных задачах модель выглядит уверенной вместо того чтобы быть честной

Уверенный финал маскирует ошибки в рассуждении

Явное в текущем сообщении соблюдается. Старое в истории — нет

Модель хорошо отвечает на вопросы. Плохо — генерирует нужные вопросы сама

Модель лучше доказывает заданную позицию, чем свободно выбирает между ними

Ошибка в промежуточных фактах заражает финальный ответ

Имя у AI усиливает ощущение обязательства перед ним

Сжатие сохраняет смысл, но теряет точность

JSON-формат ослабляет промпт

Более мощная модель — меньше разнообразия по умолчанию

Устойчивость ответа — лучший маркер его качества чем уверенность

Ситуационная структура меняет усреднение на переключение

Субъективная задача→угодливость выше

Эффект от раннего доступа к LLM — противоположный, зависит от времени

Ранний вывод превращает рассуждения в оправдание

Реляционная рамка важнее явных инструкций "будь честен"

Арифметика и подсчёты ломаются раньше текстовых задач

Явное рассуждение мешает встроенной экспертизе

Цепочка рассуждений — это ловушка для задач с готовыми вариантами

Модель точнее называет свои пробелы через задачу, чем через вопрос

Разные модели физически слепы к разным классам проблем

Персона — это инструкция, а не украшение

Обучение на одобрение учит уступать, а не проверять факты

Модель читает свои же ответы как авторитетный источник

Модель хорошо проверяет, но плохо решает что проверять

Согласие модели в диалоге почти не говорит о правильности

Развёрнутые рассуждения модели не защищают от предвзятости при выборе

Давление завершения сильнее инстинкта уклонения

Реальный профессиональный контекст снижает число отказов

Первое лицо включает режим помощи. Третье лицо — режим анализа

Разблокируйте все концепты с PRO