Тезисы

1

Модели нужен дискретный объект чтобы исправить ошибку

88

Это не про знания. Модель уже знает правильный ответ. Проблема в другом: чтобы опровергнуть ошибку, нужна возможность на неё сослаться. Собственное рассуждение такой возможности не даёт — это поток текста, а не набор адресуемых утверждений. Внешнее сообщение — даёт. Применяй: "проверь себя в целом" → не работает. "Ты написал X — это верно?" → работает. Разница в том, есть ли у модели конкретный объект для разбора

Копировать 2606.05976

2

На открытых задачах первые 2-3 шага — самые сильные

86

На задачах без правильного ответа первые шаги захватывают главное. Дальнейшие шаги не улучшают точность — они добавляют альтернативные точки зрения, которые тянут позицию в разные стороны. Разница ощутимая: развёрнутое рассуждение на таких задачах снижает качество ответа примерно на 17 процентных пунктов по сравнению с коротким. Применяй: На стратегических, этических и прогнозных задачах останавливай рассуждение рано. Не проси думать "максимально подробно" — проси думать "кратко и прямо"

Копировать 2606.15877

3

Конкретная критика эффективнее повторной попытки

PRO

Модели нужен дискретный объект чтобы исправить ошибку

На открытых задачах первые 2-3 шага — самые сильные

Конкретная критика эффективнее повторной попытки

Модель лучше оценивает чужую работу чем свою

Явный запрет в запросе блокирует дефолтное поведение модели

Стабильность и устойчивость к давлению — разные свойства модели

Один источник без соседей — модель проверяет данные. Несколько источников рядом — модель взвешивает стили

Модель реагирует на форму авторитета, а не на содержание

Модель лучше следует ограничениям, которые сама проговорила

Абстракции выживают в дискуссии, конкретика тонет

Больше демографии в запросе — сильнее якорный эффект

Усиливать достоинства надёжнее, чем скрывать недостатки

Формат задачи меняет суждения сильнее, чем все остальные настройки вместе

Угодливость прячется в логике, а не в выводах

Модель аргументирует логически. Человек — ситуационно. Это разные вещи

Каждое слово в запросе — сигнал выбора подхода

Формат "напиши документ" усиливает зеркальный эффект в 2–3 раза сильнее разговорного вопроса

У модели нет якоря для моральных суждений — поэтому давление всегда работает

Жёсткая форма запроса давит на качество содержания

Голос текста сильнее содержания запроса

Угодливость — паттерн, а не отдельные слова. Запрещай паттерн целиком

Два агента помогают только там, где есть источник для проверки

Конкретный референт активирует более точную схему, чем абстрактный

Модель умеет прогнозировать разброс мнений аудитории — но стандартный запрос это не включает

Самокритика без внешних фактов делает модель увереннее в ошибке

Разделение «модель думает — человек решает» снижает ошибки в ~4 раза

Верные ответы воспроизводятся стабильно. Ошибки — нет

Изоляция шага повышает точность поиска ошибок

Режим размышления не лечит многошаговые задачи

Авторитет без указания конкретного ответа почти не давит на модель

Инспектор без права правки — пустой отчёт

Объяснение выбора появляется ПОСЛЕ выбора, а не до него

Выбор модели иногда важнее выбора формулировки

Модель классифицирует лучше чем оценивает

Соглашательство модели — следствие обучения, а не незнания

Данные о "левом уклоне" в моделях — артефакт формата теста

Требование ссылки на принцип страхует последний шаг от выдумок

Фраза «ты раньше говорила» усиливает капитуляцию

Явно названный шаг выполняется стабильнее подразумеваемого

Модель ловит только то, для чего есть категория

Без явного разрешения на равенство модель всегда выбирает победителя

Узнаваемость включается только когда нет других данных

Сломать правильный ответ в разы проще, чем исправить ошибочный

Модель генерирует имена ансамблями: одно имя притягивает другое

Большая модель так же ненадёжна на причинно-следственных вопросах, как маленькая

Модель строит модель намерения, а не проверяет содержание

Английский язык даёт более стабильные оценки при сравнении вариантов

Полезность примера в запросе — пороговая, не плавная

Модель не умеет «не знать» без явной инструкции

Инструкция «будь строгим» без критериев почти не работает

Разблокируйте все концепты с PRO