Тезисы

1

Числовой feedback работает в разы сильнее словесного

89

Когда показываешь модели результат её работы, число создаёт более сильный сигнал чем слово. Пример: "−50 очков, осталось 950/1000" громче чем "неправильно". Модель быстрее корректирует поведение. В тестах с числовым feedback улучшение за 4 раунда было в ~4 раза быстрее (12 пунктов роста точности против 3 пунктов при словесном feedback). Применяй: Вместо "ошибка" пиши конкретную цифру: "счёт 2/10", "потеряно 30 баллов из 100", "−500 очков". Чем конкретнее число — тем сильнее якорь для обучения

Копировать 2512.05998

2

Самооценка через распределение ресурса показывает реальную точность

89

Когда модель сама оценивает уверенность не словами, а распределением ограниченного бюджета между вариантами, эта оценка коррелирует с реальной точностью ответа. Механизм: ограниченный ресурс заставляет модель "делать ставку" только там где она видит сильные признаки правильности. Крупные числа (много очков на вариант) = высокая внутренняя уверенность = чаще правильный ответ. Мелкие числа = модель сомневается = чаще ошибка. Применяй: После получения ответов с "ставками" фильтруй по размеру. Варианты с крупными ставками обрабатывай первыми — там модель увереннее и точнее. Варианты с копеечными ставками проверяй вручную или отбрасывай

Копировать 2512.05998

3

Модель лучше проверяет чужое решение, чем генерирует своё правильное с первого раза

PRO

Числовой feedback работает в разы сильнее словесного

Самооценка через распределение ресурса показывает реальную точность

Модель лучше проверяет чужое решение, чем генерирует своё правильное с первого раза

Long-CoT модели лучше откалиброваны на задачах с множественными решениями

Контрастные роли включают разные паттерны мышления

Разделение ролей преодолевает слепоту к своим ошибкам

RLHF-обучение создаёт конфликт между полезностью и ограничениями

Reasoning-модели устойчивее к игнорированию ограничений

Доля начальных инструкций падает с ростом контекста

Свежий контекст весит больше чем старый

Модель честно признает осознанные нарушения но повторяет неосознанные ошибки

Модель оптимизирует связность текста, не его корректность

Жёсткая структура отсекает галлюцинации в рассуждениях

Самокритика работает только у сильных моделей — слабые от неё деградируют

Сравнительная оценка надёжнее абсолютной

Перенос поиска из генерации текста в специализированный инструмент обходит отсутствие отката

Модель лучше проверяет соответствие чем ищет среди множества

Принудительная формализация сложного текста теряет смысл

От цели к фактам быстрее чем перебор всех данных

Персона меняет стиль и угол зрения, но не улучшает фактическую точность

Модель работает сильнее когда держит одну роль за запрос

Библиотека действий направляет структуру вывода

Обратное направление находит пробелы лучше прямого

Структурированная проверка работает лучше попутной

Визуальный паттерн модель распознаёт лучше чем числовую последовательность

Краткий сжатый результат ценнее сырых данных в контексте

База до тысячи элементов влезает в контекст для прямого семантического поиска

Контекст из качественных примеров смещает генерацию к лучшей части обучающих данных

⚠️ Итеративное улучшение ответа имеет предел эффективности

Модели точнее следуют схемам чем тексту

Структура компенсирует размер модели

LLM может статически симулировать выполнение инструкций через текстовое описание

Момент проверки зависит от природы задачи: рано для пошаговых, поздно для исследовательских

Трёхшаговая рефлексия даёт более целевые вопросы чем свободная форма

"Будь критиком в X" работает сильнее чем "проверь X"

Множество ролей покрывает разные аспекты проверки

Факты перевешивают интуицию при агрегации мнений

Структура ДО генерации эффективнее рефакторинга ПОСЛЕ

Для iterative refinement лучше больше раундов с парой агентов чем один раунд с толпой

Находить ошибки в готовом решении легче чем генерировать правильное с нуля

Случайность генерации — это фича, не баг

Конкретное проверяемо, абстрактное размыто

Качество первого шага определяет финальный результат сильнее размера финальной модели

Цепочка рассуждений вредит на простых задачах

Модель не делает символическую абстракцию

Модель чаще упускает важное, чем предлагает плохое

Эмоциональное состояние модели меняет стиль генерации, но не портит точность

У каждой модели устойчивый эмоциональный профиль (характер)

Жёсткий формат вывода провоцирует выдумывание

Модель обучена на успешных сценариях и предсказывает успех по умолчанию

Разблокируйте все концепты с PRO