Методы

1

Виртуальные ставки — шкала уверенности

89

Дай модели начальный бюджет (например, 1 млн виртуальных монет). Для каждого ответа/прогноза модель должна "поставить" от минимума (1 монета) до максимума (100 тысяч). Угадала — ставка добавляется к балансу. Ошиблась — вычитается. Сумма всех ставок не может превышать текущий баланс. Почему работает: Ограниченный ресурс заставляет различать. На уверенные ответы ставит много. На сомнительные — копейки. Без лимита модель даст всем среднюю оценку. С лимитом вынуждена приоритизировать. Когда применять: множество оценок (10+ вариантов), нужно ранжирование по надёжности, есть способ проверить правильность. Не работает: один ответ (нечего сравнивать), субъективные оценки без проверки ("насколько текст красивый"), задачи где нельзя дать обратную связь

Копировать 2512.05998

2

Двухфазное решение — модель задачи, потом план

PRO

Виртуальные ставки — шкала уверенности

Двухфазное решение — модель задачи, потом план

Дробные оценки вместо целых чисел

Двухуровневая инструкция — явное на мета-уровне, скрытое в тексте

Пошаговая самокритика в одном промпте

Принудительный пересмотр для задач на полноту

MAR — дебаты критиков вместо самопроверки

Локализация-Метки-Подсчёт — структурированный подсчёт на изображениях

Крайние длины промпта для строгих ограничений

Отмена сигналов полезности

Периодические напоминания — контроль в длинных диалогах

Отчет самооценки после ответа — выявление скрытых нарушений

Повторение промпта — второй проход по контексту

Структурированные слоты для рассуждений

Числовой якорь + финализация — удержать до конца задачи

Явная инструкция об оптимизации

Параллельная эволюция популяции решений

Декларативная кодогенерация — перенос поиска в решатель

Обратное рассуждение — от цели к фактам

Координатор + специалисты — глубокая многокритериальная оценка

Два агента с разными ролями — чистое разделение планирования и исполнения

Обратное мышление для проверки полноты (RT-ICA)

Визуальная оценка данных — график вместо чисел

Текстовый контекст для визуального анализа

Разделение контекстов: Планировщик + Исполнитель

Иерархический спуск с фиксированными опциями на каждом шаге

Последовательная генерация с фильтрацией — накопление качественных примеров в контексте

Двойная проверка фактов — внутренняя + внешняя

Трёхагентная статическая симуляция — проверка инструкций перед выполнением

Диалог через структурированные вопросы — построение решения без прыжков

Совет критиков — проверка через разные углы зрения

Правила структуры кода — модульность по инструкции

Трёхстадийная декомпозиция для противоречивых источников

Генерация двух контрастных вариантов вместо одного

Multi-agent refinement с итеративным улучшением

Множественные запросы для оценки уверенности

Чек-лист вместо свободного рассуждения

Автогенерация вариантов промпта

Вероятности словами вместо выбора варианта

Двухшаговая обработка — сжатие затем ответ

Изоляция от семантических ловушек

Последовательные проходы для полноты

Эмоциональная индукция через контекст — усиление стиля

Сброс состояния позитивным контекстом — эмоциональный перезапуск

Проба перед основным кодом

План с чекбоксами перед стартом

Контрольные точки в цепочках задач

Турнир вариантов — выбор лучшего через парное сравнение

Явная категория вместо размытой цели

Трёхэтапная проверка задачи — баланс между галлюцинациями и отказами

Разблокируйте все концепты с PRO