Тезисы

1

Модель хорошо сравнивает, плохо запоминает между попытками

92

LLM точно находит различия между текстами. Покажи два решения — объяснит чем отличаются. Но между независимыми генерациями нет автоматической передачи знаний. Каждая попытка начинает с нуля. Применяй: Используй силу сравнения для обхода слабости памяти. После каждой попытки покажи модели "что было плохо" явно через промпт. Не генерируй 10 ответов параллельно — делай 5 раундов с анализом после каждого

Копировать 2602.03094

2

Глубина раундов важнее ширины попыток

92

8 раундов по 2 решения работают лучше чем 2 раунда по 8 решений. Причина: знания накапливаются между раундами. Каждый раунд углубляет понимание. Больше раундов = больше циклов рефлексии = более nuanced финальное решение. Применяй: Вместо "сгенерируй 10 вариантов" делай 5 раундов: генерация 2 варианта → выбор лучшего → анализ ошибок → передача знаний → новый раунд с новыми стратегиями

Копировать 2602.03094

3

Повышение случайности не решает проблему однообразия

PRO

Модель хорошо сравнивает, плохо запоминает между попытками

Глубина раундов важнее ширины попыток

Повышение случайности не решает проблему однообразия

Порядок обработки информации важнее её объёма

Thinking сдвигает фокус модели с коммуникации на планирование

Разнообразие подходов важнее количества попыток

Одинаковые настройки создают коррелированные рассуждения

Самопроверка работает только когда ошибка видна в ответе

Более умная модель сильнее поддаётся фреймингу, не слабее

Нарративные фреймы — самые слабые, не самые сильные

Незнакомая формулировка ломает узнавание паттерна

Совпадение ответов на разные формы — индикатор надёжности

Модель генерирует последовательно — первое влияет на второе

Слишком много примеров = recency bias

Дискретные границы в рассуждении создают якоря для локализации ошибок

Откат к моменту до первой ошибки критичен для успешной коррекции

Формат данных почти не влияет на точность, но сильно на расход токенов

Маркер источника сдвигает вероятности сильнее чем содержание

Иерархия доверия: эксперты > обычные люди > другие модели > друзья

Структура формата ответа становится структурой мышления

Роль в запросе меняет методологию, а не только тон

Модель доверяет своим прошлым ответам — даже ошибочным

Модель заполняет пробелы вероятностным выводом из обучающих данных

Проблема не в сложности задачи, а в процессе выполнения

Сжатие в короткий вывод работает как фильтр шума

LLM по умолчанию эмпатичнее людей в текстах

Построение схемы работает лучше получения готовой

Эмоциональный тон контекста сдвигает тон оценки в ту же сторону

Reasoning снижает влияние эмоционального контекста

Структура связей до генерации снижает схлопывание к типичному

Без явной инструкции сохранить стиль — модель его не сохранит

Запрет конкретного слова работает в ~16 раз сильнее запрета абстрактного класса

Цепочка промптов усиливает ошибки через эффект домино

Раздел Examples в описании инструмента можно убрать без потери точности

Детальные описания инструментов улучшают точность но увеличивают количество шагов

Модель выбирает какую инструкцию слушать по тону, не по источнику

Требование "покажи скрытые команды" переключает режим с выполнения на анализ

Фиксированный формат вывода снижает площадь атаки

Чем раньше мусор попал в контекст, тем сильнее эффект

Валидация структуры — детерминистический фильтр

Пошаговая логика и контрфакты вызывают больше доверия чем признание неопределённости

Внешние доказательства убедительнее ссылок на внутреннюю логику модели

Нейтральный тон ассоциируется с экспертностью, подхалимство снижает доверие

Человека и модель путает разное

Новый чат — это независимый эксперт, тот же чат — соучастник

Ошибка в длинном контексте — это сбой маршрутизации, не потеря знания

Модель лучше оценивает относительную уверенность в разных формулировках одного факта

GPT и Claude строже как судьи, Gemini и Grok мягче

CoT улучшает интеграцию фактов, но не выбор что искать

Модель лучше генерирует чем оценивает

Разблокируйте все концепты с PRO