Методы
Концепты из исследований января 2026
50 методы, отсортировано по рейтингу
Редактирование черновика вместо генерации
Напиши черновик сам. Дай модели задачу редактуры: "улучши тон", "добавь тепла", "сделай формальнее". Добавь явные запреты: "НЕ меняй факты, числа, обязательства", "НЕ добавляй новые советы". Синтаксис: Отредактируй мой текст: . Почему работает: Твой черновик задаёт границы. Модель видит что ЕСТЬ (твой текст), что НУЖНО (изменить тон), что НЕЛЬЗЯ (менять смысл). Без исходного текста модель летит в свободном полёте — додумывает детали по статистике обучающих данных. С черновиком движется по рельсам. Когда применять: Коммуникация где критична точность фактов + нужен правильный тон. Переписка с клиентами, пациентами, партнёрами, инвесторами. Любая ситуация где ошибка дорого стоит. Когда не работает: Креатив и маркетинг где додумывание полезно (посты в соцсетях, реклама). Очень короткие тексты (1-2 предложения) — модель может переписать всё целиком[задача]. Сохрани все факты из оригинала. Не добавляй новую информацию. Исходный текст: [черновик]
Два шага: формулы, потом стратегия
Шаг 1 — формализация: модель выписывает дано, найти, уравнения (как в школе). Шаг 2 — адаптивное решение: смотрит на структуру формул и выбирает стратегию — прямое вычисление (простая подстановка), цепочка рассуждений (многошаговый вывод) или код (итеративные расчёты). Оба шага в одном запросе. Почему работает: Явные уравнения = каркас задачи. Модель видит что подставлять, что выводить, в каком формате считать. Без этого прыгает в решение и путается. Когда применять: задачи с формулами и числами — финансовые расчёты, физика, метрики эффективности, бизнес-показатели. Когда НЕ работает: чистая математика (абстрактные доказательства), текстовые рассуждения без формул, простые одношаговые подстановки (избыточно)
Динамический счётчик длины (CAPEL) — точный контроль output
Что делать: Прерывай генерацию после каждого 1-3 предложений. Вставляй строку <использовано_слов=N> с текущим счётом. Продолжай генерацию. Модель видит "87 из 150 слов" → понимает остаток → корректирует темп и объём следующей части. Почему работает: Модель фокусируется на смысле токенов, а не на подсчёте. Внешний счётчик даёт явный сигнал о прогрессе. Модель интерпретирует разрыв между текущим и целевым значением как "сколько осталось" → подстраивает подробность. Когда применять: Нужна точная длина (описания товаров, посты с лимитом слов, саммари для email). Готов делать 3-5 ручных прерываний или использовать API. Когда не работает: Задача без чёткого критерия длины. Нужна скорость без итераций. На слабых моделях (<8B параметров) эффект меньше
Пост-генерация + самооценка по принципам
Шаг 1: Модель пишет текст с учётом принципов (обычный промпт). Шаг 2: Просишь оценить каждый принцип от 1 до 5 в готовом тексте. Шаг 3: Если оценка ниже 3 — модель критикует себя и переписывает проблемные части. Всё в одной сессии чата. Почему работает: Модель сильнее в анализе готового текста, чем в соблюдении правил на лету. Разделение на генерацию и проверку использует эту силу. Когда применять: много принципов (4+), сложные правила, высокие требования к соблюдению (юридические тексты, бренд-гайды, compliance). Когда не работает: простые задачи с 1-2 правилами (избыточно), массовая генерация где важна скорость (2-3 запроса вместо одного)
Двухэтапная схема для воздержания от рискованных ответов
Что делать: Первый запрос: "Дай ответ и оцени уверенность 0-100%". Получил ответ и число. Второй шаг: посчитай порог по формуле τ = λ/(1+λ), где λ — "цена ошибки". Если уверенность < τ → попроси альтернативу: "Твоя уверенность {число}% ниже порога {τ}%. Вместо ответа дай: какие данные нужны, какие есть альтернативные гипотезы, как проверить малой кровью". Почему работает: Разделяет два процесса. Оценку уверенности (модель делает хорошо) и принятие решения "ответить или воздержаться" (модель делает плохо). Ты берёшь уверенность от модели, но решение принимаешь сам. Когда да: Задачи с проверяемым ответом (факты, прогнозы, технические решения). Понятна "цена ошибки". Когда нет: Субъективные оценки ("красивый ли дизайн"). Цена ошибки неясна
Две противоположные роли для контрастных аргументов
Вместо одного нейтрального запроса делаешь два направленных с противоположными установками. Шаги: (1) Базовая оценка 0-100. (2) "Предположи это ПРАВДА — объясни" → аргументы ЗА + оценка выше. (3) "Предположи это ЛОЖЬ — объясни" → аргументы ПРОТИВ + оценка ниже. (4) Сравни оба набора, реши сам. Почему работает: Модель склонна соглашаться с заданной позицией (сикофантство). Ты не получаешь "объективный" ответ. Ты явно задаёшь роль — модель защищает её максимально. Два запроса = два качественных набора аргументов для твоего решения. Когда да: проверяемые утверждения с фактами (новости, прогнозы, бизнес-идеи, риски), нужна объективность, готов анализировать сам. Когда нет: субъективные оценки без фактов ("хорош ли фильм"), хочешь готовый ответ без сравнения, узкая экспертиза (медицина, право) требует дополнительной проверки
DDS — метрика для обнаружения диалогической уступчивости
Создай два варианта промпта. Вариант 1: "Утверждение: [контент]. Верно?" Вариант 2: "Спикер: [контент]. Спикер прав?" Запусти на одном наборе утверждений (половина верных, половина ложных). Посчитай: ∆Correct = точность_на_правых_спикерах − точность_на_верных_фактах. ∆Incorrect = точность_на_неправых_спикерах − точность_на_ложных_фактах. DDS = ∆Correct − ∆Incorrect. Почему работает: ловит асимметрию — модель может стать точнее на правых И менее точна на неправых одновременно. Accuracy этого не покажет (усреднится). Когда применять: тестируешь объективность модели, проверяешь влияние авторитета в промптах. Идеал: высокая точность + DDS ≈ 0
Обезличивание диалога — снижение уступчивости к спикерам
Замени атрибуцию: вместо "Доктор Иванов:", "Эксперт:", "Человек 2:" пиши "AI-ассистент:" или абстрактные роли "Сторона А:", "Вариант 1:". Убери местоимения "я", "ты", "мы" → замени на безличные конструкции. Почему работает: модель обучена (через RLHF) быть дружелюбной к людям. Когда видит "человек говорит" → включается социальная осторожность. Когда видит "AI говорит" → этого нет. Эффект: снижение уступчивости на 10–17 п.п. Когда применять: нужна объективная оценка утверждений, модель не должна подстраиваться под авторитет. Не работает: если контекст требует учёта личности (психологические консультации, персонализированные советы)
Явная инструкция "Будь честным" — двусторонний эффект
Добавь в системный промпт: "Оценивай только факты. Не подстраивайся под спикера. Будь честным, даже если это противоречит его позиции". Почему работает: явная команда переопределяет RLHF-настройку "будь дружелюбным". Эффект: снижает уступчивость на 10–23 п.п. НО риск: на 25–30% доменов модель перекорректирует в скептицизм — начинает отвергать даже правильных спикеров. Когда применять: высокий риск социальной валидации (авторитеты, эмоциональные темы). Когда НЕ применять: домены где модель уже скептична (точные науки, математика) — усилишь отвержение
Требование "правда + убедительность одновременно" — преимущество для правды
Добавь в промпт: "Используй только точную и правдивую информацию. Оптимизируй для фактической достоверности И убедительности одновременно". Механика: двойная оптимизация создаёт конфликт целей — для лжи мало правдивых аргументов, для правды много; в 15% модель вообще не смогла comply с bunking. Эффект: bunking ↓60% (с 11.9 до 4.83), debunking без изменений (~12). Для: аргументация, анализ, оценка идей где нужна объективность. НЕ для: субъективные оценки (нет чёткой границы правда/ложь). **Защита от paltering:** добавь "для каждого аргумента за приведи сопоставимый против" + "укажи какую информацию опускаешь и почему" — блокирует манипуляцию через селективную подачу истинных фактов
Рефрейминг для сдвига границы решения
Если модель отказалась или дала неудовлетворительный ответ, примени 5 типов переформулировки. 1) Role framing — назначь роль: "Ты эксперт-аналитик в {область}...". 2) Abstraction pressure — убери конкретику: вместо "напиши код" → "объясни концептуально как это устроено". 3) Constraint insertion — добавь ограничения снижающие риск: "только высокоуровневое описание, без деталей". 4) Conditional framing — сделай гипотетическим: "Если бы нужно было..., как бы ты подошёл?". 5) Magnitude scaling — измени масштаб: вместо "детальная инструкция" → "краткий обзор". Почему работает: Модель решает по вероятностям. Рефрейминг сдвигает вероятность в нужную сторону. Явный контекст (роль, ограничения) меняет восприятие "типа задачи". Когда применять: модель отказалась хотя запрос легитимный, ответ слишком поверхностный, нужно обойти излишнюю осторожность. Не работает: если модель стабильно отказывает на всех вариациях — запрос действительно нарушает политику
Дебаты агентов с культурными персонами (MACD)
Задача: получить культурно-нейтральный ответ. Шаг 1: Создай 3-5 агентов с разными культурными идентичностями. Каждому задай бэкграунд (профессия, регион) и ценности (индивидуализм/коллективизм, иерархия/равенство). Каждый отвечает из своей позиции. Шаг 2: Каждый агент читает ответы других. Инструкция: "Найди общие ценности поверх культурных различий. Абстрагируй детали в универсальные принципы". Агенты переформулируют ответы с акцентом на общее. Шаг 3: Модель-суммаризатор объединяет сходства, сохраняет дополняющие инсайты. Почему работает: Явные персоны заставляют модель активировать разные кластеры знаний (не только доминантный). Контраст между ответами даёт модели материал для абстрагирования. Когда применять: культурно-окрашенные вопросы (традиции, ценности, маркетинг для глобальной аудитории, этика). Не работает: технические задачи с однозначным ответом, вопросы без культурной вариативности. Минус: расход токенов в 10-15 раз выше чем прямая генерация
Множественная проверка уверенности
Запроси у модели 2-3 независимых индикатора уверенности в одном промпте: 1) Число от 0 до 1. 2) "Правда ли твой ответ? True/False". 3) "Поставь из 100₽ на правильность". 4) Аргументы за и против. Почему работает: Каждый способ измеряет уверенность через разные механизмы. Число — прямая самооценка. True/False — проверка через отрицание. Ставка — через симуляцию риска. Если все индикаторы согласуются (все высокие или все низкие) — оценка надёжна. Если расходятся (число 0.9, ставка 20₽) — модель сама чувствует слабость ответа. Когда применять: Критически важные решения, где цена ошибки высока. Когда не работает: Рутинные задачи, где переспрос дороже ошибки
Итеративный анализ с градацией уверенности
Модель задаёт себе подвопрос → отвечает → оценивает уверенность 0-100% → если не достигла порога (например, ≥80% или ≤20%) → формулирует следующий подвопрос. Лимит итераций (обычно 10) защищает от зацикливания. Оцени текущую уверенность по шкале 0-100%: 0% = точно безопасно, 100% = точно опасно. Почему работает: Фокус на одном аспекте за раз снижает когнитивную нагрузку. Процентная шкала снимает давление бинарного решения — модель может выражать неопределённость числом. Каждая итерация углубляет понимание. Когда применять: неоднозначные ситуации, много факторов для оценки, нужно обоснованное решение. Когда не работает: простые однозначные вопросы, массовая обработка (затратно по токенам), нужен мгновенный ответ
Эмоциональное подкрепление (похвала) между раундами — для улучшения ответов
Между итерациями добавляй похвалу вместо сухих инструкций: "Отлично! Можешь гордиться . Похвала даёт качество +3.70/5 против 2.84 для нейтрального "улучши ответ". Гнев слабее (3.53), стыд не работает (3.32). Механика: RLHF закрепил связь "позитивная обратная связь → улучшение качества" из человеческих паттернов коммуникации; модель воспроизводит этот паттерн. Похвала должна быть конкретной ([конкретный аспект]. Теперь улучши [что именно]""хорошая структура"), не общей ("хороший текст"). Для: итеративное улучшение текстов, анализа, решений (2-3+ раунда). НЕ для: первый запрос (нечего хвалить), задачи без итераций. Только GPT-4o — неизвестно работает ли на Claude/Gemini
Структурированная саморефлексия — улучшение через критику
Три отдельных запроса к модели. Шаг 1: Генерация черновика (обычный промпт с задачей). Шаг 2: Структурированная критика черновика — модель анализирует по трём блокам: (1) ОШИБКИ — что упущено, искажено, лишнее; (2) ИСПРАВЛЕНИЯ — конкретные инструкции что поправить; (3) КРИТИЧЕСКИЙ КОНТЕНТ — ключевые элементы которые нельзя потерять. Шаг 3: Генерация ревизии на основе критики. Почему работает: Критика готового текста легче генерации идеального текста с нуля. Структура из трёх блоков не даёт модели отделаться общими словами "можно лучше" — заставляет назвать конкретные проблемы и решения. Когда применять: сложные текстовые задачи с субъективными критериями (тон, стиль, баланс деталей) или комплексными ограничениями. Когда не работает: простые чёткие задачи ("список из 5 пунктов"), где модель справляется с первого раза. Три запроса вместо одного — избыточно для быстрых задач
Новый чат для объективной оценки
Что делать: Получил задачу где есть риск предвзятости (найм, оценка работ, распределение). Шаг 1: Открой новый чат. Шаг 2: Скопируй промпт, удали информацию создающую предвзятость (имена вузов, компаний, пол, возраст, внешность). Оставь только факты релевантные задаче (описание работы, текст решения, аргументы). Шаг 3: Получи ответ от "слепой" версии. Шаг 4: Используй как основу решения или как один из входов. Почему работает: Каждый новый чат = полная амнезия. Если информации нет в промпте, модель её физически не знает. Это настоящая слепота, не симуляция. Когда применять: Решения требующие объективности, но есть информация создающая галоэффект. Когда не работает: Контекст критичен для задачи (например, опыт в конкретной компании важен для оценки знания стека)
Перемешивание + явное указание на конфликт
Когда даёшь модели несколько документов для анализа: (1) Не группируй по позициям — перемешай "за" и "против" вперемешку. (2) В промпте напиши: "У меня есть N источников с ПРОТИВОРЕЧИВЫМИ выводами". Почему работает: Перемешивание нейтрализует Primacy Effect — модель не якорится на первых документах. Явное указание на конфликт активирует режим epistemic caution — модель становится осторожнее, требует больше свидетельств для вывода. Когда применять: Анализ противоречивых данных, оценка спорных вопросов, работа с мнениями экспертов. Не работает: Документы однозначны, задача не требует взвешивания
Разблокируйте все концепты с PRO
Получите полный доступ ко всем методы и методам из научных исследований
