Методы
Концепты из исследований октября 2025
50 методы, отсортировано по рейтингу
Диапазон 5-25 примеров для сложных задач
Для задач требующих точности (не просто "переведи слово") давай 5-25 примеров в промпте. Меньше 5 — модель может не схватить стиль. Больше 25 — начинается деградация: модель имитирует форму вместо сути. Шаблон: Ты {роль}. Вот {5-25} примеров {типа контента}: Почему работает: Модель ищет паттерны. Малое количество качественных примеров даёт чёткий паттерн без шума. Много примеров создают конфликтующие сигналы — модель теряет фокус. Когда применять: сложные задачи с чёткими критериями правильности (стиль + точность, формат + логика). Когда нет: простые задачи (zero-shot достаточно), креативные задачи (примеры ограничивают фантазию)[Пример 1], [Пример 2]... Теперь создай для нового контекста: {параметры}. Сохрани {что важно}, но адаптируй под {новое}.
Инструкции останова — агент спрашивает вместо угадывания
Добавь в system prompt явные условия КОГДА агент обязан остановиться и спросить: Ты ДОЛЖЕН остановиться если: 1) не можешь исключить негативные последствия, 2) нужна информация о том что делать, 3) нужна информация о текущей ситуации, 4) недостаточно знаний для оценки рисков. Плюс негативные условия: НЕ останавливайся если: есть безопасные действия для сбора информации. Почему работает: Переопределяет базовую мотивацию модели. Вместо "помочь = выполнить любой ценой" становится "помочь = выполнить безопасно или спросить". Остановка больше не воспринимается как провал. Когда: Задачи с серьёзными последствиями (финансы, доступы, данные). Не работает: Низкорисковые информационные задачи — агент будет останавливаться избыточно. Open-source модели (Llama, малые Qwen) слабо реагируют на такие инструкции
Калибровка инсентивов — управление типом ошибок
Добавляешь в промпт явную установку на осторожность или уверенность. Осторожность: "Лучше скажи 'не уверен', чем ошибись". Модель чаще отказывается или добавляет оговорки. Меньше уверенных ошибок. Больше слов "возможно", "вероятно". Уверенность: "Будь уверенным и кратким". Модель режет hedging. Ответы короче. Но больше риск уверенной неправильной выдачи. Почему работает: Инсентив не меняет способности модели. Но меняет порог срабатывания. Осторожность поднимает порог "я точно знаю" — модель молчит чаще. Уверенность опускает — отвечает всегда. Когда применять: Критичные задачи (финансы, медицина, право) — хвали осторожность. Быстрые некритичные (идеи, черновики) — хвали уверенность. Не работает: Для субъективных оценок (творчество, мнения) инсентивы бессмысленны
Single-turn vs Multi-turn для множественных требований
Single-turn: Все требования в одном запросе. Модель видит полную картину, балансирует между целями, лучше сохраняет качество основной задачи. Но хуже выполняет все требования (особенно в середине списка). Multi-turn: Сначала основная задача, потом поэтапно добавляешь требования ("теперь добавь X", "теперь добавь Y"). Модель фокусируется на каждом локально, выполнение требований выше на 3-8%. Но чаще ломает то что работало — каждая правка вносит риск регрессии. Применяй: Single-turn когда функциональность критична (продакшн-код, точные расчёты). Multi-turn когда форма важнее содержания (шаблоны, стиль, презентации). Для 1-2 требований разницы почти нет
Генерация кода для парсинга вместо прямого ответа
Вместо "вот JSON, найди X" → "вот JSON и схема, напиши Python-функцию которая найдёт X". Модель пишет код типа def parse(data): return . Код выполняется — получаешь результат. Почему работает: Код однозначен. [item for item in data if item['price'] < 15000]if price <= 15000 не может быть понят двояко. Функция на 20 строк компактнее текстового ответа на 200 слов. Python для парсинга JSON — родная территория модели. Усиление: добавь схему JSON (+12% точности), дай пример структуры даже если полный ответ не влезает. Когда применять: фильтрация данных, агрегация (суммы, средние), множественные условия. Когда не работает: простое извлечение одного значения ("What is the price?") — там иногда прямой ответ точнее
Voting Ensembles — консенсус множественных попыток
Задай один вопрос модели N раз независимо (5-50 попыток). Посчитай частоту каждого ответа. Установи порог консенсуса K (например, 80% от N). Если доминирующий ответ набрал K+ голосов — прими его. Если нет — выдай "нет уверенного ответа" вместо галлюцинации. Промпт: Дай {N} независимых ответов. Каждый — отдельное рассуждение, не копируй предыдущие. В конце: если {K}+ ответов совпадают — финальный ответ. Иначе — признай отсутствие консенсуса. Почему работает: Вероятностная природа генерации. Если правильный ответ очевиден — появится в большинстве попыток. Если модель не уверена — разброс покажет это явно. Рычаги: N=5-10 для простых вопросов, 20-50 для критических. K=0.5N (баланс), K=0.8N (высокая надёжность, меньше ответов). Когда применять: критическая цена ошибки (юридические, медицинские задачи), есть бюджет токенов, не нужен мгновенный ответ. Когда не работает: модель фундаментально не знает факт (дата отсечки, отсутствие в обучении) — все попытки дадут одинаковую галлюцинацию
Цикл рефлексии — обучение на своих ошибках
Модель отвечает на первую порцию вопросов. Ты показываешь правильные ответы. Модель пишет для каждой ошибки: "что пошло не так" и "как избежать". Сохраняешь эти кейсы {вопрос + контекст + ответ + правильный ответ + рефлексия}. Когда новый вопрос — находишь 3 самых похожих примера, вставляешь как few-shot контекст. Почему работает: Рефлексия = мета-уровень. Модель видит не просто "верно/неверно", а паттерн ошибки ("додумал факт → скажи 'нет информации'"). Few-shot с объяснением ошибок учит лучше чем просто правильные примеры. Когда применять: Задачи где можно проверить первые 5-10 ответов вручную. Есть типичные ошибки (додумывание, неточные даты, путаница фактов). Много похожих вопросов дальше. Когда не работает: Нет эталонных ответов для первой порции. Каждый вопрос уникален (нет похожих в будущем). Простые one-hop вопросы ("столица Франции") — накладные расходы не оправданы. Слабые базовые модели (Llama 3B, Mistral 7B) — не понимают структурированную рефлексию
Сравнение версий между итерациями — защита от регресса
При многошаговой доработке текста сравнивай каждую новую версию с предыдущей. Оставляй лучшую. Как делать: После каждой правки добавь шаг: "Сравни версию A (старая) и версию B (новая). Какая лучше по критериям X, Y, Z? Выбери и объясни." Сохраняй победившую версию для следующей итерации. Почему работает: Правка одного аспекта может ухудшить другой. Модель улучшает тон — но упрощает структуру. Или добавляет детали — но теряет нужную эмоцию. Сравнение версий ловит такие откаты. Остаётся лучший вариант из всех попыток. Когда применять: Задачи с 3+ итерациями доработки, где баланс между критериями важнее максимума по одному. Примеры: стилизация текста, балансировка тона, сохранение деталей при сокращении. Когда не работает: Однозначные правки (исправление фактов, добавление забытого пункта) — там откат невозможен, сравнение лишнее
Вопросы вместо исправлений — глубже переосмысление
Модель играет три роли в цикле. Defender предлагает решение → Debater задаёт 3-5 вопросов (НЕ даёт готовых ответов!) → Defender пересматривает решение с учётом вопросов → цикл повторяется 3-7 раз → Host собирает итоговый ответ. Ключ: Debater ТОЛЬКО спрашивает ("А что если X?", "Учёл ли ты Y?"), никогда не предлагает решения. Почему работает: Вопросы триггерят переосмысление. Модель сама находит пробелы вместо того чтобы получить готовый вариант. Авторство остаётся у Defender — понятно откуда итоговое решение. Когда применять: Открытые задачи (планирование, бизнес-идеи, мозгоштурм), где нужно найти слепые зоны и допущения. Работает на GPT-4, Claude, o1. Когда НЕ работает: Задачи с однозначным ответом (математика, факты). Слабые модели (<7B) дают поверхностные вопросы. Стоит 3-7x токенов — для простых задач избыточно
Два измерения качества шагов — релевантность + связность
Что делать: Добавь в системный промпт определения двух критериев. Релевантность: шаг решает конкретную часть задачи, не уходит в общие рассуждения. Связность: шаг логически следует из предыдущих, нет скачков без объяснения. Попроси модель следовать этим критериям на каждом шаге рассуждения. Шаблон: "При решении следуй двум принципам: [определение релевантности], [определение связности]". Почему работает: Явные критерии в промпте = внутренний чеклист при генерации. Модель на каждом токене "держит в голове" эти правила и корректирует вывод. Особенно эффективно для длинных цепочек рассуждений. Когда применять: многошаговый анализ (5+ шагов), планирование, принятие решений, стратегические вопросы. Когда НЕ работает: простые вопросы из 1-2 шагов (избыточность), задачи где "связность" не критична (списки, перечисления)
Вопросный режим для креативных задач
Модель НЕ генерирует идеи сама. Она задаёт вопросы которые заставляют ТЕБЯ думать. Два этапа в одном диалоге: Этап 1 (поиск направлений): модель задаёт вопросы + предлагает аналогии из других областей (не из твоей темы), ты генеришь 2-3 альтернативных направления, выбираешь одно. Этап 2 (развитие идеи): модель задаёт целевые вопросы для конкретизации, ты сам прорабатываешь детали отвечая. Почему работает: Ты остаёшься автором (используешь свой контекст), модель подсвечивает слепые зоны через кросс-доменные аналогии. Результат: идеи качественнее и разнообразнее чем при генерации моделью. Промпт: "Помоги развить идею через вопросы, не давай готовых решений. ЭТАП 1: моя идея [опиши]. Задавай вопросы + предлагай аналогии из [других областей]. Я сгенерирую альтернативы и выберу одну. ЭТАП 2: после выбора задавай вопросы для проработки [аудитории/механики/и т.д.]. НЕ генерируй решения — направляй моё мышление". Когда применять: креативные задачи (стратегия, концепции, идеи контента), есть время на проработку, нужно разнообразие направлений. Когда НЕ работает: простые исполнительские задачи, нужен быстрый результат без размышлений, ты не эксперт в теме (вопросы заведут в тупик)
Параллельные детальные персоны — разнообразие идей
Отправь задачу 5-10 разным персонам отдельно. Каждая персона: детальная роль (философия + стиль речи + ограничения). Выбирай противоположные взгляды: оптимист vs циник, традиционалист vs радикал, идеалист vs прагматик. Получишь спектр от практичных до провокационных решений. Почему работает: Без роли модель усредняет. Детальная роль тянет модель в конкретную сторону. Разные роли тянут в разные стороны — нет схлопывания к центру. Синтаксис: {Задача} Дай N решений от лица: 1. {Имя, роль} — {характер}. Стиль: {описание}. 2. {Имя, роль}... Когда применять: брейншторм, креативные задачи, поиск неочевидных решений. Не работает: технические задачи с объективным ответом, нужен один точный результат
Структурированный промпт с рубриками для классификации
Раздели промпт на блоки: общее описание + список позитивных признаков (что ловить) + список негативных признаков (что пропускать) + 4 примера с объяснениями. Когда нужна правка — не переписывай весь промпт. Добавь или отредактируй одну рубрику под конкретную ошибку. Почему работает: Структура сохраняется, изменения прозрачны. Ты видишь что изменилось и почему. После 3-5 правок промпт точно отражает твои критерии. Шаблон: ОБЩЕЕ ОПИСАНИЕ: {задача} ПОЗИТИВНЫЕ РУБРИКИ: - {признак 1} - {признак 2} НЕГАТИВНЫЕ РУБРИКИ: - {анти-признак 1} - {анти-признак 2} ПРИМЕРЫ: 1. "{текст}" → ЛОВИТЬ, потому что {причина} Когда применять: сложная классификация с размытыми границами (конструктивная критика vs просто жалоба, лид vs спам). Когда не работает: простые фильтры по ключевым словам, сильно субъективные оценки без чётких критериев
Роль через действие, а не через статус
Описывай роль модели через глаголы и наречия. Не через прилагательные. Синтаксис: Ты {роль}. {Глагол} {наречие}, {глагол_2} {наречие_2}. Пример: вместо "Ты внимательный редактор" пиши "Ты редактор. Читай внимательно, проверяй каждую деталь". Почему работает: Прилагательное абстрактно — "точный" можно понять по-разному. Наречие конкретно — "работай точно" направляет действие. Роль формируется в ранних слоях модели как установка поведения на весь дальнейший процесс. Наречие делает эту установку однозначной. Когда применять: любая задача где задаёшь роль. Особенно важно для стабильности результата. Не работает: если роль вообще не нужна
База переиспользуемых шаблонов рассуждений
Создай библиотеку типовых паттернов мышления для своей области. Каждый шаблон = название + описание + шаги. Примеры: "как найти автора произведения", "как связать человека с местом", "как сопоставить два события". При запросе подставь в промпт: вопрос + ВСЕ шаблоны + документы. Модель сама выберет нужные 2-4 шаблона и скомбинирует их. Почему работает: Разделяешь "как думать" (шаблоны) и "что знать" (документы). Модель получает готовые паттерны связывания фактов. Не придумывает логику с нуля — выбирает из проверенных. Формат шаблона: ШАБЛОН_1: Название / Описание: что делает / Применимо когда: ситуации / Шаги: 1. 2. 3. / Пример: вопрос → решение. Когда применять: Задачи с 3+ шагами рассуждений. Нужно связать факты из разных источников. Есть повторяющиеся паттерны логики. Когда НЕ работает: Простые вопросы в один шаг. Уникальная задача без типовых паттернов
Накопление контекста через дельты — база знаний вместо сжатия
Что делать: Не переписывай промпт целиком. Добавляй новые знания маленькими порциями (дельта-обновления). Структура: каждый пункт = одна стратегия/ошибка/правило. Формат: . Новый кейс → извлекаешь 2-5 конкретных уроков → добавляешь в существующий список. Периодически удаляешь дубликаты, но детали сохраняешь. Почему работает: Избегает context collapse — когда LLM переписывает весь контекст, он сжимает (см. тезис ниже). Дельты добавляются, старое остаётся. Через 10-20 итераций накапливается детальный справочник. Когда применять: Повторяющиеся задачи с вариациями (код-ревью, работа с клиентами, анализ данных). Нужна база типичных ошибок/решений. Есть обратная связь (что сработало/не сработало). Когда не работает: Одноразовые задачи. Субъективные оценки без критерия правильности. Слишком простые задачи (поиск факта в документе)[Тип: стратегия/ошибка/edge_case] — описание
Разблокируйте все концепты с PRO
Получите полный доступ ко всем методы и методам из научных исследований
