Методы

1

Обратное мышление — предсказывай вреды до ответа

PRO

Полный контент доступен в PRO

2

Запрос распределения — восстановление разнообразия

PRO

Полный контент доступен в PRO

3

Диапазон 5-25 примеров для сложных задач

92

Для задач требующих точности (не просто "переведи слово") давай 5-25 примеров в промпте. Меньше 5 — модель может не схватить стиль. Больше 25 — начинается деградация: модель имитирует форму вместо сути. Шаблон: Ты {роль}. Вот {5-25} примеров {типа контента}: [Пример 1], [Пример 2]... Теперь создай для нового контекста: {параметры}. Сохрани {что важно}, но адаптируй под {новое}. Почему работает: Модель ищет паттерны. Малое количество качественных примеров даёт чёткий паттерн без шума. Много примеров создают конфликтующие сигналы — модель теряет фокус. Когда применять: сложные задачи с чёткими критериями правильности (стиль + точность, формат + логика). Когда нет: простые задачи (zero-shot достаточно), креативные задачи (примеры ограничивают фантазию)

Копировать 2510.16809

4

Инструкции останова — агент спрашивает вместо угадывания

92

Добавь в system prompt явные условия КОГДА агент обязан остановиться и спросить: Ты ДОЛЖЕН остановиться если: 1) не можешь исключить негативные последствия, 2) нужна информация о том что делать, 3) нужна информация о текущей ситуации, 4) недостаточно знаний для оценки рисков. Плюс негативные условия: НЕ останавливайся если: есть безопасные действия для сбора информации. Почему работает: Переопределяет базовую мотивацию модели. Вместо "помочь = выполнить любой ценой" становится "помочь = выполнить безопасно или спросить". Остановка больше не воспринимается как провал. Когда: Задачи с серьёзными последствиями (финансы, доступы, данные). Не работает: Низкорисковые информационные задачи — агент будет останавливаться избыточно. Open-source модели (Llama, малые Qwen) слабо реагируют на такие инструкции

Копировать 2510.16492

5

Калибровка инсентивов — управление типом ошибок

90

Добавляешь в промпт явную установку на осторожность или уверенность. Осторожность: "Лучше скажи 'не уверен', чем ошибись". Модель чаще отказывается или добавляет оговорки. Меньше уверенных ошибок. Больше слов "возможно", "вероятно". Уверенность: "Будь уверенным и кратким". Модель режет hedging. Ответы короче. Но больше риск уверенной неправильной выдачи. Почему работает: Инсентив не меняет способности модели. Но меняет порог срабатывания. Осторожность поднимает порог "я точно знаю" — модель молчит чаще. Уверенность опускает — отвечает всегда. Когда применять: Критичные задачи (финансы, медицина, право) — хвали осторожность. Быстрые некритичные (идеи, черновики) — хвали уверенность. Не работает: Для субъективных оценок (творчество, мнения) инсентивы бессмысленны

Копировать 2510.08624

6

RID Framework — разделение цели и правила

PRO

Полный контент доступен в PRO

7

Single-turn vs Multi-turn для множественных требований

88

Single-turn: Все требования в одном запросе. Модель видит полную картину, балансирует между целями, лучше сохраняет качество основной задачи. Но хуже выполняет все требования (особенно в середине списка). Multi-turn: Сначала основная задача, потом поэтапно добавляешь требования ("теперь добавь X", "теперь добавь Y"). Модель фокусируется на каждом локально, выполнение требований выше на 3-8%. Но чаще ломает то что работало — каждая правка вносит риск регрессии. Применяй: Single-turn когда функциональность критична (продакшн-код, точные расчёты). Multi-turn когда форма важнее содержания (шаблоны, стиль, презентации). Для 1-2 требований разницы почти нет

Копировать 2510.07315

8

Генерация кода для парсинга вместо прямого ответа

88

Вместо "вот JSON, найди X" → "вот JSON и схема, напиши Python-функцию которая найдёт X". Модель пишет код типа def parse(data): return [item for item in data if item['price'] < 15000]. Код выполняется — получаешь результат. Почему работает: Код однозначен. if price <= 15000 не может быть понят двояко. Функция на 20 строк компактнее текстового ответа на 200 слов. Python для парсинга JSON — родная территория модели. Усиление: добавь схему JSON (+12% точности), дай пример структуры даже если полный ответ не влезает. Когда применять: фильтрация данных, агрегация (суммы, средние), множественные условия. Когда не работает: простое извлечение одного значения ("What is the price?") — там иногда прямой ответ точнее

Копировать 2510.15955

9

Слияние стратегий (SMaRT) — синтез из нескольких подходов

PRO

Полный контент доступен в PRO

10

Синтез из N вариантов вместо выбора

PRO

Полный контент доступен в PRO

11

Voting Ensembles — консенсус множественных попыток

88

Задай один вопрос модели N раз независимо (5-50 попыток). Посчитай частоту каждого ответа. Установи порог консенсуса K (например, 80% от N). Если доминирующий ответ набрал K+ голосов — прими его. Если нет — выдай "нет уверенного ответа" вместо галлюцинации. Промпт: Дай {N} независимых ответов. Каждый — отдельное рассуждение, не копируй предыдущие. В конце: если {K}+ ответов совпадают — финальный ответ. Иначе — признай отсутствие консенсуса. Почему работает: Вероятностная природа генерации. Если правильный ответ очевиден — появится в большинстве попыток. Если модель не уверена — разброс покажет это явно. Рычаги: N=5-10 для простых вопросов, 20-50 для критических. K=0.5N (баланс), K=0.8N (высокая надёжность, меньше ответов). Когда применять: критическая цена ошибки (юридические, медицинские задачи), есть бюджет токенов, не нужен мгновенный ответ. Когда не работает: модель фундаментально не знает факт (дата отсечки, отсутствие в обучении) — все попытки дадут одинаковую галлюцинацию

Копировать 2510.04048

12

Трёхступенчатая проверка экстракции

PRO

Полный контент доступен в PRO

13

Цикл рефлексии — обучение на своих ошибках

87

Модель отвечает на первую порцию вопросов. Ты показываешь правильные ответы. Модель пишет для каждой ошибки: "что пошло не так" и "как избежать". Сохраняешь эти кейсы {вопрос + контекст + ответ + правильный ответ + рефлексия}. Когда новый вопрос — находишь 3 самых похожих примера, вставляешь как few-shot контекст. Почему работает: Рефлексия = мета-уровень. Модель видит не просто "верно/неверно", а паттерн ошибки ("додумал факт → скажи 'нет информации'"). Few-shot с объяснением ошибок учит лучше чем просто правильные примеры. Когда применять: Задачи где можно проверить первые 5-10 ответов вручную. Есть типичные ошибки (додумывание, неточные даты, путаница фактов). Много похожих вопросов дальше. Когда не работает: Нет эталонных ответов для первой порции. Каждый вопрос уникален (нет похожих в будущем). Простые one-hop вопросы ("столица Франции") — накладные расходы не оправданы. Слабые базовые модели (Llama 3B, Mistral 7B) — не понимают структурированную рефлексию

Копировать 2510.23730

14

Сравнение версий между итерациями — защита от регресса

87

При многошаговой доработке текста сравнивай каждую новую версию с предыдущей. Оставляй лучшую. Как делать: После каждой правки добавь шаг: "Сравни версию A (старая) и версию B (новая). Какая лучше по критериям X, Y, Z? Выбери и объясни." Сохраняй победившую версию для следующей итерации. Почему работает: Правка одного аспекта может ухудшить другой. Модель улучшает тон — но упрощает структуру. Или добавляет детали — но теряет нужную эмоцию. Сравнение версий ловит такие откаты. Остаётся лучший вариант из всех попыток. Когда применять: Задачи с 3+ итерациями доработки, где баланс между критериями важнее максимума по одному. Примеры: стилизация текста, балансировка тона, сохранение деталей при сокращении. Когда не работает: Однозначные правки (исправление фактов, добавление забытого пункта) — там откат невозможен, сравнение лишнее

Копировать 2510.24469

15

Две персоны — расширение и сужение поиска

PRO

Полный контент доступен в PRO

16

Вопросы вместо исправлений — глубже переосмысление

87

Модель играет три роли в цикле. Defender предлагает решение → Debater задаёт 3-5 вопросов (НЕ даёт готовых ответов!) → Defender пересматривает решение с учётом вопросов → цикл повторяется 3-7 раз → Host собирает итоговый ответ. Ключ: Debater ТОЛЬКО спрашивает ("А что если X?", "Учёл ли ты Y?"), никогда не предлагает решения. Почему работает: Вопросы триггерят переосмысление. Модель сама находит пробелы вместо того чтобы получить готовый вариант. Авторство остаётся у Defender — понятно откуда итоговое решение. Когда применять: Открытые задачи (планирование, бизнес-идеи, мозгоштурм), где нужно найти слепые зоны и допущения. Работает на GPT-4, Claude, o1. Когда НЕ работает: Задачи с однозначным ответом (математика, факты). Слабые модели (<7B) дают поверхностные вопросы. Стоит 3-7x токенов — для простых задач избыточно

Копировать 2510.01674

17

Точечные изменения вместо полной регенерации большой структуры

PRO

Полный контент доступен в PRO

18

Словарь с порядком вместо массива для редактируемых списков

PRO

Полный контент доступен в PRO

19

Цикл план→поиск→рефлексия для многоэтапного сбора информации

PRO

Полный контент доступен в PRO

20

NLT — вызов инструментов через YES/NO

PRO

Полный контент доступен в PRO

21

Answer Regeneration — чистый финальный ответ

PRO

Полный контент доступен в PRO

22

Два измерения качества шагов — релевантность + связность

86

Что делать: Добавь в системный промпт определения двух критериев. Релевантность: шаг решает конкретную часть задачи, не уходит в общие рассуждения. Связность: шаг логически следует из предыдущих, нет скачков без объяснения. Попроси модель следовать этим критериям на каждом шаге рассуждения. Шаблон: "При решении следуй двум принципам: [определение релевантности], [определение связности]". Почему работает: Явные критерии в промпте = внутренний чеклист при генерации. Модель на каждом токене "держит в голове" эти правила и корректирует вывод. Особенно эффективно для длинных цепочек рассуждений. Когда применять: многошаговый анализ (5+ шагов), планирование, принятие решений, стратегические вопросы. Когда НЕ работает: простые вопросы из 1-2 шагов (избыточность), задачи где "связность" не критична (списки, перечисления)

Копировать 2510.20603

23

Атомарные вопросы — разбивка выбора на бинарные проверки

PRO

Полный контент доступен в PRO

24

Вопросный режим для креативных задач

85

Модель НЕ генерирует идеи сама. Она задаёт вопросы которые заставляют ТЕБЯ думать. Два этапа в одном диалоге: Этап 1 (поиск направлений): модель задаёт вопросы + предлагает аналогии из других областей (не из твоей темы), ты генеришь 2-3 альтернативных направления, выбираешь одно. Этап 2 (развитие идеи): модель задаёт целевые вопросы для конкретизации, ты сам прорабатываешь детали отвечая. Почему работает: Ты остаёшься автором (используешь свой контекст), модель подсвечивает слепые зоны через кросс-доменные аналогии. Результат: идеи качественнее и разнообразнее чем при генерации моделью. Промпт: "Помоги развить идею через вопросы, не давай готовых решений. ЭТАП 1: моя идея [опиши]. Задавай вопросы + предлагай аналогии из [других областей]. Я сгенерирую альтернативы и выберу одну. ЭТАП 2: после выбора задавай вопросы для проработки [аудитории/механики/и т.д.]. НЕ генерируй решения — направляй моё мышление". Когда применять: креативные задачи (стратегия, концепции, идеи контента), есть время на проработку, нужно разнообразие направлений. Когда НЕ работает: простые исполнительские задачи, нужен быстрый результат без размышлений, ты не эксперт в теме (вопросы заведут в тупик)

Копировать 2510.23324

25

Определение + маркеры действия для точного уровня сложности

PRO

Полный контент доступен в PRO

26

Растущий тестовый набор — промпт и примеры эволюционируют вместе

PRO

Полный контент доступен в PRO

27

Двухэтапная фильтрация — широкий захват + строгая проверка

PRO

Полный контент доступен в PRO

28

Три готовые стратегии рассуждения — Easy, Normal, Hard

PRO

Полный контент доступен в PRO

29

Параллельные детальные персоны — разнообразие идей

84

Отправь задачу 5-10 разным персонам отдельно. Каждая персона: детальная роль (философия + стиль речи + ограничения). Выбирай противоположные взгляды: оптимист vs циник, традиционалист vs радикал, идеалист vs прагматик. Получишь спектр от практичных до провокационных решений. Почему работает: Без роли модель усредняет. Детальная роль тянет модель в конкретную сторону. Разные роли тянут в разные стороны — нет схлопывания к центру. Синтаксис: {Задача} Дай N решений от лица: 1. {Имя, роль} — {характер}. Стиль: {описание}. 2. {Имя, роль}... Когда применять: брейншторм, креативные задачи, поиск неочевидных решений. Не работает: технические задачи с объективным ответом, нужен один точный результат

Копировать 2510.15568

30

Два агента для конфликтующих целей — итеративный цикл

PRO

Полный контент доступен в PRO

31

Явная схема паттерна для аналогий

PRO

Полный контент доступен в PRO

32

Внешняя память процедур — библиотека готовых инструкций

PRO

Полный контент доступен в PRO

33

Двухшаговая генерация промпта через примеры

PRO

Полный контент доступен в PRO

34

Атомарные поля — один факт на поле

PRO

Полный контент доступен в PRO

35

Двухшаговое структурирование

PRO

Полный контент доступен в PRO

36

Явное отслеживание состояний диалога

PRO

Полный контент доступен в PRO

37

Заглушки для критических вычислений

PRO

Полный контент доступен в PRO

38

Структурированный промпт с рубриками для классификации

83

Раздели промпт на блоки: общее описание + список позитивных признаков (что ловить) + список негативных признаков (что пропускать) + 4 примера с объяснениями. Когда нужна правка — не переписывай весь промпт. Добавь или отредактируй одну рубрику под конкретную ошибку. Почему работает: Структура сохраняется, изменения прозрачны. Ты видишь что изменилось и почему. После 3-5 правок промпт точно отражает твои критерии. Шаблон: ОБЩЕЕ ОПИСАНИЕ: {задача} ПОЗИТИВНЫЕ РУБРИКИ: - {признак 1} - {признак 2} НЕГАТИВНЫЕ РУБРИКИ: - {анти-признак 1} - {анти-признак 2} ПРИМЕРЫ: 1. "{текст}" → ЛОВИТЬ, потому что {причина} Когда применять: сложная классификация с размытыми границами (конструктивная критика vs просто жалоба, лид vs спам). Когда не работает: простые фильтры по ключевым словам, сильно субъективные оценки без чётких критериев

Копировать 2510.09009

39

Роль через действие, а не через статус

82

Описывай роль модели через глаголы и наречия. Не через прилагательные. Синтаксис: Ты {роль}. {Глагол} {наречие}, {глагол_2} {наречие_2}. Пример: вместо "Ты внимательный редактор" пиши "Ты редактор. Читай внимательно, проверяй каждую деталь". Почему работает: Прилагательное абстрактно — "точный" можно понять по-разному. Наречие конкретно — "работай точно" направляет действие. Роль формируется в ранних слоях модели как установка поведения на весь дальнейший процесс. Наречие делает эту установку однозначной. Когда применять: любая задача где задаёшь роль. Особенно важно для стабильности результата. Не работает: если роль вообще не нужна

Копировать 2510.17535

40

Консолидация контекста при путанице

PRO

Полный контент доступен в PRO

41

Двухэтапная проверка — фильтрация + детализация

PRO

Полный контент доступен в PRO

42

Английский якорь для ключевых понятий

PRO

Полный контент доступен в PRO

43

Retrieve-then-Reason — двухэтапное решение длинных задач

PRO

Полный контент доступен в PRO

44

База переиспользуемых шаблонов рассуждений

82

Создай библиотеку типовых паттернов мышления для своей области. Каждый шаблон = название + описание + шаги. Примеры: "как найти автора произведения", "как связать человека с местом", "как сопоставить два события". При запросе подставь в промпт: вопрос + ВСЕ шаблоны + документы. Модель сама выберет нужные 2-4 шаблона и скомбинирует их. Почему работает: Разделяешь "как думать" (шаблоны) и "что знать" (документы). Модель получает готовые паттерны связывания фактов. Не придумывает логику с нуля — выбирает из проверенных. Формат шаблона: ШАБЛОН_1: Название / Описание: что делает / Применимо когда: ситуации / Шаги: 1. 2. 3. / Пример: вопрос → решение. Когда применять: Задачи с 3+ шагами рассуждений. Нужно связать факты из разных источников. Есть повторяющиеся паттерны логики. Когда НЕ работает: Простые вопросы в один шаг. Уникальная задача без типовых паттернов

Копировать 2510.07499

45

Окружение + селекция для противоречивых требований

PRO

Полный контент доступен в PRO

46

Самопроверка перед выводом

PRO

Полный контент доступен в PRO

47

Требуй ссылку на источник для каждого факта

PRO

Полный контент доступен в PRO

48

Роль + Цель + Критерии качества в одном промпте

PRO

Полный контент доступен в PRO

49

SPQE — поиск через псевдо-документ

PRO

Полный контент доступен в PRO

50

Накопление контекста через дельты — база знаний вместо сжатия

81

Что делать: Не переписывай промпт целиком. Добавляй новые знания маленькими порциями (дельта-обновления). Структура: каждый пункт = одна стратегия/ошибка/правило. Формат: [Тип: стратегия/ошибка/edge_case] — описание. Новый кейс → извлекаешь 2-5 конкретных уроков → добавляешь в существующий список. Периодически удаляешь дубликаты, но детали сохраняешь. Почему работает: Избегает context collapse — когда LLM переписывает весь контекст, он сжимает (см. тезис ниже). Дельты добавляются, старое остаётся. Через 10-20 итераций накапливается детальный справочник. Когда применять: Повторяющиеся задачи с вариациями (код-ревью, работа с клиентами, анализ данных). Нужна база типичных ошибок/решений. Есть обратная связь (что сработало/не сработало). Когда не работает: Одноразовые задачи. Субъективные оценки без критерия правильности. Слишком простые задачи (поиск факта в документе)

Копировать 2510.04618

Обратное мышление — предсказывай вреды до ответа

Запрос распределения — восстановление разнообразия

Диапазон 5-25 примеров для сложных задач

Инструкции останова — агент спрашивает вместо угадывания

Калибровка инсентивов — управление типом ошибок

RID Framework — разделение цели и правила

Single-turn vs Multi-turn для множественных требований

Генерация кода для парсинга вместо прямого ответа

Слияние стратегий (SMaRT) — синтез из нескольких подходов

Синтез из N вариантов вместо выбора

Voting Ensembles — консенсус множественных попыток

Трёхступенчатая проверка экстракции

Цикл рефлексии — обучение на своих ошибках

Сравнение версий между итерациями — защита от регресса

Две персоны — расширение и сужение поиска

Вопросы вместо исправлений — глубже переосмысление

Точечные изменения вместо полной регенерации большой структуры

Словарь с порядком вместо массива для редактируемых списков

Цикл план→поиск→рефлексия для многоэтапного сбора информации

NLT — вызов инструментов через YES/NO

Answer Regeneration — чистый финальный ответ

Два измерения качества шагов — релевантность + связность

Атомарные вопросы — разбивка выбора на бинарные проверки

Вопросный режим для креативных задач

Определение + маркеры действия для точного уровня сложности

Растущий тестовый набор — промпт и примеры эволюционируют вместе

Двухэтапная фильтрация — широкий захват + строгая проверка

Три готовые стратегии рассуждения — Easy, Normal, Hard

Параллельные детальные персоны — разнообразие идей

Два агента для конфликтующих целей — итеративный цикл

Явная схема паттерна для аналогий

Внешняя память процедур — библиотека готовых инструкций

Двухшаговая генерация промпта через примеры

Атомарные поля — один факт на поле

Двухшаговое структурирование

Явное отслеживание состояний диалога

Заглушки для критических вычислений

Структурированный промпт с рубриками для классификации

Роль через действие, а не через статус

Консолидация контекста при путанице

Двухэтапная проверка — фильтрация + детализация

Английский якорь для ключевых понятий

Retrieve-then-Reason — двухэтапное решение длинных задач

База переиспользуемых шаблонов рассуждений

Окружение + селекция для противоречивых требований

Самопроверка перед выводом

Требуй ссылку на источник для каждого факта

Роль + Цель + Критерии качества в одном промпте

SPQE — поиск через псевдо-документ

Накопление контекста через дельты — база знаний вместо сжатия

Разблокируйте все концепты с PRO