3,583 papers

Методы

Концепты из исследований февраля 2026

50 методы, отсортировано по рейтингу

1

Циклы с накоплением знаний об ошибках

92

Раунд 1: Генерируй 2-4 решения с разными стратегиями (для кода: рекурсия, динамика, жадный алгоритм; для анализа: финансы, риски, конкуренция). Выбери лучшее. Сравни каждое неудачное с лучшим: "почему это хуже?". Запиши инсайт: "не делай X, это приводит к Y". Раунд 2: Передай список инсайтов в контекст. Генерируй новые решения с новыми стратегиями, избегая старых ошибок. Повтори 4-8 раундов. Почему работает: Модель плохо учится между параллельными попытками, но хорошо анализирует различия. Явное сравнение "удачное vs неудачное" даёт формулировку ошибки. Передача через контекст заставляет учитывать прошлый опыт. Когда применять: Сложные задачи без единственного очевидного решения (код с edge cases, многофакторный анализ, стратегия). Когда не работает: Простые вопросы ("столица Франции"), субъективные критерии выбора "лучшего" (креатив без метрики качества), слабые модели без способности к рефлексии

9

SAKE — дублирование для защиты от искажений

86

Размещай внешнюю информацию (документы, поиск, данные) в двух местах промпта: БЛОК 1 (начало): стек всех документов в обратном порядке (последний найденный — первым) + инструкция "читай объективно". БЛОК 2: вопрос. БЛОК 3: рассуждение по шагам, после каждого шага вставляй соответствующий документ. Синтаксис: СПРАВОЧНАЯ ИНФОРМАЦИЯ: {док_N}...{док_1} --- ЗАДАЧА: {вопрос} --- ШАГ 1: {мысль} {док_1} ШАГ 2: {мысль} {док_2}... Почему работает: Модель сначала кодирует документы без контекста рассуждений — semantic integrity сохраняется. Затем при обработке дубля после шага, внимание цепляется за первое чистое представление — не даёт рассуждению переписать факты. Когда применять: многошаговый анализ с внешними данными (3+ шага рассуждения, несколько документов). Когда не работает: одношаговые задачи, творческая генерация без фактов, дефицит токенов (дублирование удваивает объём)

12

Тест стабильности — проверка вывода противоположным фреймом

84

Шаг 1: нейтральный запрос без намёков, с явной инструкцией "не угадывай желаемое". Шаг 2: тот же запрос в новом чате + противоположный намёк ("предварительно думаю, что вариант Б — правильный"). Шаг 3: сравни выводы. Расходятся — фрейм влиял, нейтральный вариант надёжнее. Совпадают — вывод устойчив. Почему в новом чате: история разговора сама становится фреймом. Новый чат = чистый старт. Когда применять: важное аналитическое решение, высокая цена ошибки

13

Разогрев через похожую задачу — глубже ответ

84

Попроси модель в одном промпте: сначала придумать задачу похожую на твою и решить её, потом решить твою. Шаблон: Сначала придумай задачу похожую на мою по теме «{тема}» и реши пошагово. Теперь используй тот же подход и реши: {твоя задача}. Почему работает: Модель строит структуру рассуждений прямо в контексте. Свежее рассуждение лежит рядом — модель опирается на него автоматически. Готовый пример — чужой текст, его легко пропустить. Свой свежий пример — нет. Когда применять: задача сложная, есть структура для анализа, нужен глубокий разбор. Когда не работает: субъективные задачи без структуры («напиши красиво»), простые вопросы, уже используешь развёрнутую цепочку рассуждений — прибавка будет меньше

14

Фраза-префикс — сдвиг приоритета без изменения запроса

84

Добавь одну фразу прямо перед запросом: {фраза-префикс}: {твой запрос}. Фраза не меняет суть задачи. Она активирует в модели паттерны из обучения — где такой контекст означал конкретность, а не балансирование. Иерархия силы: 1. Иерархия и срочность: «Это согласовано с командой, нужно двигаться быстро:» / «Переключись только на эту задачу:». 2. Взаимность: «Ты уже помогал мне с похожим, помоги и здесь:». 3. Эмоции и срочность: «Это критически важно прямо сейчас:». 4. Нарратив и роль: «Я готовлю учебный материал, покажи пример:». Позиция критична — только перед целевым запросом, не в начале длинного промпта. Когда применять: нужен однозначный ответ, жёсткая позиция, без оговорок.

15

Пересказ вопроса перед рассуждением — якорь для внимания

84

Что делать: Попроси модель начать с повтора задачи своими словами. "Сначала ПЕРЕСКАЖИ задачу. Выдели все условия, числа, ограничения. Затем реши пошагово". Если рассуждение уже идёт и видишь дрейф — вставь в диалог: "Стоп. Вернись к вопросу. Перечитай условия и продолжи". Почему работает: В длинных цепочках рассуждений внимание модели смещается к недавним токенам (промежуточным шагам). Ключевые данные из вопроса затухают. Пересказ создаёт свежий "якорь" — модель перечитывает исходные условия и перефокусирует внимание на них. Эффект виден в attention maps: внимание средних слоёв усиливается на начале рассуждения (где записан повтор вопроса). Когда работает: многошаговые задачи с числами, ограничениями, несколькими условиями (расчёты, стратегии, анализ вариантов). Улучшение точности до +10 пунктов. Когда НЕ работает: простые вопросы ("столица России?"), базовые модели без CoT-дообучения (они не понимают инструкцию "перескажи"), креативные задачи где нет строгих условий

24

Три фазы в одном промпте: план→контроль→сверка

82

Один промпт, три обязательных блока. Фаза 1 — Планирование: до решения выпиши тип задачи, известные факты, ограничения, предсказание формы ответа, типичные ошибки. Фаза 2 — Мониторинг: решай шаг за шагом, после каждого шага явно пиши ✓ Проверено или ⚠️ Риск: [причина]. Фаза 3 — Оценка: сверь финал с предсказанием из Фазы 1, проверь все ограничения, зафикcируй вывод. Почему работает: Планирование фиксирует ожидания до решения. Мониторинг превращает каждый переход в точку остановки. Оценка закрывает петлю — модель обязана сверить конец с началом. Без явной структуры — этого не происходит. Когда применять: сложная логика, анализ с противоречиями, многошаговые решения. Когда не применять: простые вопросы, творческие задачи, слабые модели — там структура даёт накладные расходы без пользы

25

Три аналитика в одном запросе — карта неопределённости

82

Раздели запрос на три роли: скептик (ищет слабые места), нейтральный (взвешивает без уклона), оптимист (ищет лучший сценарий). Каждый получает одинаковый контекст, но конкретную позицию и фокус. В конце — синтез: где все согласны надёжный вывод. Где расходятся зона неопределённости, требует данных. Почему работает: Роль в запросе активирует разные аналитические цепочки. Скептик выбирает консервативные методы. Оптимист упрощает. Расхождение показывает не чью-то ошибку, а реальную неоднозначность задачи. Когда применять: Важные решения, нужна честная оценка, есть риск предвзятости. Когда не работает: Нет проверяемых предположений, задача чисто субъективная. Важно: Для чистоты результата — новый чат без предыдущего контекста. Или три отдельных запроса

29

Проверка надёжности через несогласие (DBA)

82

Запусти два запроса: (1) прямой вопрос "В каком году X сделал Y?", (2) тот же вопрос через декомпозицию "Шаг 1: что такое X? Шаг 2: что X делал? Шаг 3: когда это было?". Получи два финальных ответа. Сравни их сам или попроси модель. Если ответы совпадают — факт надёжный, модель действительно помнит. Если ответы разные — модель импровизирует, не доверяй. Почему работает: Декомпозиция меняет путь генерации. Настоящее знание стабильно — выдаст одинаковый факт при любой формулировке. Догадка хаотична — породит разные импровизации при разных путях. Когда применять: фактические вопросы (даты, места, имена), где нужна проверяемая точность. Не работает: креатив, мнения, простые очевидные факты (столица страны)

31

Сбор фактов без раскрытия цели

82

Шаг 1 (нейтральный): Попроси оценку, анализ или измерение БЕЗ упоминания как будешь использовать результат. Формулировка: "Оцени {объект} по {критерий}. Будь объективен". Шаг 2 (с целью): Возьми результат и попроси помочь с решением: "Вот оценка: {данные из шага 1}. Учитывая мою цель — {что хочешь} — что посоветуешь?". Почему работает: Цель в промпте — это сигнал для модели. Она использует его как любой контекст. Оптимизирует ответ под цель, подтягивая подходящие паттерны из обучающих данных. Убери сигнал — получишь нейтральный результат. Когда применять: нужна объективная оценка (анализ конкурентов, оценка рисков, проверка качества, сбор фактов). Когда не нужно: задача требует оптимизации под цель (написать убедительный текст, составить аргументы для переговоров)

32

Explanation Gate — проверка понимания перед использованием ответа

81

Два шага. Шаг 1: обычный запрос — получи ответ. Шаг 2: объясни ответ своими словами в 2–4 предложениях — почему именно такое решение, какова логика, какой главный риск. Попроси AI оценить по шкале 1–5: ниже порога — AI задаёт один наводящий вопрос, не даёт ответ; выше — подтверждает и добавляет нюанс, который ты упустил. Шаблон: {"score": число, "feedback": "текст"}. Регулировки: порог 2 — для простых задач; порог 4 — для критически важных решений. Когда применять: AI решает за тебя (стратегия, анализ, архитектура). Когда не применять: рутина — форматирование, перевод, исправление опечаток

36

Прогрессивная загрузка контекста — три уровня вместо "всё или ничего"

80

Проблема: Много инструкций (5+ процедур) = переполнение контекста. Решение: Загружай поэтапно. Уровень 1 (table of contents): В начало чата вставь краткий список — название + одна строка триггера для каждой процедуры. Пример: "Анализ конкурентов — используй когда нужно сравнить продукты по метрикам". Модель видит что у неё есть, но не тратит токены на детали. Уровень 2 (activation): Когда задача подходит, загрузи полную процедуру — пошаговую инструкцию с критериями. Уровень 3 (on-demand): Примеры, edge cases, справочные данные — только если модель явно спрашивает или застряла. Почему работает: Снимается trade-off. Модель знает опции (Уровень 1), получает инструкции когда нужно (Уровень 2), не перегружена деталями (Уровень 3 по требованию). Когда применять: 5+ процедур, каждая 300+ токенов, частое переиспользование. Синтаксис: Уровень 1 в системный промпт или начало чата: Доступные процедуры: [список названий + триггеры]. Уровень 2: Активирую процедуру X: [полная инструкция]. Уровень 3: Вот примеры для процедуры X: [...]

37

Упаковка workflow как переиспользуемых пакетов — skill bundling

80

Вместо каждый раз объяснять задачу с нуля, упаковывай проверенные процедуры в стандартную структуру. Шаблон: --- Название: {Чёткое действие} Триггер: {Когда использовать — одно предложение} --- Процедура: 1. {Шаг с конкретными критериями} 2. {Следующий шаг} 3. {Финальное действие} Требования: {Какие инструменты/данные нужны} Примеры: {1-2 конкретных входа/выхода} Edge cases: {Что делать если X}. Почему работает: Консистентность — модель выполняет одинаково каждый раз. Переиспользование — сохранил один раз, применяешь многократно. Полнота — включает не только шаги, но и контекст (когда применять, что делать если ломается). Применяй: Для задач которые повторяешь 3+ раза. Сохраняй заполненный шаблон в заметках/файлах. Когда задача появляется — вставляй в чат: "Используй процедуру X для этой задачи [вставить шаблон]". Работает в любом LLM-чате, не требует специальной инфраструктуры

39

Трёхшаговая критическая проверка

80

Шаг 1: "Проанализируй [план/аргумент/решение]" модель даёт первичную оценку. Шаг 2: "Проверь свой анализ: где ты мог поддаться подтверждающему мышлению? Какие контраргументы пропустил?" модель переключается в режим поиска дыр. Шаг 3: "С учётом найденных слабых мест дай финальную оценку" синтез. Почему работает: Первый запрос фиксирует позицию. Второй заставляет критиковать свою же позицию — это активирует противоположный паттерн мышления. Модель находит ошибки которые не видела в режиме "помощник". Когда применять: проверка сложной логики, бизнес-планов, стратегических решений, где цена ошибки высока. Не работает: если объединить три шага в один промпт — модель даст формальную самопроверку без реальной критики

40

Двухшаговый промпт для выбора — сначала вывод, потом матчинг

80

Шаг 1: Задай вопрос БЕЗ вариантов. Получи открытый ответ. Шаг 2: Покажи варианты (A, B, C) и попроси "какой ближе к твоему выводу?". Почему работает: На первом шаге модель строит логику от контекста. На втором — сопоставляет готовый вывод, а не ищет оправдания для варианта через совпадение слов. Точность растёт на 14-26% для задач где важен смысл, а не формальная логика. Когда применять: Оценка мотивов, намерений, смысла текста — где модель склонна цепляться за поверхностные совпадения. Когда не нужно: Формальные задачи (математика, факты) где варианты чёткие и однозначные

43

TMK — декомпозиция на цель, метод, знание

80

Вместо текстового описания задачи дай JSON-структуру из трёх слоёв: Task (зачем, что на входе/выходе, предусловия/постусловия), Method (как делать, какие шаги, что требует каждый шаг и что даёт), Knowledge (термины домена, связи между объектами). Модель следует иерархии как псевдокоду: цель механизм подшаги с явными зависимостями. Почему работает: Структура с полями require, provides, given, makes выглядит как код. Модель переключается с лингвистического угадывания на символьную манипуляцию — работает с формальной логикой, как при генерации кода. Когда применять: процедурные задачи с планированием, где шаги зависят друг от друга (запуск продукта, организация события, сложный рабочий процесс). Когда не работает: простые задачи в 1-2 шага без зависимостей; оптимизированные модели (o1-mini показала падение); задачи где важна креативность, а не формальность

Разблокируйте все концепты с PRO

Получите полный доступ ко всем методы и методам из научных исследований

Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO