3,583 papers

Методы

Концепты из исследований марта 2026

50 методы, отсортировано по рейтингу

2

Отдельный сеанс для проверки

88

Готовый артефакт копируешь в новый чат. Никакой истории создания — только текст и запрос на проверку. Шаблон: «Проверь по критериям: 1) точность фактов, 2) внутренние противоречия, 3) применимость для {аудитория}, 4) что может быть неправильно понято, 5) чего не хватает для {цель}». Для каждой проблемы: место в тексте + серьёзность. Почему работает: в новом сеансе нет якорей. Нет истории одобрений. Модель не знает что это её текст — подхалимство исчезает. Контекст короткий — эффект «потерялся в середине» слабее. Когда не работает: творческие тексты без чётких критериев, технические ошибки связанные с конкретной средой (нужен человек)

5

Судья-отборщик — выбрать один лучший из нескольких

84

Два шага. Шаг 1: получи несколько вариантов (от разных моделей или с разными запросами). Шаг 2: отдельным запросом попроси судью выбрать одного победителя. Шаблон: Ты — судья. Выбери лучший {тип контента} из {N} вариантов. НЕ объединяй. Критерии: {критерий 1}, {критерий 2}. --- ВАРИАНТ 1: ... --- ВАРИАНТ 2: ... Победитель: ВАРИАНТ [N]. Причина: одно предложение. Почему работает: разные модели ошибаются в разных местах. Шансы, что все три одновременно ошиблись там же — малы. В пуле почти всегда есть один сильный вариант. Судья его находит и сохраняет. Когда работает: сложные тексты, стратегические решения, задачи где качество ответов действительно различается. Когда не работает: простые фактические задачи, однородные варианты (три похожих запроса к одной модели)

6

No-Have запрет — убираешь шаблоны, получаешь механику

84

Добавь в промпт: "Не используй глагол «иметь/обладать» в посессивном значении. Вместо «X имеет Y» описывай через действия и отношения: что происходит, как устроено, что из чего следует." Почему работает: Фраза "компания имеет ресурсы" ни о чём не говорит. Запрет заставляет описать конкретно: что за ресурсы, как они задействуются, что меняется. Модель перестаёт прятаться за посессивную конструкцию. Когда применять: анализ решений, этические дилеммы, классификация, оценка рисков. Когда не применять: формальная логика с отношениями подмножеств — там небольшая просадка

7

E-Prime запрет — убираешь ярлыки, получаешь поведение

84

Добавь в промпт: "Не используй формы глагола «быть/являться» как связку. Не «X является Y», не «это — проблема». Вместо этого описывай поведение: что происходит, при каких условиях, какой механизм запускается." Почему работает: "Это плохое решение" — ярлык, мысль остановилась. "При таком решении падает конверсия и растёт нагрузка на поддержку" — описание механизма, мысль продолжается. Когда применять: причинно-следственный анализ, критика без оценочных суждений. ⚠️ Проверяй модель: на задачах с взвешенными суждениями эффект непредсказуем. Протестируй перед использованием

11

Антифреймовая инструкция — честная критика без влияния твоих слов

83

Три шага в одном запросе. Шаг 1: убери все оценочные слова ("отличный", "надёжный", "я уверен"). Шаг 2: добавь явно: "Игнорируй мои описания. Анализируй только содержание само по себе." Шаг 3: сформулируй цель: "Найди слабые места, необоснованные допущения, пропущенные риски. Не ищи подтверждений." Почему работает: явная инструкция — это тоже токены в контексте. Сильная инструкция вытесняет слабый фоновый фрейм. Когда явно написано "ищи проблемы" — это весит больше, чем фоновое "отличный". Когда работает: единичный запрос на критику. Когда не работает: диалог где после критики давишь "может всё ок?" — модель переключится на одобрение

12

Двухшаговый аудит рассуждений через таксономию

83

Шаг 1. Попроси модель развернуть рассуждение: "Думай вслух, показывай каждый шаг, нумеруй их". Шаг 2. В новом запросе вставь цепочку и попроси проверить её по таксономии из 9 типов ошибок. Таксономия разбита на три группы: ошибки разбора задачи (неверная интерпретация, пропущенные условия, ошибка перевода понятий в логику), ошибки выполнения (неверный вывод из посылок, ошибка в подсчётах, шаги противоречат друг другу), ошибки управления процессом (зацикливание, уход от темы, ответ без обоснования). Формат: Шаг [N]: [ОК] или [ОШИБКА — тип: объяснение]. Почему работает: LLM плохо проверяет себя в момент генерации. Но она хорошо классифицирует текст по заданным категориям. Когда типы ошибок вшиты в промпт и задача — «найди соответствие», модель работает как редактор с чек-листом. Генерация и проверка — разные режимы. Когда применять: сложный анализ, финансовые и юридические выводы, многошаговые расчёты. Когда не работает: короткие ответы без шагов, творческие задачи без критерия правильности

13

Формула вместо списка требований — оценка через произведение

83

Описываешь каждый критерий как переменную: X1 — маржа, X2 — спрос, X3 — доступность. Задаёшь формулу: O(a) = E[X1] × E[X2] × E[X3]. Просишь: 1) сгенерировать 7–10 вариантов, 2) оценить каждую переменную отдельно от 0 до 1, 3) перемножить и выбрать максимум. Почему работает: модель плохо балансирует несколько целей одновременно, но хорошо оценивает один изолированный критерий. Формула разбивает одну сложную задачу на несколько простых. Мультипликативная структура добавляет логику: если один критерий близок к нулю — весь вариант проваливается, даже при хороших остальных. Когда работает: критерии можно описать измеримо ("вероятность, что бюджет не превысит 500 тыс."). Не работает: субъективные задачи ("напиши красивый текст"), слабые модели (ниже уровня GPT-4o, Claude Sonnet). Рычаги: добавь X4, X5 для тонкого контроля; уточни шкалу (0–1 или 1–10, главное — одинаково для всех); меняй число кандидатов (3–5 для сравнения известных, 15–20 для широкого поиска)

14

Трёхэтапный совет экспертов — ловит пропуски

82

Шаг 1: Каждый эксперт отвечает изолированно. Не знает что скажут остальные. 3–4 роли с конкретной специализацией — не «юрист», а «арбитражник по строительным спорам». Шаг 2: Каждый анонимно оценивает все ответы, включая свой. Анонимно — значит «Ответ А», «Ответ Б», без имён. Иначе модель «доверяет» авторитетной роли и остальные голоса становятся декоративными. Шаг 3: Председатель видит задачу + все ответы + всю критику. Синтезирует финальный ответ. Почему работает: Разные роли = разные точки входа. Финансист не смотрит на формулировки. Юрист не смотрит на налоги. Вместе покрывают то, что одна роль не заметит. Когда не применять: Фактический вопрос с однозначным ответом — совет только утроит длину

15

Фильтр стабильности — отсев по повторяемости

82

Запроси источники по теме три раза. Можно в одной модели (три отдельных чата), можно в трёх разных моделях. Сравни списки. Возьми только то, что появилось 2 раза из трёх. Почему работает: реальные источники — устойчивые точки в данных обучения. Модель воспроизводит их стабильно. Выдуманные — случайны. Возникают раз и не повторяются. Повторяемость = сигнал реальности. Точность: три модели дают ~96% реальных источников. Одна модель, три повтора — ~89%. Без фильтра — от 43% до 89% галлюцинаций в зависимости от модели. Синтаксис финального запроса: Выдели источники, которые встречаются минимум в 2 списках из 3. [Список 1] [Список 2] [Список 3] Когда усилить: узкая тема, нишевая область — требуй совпадение в 3 из 3

16

Формулировка "классические" — снижение галлюцинаций на старте

82

Вместо "свежие и влиятельные источники" пиши "основополагающие и классические работы". Почему работает: классические статьи цитируются тысячи раз. Хорошо закреплены в данных обучения. "Свежие" — часто за датой среза или почти отсутствуют в данных. Модель заполняет пробел выдуманным. Ключевые слова: "основополагающие", "классические", "фундаментальные", "семинальные" Эффект: галлюцинаций становится меньше примерно на 20 процентных пунктов. Это снижение, не решение — фильтр стабильности всё равно нужен

18

Якорь актуального — защита от старых данных

82

Перед вопросом о текущем состоянии явно пиши актуальные данные. Полностью. Без отсылок к «как обсуждали выше». АКТУАЛЬНО: [все нужные данные прямо здесь]. Вопрос: [что нужно сделать]. Почему работает: свежие данные стоят максимально близко к генерации. Ранняя информация не успевает «перекрыть». Когда применять: длинный чат, несколько итераций правок, обновлялись цифры или условия. Когда не нужно: короткий чат, ничего не менялось

19

Сброс через краткое изложение — обнуление накопленного

82

Вместо продолжения длинного чата начни новый. В первом сообщении дай полное текущее состояние: что делаем, какие параметры, что готово, что осталось. Вот актуальное состояние задачи: [всё нужное]. Продолжай отсюда. Почему работает: убирает весь накопленный приоритет старых данных. Новый чат — чистое поле. Когда применять: задача шла долго, много итераций, чувствуешь что модель «застряла» на старом

27

Hypothesis-Verification — гипотеза до поиска

80

Четыре роли в одном промпте. Сначала Thinker: для каждого варианта — "что должно быть правдой в данных, если именно он верен?". Потом Judge: "какое минимальное наблюдение разделит все версии?" — одна конкретная улика, не список. Потом Verifier: ищет улику в данных, выдаёт статус: ПОДТВЕРЖДЕНО / ЧАСТИЧНО / НЕ ПОДТВЕРЖДЕНО + цитаты. Потом Answer: финальный вывод с явной цепочкой логики. Почему работает: Когда роли разделены явно, каждый шаг не тянет следующий к первому найденному ответу. Judge специально ищет разделяющее, а не подтверждающее. Когда применять: есть несколько конкурирующих версий и данные для проверки. Когда не работает: открытый вопрос без вариантов ответа — Judge не может сформулировать улику, если нечего различать.

34

Аудитная структура — делаешь рассуждение проверяемым

80

Добавь в запрос жёсткую структуру: краткий вывод (1-2 предложения) пронумерованные шаги рассуждения флаги неуверенности на каждом шаге блок противоречий (если вывод расходится с шагами). Пример: Шаг 1: ... Шаг 2: ... Флаги: здесь данные 2022 года. Противоречия: вывод говорит X, Шаг 2 предполагает Y. Почему работает: каждый шаг — точка контроля. Видишь конкретный шаг, не общий нарратив. Противоречие между шагами становится явным, а не замаскированным. Когда да: проверка фактов, аналитика, логические цепочки. Когда слабее: субъективные оценки, творческие задачи без объективного критерия

35

Аудит ограничений — контроль правил в длинных диалогах

80

Вставляй два шага перед любым запросом в длинной сессии. Шаг 1: Перечисли все активные ограничения из нашей беседы: обязательные требования, запреты, принятые решения, форматы. Шаг 2: Проверь: нарушает ли твой планируемый ответ хоть одно из перечисленных ограничений? Если да — сообщи до ответа. Потом ставь саму задачу. Почему работает: Модель хорошо следует тому, что написано прямо сейчас. Шаг 1 переносит "затонувшие" правила из истории диалога в текущее сообщение. Шаг 2 заставляет сверить ответ с этим списком до генерации. Когда применять: сессия перевалила за 5–7 сообщений; добавляешь новое требование; кажется что "что-то пошло не так". Когда не нужен: диалог из 2–3 сообщений — только лишний шум

38

Двухшаговая "прививка" перед оценкой

80

Шаг 1: Попроси модель разобрать манипулятивные намерения в тексте. Дай конкретный список типов: подрыв доверия к экспертам, разжигание конфликта между группами, продвижение конспирологии и т.д. Для каждого типа: Да/Нет + примеры из текста. Шаг 2: Вставь вывод из шага 1 в новый запрос с предупреждением ⚠️ Этот текст может содержать скрытые манипуляции. Попроси финальный вердикт с учётом находок. Почему работает: Когда модель явно называет приёмы манипуляции на шаге 1 — они теряют убеждающую силу. Модель уже не может "поверить" тексту на шаге 2. Когда работает: длинные тексты с развёрнутой аргументацией (статьи, посты от 500 слов). Когда слабее: короткие посты в 2-3 предложения — мало материала для разбора намерений. Список типов меняй под задачу: для маркетинга — "ложная срочность", "скрытое сравнение"; для здоровья — "антинаучные утверждения", "страх как мотиватор"

40

Категорийное извлечение — полный обход документа по углам

80

Вместо одного запроса "найди всё" — несколько запросов с чёткими семантическими границами. Каждый запрос покрывает свою зону: контекст и участники / внешние зависимости / цели и критерии успеха / конкретные функции и ограничения. Синтаксис: КАТЕГОРИЯ 1 — [название]: [что искать + примеры]. КАТЕГОРИЯ 2 — [название]: [что искать + примеры]... В конце добавь: Укажи противоречия между категориями. Почему работает: Модель генерирует в рамках заданного пространства. Широкий запрос = большое размытое пространство = тяготение к типичному. Узкий запрос с примерами = маленькое чёткое пространство = находит именно там. Когда применять: объёмные документы, брифы, договоры, ТЗ — там где нужен полный охват. Когда не работает: текст на абзац, творческие задачи без критериев полноты

43

Четыре фазы для постановки цели с обязательством

79

Фаза 1: AI расспрашивает контекст — что происходит, что даёт энергию. Фаза 2: AI выясняет приоритеты — что важно прямо сейчас. Фаза 3: AI уточняет цель до конкретики — срок + измеримый результат. Фаза 4: явный отчёт — AI спрашивает "когда вернёшься и что именно расскажешь?". Почему работает: Мозг реагирует на разговорную форму как на отношения. Финальное обещание создаёт ощущение "кто-то ждёт". Именно это двигает выполнение. Ключевое условие: Фаза 4 обязательна. Без неё сессия не создаёт обязательства. Синтаксис: "В конце зафиксируй: когда я вернусь к тебе с отчётом и что именно расскажу?"

45

8 осей неопределённости — ответ с первого раза

79

Пиши промпт, который закрывает 8 вопросов: Что (задача), Зачем (цель и критерий успеха), Кто (аудитория и уровень), Когда (период данных), Где (контекст применения), Как делать (методология и структура), Сколько (объём), Тон (стиль и чего избегать). Пиши обычным текстом. Не JSON. Почему работает: каждое измерение — это ось, по которой ответ может уйти не туда. Закрыл все восемь — пространство для "угадывания" исчезает. Когда применять: задача неоднозначная, результат будешь переделывать, или ставки высокие. Когда не применять: один чёткий ответ, нет контекстной неопределённости

Разблокируйте все концепты с PRO

Получите полный доступ ко всем методы и методам из научных исследований

Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO