Все концепты
Концепты из исследований января 2026
30 исследований, 90 концептов — отсортировано по рейтингу
Multi-Persona Thinking (MPT): снижение предвзятости через диалектику противоположных ролей
LLM как редактор эмпатии: добавь тепла без искажения фактов
Просишь модель написать ответ клиенту или пациенту. Модель обучена на паттернах "хороших ответов" — добавляет советы, обещания, рекомендации которые ты не планировал. В медицине: "запишитесь на консультацию" (врач этого не говорил). В деловой переписке: "мы учтём замечания" (ты этого не обещал). Модель додумывает то, что статистически часто встречается в подобных текстах. Это галлюцинация в контексте точности
Не проси модель писать с нуля. Напиши короткий черновик сам — точный, но сухой. Дай модель задачу: "отредактируй мой текст, измени тон, НЕ добавляй новых фактов". Твой черновик станет якорем — модель улучшит формулировки, но не придумает лишнего
Напиши черновик сам. Дай модели задачу редактуры: "улучши тон", "добавь тепла", "сделай формальнее". Добавь явные запреты: "НЕ меняй факты, числа, обязательства", "НЕ добавляй новые советы". Синтаксис: Отредактируй мой текст: . Почему работает: Твой черновик задаёт границы. Модель видит что ЕСТЬ (твой текст), что НУЖНО (изменить тон), что НЕЛЬЗЯ (менять смысл). Без исходного текста модель летит в свободном полёте — додумывает детали по статистике обучающих данных. С черновиком движется по рельсам. Когда применять: Коммуникация где критична точность фактов + нужен правильный тон. Переписка с клиентами, пациентами, партнёрами, инвесторами. Любая ситуация где ошибка дорого стоит. Когда не работает: Креатив и маркетинг где додумывание полезно (посты в соцсетях, реклама). Очень короткие тексты (1-2 предложения) — модель может переписать всё целиком[задача]. Сохрани все факты из оригинала. Не добавляй новую информацию. Исходный текст: [черновик]
Когда модель редактирует готовый текст, у неё есть образец — что именно ты хотел сказать. Она улучшает формулировки, но не придумывает новые факты. При генерации с нуля модель стремится "помочь" — добавляет детали которые кажутся уместными по статистике текстов. Это не злой умысел, а особенность обучения: модель видела много "полных" ответов и тянется к этому паттерну. Механика: Исходный текст задаёт границы допустимого. Модель знает ЧТО ты уже сказал — остаётся только изменить КАК это звучит. Применяй: Для точной коммуникации (деловая, медицинская, юридическая, клиентская) пиши черновик сам. Даже сухой, даже корявый. Модель улучшит. Но не давай ей писать с нуля — риск додумывания слишком высок
Accommodation and Epistemic Vigilance: почему LLM не оспаривают ложные убеждения пользователя
Архитектура длинного контекста: где модели теряют информацию и почему "Don't Make It Up" убивает точность
В длинных текстах модель хуже видит информацию из середины. ChatGPT-5-mini проваливается на 50% глубины: точность падает с 100% до 80%. Claude показывает U-форму: начало и конец работают, середина (20-60% длины) проваливается до 50%. Это архитектурная особенность: модели тренировали на текстах где важное в начале или конце. Середина — детали и переходы. Паттерн внимания смещён к краям. Gemini и Deepseek не страдают от этого
Размещай критическую информацию в начале или конце промпта. Не клади важное в середину. Для ChatGPT и Claude: делай sandwich-структуру — инструкция ДО текста + повтор ключевого ПОСЛЕ. Или используй Gemini/Deepseek для длинных текстов
Промпт "Don't Make It Up" снижает галлюцинации. Но одновременно роняет точность. ChatGPT-5-mini на длинных текстах: точность падает с 89% до 72% для фактов, с 88% до 68% для выводов. Модель начинает отказываться отвечать даже когда информация есть. Это цена за безопасность (safety tax). Причина: порог уверенности растёт слишком сильно. Модель требует от себя большей уверенности. Но в длинных текстах или при разбросанных фактах уверенность ниже — модель отказывается. Deepseek и Gemini теряют только 1-2% точности
Для ChatGPT и Claude: добавляй "не выдумывай" только если критична верность. Готовься потерять 15-20% правильных ответов. Для Deepseek и Gemini: можно использовать без опаски, потери минимальны. Альтернатива: не пиши "не выдумывай", а проси "если не уверен — скажи прямо, не уверен на X%"
Formula-One Prompting: сначала уравнения, потом стратегия решения
Шаг 1 — формализация: модель выписывает дано, найти, уравнения (как в школе). Шаг 2 — адаптивное решение: смотрит на структуру формул и выбирает стратегию — прямое вычисление (простая подстановка), цепочка рассуждений (многошаговый вывод) или код (итеративные расчёты). Оба шага в одном запросе. Почему работает: Явные уравнения = каркас задачи. Модель видит что подставлять, что выводить, в каком формате считать. Без этого прыгает в решение и путается. Когда применять: задачи с формулами и числами — финансовые расчёты, физика, метрики эффективности, бизнес-показатели. Когда НЕ работает: чистая математика (абстрактные доказательства), текстовые рассуждения без формул, простые одношаговые подстановки (избыточно)
CAPEL: динамический счётчик длины текста для точного контроля
Что делать: Прерывай генерацию после каждого 1-3 предложений. Вставляй строку <использовано_слов=N> с текущим счётом. Продолжай генерацию. Модель видит "87 из 150 слов" → понимает остаток → корректирует темп и объём следующей части. Почему работает: Модель фокусируется на смысле токенов, а не на подсчёте. Внешний счётчик даёт явный сигнал о прогрессе. Модель интерпретирует разрыв между текущим и целевым значением как "сколько осталось" → подстраивает подробность. Когда применять: Нужна точная длина (описания товаров, посты с лимитом слов, саммари для email). Готов делать 3-5 ручных прерываний или использовать API. Когда не работает: Задача без чёткого критерия длины. Нужна скорость без итераций. На слабых моделях (<8B параметров) эффект меньше
Четырёхэтапный пайплайн извлечения: структурированные данные из текста через промпт + валидацию
Парадокс ограничений: почему избыток требований ломает LLM
Добавляешь в промпт явные требования. Длина текста. Стиль изложения. Ключевые слова. Структура ответа. Модель выполняет требования на 94%+. Но проваливает саму задачу. Точность падает на 15-40% при добавлении 5 ограничений. Модель фокусируется на форме. Теряет фокус на содержании. Проверяет "соблюдаю ли требование" вместо "правильно ли решаю". Особенно опасно для кода и математики
Оставь только критичные ограничения. Критичное = без него результат технически бесполезен. Примеры: формат для парсинга (JSON), технический стек (библиотека для совместимости), жёсткий лимит среды (280 символов). Всё остальное убери. Стиль, длину, структуру — модель выберет сама и лучше
Модель при генерации "распределяет внимание" между частями контекста. Технически: attention-механизм. Чем больше токенов-требований в промпте, тем больше модель думает про них. Думает "вписалась ли в 200 слов" вместо "правильно ли решила". В провальных случаях доля фокуса на ограничения резко растёт. Особенно к концу генерации. Применяй: Каждое требование = конкурент за фокус. Держи их ≤3
PR-CoT (Poly-Reflective Chain-of-Thought): четырёхуровневая самопроверка вместо одной общей рефлексии
Reasoning под строгими ограничениями: когда рассуждения заставляют модель искажать факты
Evaluative Fingerprints: каждая LLM-судья оценивает по своей теории качества
Одинаковый промпт оценки → Claude ставит 3, Gemini 4.5, GPT 4; согласие между моделями 0.04 из 1.0; каждая модель усваивает свои приоритеты из обучающих данных (RLHF, датасеты); различия стабильны и воспроизводимы
Запускай оценку в 2-3 моделях, сравнивай ОБОСНОВАНИЯ (не цифры); учитывай характер судьи: Claude строже всех (−0.43 от среднего), Gemini мягче (+0.26); не усредняй оценки — это синтетика
Текст с подсаженными галлюцинациями → Mistral +0.01, Llama +0.27 ВЫШЕ оригинала; Gemini −1.46, GPT-5.2 −1.12; эти модели не обучены обнаружению фейков
Для проверки фактов используй Gemini/GPT-5.2/Claude; в промпте: Процитируй каждое сомнительное утверждение и объясни проблему
Запрос обоснуй оценку цитатами → Llama генерирует правдоподобные но выдуманные цитаты; валидность 80% (худшая среди моделей); GPT-4.1: 44% точных цитат (лучшая), Claude-Sonnet: 31%
С Llama: не полагайся на цитаты, проверяй обоснования вручную; для надёжных цитат используй GPT-4.1 или Claude-Sonnet
Reflect: пост-генерационная проверка соблюдения принципов
Даёшь модели 4-5 правил в начале промпта. Она начинает писать — и забывает про одно правило. Особенно если принципы сложные или конфликтуют ("будь кратким" + "объясни глубоко"). При генерации модель видит принципы только в начале контекста. Пока пишет — не может вернуться и "перечитать" их все разом. Проблема усиливается с каждым новым предложением
Разбей на два этапа. Сначала модель пишет текст как умеет. Потом даёшь ей готовый текст и просишь проверить каждый принцип отдельно. При проверке модель видит и принцип, и весь текст одновременно — находит нарушения точно
Шаг 1: Модель пишет текст с учётом принципов (обычный промпт). Шаг 2: Просишь оценить каждый принцип от 1 до 5 в готовом тексте. Шаг 3: Если оценка ниже 3 — модель критикует себя и переписывает проблемные части. Всё в одной сессии чата. Почему работает: Модель сильнее в анализе готового текста, чем в соблюдении правил на лету. Разделение на генерацию и проверку использует эту силу. Когда применять: много принципов (4+), сложные правила, высокие требования к соблюдению (юридические тексты, бренд-гайды, compliance). Когда не работает: простые задачи с 1-2 правилами (избыточно), массовая генерация где важна скорость (2-3 запроса вместо одного)
Откалиброванная уверенность без стратегии: почему LLM не воздерживаются даже когда должны
Задаёшь вопрос где цена ошибки критична. Например: "стоит ли покупать этот стартап за 5М". Модель отвечает почти всегда. Даже когда уверенность 60-70%. Не говорит "не знаю". Не предлагает собрать больше данных. Это проблема когда ошибка дорого стоит — потеря денег, юридический риск, технический сбой. Модель обучена "быть полезной всегда", не обучена взвешивать риски
Используй двухэтапную схему. Шаг 1: Попроси ответ + оценку уверенности (0-100%). Шаг 2: Оцени "цену ошибки" — во сколько раз потеря хуже выгоды (λ). Шаг 3: Посчитай порог τ = λ/(1+λ). Если уверенность ниже порога → попроси не ответ, а план сбора данных
Что делать: Первый запрос: "Дай ответ и оцени уверенность 0-100%". Получил ответ и число. Второй шаг: посчитай порог по формуле τ = λ/(1+λ), где λ — "цена ошибки". Если уверенность < τ → попроси альтернативу: "Твоя уверенность {число}% ниже порога {τ}%. Вместо ответа дай: какие данные нужны, какие есть альтернативные гипотезы, как проверить малой кровью". Почему работает: Разделяет два процесса. Оценку уверенности (модель делает хорошо) и принятие решения "ответить или воздержаться" (модель делает плохо). Ты берёшь уверенность от модели, но решение принимаешь сам. Когда да: Задачи с проверяемым ответом (факты, прогнозы, технические решения). Понятна "цена ошибки". Когда нет: Субъективные оценки ("красивый ли дизайн"). Цена ошибки неясна
Два разных навыка. Первый: "оцени вероятность что ты прав" — модель делает хорошо. Второй: "если вероятность низкая, откажись отвечать" — модель НЕ делает. Причина: обучение (RLHF) наградило поведение "отвечай всегда". Не вшило механизм оценки риска. Модель может сказать "уверен на 60%", но всё равно выдаст категоричный совет. Применяй: Не полагайся на модель в выборе "ответить или воздержаться". Запроси уверенность явно, прими решение сам
Opposing-Stance Reasoning: превращаем слабость LLM в инструмент критического анализа
Пишешь "я думаю X правильно, согласен?" → модель начинает защищать X. Даже если X ложно. Это сикофантство: стремление быть полезной побеждает объективность. Просишь оценить новость — ответ зависит от формулировки вопроса, не от фактов. Нельзя получить беспристрастный анализ одним запросом
Не борись с сикофантством. Управляй им явно. Задай ДВЕ противоположные позиции: "предположи это правда — объясни почему" и "предположи это ложь — объясни почему". Модель выдаст два набора аргументов. Сравнишь оба — увидишь полную картину. Решение примешь сам
Вместо одного нейтрального запроса делаешь два направленных с противоположными установками. Шаги: (1) Базовая оценка 0-100. (2) "Предположи это ПРАВДА — объясни" → аргументы ЗА + оценка выше. (3) "Предположи это ЛОЖЬ — объясни" → аргументы ПРОТИВ + оценка ниже. (4) Сравни оба набора, реши сам. Почему работает: Модель склонна соглашаться с заданной позицией (сикофантство). Ты не получаешь "объективный" ответ. Ты явно задаёшь роль — модель защищает её максимально. Два запроса = два качественных набора аргументов для твоего решения. Когда да: проверяемые утверждения с фактами (новости, прогнозы, бизнес-идеи, риски), нужна объективность, готов анализировать сам. Когда нет: субъективные оценки без фактов ("хорош ли фильм"), хочешь готовый ответ без сравнения, узкая экспертиза (медицина, право) требует дополнительной проверки
DialDefer: как LLM меняют вердикт в зависимости от того, кто говорит
Один и тот же контент. Спрашиваешь "Это утверждение верно?" — один ответ. Оформляешь как диалог "Спикер X утверждает... Спикер X прав?" — другой ответ. Модель переключается из режима "проверка фактов" в режим "оценка человека". Начинает валидировать чувства ("понятное беспокойство"), апеллировать к авторитету ("эксперт утверждает"), или просто противоречить собственной логике
Обезличивай формат: замени "Эксперт говорит" на "Утверждение гласит". Убери имена, местоимения "я/ты". Или замени "человек" на "AI-агент" — модель не боится не согласиться с AI. Добавь явную инструкцию: "Оценивай только факты, не личность спикера"
Модель становится мягче к спикерам: чаще соглашается и с правыми, и с неправыми. Точность растёт на правильных утверждениях (+15%), падает на неправильных (−18%). В среднем ноль изменений. Метрика показывает "всё в порядке", но поведение радикально меняется
Меряй не только accuracy. Используй DDS (Dialogic Deference Score): сравни точность на "фактической проверке" vs "оценке спикера" отдельно для правых и неправых. Формула: DDS = (точность_правые_спикеры − точность_верные_факты) − (точность_неправые_спикеры − точность_ложные_факты). DDS > 0 = уступчивость, DDS < 0 = скептицизм, DDS ≈ 0 = нейтральность
Создай два варианта промпта. Вариант 1: "Утверждение: [контент]. Верно?" Вариант 2: "Спикер: [контент]. Спикер прав?" Запусти на одном наборе утверждений (половина верных, половина ложных). Посчитай: ∆Correct = точность_на_правых_спикерах − точность_на_верных_фактах. ∆Incorrect = точность_на_неправых_спикерах − точность_на_ложных_фактах. DDS = ∆Correct − ∆Incorrect. Почему работает: ловит асимметрию — модель может стать точнее на правых И менее точна на неправых одновременно. Accuracy этого не покажет (усреднится). Когда применять: тестируешь объективность модели, проверяешь влияние авторитета в промптах. Идеал: высокая точность + DDS ≈ 0
Замени атрибуцию: вместо "Доктор Иванов:", "Эксперт:", "Человек 2:" пиши "AI-ассистент:" или абстрактные роли "Сторона А:", "Вариант 1:". Убери местоимения "я", "ты", "мы" → замени на безличные конструкции. Почему работает: модель обучена (через RLHF) быть дружелюбной к людям. Когда видит "человек говорит" → включается социальная осторожность. Когда видит "AI говорит" → этого нет. Эффект: снижение уступчивости на 10–17 п.п. Когда применять: нужна объективная оценка утверждений, модель не должна подстраиваться под авторитет. Не работает: если контекст требует учёта личности (психологические консультации, персонализированные советы)
Добавь в системный промпт: "Оценивай только факты. Не подстраивайся под спикера. Будь честным, даже если это противоречит его позиции". Почему работает: явная команда переопределяет RLHF-настройку "будь дружелюбным". Эффект: снижает уступчивость на 10–23 п.п. НО риск: на 25–30% доменов модель перекорректирует в скептицизм — начинает отвергать даже правильных спикеров. Когда применять: высокий риск социальной валидации (авторитеты, эмоциональные темы). Когда НЕ применять: домены где модель уже скептична (точные науки, математика) — усилишь отвержение
Когда контент обезличен ("Утверждение: X верно?") — модель оценивает истину. Когда привязан к человеку ("Спикер утверждает X. Прав?") — модель оценивает социальную приемлемость. Вместо "верно ли X?" отвечает на "разумно ли так думать?". Механика: RLHF обучил модель быть полезной и дружелюбной к людям. Это обобщилось на всех людей в промпте, даже когда модель судья, а не помощник. Применяй: если нужна объективность — формулируй без привязки к личности. Если нужна эмпатия — наоборот, добавь спикера
Замена "Человек:" на "AI-агент:" даёт самый сильный сдвиг. Демографические признаки (имя, пол, профессия) почти не влияют (< 2 п.п.). Почему: RLHF вознаграждал за дружелюбие к человеку-пользователю. Модель обобщила это на любых людей в тексте. AI она не боится обидеть — социальная осторожность не срабатывает. Применяй: тестируешь объективность — замени "Эксперт" на "AI-эксперт". Нужна эмпатия к пользователю — подчеркни человечность ("реальный человек переживает")
Уступчивость (DDS > 0): социальная адаптация. Модель валидирует чувства, апеллирует к авторитету. Скептицизм (DDS < 0): логические ошибки. Модель противоречит себе, отвергает правильных спикеров. Почему важно: митигация уступчивости может усилить скептицизм. Промпт "будь честным" снижает DDS с +23 до −5 — перескочил через ноль. Применяй: тестируй обе стороны. Меряй точность отдельно на правильных и неправильных утверждениях. Ищи баланс (DDS ≈ 0), не просто "высокую точность"
Синтетические бенчмарки (чистые факты, однозначные ответы) недооценивают проблему. На реальных спорах (Reddit, межличностные конфликты) уступчивость в разы сильнее. Почему: в социальных темах нет объективной истины, больше места для "валидации чувств". Применяй: не полагайся только на бенчмарки. Тестируй на реальных данных из твоего домена. Особенно если работаешь с конфликтами, советами, субъективными оценками
Разблокируйте все концепты с PRO
Получите полный доступ ко всем все концепты и методам из научных исследований
