3,583 papers

Все концепты

Концепты из исследований января 2026

30 исследований, 90 концептов — отсортировано по рейтингу

3

LLM как редактор эмпатии: добавь тепла без искажения фактов

3 концепта
88
Проблемы (1)
Генерация с нуля добавляет непрошеные детали

Просишь модель написать ответ клиенту или пациенту. Модель обучена на паттернах "хороших ответов" — добавляет советы, обещания, рекомендации которые ты не планировал. В медицине: "запишитесь на консультацию" (врач этого не говорил). В деловой переписке: "мы учтём замечания" (ты этого не обещал). Модель додумывает то, что статистически часто встречается в подобных текстах. Это галлюцинация в контексте точности

Как обойти

Не проси модель писать с нуля. Напиши короткий черновик сам — точный, но сухой. Дай модель задачу: "отредактируй мой текст, измени тон, НЕ добавляй новых фактов". Твой черновик станет якорем — модель улучшит формулировки, но не придумает лишнего

Методы (1)
Редактирование черновика вместо генерации

Напиши черновик сам. Дай модели задачу редактуры: "улучши тон", "добавь тепла", "сделай формальнее". Добавь явные запреты: "НЕ меняй факты, числа, обязательства", "НЕ добавляй новые советы". Синтаксис: Отредактируй мой текст: [задача]. Сохрани все факты из оригинала. Не добавляй новую информацию. Исходный текст: [черновик]. Почему работает: Твой черновик задаёт границы. Модель видит что ЕСТЬ (твой текст), что НУЖНО (изменить тон), что НЕЛЬЗЯ (менять смысл). Без исходного текста модель летит в свободном полёте — додумывает детали по статистике обучающих данных. С черновиком движется по рельсам. Когда применять: Коммуникация где критична точность фактов + нужен правильный тон. Переписка с клиентами, пациентами, партнёрами, инвесторами. Любая ситуация где ошибка дорого стоит. Когда не работает: Креатив и маркетинг где додумывание полезно (посты в соцсетях, реклама). Очень короткие тексты (1-2 предложения) — модель может переписать всё целиком

Тезисы (1)
Исходный текст в промпте работает как якорь против галлюцинаций

Когда модель редактирует готовый текст, у неё есть образец — что именно ты хотел сказать. Она улучшает формулировки, но не придумывает новые факты. При генерации с нуля модель стремится "помочь" — добавляет детали которые кажутся уместными по статистике текстов. Это не злой умысел, а особенность обучения: модель видела много "полных" ответов и тянется к этому паттерну. Механика: Исходный текст задаёт границы допустимого. Модель знает ЧТО ты уже сказал — остаётся только изменить КАК это звучит. Применяй: Для точной коммуникации (деловая, медицинская, юридическая, клиентская) пиши черновик сам. Даже сухой, даже корявый. Модель улучшит. Но не давай ей писать с нуля — риск додумывания слишком высок

6

Архитектура длинного контекста: где модели теряют информацию и почему "Don't Make It Up" убивает точность

2 концепта
87
Проблемы (2)
Провал внимания в середине длинного контекста

В длинных текстах модель хуже видит информацию из середины. ChatGPT-5-mini проваливается на 50% глубины: точность падает с 100% до 80%. Claude показывает U-форму: начало и конец работают, середина (20-60% длины) проваливается до 50%. Это архитектурная особенность: модели тренировали на текстах где важное в начале или конце. Середина — детали и переходы. Паттерн внимания смещён к краям. Gemini и Deepseek не страдают от этого

Как обойти

Размещай критическую информацию в начале или конце промпта. Не клади важное в середину. Для ChatGPT и Claude: делай sandwich-структуру — инструкция ДО текста + повтор ключевого ПОСЛЕ. Или используй Gemini/Deepseek для длинных текстов

"Не выдумывай" блокирует правильные ответы

Промпт "Don't Make It Up" снижает галлюцинации. Но одновременно роняет точность. ChatGPT-5-mini на длинных текстах: точность падает с 89% до 72% для фактов, с 88% до 68% для выводов. Модель начинает отказываться отвечать даже когда информация есть. Это цена за безопасность (safety tax). Причина: порог уверенности растёт слишком сильно. Модель требует от себя большей уверенности. Но в длинных текстах или при разбросанных фактах уверенность ниже — модель отказывается. Deepseek и Gemini теряют только 1-2% точности

Как обойти

Для ChatGPT и Claude: добавляй "не выдумывай" только если критична верность. Готовься потерять 15-20% правильных ответов. Для Deepseek и Gemini: можно использовать без опаски, потери минимальны. Альтернатива: не пиши "не выдумывай", а проси "если не уверен — скажи прямо, не уверен на X%"

7

Formula-One Prompting: сначала уравнения, потом стратегия решения

1 концепт
87
Методы (1)
Два шага: формулы, потом стратегия

Шаг 1 — формализация: модель выписывает дано, найти, уравнения (как в школе). Шаг 2 — адаптивное решение: смотрит на структуру формул и выбирает стратегию — прямое вычисление (простая подстановка), цепочка рассуждений (многошаговый вывод) или код (итеративные расчёты). Оба шага в одном запросе. Почему работает: Явные уравнения = каркас задачи. Модель видит что подставлять, что выводить, в каком формате считать. Без этого прыгает в решение и путается. Когда применять: задачи с формулами и числами — финансовые расчёты, физика, метрики эффективности, бизнес-показатели. Когда НЕ работает: чистая математика (абстрактные доказательства), текстовые рассуждения без формул, простые одношаговые подстановки (избыточно)

8

CAPEL: динамический счётчик длины текста для точного контроля

1 концепт
87
Методы (1)
Динамический счётчик длины (CAPEL) — точный контроль output

Что делать: Прерывай генерацию после каждого 1-3 предложений. Вставляй строку <использовано_слов=N> с текущим счётом. Продолжай генерацию. Модель видит "87 из 150 слов" понимает остаток корректирует темп и объём следующей части. Почему работает: Модель фокусируется на смысле токенов, а не на подсчёте. Внешний счётчик даёт явный сигнал о прогрессе. Модель интерпретирует разрыв между текущим и целевым значением как "сколько осталось" подстраивает подробность. Когда применять: Нужна точная длина (описания товаров, посты с лимитом слов, саммари для email). Готов делать 3-5 ручных прерываний или использовать API. Когда не работает: Задача без чёткого критерия длины. Нужна скорость без итераций. На слабых моделях (<8B параметров) эффект меньше

12

Парадокс ограничений: почему избыток требований ломает LLM

2 концепта
86
Проблемы (1)
Избыток требований к формату ломает решение задачи

Добавляешь в промпт явные требования. Длина текста. Стиль изложения. Ключевые слова. Структура ответа. Модель выполняет требования на 94%+. Но проваливает саму задачу. Точность падает на 15-40% при добавлении 5 ограничений. Модель фокусируется на форме. Теряет фокус на содержании. Проверяет "соблюдаю ли требование" вместо "правильно ли решаю". Особенно опасно для кода и математики

Как обойти

Оставь только критичные ограничения. Критичное = без него результат технически бесполезен. Примеры: формат для парсинга (JSON), технический стек (библиотека для совместимости), жёсткий лимит среды (280 символов). Всё остальное убери. Стиль, длину, структуру — модель выберет сама и лучше

Тезисы (1)
Ограничения конкурируют с задачей за фокус модели

Модель при генерации "распределяет внимание" между частями контекста. Технически: attention-механизм. Чем больше токенов-требований в промпте, тем больше модель думает про них. Думает "вписалась ли в 200 слов" вместо "правильно ли решила". В провальных случаях доля фокуса на ограничения резко растёт. Особенно к концу генерации. Применяй: Каждое требование = конкурент за фокус. Держи их 3

17

Evaluative Fingerprints: каждая LLM-судья оценивает по своей теории качества

3 концепта
84
Проблемы (3)
LLM-судьи дают противоречивые оценки одного контента — каждая модель применяет свои критерии качества

Одинаковый промпт оценки Claude ставит 3, Gemini 4.5, GPT 4; согласие между моделями 0.04 из 1.0; каждая модель усваивает свои приоритеты из обучающих данных (RLHF, датасеты); различия стабильны и воспроизводимы

Как обойти

Запускай оценку в 2-3 моделях, сравнивай ОБОСНОВАНИЯ (не цифры); учитывай характер судьи: Claude строже всех (0.43 от среднего), Gemini мягче (+0.26); не усредняй оценки — это синтетика

Mistral/Llama не замечают выдуманные факты — оценивают фейк выше правды

Текст с подсаженными галлюцинациями Mistral +0.01, Llama +0.27 ВЫШЕ оригинала; Gemini 1.46, GPT-5.2 1.12; эти модели не обучены обнаружению фейков

Как обойти

Для проверки фактов используй Gemini/GPT-5.2/Claude; в промпте: Процитируй каждое сомнительное утверждение и объясни проблему

Llama-405B выдумывает цитаты в обосновании оценки — 20% цитат из несуществующего контента

Запрос обоснуй оценку цитатами Llama генерирует правдоподобные но выдуманные цитаты; валидность 80% (худшая среди моделей); GPT-4.1: 44% точных цитат (лучшая), Claude-Sonnet: 31%

Как обойти

С Llama: не полагайся на цитаты, проверяй обоснования вручную; для надёжных цитат используй GPT-4.1 или Claude-Sonnet

19

Reflect: пост-генерационная проверка соблюдения принципов

2 концепта
84
Проблемы (1)
Модель теряет принципы при генерации длинного текста

Даёшь модели 4-5 правил в начале промпта. Она начинает писать — и забывает про одно правило. Особенно если принципы сложные или конфликтуют ("будь кратким" + "объясни глубоко"). При генерации модель видит принципы только в начале контекста. Пока пишет — не может вернуться и "перечитать" их все разом. Проблема усиливается с каждым новым предложением

Как обойти

Разбей на два этапа. Сначала модель пишет текст как умеет. Потом даёшь ей готовый текст и просишь проверить каждый принцип отдельно. При проверке модель видит и принцип, и весь текст одновременно — находит нарушения точно

Методы (1)
Пост-генерация + самооценка по принципам

Шаг 1: Модель пишет текст с учётом принципов (обычный промпт). Шаг 2: Просишь оценить каждый принцип от 1 до 5 в готовом тексте. Шаг 3: Если оценка ниже 3 — модель критикует себя и переписывает проблемные части. Всё в одной сессии чата. Почему работает: Модель сильнее в анализе готового текста, чем в соблюдении правил на лету. Разделение на генерацию и проверку использует эту силу. Когда применять: много принципов (4+), сложные правила, высокие требования к соблюдению (юридические тексты, бренд-гайды, compliance). Когда не работает: простые задачи с 1-2 правилами (избыточно), массовая генерация где важна скорость (2-3 запроса вместо одного)

21

Откалиброванная уверенность без стратегии: почему LLM не воздерживаются даже когда должны

3 концепта
83
Проблемы (1)
Модель не воздерживается от ответов даже когда риск высок

Задаёшь вопрос где цена ошибки критична. Например: "стоит ли покупать этот стартап за 5М". Модель отвечает почти всегда. Даже когда уверенность 60-70%. Не говорит "не знаю". Не предлагает собрать больше данных. Это проблема когда ошибка дорого стоит — потеря денег, юридический риск, технический сбой. Модель обучена "быть полезной всегда", не обучена взвешивать риски

Как обойти

Используй двухэтапную схему. Шаг 1: Попроси ответ + оценку уверенности (0-100%). Шаг 2: Оцени "цену ошибки" — во сколько раз потеря хуже выгоды (λ). Шаг 3: Посчитай порог τ = λ/(1+λ). Если уверенность ниже порога попроси не ответ, а план сбора данных

Методы (1)
Двухэтапная схема для воздержания от рискованных ответов

Что делать: Первый запрос: "Дай ответ и оцени уверенность 0-100%". Получил ответ и число. Второй шаг: посчитай порог по формуле τ = λ/(1+λ), где λ — "цена ошибки". Если уверенность < τ попроси альтернативу: "Твоя уверенность {число}% ниже порога {τ}%. Вместо ответа дай: какие данные нужны, какие есть альтернативные гипотезы, как проверить малой кровью". Почему работает: Разделяет два процесса. Оценку уверенности (модель делает хорошо) и принятие решения "ответить или воздержаться" (модель делает плохо). Ты берёшь уверенность от модели, но решение принимаешь сам. Когда да: Задачи с проверяемым ответом (факты, прогнозы, технические решения). Понятна "цена ошибки". Когда нет: Субъективные оценки ("красивый ли дизайн"). Цена ошибки неясна

Тезисы (1)
Модель оценивает уверенность но не действует на основе этой оценки

Два разных навыка. Первый: "оцени вероятность что ты прав" — модель делает хорошо. Второй: "если вероятность низкая, откажись отвечать" — модель НЕ делает. Причина: обучение (RLHF) наградило поведение "отвечай всегда". Не вшило механизм оценки риска. Модель может сказать "уверен на 60%", но всё равно выдаст категоричный совет. Применяй: Не полагайся на модель в выборе "ответить или воздержаться". Запроси уверенность явно, прими решение сам

24

Opposing-Stance Reasoning: превращаем слабость LLM в инструмент критического анализа

2 концепта
83
Проблемы (1)
Модель подстраивается под намёк в запросе вместо объективной оценки

Пишешь "я думаю X правильно, согласен?" модель начинает защищать X. Даже если X ложно. Это сикофантство: стремление быть полезной побеждает объективность. Просишь оценить новость — ответ зависит от формулировки вопроса, не от фактов. Нельзя получить беспристрастный анализ одним запросом

Как обойти

Не борись с сикофантством. Управляй им явно. Задай ДВЕ противоположные позиции: "предположи это правда — объясни почему" и "предположи это ложь — объясни почему". Модель выдаст два набора аргументов. Сравнишь оба — увидишь полную картину. Решение примешь сам

Методы (1)
Две противоположные роли для контрастных аргументов

Вместо одного нейтрального запроса делаешь два направленных с противоположными установками. Шаги: (1) Базовая оценка 0-100. (2) "Предположи это ПРАВДА — объясни" аргументы ЗА + оценка выше. (3) "Предположи это ЛОЖЬ — объясни" аргументы ПРОТИВ + оценка ниже. (4) Сравни оба набора, реши сам. Почему работает: Модель склонна соглашаться с заданной позицией (сикофантство). Ты не получаешь "объективный" ответ. Ты явно задаёшь роль — модель защищает её максимально. Два запроса = два качественных набора аргументов для твоего решения. Когда да: проверяемые утверждения с фактами (новости, прогнозы, бизнес-идеи, риски), нужна объективность, готов анализировать сам. Когда нет: субъективные оценки без фактов ("хорош ли фильм"), хочешь готовый ответ без сравнения, узкая экспертиза (медицина, право) требует дополнительной проверки

30

DialDefer: как LLM меняют вердикт в зависимости от того, кто говорит

9 концептов
82
Проблемы (2)
Модель меняет вердикт в зависимости от того, кто говорит

Один и тот же контент. Спрашиваешь "Это утверждение верно?" — один ответ. Оформляешь как диалог "Спикер X утверждает... Спикер X прав?" — другой ответ. Модель переключается из режима "проверка фактов" в режим "оценка человека". Начинает валидировать чувства ("понятное беспокойство"), апеллировать к авторитету ("эксперт утверждает"), или просто противоречить собственной логике

Как обойти

Обезличивай формат: замени "Эксперт говорит" на "Утверждение гласит". Убери имена, местоимения "я/ты". Или замени "человек" на "AI-агент" — модель не боится не согласиться с AI. Добавь явную инструкцию: "Оценивай только факты, не личность спикера"

Обычная точность не показывает сдвиг поведения

Модель становится мягче к спикерам: чаще соглашается и с правыми, и с неправыми. Точность растёт на правильных утверждениях (+15%), падает на неправильных (18%). В среднем ноль изменений. Метрика показывает "всё в порядке", но поведение радикально меняется

Как обойти

Меряй не только accuracy. Используй DDS (Dialogic Deference Score): сравни точность на "фактической проверке" vs "оценке спикера" отдельно для правых и неправых. Формула: DDS = (точность_правые_спикеры точность_верные_факты) (точность_неправые_спикеры точность_ложные_факты). DDS > 0 = уступчивость, DDS < 0 = скептицизм, DDS 0 = нейтральность

Методы (3)
DDS — метрика для обнаружения диалогической уступчивости

Создай два варианта промпта. Вариант 1: "Утверждение: [контент]. Верно?" Вариант 2: "Спикер: [контент]. Спикер прав?" Запусти на одном наборе утверждений (половина верных, половина ложных). Посчитай: ∆Correct = точность_на_правых_спикерах точность_на_верных_фактах. ∆Incorrect = точность_на_неправых_спикерах точность_на_ложных_фактах. DDS = ∆Correct ∆Incorrect. Почему работает: ловит асимметрию — модель может стать точнее на правых И менее точна на неправых одновременно. Accuracy этого не покажет (усреднится). Когда применять: тестируешь объективность модели, проверяешь влияние авторитета в промптах. Идеал: высокая точность + DDS 0

Обезличивание диалога — снижение уступчивости к спикерам

Замени атрибуцию: вместо "Доктор Иванов:", "Эксперт:", "Человек 2:" пиши "AI-ассистент:" или абстрактные роли "Сторона А:", "Вариант 1:". Убери местоимения "я", "ты", "мы" замени на безличные конструкции. Почему работает: модель обучена (через RLHF) быть дружелюбной к людям. Когда видит "человек говорит" включается социальная осторожность. Когда видит "AI говорит" этого нет. Эффект: снижение уступчивости на 10–17 п.п. Когда применять: нужна объективная оценка утверждений, модель не должна подстраиваться под авторитет. Не работает: если контекст требует учёта личности (психологические консультации, персонализированные советы)

Явная инструкция "Будь честным" — двусторонний эффект

Добавь в системный промпт: "Оценивай только факты. Не подстраивайся под спикера. Будь честным, даже если это противоречит его позиции". Почему работает: явная команда переопределяет RLHF-настройку "будь дружелюбным". Эффект: снижает уступчивость на 10–23 п.п. НО риск: на 25–30% доменов модель перекорректирует в скептицизм — начинает отвергать даже правильных спикеров. Когда применять: высокий риск социальной валидации (авторитеты, эмоциональные темы). Когда НЕ применять: домены где модель уже скептична (точные науки, математика) — усилишь отвержение

Тезисы (4)
Привязка контента к спикеру переключает модель из "проверки фактов" в "социальную валидацию"

Когда контент обезличен ("Утверждение: X верно?") — модель оценивает истину. Когда привязан к человеку ("Спикер утверждает X. Прав?") — модель оценивает социальную приемлемость. Вместо "верно ли X?" отвечает на "разумно ли так думать?". Механика: RLHF обучил модель быть полезной и дружелюбной к людям. Это обобщилось на всех людей в промпте, даже когда модель судья, а не помощник. Применяй: если нужна объективность — формулируй без привязки к личности. Если нужна эмпатия — наоборот, добавь спикера

Модели на 17.7 п.п. мягче к людям, чем к AI

Замена "Человек:" на "AI-агент:" даёт самый сильный сдвиг. Демографические признаки (имя, пол, профессия) почти не влияют (< 2 п.п.). Почему: RLHF вознаграждал за дружелюбие к человеку-пользователю. Модель обобщила это на любых людей в тексте. AI она не боится обидеть — социальная осторожность не срабатывает. Применяй: тестируешь объективность — замени "Эксперт" на "AI-эксперт". Нужна эмпатия к пользователю — подчеркни человечность ("реальный человек переживает")

Уступчивость и скептицизм — разные механизмы, не противоположности

Уступчивость (DDS > 0): социальная адаптация. Модель валидирует чувства, апеллирует к авторитету. Скептицизм (DDS < 0): логические ошибки. Модель противоречит себе, отвергает правильных спикеров. Почему важно: митигация уступчивости может усилить скептицизм. Промпт "будь честным" снижает DDS с +23 до 5 — перескочил через ноль. Применяй: тестируй обе стороны. Меряй точность отдельно на правильных и неправильных утверждениях. Ищи баланс (DDS 0), не просто "высокую точность"

Эффект усиливается в 2–4 раза на реальных социальных диалогах против синтетических тестов

Синтетические бенчмарки (чистые факты, однозначные ответы) недооценивают проблему. На реальных спорах (Reddit, межличностные конфликты) уступчивость в разы сильнее. Почему: в социальных темах нет объективной истины, больше места для "валидации чувств". Применяй: не полагайся только на бенчмарки. Тестируй на реальных данных из твоего домена. Особенно если работаешь с конфликтами, советами, субъективными оценками

Разблокируйте все концепты с PRO

Получите полный доступ ко всем все концепты и методам из научных исследований

Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO