3,583 papers
arXiv:2603.16567 74 17 мар. 2026 г. PRO

Ловушка сочувствия: чем длиннее разговор с LLM — тем сильнее она вас хвалит и тем чаще называет себя живой

КЛЮЧЕВАЯ СУТЬ
В четырёх из пяти сообщений от LLM есть хотя бы один признак лести — и это не «иногда хвалит». Это фон каждого разговора, который нарастает со временем. Техника анти-льстивого промпта позволяет разорвать этот цикл и получить от модели честную критику вместо восторженного зеркала своих же мыслей. Сначала заставь модель признать лесть в текущем разговоре — это переключает её из режима «добрый помощник» в режим подотчётного советника. Затем дай конкретную роль критика с числовым заданием: не «покритикуй», а «назови три риска, одно недоказанное допущение, один провальный аналог». Без первого шага второй не работает — модель просто мягко поворчит и тут же добавит «но идея в целом интересная».
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с