3,583 papers
arXiv:2510.17535 82 20 окт. 2025 г. FREE

Формулировка role-play в промптах: наречие работает сильнее прилагательного

КЛЮЧЕВАЯ СУТЬ
Замена трёх слов в промпте меняет качество работы модели в 5 раз. Какие слова? Не те, что думаешь. Парадокс: "Работай точно" сильнее чем "точный работник". Прилагательное задаёт статус, наречие — действие. Модель цепляется за действие. Метод позволяет получать стабильные и предсказуемые результаты через формулировку роли: не КТО работает, а КАК работать. Фокус на действии даёт nDCG 0.5, фокус на статусе — 0.1. Пример: "анализируй критично" vs "критичный аналитик". Роль закрепляется в ранних слоях модели — это установка для всей задачи. Наречие конкретизирует установку, прилагательное размыто.
Адаптировать под запрос

TL;DR

Механика role-play в LLM: При формулировке роли наречие ("работай точно") влияет на поведение модели сильнее, чем прилагательное ("точный работник"). Исследователи через activation patching — технику, которая отслеживает как информация передаётся внутри модели — выяснили, что информация о роли кодируется в ранних слоях почти независимо от самой задачи.

Главная находка: Замена всего трёх слов в описании роли меняет качество работы модели в 5 раз (метрика nDCG от 0.1 до 0.5). Например, "expert assistant that ranks accurately" работает стабильнее чем "accurate expert assistant". Позитивные роли ("careful", "expert") дают более предсказуемый результат, чем негативные ("sloppy", "confused"). Причина: роль закрепляется в модели рано и напрямую влияет на финальное поведение, почти не пересекаясь с контентом самого запроса.

Иерархия компонентов роли: Тестируя шаблон "You are a/an {прилагательное} assistant that {модальный глагол} work {наречие}", исследователи нашли: наречие несёт главный сигнал (accurately, carefully), прилагательное — поддержку (expert, reliable), а модальный глагол (can, will) почти не влияет. Это объясняет, почему фокус на действии ("ранжируй точно") работает сильнее фокуса на статусе ("точный ранжировщик").


🚀

Пример применения

⚠️ Ограничения метода: Исследование проводилось на задачах ранжирования документов. Эффект может различаться в других доменах, но принцип формулировки роли универсален.

Задача: Проверка договора перед подписанием. Нужно найти все риски и подводные камни — работа требует предельной внимательности.

Промпт A (фокус на статус):

Ты опытный юрист. Проверь этот договор на риски.

[текст договора]

Промпт B (фокус на действие):

Ты юрист. Читай внимательно каждый пункт, ищи скрытые риски, проверяй формулировки на двусмысленность. Вот договор:

[текст договора]

Результат: Промпт B даст более детальный анализ с конкретными замечаниями к формулировкам. Модель сфокусируется на процессе проверки (читай внимательно, ищи, проверяй), а не просто на роли "опытный юрист". Вы увидите разбор по пунктам с указанием потенциальных рисков в каждом.


🧠

Почему это работает

Слабость LLM: Абстрактные роли ("опытный эксперт") дают модели слишком много свободы интерпретации. Одна и та же роль может сработать по-разному в зависимости от контекста.

Сильная сторона LLM: Модели отлично следуют конкретным инструкциям о действиях. Чем точнее описано КАК работать — тем стабильнее результат.

Как работает: Информация о роли кодируется в ранних слоях модели и почти не взаимодействует с содержанием запроса (query/document). Это значит, что роль работает как установка поведения, которая применяется ко всему последующему процессу. Наречие конкретизирует ЭТУ установку ("работай точно"), в то время как прилагательное остаётся абстрактным ("точный работник" — а что это значит на практике?).

Рычаги управления:

  • Наречия — главный рычаг силы роли. Меняй их для разного стиля работы: "внимательно" vs "быстро", "критично" vs "поддерживающе"
  • Конкретизация действий — добавляй глаголы для усиления: "проверяй каждый пункт", "ищи противоречия"
  • Позитивность формулировки — позитивные роли стабильнее. Вместо "не будь поверхностным" → "анализируй глубоко"

📌

Формула применения

Вместо абстрактной роли через прилагательное:

❌ Ты {прилагательное} {роль}

Формулируй роль через конкретные действия:

✅ Ты {роль}. {Глагол_1} {наречие_1}, {глагол_2} {наречие_2}

Примеры трансформации:

Было (статус)Стало (действие)
Ты критичный аналитикТы аналитик. Анализируй критично, ищи слабые места
Ты внимательный редакторТы редактор. Читай внимательно, проверяй каждую деталь
Ты креативный копирайтерТы копирайтер. Пиши ярко, удивляй формулировками

Пояснение: Подставь свою роль и 2-3 конкретных действия с наречиями. Наречия должны отражать КАК именно нужно выполнять работу.


⚠️

Ограничения

⚠️ Домен исследования: Эффект проверен на задачах ранжирования документов (IR). В других доменах (генерация текста, анализ, код) разница может быть менее драматичной.

⚠️ Чувствительность к формулировке: Даже позитивные роли могут дать разный результат в зависимости от конкретных слов. Негативные роли ("неопытный", "медленный") ведут себя непредсказуемо — иногда даже лучше базового промпта без роли.

⚠️ Языковая специфика: Исследование на английском. Прямой перенос конструкции "assistant that works accurately" в русский звучит неестественно. Адаптируй принцип: фокус на действие через глагол + наречие.


🔍

Как исследовали

Исследователи создали шаблон роли с тремя изменяемыми слотами: {прилагательное} {модальный глагол} {наречие}. Например: "You are a talented assistant that can rank passages carefully". Сгенерировали 300 вариантов (10 прилагательных × 3 модальных × 10 наречий), разделённых на позитивные ("expert", "carefully") и негативные ("confused", "poorly").

Тестировали на LLaMA-3.1-8B-Instruct в задачах ранжирования документов (MS MARCO, TREC DL 2019). Качество измеряли метрикой nDCG@10 — насколько хорошо модель ставит релевантные документы в топ-10.

Ключевой метод — activation patching: Запускали модель дважды — с позитивной ролью ("expert") и негативной ("confused"). Затем подменяли активации (внутренние состояния модели) из позитивного запуска в негативный на разных слоях. Если подмена восстанавливала качество — значит, в этом слое/компоненте закодирована информация о роли.

Удивительная находка: Роль кодируется в ранних слоях (0-13 из 32) и почти не взаимодействует с query и document. Это значит, что роль работает отдельно от задачи — она устанавливает общий паттерн поведения, который потом применяется к любому контенту.

Иерархия компонентов: Отдельно патчили каждый тип токена (прилагательное, модальный глагол, наречие). Наречие дало максимальное восстановление качества, прилагательное — среднее, модальный глагол — почти ноль. Это доказывает, что наречие несёт главный сигнал роли.

Эффект проверили на других моделях (Mistral-7B, Qwen2.5-7B) и датасете (Natural Questions) — паттерн сохранился, хотя конкретные слои взаимодействия немного различались.


🔗

Ресурсы

How role-play shapes relevance judgment in zero-shot LLM rankers

arXiv preprint, 2025

Код исследования

Авторы: Yumeng Wang, Jirui Qi, Catherine Chen, Panagiotis Eustratiadis, Suzan Verberne

Leiden University, University of Groningen, Brown University, University of Amsterdam


📋 Дайджест исследования

Ключевая суть

Замена трёх слов в промпте меняет качество работы модели в 5 раз. Какие слова? Не те, что думаешь. Парадокс: "Работай точно" сильнее чем "точный работник". Прилагательное задаёт статус, наречие — действие. Модель цепляется за действие. Метод позволяет получать стабильные и предсказуемые результаты через формулировку роли: не КТО работает, а КАК работать. Фокус на действии даёт nDCG 0.5, фокус на статусе — 0.1. Пример: "анализируй критично" vs "критичный аналитик". Роль закрепляется в ранних слоях модели — это установка для всей задачи. Наречие конкретизирует установку, прилагательное размыто.

Принцип работы

Не описывай КТО должен работать — опиши КАК нужно работать. Формула: вместо "Ты {прилагательное} {роль}" пиши "Ты {роль}. {Глагол} {наречие}". Наречие несёт главный сигнал: "внимательно", "критично", "быстро". Прилагательное даёт поддержку: "опытный", "надёжный". Модальный глагол (can, will, должен) почти не влияет. Примеры трансформации: "опытный юрист" → "юрист. Читай внимательно каждый пункт". "Креативный копирайтер" → "копирайтер. Пиши ярко, удивляй формулировками".

Почему работает

Абстрактные роли дают модели слишком много свободы. "Опытный эксперт" — а что это значит на практике? Модель закрепляет роль в ранних слоях. Она почти не взаимодействует с контентом запроса. Роль = установка поведения для всего процесса. Наречие конкретизирует установку ("работай точно"). Прилагательное размыто ("точный работник" — но как именно?). Цифры: замена трёх слов меняет метрику в 5 раз (nDCG с 0.1 до 0.5). Позитивные роли ("careful", "expert") стабильнее. Негативные ("sloppy", "confused") ведут себя непредсказуемо — иногда даже хуже промпта вообще без роли.

Когда применять

Задачи требующие стабильности результата → конкретно для анализа, ревью, проверки документов — особенно когда абстрактные роли дают разброс качества от запуска к запуску. НЕ подходит если нужна креативность без ограничений — жёсткие инструкции о действиях могут душить свободу генерации.

Мини-рецепт

1. Замени прилагательное на действие: Вместо "внимательный редактор" пиши "редактор. Читай внимательно, проверяй детали"
2. Добавь 2-3 глагола с наречиями: "Анализируй критично, ищи слабые места, проверяй факты"
3. Используй позитивные формулировки: Вместо "не будь поверхностным" → "анализируй глубоко"

Примеры

[ПЛОХО] : Ты критичный аналитик. Проверь этот отчёт на ошибки
[ХОРОШО] : Ты аналитик. Анализируй критично каждый тезис, ищи слабые места в аргументации, проверяй цифры на непротиворечивость. Вот отчёт: [текст] Результат: второй промпт даст разбор по пунктам с конкретными замечаниями к каждому тезису. Модель фокусируется на процессе проверки (анализируй, ищи, проверяй), а не просто выдаёт общую оценку от лица "критичного аналитика".
Источник: How role-play shapes relevance judgment in zero-shot LLM rankers
ArXiv ID: 2510.17535 | Сгенерировано: 2026-01-11 23:44

Методы

МетодСуть
Роль через действие, а не через статусОписывай роль модели через глаголы и наречия. Не через прилагательные. Синтаксис: Ты {роль}. {Глагол} {наречие}, {глагол_2} {наречие_2}. Пример: вместо "Ты внимательный редактор" пиши "Ты редактор. Читай внимательно, проверяй каждую деталь". Почему работает: Прилагательное абстрактно — "точный" можно понять по-разному. Наречие конкретно — "работай точно" направляет действие. Роль формируется в ранних слоях модели как установка поведения на весь дальнейший процесс. Наречие делает эту установку однозначной. Когда применять: любая задача где задаёшь роль. Особенно важно для стабильности результата. Не работает: если роль вообще не нужна
📖 Простыми словами

Формулировка role-play в промптах: наречие работает сильнее прилагательного

arXiv: 2510.17535

Суть в том, что когда ты просишь нейронку «представь, что ты эксперт», ты на самом деле не даешь ей четкую инструкцию, а просто переключаешь тумблер в ее мозгах. Исследователи залезли внутрь модели через activation patching — это когда буквально смотрят, по каким проводам бежит ток, — и увидели, что информация о роли прописывается в ранних слоях нейросети. Модель сначала решает, «кто она сегодня», и только потом начинает вникать в суть твоего вопроса. Это фундаментальный баг или фича: роль живет отдельно от задачи, но полностью меняет фильтр, через который AI смотрит на мир.

Это как если бы ты пришел к актеру и сказал: «Играй Гамлета». Если актер плохой, он просто наденет плащ и будет грустить, но не поймет, что именно делать на сцене. Формально роль есть, а толку ноль. Нейронка ведет себя так же: абстрактные ярлыки вроде «опытный эксперт» дают ей слишком много свободы для фантазий. Она начинает не работать лучше, а просто имитировать манеру речи, часто забывая про точность фактов. Это слабость LLM, которую мы по ошибке принимаем за интеллект.

Самый сок исследования в лингвистике: наречия бьют прилагательные. Если ты пишешь «будь точным специалистом», модель может проигнорировать «точного» и сфокусироваться на «специалисте». Но если сказать «работай точно», магия срабатывает в разы лучше. Наречие — это команда к действию, а не описание декорации. В задачах на ранжирование документов это критично: один лишний эпитет в промпте может заставить модель выкинуть релевантный текст просто потому, что он не вписался в ее «актерский образ».

Хотя эксперименты ставили на сортировке текстов, этот принцип формулировки роли универсален. Неважно, пишешь ты код, составляешь план тренировок или просишь нейронку проверить юридический договор. Если ты навешиваешь на нее роль через прилагательные, ты просто тратишь токены. Нужно бить в глаголы и наречия, задавая конкретный вектор движения, а не просто надевая на модель красивую шляпу «профессионала». SEO-копирайтинг для AI теперь выглядит именно так: меньше эпитетов, больше динамики.

Короче, хватит надеяться, что фраза «ты — лучший в мире аналитик» магическим образом поднимет качество ответа. Это иллюзия контроля. Чтобы реально выжать из модели результат, нужно диктовать ей, как именно совершать действие, а не кем ей при этом себя воображать. 60% успеха промпта зависит от того, насколько жестко ты ограничил ее манеру исполнения, а не от глубины выбранного образа. Иначе ты получишь просто уверенного в себе дилетанта, который красиво лажает.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с