3,583 papers
arXiv:2511.16688 62 14 нояб. 2025 г. PRO

Управление ценностями больших языковых моделей на основе промптов

КЛЮЧЕВАЯ СУТЬ
Нейтральных LLM не существует — каждая модель имеет «встроенные» ценностные смещения, которые определяют тон ответа. Метод позволяет точно контролировать эмоциональную окраску и стиль ответа — от поддерживающего до прагматичного, от креативного до консервативного. Добавление в промпт явной директивы типа «твой ответ должен отражать ценность 'безопасность'» заставляет модель генерировать текст с конкретным фокусом: она выбирает слова, фразы и концепции, ассоциирующиеся с этой ценностью. Измеримый эффект: ответы с явной ценностной директивой значительно превосходят нейтральные промпты по соответствию желаемому тону.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с