3,583 papers
arXiv:2507.04250 55 6 июля 2025 г. PRO

Ровно столько сдвигов, сколько нужно: снижение чрезмерного отказа в выровненных языковых моделях с помощью целевой донастройки представлений

КЛЮЧЕВАЯ СУТЬ
Отказы — это не случайность, а результат того, что ваш запрос семантически "слишком близко" подошел к области запретных тем
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с