3,583 papers
arXiv:2511.16324 65 20 нояб. 2025 г. PRO

SDA: управление распределением с помощью рулевого механизма для OpenLLM без тонкой настройки

КЛЮЧЕВАЯ СУТЬ
Модель генерирует более качественный ответ, когда четко видит разницу между «что сделать» и «как это сделать» — исследование SDA обнаружило, что разделение запроса и инструкции по стилю создает «вектор управления», который отклоняет модель от усредненного ответа к целевому. Метод позволяет получать ответы, соответствующие мета-требованиям (тон, структура, принципы), без переобучения модели. Работает это через сравнение двух сценариев генерации: базовый ответ (P1) vs ответ с явной инструкцией (P2) — разница между ними и есть направление улучшения, которое усиливается пропорционально качеству черновика.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с