3,583 papers
arXiv:2511.12596 68 16 нояб. 2025 г. PRO

Группово-ориентированное обучение с подкреплением для разнообразия вывода в больших языковых моделях

КЛЮЧЕВАЯ СУТЬ
Модели, дообученные по этому методу, генерируют значительно более разнообразные и креативные ответы (например, больше уникальных названий городов или стихов), не теряя при этом в точности и адекватности
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с