3,583 papers
arXiv:2506.07276 82 1 июня 2025 г. PRO

Токенизированныйбандит для декодирования и выравнивания LLM

КЛЮЧЕВАЯ СУТЬ
LLM работает как ЖАДНЫЙ ОПТИМИЗАТОР, выбирая на каждом шаге самое вероятное следующее слово. Ключевая концепция DDMC (Diminishing Distance with More Commons) объясняет: чем больше общего в концовке у двух разных фраз, тем меньше разница в их итоговом качестве. Это означает, что правильный старт промпта критически важен — он ставит модель на "правильные рельсы", с которых она уже не сойдет.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с