3,583 papers
arXiv:2510.20498 82 23 окт. 2025 г. PRO

RPS (Robust Preference Selection): генерация из окружения предпочтений вместо точной цели

КЛЮЧЕВАЯ СУТЬ
Парадокс: Чтобы попасть в сложную нестандартную цель, генерируй НЕ из неё, а из окружения. LLM проваливаются на противоречивых требованиях типа "технично для новичка" или "подробно, но кратко" — таких комбинаций мало в обучающих данных, модель плывёт. RPS решает задачу через отступление: генерирует 5 вариантов с разным балансом атрибутов ВОКРУГ цели (где модель работает стабильно), оценивает все по целевому критерию, выбирает лучший. +19-44% качества на нестандартных запросах против прямой генерации.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с