3,583 papers
arXiv:2508.03178 82 5 авг. 2025 г. PRO

Light-IF: предварительное планирование и самопроверка для точного следования сложным инструкциям

КЛЮЧЕВАЯ СУТЬ
Обнаружено: reasoning-модели (Qwen, DeepSeek) "лениво мыслят" при сложных инструкциях — видят задачу целиком, но обрабатывают "по диагонали", упуская конкретные ограничения. Просишь "150 слов, 3 абзаца, слово 'инновация' минимум 2 раза" — получаешь 145 слов, 4 абзаца, "инновация" один раз. Light-IF позволяет генерировать тексты с точным соблюдением множественных ограничений (5+ требований к формату, длине, структуре). Метод заставляет модель сначала спланировать выполнение каждого ограничения (preview), потом пошагово проверить соответствие (self-checking) — вместо бинарного "всё верно/неверно" модель получает баллы за каждый пункт отдельно. Результат: в 2-3 раза лучшее соблюдение ограничений.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с