3,583 papers
arXiv:2508.04626 80 6 авг. 2025 г. PRO

P-Aligner: переписывание промптов по принципам для выравнивания LLM

КЛЮЧЕВАЯ СУТЬ
LLM чувствительны к формулировке промпта — размытое «напиши текст» даёт воду, чёткое «500 слов, структура: проблема→решение→цифры» даёт конкретику. Но пользователи пишут небрежно, без структуры. P-Aligner позволяет автоматически улучшать промпты перед отправкой в LLM, опираясь на 10 явных принципов (уточни задачу, добавь контекст, улучши тон, требуй факты). Фишка: невозможно оценить промпт напрямую («хороший» или «плохой»?), но можно оценить ответы которые он вызвал. Генерируем 3 ответа, смотрим на качество через reward model — если ответы лучше, значит промпт лучше. Результат: +28% win-rate на GPT-4-turbo из одной строчки улучшения.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с