3,583 papers
arXiv:2603.08993 79 9 мар. 2026 г. PRO

Arbiter / Multi-Model Scouring: аудит промпта несколькими LLM через намеренно расплывчатые инструкции

КЛЮЧЕВАЯ СУТЬ
Промпт с противоречием не выдаёт ошибку. Модель молча выбирает интерпретацию — и каждый раз чуть-чуть иначе. Это и объясняет, почему большой промпт, который рос полгода, ведёт себя непредсказуемо: то официально, то дружелюбно, то с эмодзи, то без. Метод Arbiter позволяет находить такие скрытые конфликты до того, как они портят результат. Главная фишка: разные языковые модели буквально слепы к разным классам проблем — Claude ловит структурные конфликты, Kimi замечает расход токенов, DeepSeek находит лазейки в делегировании. Три прогона одного ChatGPT дадут три похожих ответа. Это иллюзия покрытия, не реальная.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с