3,583 papers

Меню

arXiv:2602.04853 82 4 фев. 2026 г. PRO

DBA (Disagreement-Based Abstention): детектор ненадёжных ответов через несогласие промптов

КЛЮЧЕВАЯ СУТЬ
LLM уверенно называет год IPO компании, которая вообще не выходила на биржу. Проблема: модель не отличает знание от догадки — генерирует правдоподобный текст в обоих случаях. Стандартные проверки ('Ты уверен?', инструкция 'отвечай не знаю') плывут — модель либо остаётся самоуверенной, либо отказывается от правильных ответов. DBA (Disagreement-Based Abstention) позволяет детектировать ненадёжные ответы без дообучения и внешних источников — работает в обычном чате. Механика: задай один вопрос двумя способами — прямо и через разбивку на шаги, сравни ответы. Если ответы разные — модель не уверена, лучше не доверять. Если совпадают — вероятность правильного ответа в 50 раз выше.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с