arXiv:2604.15702 76 17 апр. 2026 г. PRO

Двойной зонд (Dual Probe): как заставить модель честно оценить свой ответ

КЛЮЧЕВАЯ СУТЬ

Парадокс: самая точная модель в тесте оказалась одной из худших по честности самооценки. GLM-5 занимает первое место по правильным ответам — и девятое по тому, умеет ли она отличать свои верные ответы от неверных. Claude Haiku стоит 14-й по точности, но 2-й по самооценке. Gemini уверенно говорит «оставлю ответ» даже на вопросах, где ошибается в 100% случаев. Метод Dual Probe (Двойной зонд) позволяет получить второй сигнал о надёжности ответа — прямо в том же промпте, без кода и дообучения. Фишка: к любому запросу добавь два вопроса — KEEP/WITHDRAW и BET/NO_BET. Модель вынуждена выбирать между вариантами с разными последствиями, а не просто продолжать генерировать уверенный текст. Разрыв между частотой WITHDRAW на ошибках и на правильных ответах — вот реальная мера честности модели.

Адаптировать под запрос

Контент доступен только для PRO подписчиков

Чтобы получить доступ к полному содержанию этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Меню

Двойной зонд (Dual Probe): как заставить модель честно оценить свой ответ

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Работа с исследованием

Результат адаптации