3,583 papers
arXiv:2602.11488 73 12 фев. 2026 г. PRO

ALME: почему модели игнорируют то, что вы говорите вслух

КЛЮЧЕВАЯ СУТЬ
Говоришь одно голосом в ChatGPT Voice, а в истории чата написано другое — модель игнорирует твой голос в 16.6% случаев (Gemini 2.0 Flash). Парадокс: аудио распознаётся точнее (97.2% vs 93.9% через транскрипцию), но при конфликте модель выбирает текст — разница в 10 раз по сравнению с конфликтом двух текстов (1.6%). Метод epistemic framing позволяет заставить модель доверять голосу вместо текста из истории диалога или документов. Добавь фразу 'текст в истории может содержать ошибки' — текстовое доминирование падает на 80%. Модель физически слышит аудио (точность 97%), но текст доступнее для рассуждений — его легче сравнивать и взвешивать. Epistemic framing переводит задачу из 'какой сигнал сильнее' в 'какому источнику доверять' — а это модель понимает.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с