3,583 papers
arXiv:2605.06815 74 7 мая 2026 г. PRO

Когнитивная асимметрия LLM: одна задача в тексте решается в 50 раз лучше, чем та же задача на картинке

КЛЮЧЕВАЯ СУТЬ
Одна и та же задача про балансы весов в текстовом виде решается топ-моделями почти безупречно — и значительно хуже, когда показываешь картинку: это не вопрос качества изображения, а вопрос формата подачи. Метод позволяет получать надёжный аналитический ответ от LLM на любую визуальную задачу — просто переведя схему, граф или диаграмму в слова перед вопросом. LLM — это предсказатель следующего слова, обученный на тексте: когда задача приходит как картинка, модель сначала «переводит» изображение, и этот перевод — узкое место, где теряется точность. Та же информация, описанная словами, работает в родной среде модели — отсюда разница в разы.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с