3,583 papers
arXiv:2607.02436 76 2 июля 2026 г. PRO

Больше мышления, не больше инструментов: как reasoning effort побеждает tool bloat в агентных задачах

КЛЮЧЕВАЯ СУТЬ
Парадокс: добавили браузерный инструмент для тестирования агенту — стоимость выросла на 42–68%, доля правильных первых попыток не изменилась вообще. Деньги ушли туда, где проблемы не было. Метод диагностики позволяет понять ЧТО именно ломается — и выбрать нужный рычаг вместо добавления очередного инструмента. Фишка: поднять уровень мышления (с обычного до усиленного — extended thinking у Claude, o1/o3 у OpenAI) — и доля идеальных попыток с первого раза вырастает с 28% до 89%, корректирующих запросов в 5 раз меньше, а стоимость выше всего на 9–29%.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с