arXiv:2602.01611 77 2 фев. 2026 г. PRO

PIPE: Диагностика запоминания интерфейса vs понимания смысла

КЛЮЧЕВАЯ СУТЬ

Агенты обученные на траекториях запоминают НАЗВАНИЯ функций, а не их СМЫСЛ. В примере из исследования агент 15 раз подряд пишет click[...], хотя окружение явно говорит 'доступны только find и press'. Жесть — AgentLM-14b на WebShop падает с 61% до 4% после переименования click → press. Метод PIPE позволяет диагностировать промпты и Custom GPT: устойчивы ли они к переформулировкам, или запомнили конкретные слова. PIPE переименовывает функции (click → press), но сохраняет описания и поведение. Если агент падает в качестве — значит он запомнил названия, а не понял суть. Большое падение = сильная зависимость от формы, а не от смысла.

Адаптировать под запрос

Контент доступен только для PRO подписчиков

Чтобы получить доступ к полному содержанию этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Что это?

PIPE (Perturb Interface Protocol for Evaluation) — это метод оценки агентов. Авторы слегка меняют названия функций (click → press, go to → navigate to), но оставляют их описания и поведение неизменными. Если агент падает в качестве — значит он запомнил surface form (названия), а не семантику.

Ключевой инсайт: trajectory-SFT (обучение на траекториях взаимодействия с инструментами) может улучшать бенчмарки двумя путями:

Semantic learning — агент понял ЧТО делают инструменты

Interface shortcut — агент запомнил КАК называются функции в датасете

На стандартных бенчмарках оба дают одинаковый результат! Но только первое — настоящая способность.

Находки

Главная проблема: Агенты после trajectory-SFT показывают огромные падения при минимальных изменениях интерфейса. Например:

AgentLM-14b на WebShop: с 61.2% до 4.44% после переименования click → press

Агенты продолжают вызывать старые названия функций даже после ошибок

В WebShop агент вызывает click[...] 15 раз подряд, хотя окружение говорит "доступны только find и press"

Причина: Trajectory-SFT учит не столько "что делает search", сколько "вызывай функцию с именем search в таком формате".

Что можно применить?

Это исследование-находка, не готовая техника. Но есть extractable principles: нужно проверять устойчивость агентов к изменениям интерфейса, чтобы убедиться, что они действительно понимают инструменты, а не просто воспроизводят запомненные паттерны.

Первый подход — варьировать формулировки в примерах. Если переформулировать инструкции синонимами и модель перестаёт работать, значит она привязана к конкретным словам, а не к смыслу. Второй подход — использовать разнообразные примеры с разными форматами и структурами, чтобы снизить зависимость от конкретного интерфейса.

Третий принцип касается явного описания семантики — исследования показывают, что агенты лучше понимают задачу, когда смысл операций описан явно, а не подразумевается.

Вместо простого перечисления функций с их сигнатурами нужно объяснять, что именно они делают и как взаимодействуют. Например, filter(category) работает после search, а не независимо. Такая детализация помогает модели выбирать правильную последовательность действий.

Это особенно важно для тех, кто создаёт Custom GPTs с функциями или готовит наборы промптов для команды. В обычном чате принцип менее критичен, но в few-shot примерах он становится ключевым.

Исследование выявляет реальную проблему: если изменить названия функций в Custom GPT, модель может потерять согласованность, потому что полагалась на примеры. Решение — описывать не только интерфейс, но и поведение каждой функции. Главный вывод: нужно проверять устойчивость промптов к изменениям.

Оценка 76-78 — практичные наблюдения, но без готового шаблона и требующие адаптации под конкретный контекст. Ценность в понимании механики, а не в готовом workflow.

Остаётся актуальным, потому что решает реальную проблему с запоминанием интерфейсов, и принципы можно применять прямо в диалоге. Это переформатирует подход к примерам и инструкциям.

Меню

PIPE: Диагностика запоминания интерфейса vs понимания смысла

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Работа с исследованием

Результат адаптации