3,583 papers
arXiv:2605.15404 79 14 мая 2026 г. FREE

CCS (Capability-Conditioned Scaffolding): персонализация LLM под реальный уровень экспертизы пользователя

КЛЮЧЕВАЯ СУТЬ
Модель уверенно разъясняет юридический договор маркетологу. Звучит убедительно. Маркетолог соглашается. Там ошибка — но он не заметил. Это не сбой модели. Это следствие простого факта: модель не знает, где ты можешь её проверить, а где нет. CCS позволяет объявить три зоны — сильную, смешанную, слабую — и зафиксировать поведение модели для каждой. Суть не в стиле — в степени осторожности. В сильных областях: прямые ответы без лекций. В слабых: явные предупреждения с конкретными рисками. Плюс ConsistencyGuardrail — он ловит пересечения зон. Вопрос про «маркетинговый договор» уйдёт в режим слабого домена. Даже если слово «маркетинг» торчит в названии.
Адаптировать под запрос

TL;DR

CCS — это техника, которая встраивает в промпт трёхуровневый профиль экспертизы и заставляет модель менять поведение в зависимости от того, насколько пользователь способен проверить её ответ. Не стиль, не тон — именно степень осторожности и прозрачности.

Стандартная персонализация LLM подстраивает голос и формат. Но она не знает, что вы — крутой маркетолог и слабый юрист. Результат: модель уверенно генерирует юридический анализ, вы его читаете, звучит убедительно, вы соглашаетесь. Исследователи называют это Professional Domain Drift (профессиональное смещение) — вы полагаетесь на AI там, где не можете проверить его правоту. Проблема не в том, что модель ошибается, а в том, что вы не замечаете ошибки.

CCS решает это через явный профиль: вы объявляете, где сильны (модель работает прямо и эффективно), где частично разбираетесь (смешанная зона — модель проверяет, насколько вопрос выходит за вашу реальную компетенцию), где слабы (модель активно сигнализирует об ограничениях и неопределённости). Три зоны, три режима поведения — всё встроено в один структурированный промпт.


🔬

Схема метода

ШАГ 1 (один промпт-профиль, устанавливается один раз):
  Объявить сильные домены → модель: минимум предупреждений, прямые ответы
  Объявить смешанные домены → модель: проверяет сложность вопроса, 
                               добавляет оговорки при выходе за реальную экспертизу
  Объявить слабые домены → модель: явно сигнализирует об ограничениях, 
                            рекомендует проверку у специалиста

ШАГ 2 (каждый следующий вопрос):
  Модель автоматически определяет, в какую зону попадает вопрос
  → Применяет соответствующий режим из профиля
  → Consistency-проверка: если вопрос из "сильного" домена содержит концепции 
    из "слабого" — активируется режим слабого домена

Всё работает в одном чате. Профиль задаётся в начале или в системном промпте.


🚀

Пример применения

Задача: Артём — основатель EdTech-стартапа. Сильный в продукте и маркетинге, слабее в финансах, совсем не разбирается в корпоративном праве. Часто использует Claude для рабочих вопросов и хочет, чтобы модель не читала ему лекции там, где он сам разбирается — но честно предупреждала там, где он может ошибиться.

Промпт:


  
    Продуктовая разработка, пользовательский опыт (UX), контент-маркетинг, 
    SEO, email-маркетинг, growth hacking
  
  
    Финансовое моделирование, Unit-экономика, привлечение инвестиций, 
    переговоры с инвесторами
  
  
    Корпоративное право, трудовое законодательство, налоговое планирование, 
    бухгалтерский учёт
  



StrongDomain: отвечай прямо и по делу. Не добавляй избыточных предупреждений и 
оговорок — пользователь может сам оценить ответ.

MixedDomain: внимательно смотри на сложность конкретного вопроса. 
Если вопрос затрагивает базовые концепции — отвечай прямо. 
Если вопрос предполагает реальную экспертизу, которой у непрофессионала нет — 
явно укажи, что ответ требует профессиональной проверки, объясни почему.

WeakDomain: всегда явно сигнализируй, что пользователь не может надёжно 
оценить этот ответ самостоятельно. Указывай конкретные риски. 
Рекомендуй обратиться к специалисту.



Если вопрос формально из сильного домена, но содержит концепции из смешанного 
или слабого домена — применяй режим более осторожного домена.
Пример: вопрос про "маркетинговый договор с агентством" — это пересечение 
маркетинга (сильный) и права (слабый). Применяй режим слабого домена.


Вопрос: {вопрос пользователя}

Результат:

На вопрос про A/B-тестирование — прямой ответ без оговорок. На вопрос про оценку стартапа для раунда — ответ с пояснением, где именно расчёт требует финансовой экспертизы. На вопрос про договор с подрядчиком — чёткое предупреждение, что нельзя полагаться на этот ответ без юриста, с указанием конкретных рисков. На вопрос про "маркетинговый договор" — модель заметит пересечение зон и активирует осторожный режим, несмотря на слово "маркетинг" в вопросе.


🧠

Почему это работает

Слабость LLM: Без профиля модель не знает, где вы можете её проверить. Она либо перестраховывается везде ("проконсультируйтесь со специалистом" даже когда вы сами специалист), либо отвечает уверенно везде, создавая иллюзию надёжности там, где она опасна.

Сильная сторона LLM: Модель хорошо умеет адаптировать поведение под явно заданный контекст. Она умеет читать структурированные правила и применять их к конкретному вопросу. Особенно важно: она умеет определять концептуальную близость вопроса к разным областям — это то, что делает consistency-проверку рабочей.

Как метод использует это: CCS даёт модели явную карту вашей компетенции и чёткие правила поведения для каждой зоны. Модель не угадывает — она следует структуре. И ключевое: промпт заставляет её проверять не просто метку домена, а реальную концептуальную сложность конкретного вопроса внутри этого домена. Именно поэтому в исследовании "Формальная логика" и "Психология" дали совершенно разную активацию, хотя оба были помечены как "смешанный домен".

Рычаги управления: - Гранулярность доменов — чем точнее описаны домены, тем точнее работает маршрутизация. "Маркетинг" хуже, чем "email-маркетинг, SEO, контент". - Строгость ConsistencyGuardrail — добавьте конкретные примеры пересечений ("X + Y = режим Z"), и модель будет реже ошибаться на стыке доменов. - Язык режимов — замените абстрактные инструкции на конкретные действия ("рекомендуй конкретных специалистов" вместо "рекомендуй специалиста"). - Профиль в системном промпте — установите один раз через "Custom instructions" в ChatGPT или "System prompt" в Claude, и он работает во всех чатах.


📋

Шаблон промпта


  
    {перечисли области глубокой экспертизы — конкретно, не широко}
  
  
    {перечисли смежные области — где есть контекст, но нет полной экспертизы}
  
  
    {перечисли области вне экспертизы — где ты как неспециалист}
  



StrongDomain: отвечай прямо, без избыточных оговорок и предупреждений. 
Доверяй способности пользователя оценить ответ.

MixedDomain: анализируй сложность конкретного вопроса. 
При базовых вопросах — отвечай прямо. 
При вопросах, требующих глубокой экспертизы — явно укажи, 
что ответ выходит за зону надёжной оценки, объясни риски.

WeakDomain: всегда явно сигнализируй об ограниченности оценочной способности 
пользователя в этой области. Указывай конкретные риски. 
Рекомендуй профессиональную проверку.



Если вопрос формально из сильного домена, но концептуально затрагивает 
смешанный или слабый — применяй режим более осторожного домена.


{вопрос или задача}

Плейсхолдеры: - {перечисли области...} — конкретные специализации, не широкие категории. "Контекстная реклама Яндекс.Директ" лучше, чем "маркетинг". - {вопрос или задача} — любой рабочий запрос.


🚀 Быстрый старт — вставь в чат:

Вот шаблон CCS — системы, которая настраивает поведение AI 
под уровень моей экспертизы. Адаптируй его под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля профиля.

[вставить шаблон выше]

LLM спросит про твои сильные и слабые области знаний — потому что профиль экспертизы — это сердце метода, без него маршрутизация не работает. Она возьмёт структуру шаблона и заполнит её под твой контекст.


⚠️

Ограничения

⚠️ Самодекларация: Профиль составляешь ты сам, и если переоцениваешь себя в смешанной зоне — модель тоже ошибётся в сторону "пользователь справится". Метод не защищает от слепых пятен в собственной экспертизе.

⚠️ Нет памяти между чатами: В каждом новом чате профиль нужно подключать заново. Спасает только системный промпт или шаблон с профилем.

⚠️ Смешанные домены непредсказуемы: Исследование показало, что "Формальная логика" и "Психология" — оба смешанные домены, но активация отличалась в пять раз. Модель сама решает, насколько вопрос "реально сложный" внутри смешанной зоны. Это не баг, но и не полностью под твоим контролем.

⚠️ Только один поворот разговора: Исследование тестировало single-turn — один вопрос, один ответ. Как профиль работает в длинных диалогах с накопленным контекстом — не проверяли.


🔍

Как исследовали

Команда взяла 480 вопросно-профильных пар из MMLU — большого бенчмарка с вопросами по 57 областям знаний (медицина, право, математика, история и т.д.). Каждый вопрос тестировали в трёх условиях: без профиля (контроль), с профилем NLP-специалиста (ML и CS — сильные, медицина и право — слабые), и с инвертированным профилем гуманитария (всё наоборот). Ключевой момент дизайна: вопросы оставались идентичными — менялся только профиль. Это позволяло видеть чистый эффект профиля без шума.

Результат впечатлил: при профиле NLP-специалиста модель почти молчала на вопросах по ML и CS (3% активации предупреждений), но уходила в максимальную осторожность на медицинских и юридических (100%). При инвертированном профиле — паттерн полностью перевернулся: ML/CS получили 100% активации, гуманитарные — 0%. Статистически это практически невозможно случайно (p < 10⁻¹³). Особенно интригующий результат — смешанная зона: "Психология" дала 73% активации, "Формальная логика" — только 13%, "Эконометрика" — 3%, хотя все три формально один домен. Это означает, что модель реагирует не на метку домена, а на реальную концептуальную структуру вопроса. Для практики это важно: нельзя просто написать "слабый домен" — нужно описать его точно, чтобы модель правильно матчила.

Всё проверили на четырёх моделях — Claude Sonnet 4.5, Haiku 4.5, GPT-4.1, GPT-4.5. Паттерн оставался стабильным у всех, хотя в деталях поведение немного отличалось.


💡

Адаптации и экстраполяции

🔧 Техника: Динамический профиль → автоматическая коррекция при новой информации

Добавь в ConsistencyGuardrail инструкцию обновлять оценку домена прямо в диалоге:


Если в ходе диалога пользователь демонстрирует знания, 
противоречащие заявленному профилю — сообщи об этом явно и спроси, 
нужно ли скорректировать уровень для этой темы.

Модель будет замечать, когда ваши вопросы выдают больше или меньше экспертизы, чем заявлено — и предлагать пересмотр.


🔧 Техника: Профиль команды → разные режимы для разных ролей

Если используешь ChatGPT для работы с командой или настраиваешь промпт под конкретного человека:


  {...}
  {...}
  {...}

Создай несколько профилей для разных ролей и переключай их в начале сессии. Маркетолог получает один режим модели, финансовый директор — другой, при одних и тех же вопросах.


🔧 Экстраполяция: CCS + Chain-of-Thought только для слабых зон

Добавь в правила для WeakDomain инструкцию разворачивать рассуждение по шагам:

WeakDomain: показывай рассуждение по шагам — пользователю важно 
видеть логику, а не только вывод, чтобы хотя бы частично оценить ответ.

В зонах, где вы не эксперт, пошаговое рассуждение даёт шанс заметить ошибку даже без глубоких знаний.


🔗

Ресурсы

Capability-Conditioned Scaffolding for Professional Human–LLM Collaboration Sen Yang (University College London), Yinglei Ma (Fudan University)


📋 Дайджест исследования

Ключевая суть

Модель уверенно разъясняет юридический договор маркетологу. Звучит убедительно. Маркетолог соглашается. Там ошибка — но он не заметил. Это не сбой модели. Это следствие простого факта: модель не знает, где ты можешь её проверить, а где нет. CCS позволяет объявить три зоны — сильную, смешанную, слабую — и зафиксировать поведение модели для каждой. Суть не в стиле — в степени осторожности. В сильных областях: прямые ответы без лекций. В слабых: явные предупреждения с конкретными рисками. Плюс ConsistencyGuardrail — он ловит пересечения зон. Вопрос про «маркетинговый договор» уйдёт в режим слабого домена. Даже если слово «маркетинг» торчит в названии.

Принцип работы

Обычная персонализация подстраивает тон и формат. CCS подстраивает кое-что важнее — насколько модель тебя предупреждает. Не КАК говорит, а КОГДА бьёт тревогу. Ты — крутой продакт, слабый бухгалтер. Модель этого не знает. Жаришь промпт — она отвечает с одинаковой уверенностью в обоих случаях. Профиль даёт ей карту: здесь пользователь проверит сам, здесь — нет. Поведение меняется автоматически.

Почему работает

Проблема называется Professional Domain Drift — ты полагаешься на AI там, где не можешь поймать его на ошибке. Без профиля модель делает одно из двух: перестрахуется везде («проконсультируйтесь со специалистом» — даже когда ты сам специалист) или отвечает уверенно везде и создаёт иллюзию надёжности там, где это опасно. Профиль даёт модели явную карту — и она следует не интуиции, а структуре. Интересная деталь: смешанные домены работают нетривиально. Исследователи пометили «Формальную логику» и «Психологию» одним ярлыком — смешанный домен. Активация различалась в пять раз. Модель сама оценивает реальную сложность конкретного вопроса внутри домена. Не просто метку читает — думает, насколько этот вопрос реально требует экспертизы.

Когда применять

Для всех, кто использует LLM через несколько областей — где-то специалист, где-то на уровне «читал статьи», где-то полный ноль. Особенно полезно предпринимателям и руководителям: много доменов, разная глубина, высокая цена ошибки в слабых зонах. Работает в ChatGPT, Claude, любом LLM с системным промптом. НЕ подходит: если работаешь только в одной области — смысла делить на три зоны нет.

Мини-рецепт

1. Раздели свои области на три группы: где ты специалист, где дилетант с контекстом, где полный ноль. Конкретнее — лучше: «контекстная реклама Яндекс.Директ» точнее, чем «маркетинг».

2. Собери профиль по шаблону: три блока — StrongDomains, MixedDomains, WeakDomains. К каждому добавь правило поведения — что именно должна делать модель: предупреждать, не предупреждать, рекомендовать специалиста.

3. Добавь ConsistencyGuardrail с одним конкретным примером пересечения: «вопрос про X из сильного + концепции из слабого — активируй режим слабого». Один конкретный пример работает лучше общей фразы.

4. Один раз закинь профиль в системный промпт — Custom Instructions в ChatGPT или System Prompt в Claude. Всё, он работает во всех чатах без повторения.

Примеры

[ПЛОХО] : Проверь мой договор с подрядчиком — всё нормально? (Модель не знает, что ты не юрист. Ответит уверенно. Ты согласишься.)
[ХОРОШО] : Один раз устанавливаешь профиль в системный промпт: продуктовая разработка, контент-маркетинг, SEOфинансовое моделирование, переговоры с инвесторамикорпоративное право, трудовое законодательство, налогиStrongDomain: отвечай прямо, без лишних оговорок. MixedDomain: при сложных вопросах — укажи конкретные риски. WeakDomain: всегда предупреждай, что ответ требует проверки у специалиста.Если вопрос формально из сильного домена, но касается слабого — применяй режим слабого. Пример: маркетинговый договор = маркетинг (сильный) + право (слабый), применяй режим слабого домена. Теперь на вопрос Проверь договор с маркетинговым агентством модель не скажет «выглядит нормально». Она скажет: это пересечение маркетинга и права — по профилю это слабая зона. Вот конкретные риски. Иди к юристу.
Источник: Capability Conditioned Scaffolding for Professional Human-LLM Collaboration
ArXiv ID: 2605.15404 | Сгенерировано: 2026-05-18 11:28

Проблемы LLM

ПроблемаСутьКак обойти
Модель не знает, где вы можете поймать её на ошибкеБез профиля экспертизы модель не различает ситуации. Либо добавляет оговорки везде — и раздражает там, где вы сами специалист. Либо отвечает уверенно везде — и это опасно там, где вы не можете проверить. Результат второго сценария: вы получаете уверенный юридический анализ, не замечаете ошибок, действуете по немуОбъяви модели карту своей экспертизы: где сильный, где средний, где слабый. Задай разные правила поведения для каждой зоны. Модель будет добавлять предупреждения только там, где вы реально не можете её проверить

Методы

МетодСуть
Трёхзонный профиль компетенций — разная осторожность в разных областяхУстанови профиль один раз в начале чата или в системном промпте. Три зоны: Сильная (ты эксперт) — модель отвечает прямо, без лишних оговорок. Смешанная (есть контекст, но не глубокая экспертиза) — модель оценивает сложность конкретного вопроса: базовый отвечает прямо; требует экспертизы предупреждает. Слабая (ты не специалист) — модель всегда сигнализирует об ограничениях, называет конкретные риски, рекомендует специалиста. Добавь правило пересечений: если вопрос формально из сильной зоны, но концептуально затрагивает слабую — применяй режим слабой. Пример: "маркетинговый договор" = маркетинг (сильная) + право (слабая) режим слабой зоны. Шаблон: три блока доменов правила для каждой зоны правило пересечений. Работает лучше когда домены конкретные: "контекстная реклама Яндекс.Директ" сильнее, чем "маркетинг". Ограничение: профиль составляешь сам. Если переоцениваешь себя в смешанной зоне — модель тоже ошибётся

Тезисы

ТезисКомментарий
Модель оценивает сложность конкретного вопроса внутри домена, а не просто его меткуКогда задаёшь зону "смешанная" — модель не применяет одно поведение ко всем вопросам из неё. Она оценивает, насколько этот конкретный вопрос требует реальной экспертизы. Два вопроса про психологию могут дать совершенно разную реакцию: один — прямой ответ, другой — предупреждение. Это и сила, и ограничение: поведение в смешанной зоне непредсказуемо. Применяй: если нужна стабильность — переводи домен из смешанной в слабую. Теряешь удобство, получаешь предсказуемость
📖 Простыми словами

Capability Conditioned Scaffolding for Professional HumanLLMCollaboration

arXiv: 2605.15404

Суть метода CCS в том, что нейронка наконец-то перестает вести себя как заведенный автоответчик и начинает понимать, кто перед ней сидит. Обычно LLM либо душнит советами там, где ты и сам профи, либо уверенно несет чушь в темах, где ты полный ноль. CCS ломает эту систему: модель получает четкий профиль твоей экспертизы и меняет не просто тон, а саму механику ответа. Если ты шаришь, она выдает сухую выжимку без лишних соплей. Если ты дилетант — она включает режим максимальной осторожности, подсвечивает риски и разжевывает каждый шаг, потому что знает: ты не сможешь поймать её на ошибке.

Это как общение с опытным автомехаником. Если ты приехал и с порога объяснил проблему на техническом языке, он просто скажет: "Меняем ГРМ, цена такая-то". Но если он видит, что ты даже не знаешь, где открывается капот, он начнет рисовать схемы и объяснять, почему машина может заглохнуть на трассе. Формально задача одна и та же, но уровень детализации и контроля разный. Метод CCS — это и есть тот самый фильтр, который заставляет AI оценивать твою способность проверить результат и подстраивать свою честность под твой уровень.

В основе лежат три уровня экспертизы, которые жестко вшиваются в промпт. На высоком уровне модель работает как исполнитель: минимум воды, максимум дела, ведь пользователь сам увидит косяк. На среднем уровне включается режим верификации: AI объясняет логику, чтобы ты мог проследить за ходом мысли. На низком уровне модель превращается в гиперответственного наставника: она буквально тыкает пальцем в места, где может ошибиться, потому что понимает — ты примешь её слова на веру без оглядки. Это не просто "стиль текста", это управление прозрачностью в зависимости от твоих компетенций.

Хотя метод тестировали на профессиональных задачах, принцип универсален для любого взаимодействия с AI. Будь то написание кода, юридический разбор или планирование тренировок — CCS решает проблему доверия. Вместо того чтобы гадать, не галлюцинирует ли модель, ты получаешь ответ, адаптированный под твой "детектор лжи". Это превращает ChatGPT из сомнительного советчика в адаптивного напарника, который знает, когда можно сократить путь, а когда нужно вести тебя за руку через минное поле.

Короче, хватит использовать универсальные промпты для всех задач — это путь к посредственным результатам и опасным ошибкам. Нужно внедрять профиль компетенций прямо в системные инструкции, чтобы модель понимала, где ты босс, а где — уязвимый новичок. CCS доказывает: чем лучше AI понимает твои границы, тем меньше шансов, что он тебя подставит. Кто научится калибровать модель под себя, получит реальный рычаг, остальные так и будут бороться с уверенным бредом и ненужными лекциями.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с