TL;DR
SSD — техника анализа, которая разбивает один широкий вопрос «оцени это» на несколько независимых под-задач, каждая со своим конкретным фокусом. Каждой под-задаче — свой промпт, свой угол зрения, свой отдельный анализ.
Когда просишь модель «проверь эту идею» или «есть ли здесь риски» — она смотрит на заявленную цель и, если та звучит разумно, склоняется к одобрению. Это как нанять одного человека и попросить его оценить и финансы, и юридику, и операционку сразу: он глянет по верхам и скажет «выглядит нормально». Детали, очевидные профильному специалисту — проскочат мимо. В исследовании именно так и произошло: один широкий вопрос «это вредоносно?» пропускал угрозы, которые декомпозиция обнаруживала.
SSD решает проблему разбивкой на измерения. В оригинале: (1) совпадает ли заявленная цель с фактическими действиями, (2) оправданы ли запрашиваемые ресурсы, (3) нет ли скрытых инструкций, (4) согласованы ли разные части между собой. Каждое измерение — отдельный запрос, отдельный анализ без смешивания.
Схема метода
ШАГ 1: Определи 3-4 измерения под свою задачу
→ список фокусов с конкретными вопросами
ШАГ 2: Для каждого измерения — отдельный анализ
→ можно в одном промпте (параллельно)
или в нескольких запросах подряд
ШАГ 3: Агрегируй все ответы → итоговый вывод
Все шаги работают в одном запросе — достаточно явно выделить измерения в тексте промпта.
Пример применения
Задача: Агентство прислало КП на SMM-продвижение за 150 000 ₽/мес. Надо понять — адекватно это или нет.
Промпт:
Оцени это коммерческое предложение по четырём независимым измерениям.
По каждому — отдельный блок анализа. Не смешивай их.
[вставить текст КП]
---
Измерение 1 — СООТВЕТСТВИЕ ЗАЯВЛЕННОГО И РЕАЛЬНОГО
Что агентство обещает в результате? Что фактически входит в работы?
Есть ли расхождение между обещанным эффектом и описанной деятельностью?
Измерение 2 — ОБОСНОВАННОСТЬ СТОИМОСТИ
Оправдана ли цена 150 000 ₽/мес для задач этого масштаба?
Какие работы входят в прайс, что сопоставимо по рынку?
Измерение 3 — СКРЫТЫЕ РИСКИ
Есть ли размытые формулировки, позволяющие не выполнять обещания?
Какие пункты выгодны агентству, но не клиенту?
Измерение 4 — ВНУТРЕННЯЯ СОГЛАСОВАННОСТЬ
Соответствуют ли предложенные инструменты заявленным результатам?
Есть ли противоречия внутри документа?
---
После анализа по каждому измерению — итоговый вывод: брать или нет, и почему.
Результат: Модель выдаст четыре отдельных блока. Там, где широкая просьба «оцени КП» дала бы общее «выглядит неплохо» — декомпозиция вскроет детали: в измерении 1 — что обещают результат, но описывают только процесс; в измерении 3 — что нет конкретных KPI и агентство ничем не рискует. Итоговый вывод будет опираться на все четыре блока с конкретными цитатами.
Почему это работает
LLM хорошо справляется с узкой конкретной задачей. Плохо — когда нужно удержать одновременно много критериев и не упустить ни один. При широком вопросе модель формирует общее впечатление: если поверхностно всё выглядит логично — она склоняется к позитивной оценке. Именно это показало исследование: один монолитный вопрос принимал вредоносные пакеты как «разумные инструменты», потому что описание выглядело убедительно.
Когда модель знает, что её спрашивают только про внутренние противоречия — она ищет только их. Нет соблазна сказать «в целом нормально». Узкий фокус снижает шанс пропустить что-то важное. Это не «думать лучше», это убрать отвлекающие факторы.
Ещё эффект: декомпозиция делает анализ проверяемым. Четыре блока вместо одного — видно, где именно модель нашла проблему, а где не нашла. С монолитным ответом непонятно, смотрела ли она на нужный угол вообще.
Рычаги управления: - Число измерений → 2-3 для простых задач, 4-5 для сложных. Больше измерений = глубже, но дольше и дороже по токенам - Формулировка вопроса в каждом блоке → чем конкретнее, тем острее. «Есть ли риски?» слабее, чем «какие формулировки позволяют агентству не выполнять KPI?» - Параллельно или последовательно → всё в одном промпте — быстро; каждое измерение в отдельном запросе — больше пространства для анализа каждого блока - Веса измерений → в конце промпта можно явно указать, какое измерение важнее: «Измерение 3 (риски) считай приоритетным»
Шаблон промпта
Оцени {объект_анализа} по {число} независимым измерениям.
По каждому — отдельный блок анализа. Не смешивай их между собой.
{объект_анализа}:
[вставить текст / описание]
---
Измерение 1 — {НАЗВАНИЕ_1}
{Конкретный узкий вопрос только про это измерение}
Измерение 2 — {НАЗВАНИЕ_2}
{Конкретный узкий вопрос только про это измерение}
Измерение 3 — {НАЗВАНИЕ_3}
{Конкретный узкий вопрос только про это измерение}
Измерение 4 — {НАЗВАНИЕ_4}
{Конкретный узкий вопрос только про это измерение}
---
После анализа по каждому измерению — итоговый вывод: {что хочешь решить}.
Что подставлять:
- {объект_анализа} — что оцениваем: КП, бизнес-идея, договор, стратегия, текст
- {число} — сколько измерений: 3-4 для большинства задач
- {НАЗВАНИЕ_X} — короткое имя измерения: РИСКИ, СОГЛАСОВАННОСТЬ, ОБОСНОВАННОСТЬ, СООТВЕТСТВИЕ
- {Конкретный вопрос} — узкий вопрос именно по этому измерению, не широкий
- Последняя строка — что хочешь получить: взять/не взять, одобрить/отклонить, список рисков
🚀 Быстрый старт — вставь в чат:
Вот шаблон SSD для структурированной оценки.
Адаптируй под мою задачу: [твоя задача].
Задавай вопросы, чтобы заполнить поля.
[вставить шаблон выше]
LLM спросит, что именно анализировать и какие стороны важны — потому что без этого нельзя сформулировать точные вопросы внутри каждого блока. Она возьмёт структуру декомпозиции из шаблона и адаптирует под твою задачу.
Ограничения
⚠️ Простые задачи: Если вопрос однозначный — декомпозиция избыточна. Метод окупается там, где объект сложный и есть несколько аспектов оценки.
⚠️ Качество измерений: Метод работает ровно настолько, насколько верно выбраны сами углы анализа. Неправильные измерения — декомпозиция не поможет.
⚠️ Субъективные оценки: Для задач типа «мне понравится?» или «это красиво?» — измерения получатся размытыми, эффект слабее. Лучше работает на объектах с проверяемыми характеристиками: документы, предложения, планы.
⚠️ Оригинальный контекст: Исследование создавалось для проверки безопасности AI-расширений. Четыре авторских измерения (соответствие намерений, оправданность разрешений, скрытые действия, согласованность файлов) — доменно-специфичны. Для других задач измерения нужно переформулировать.
Ресурсы
SkillSieve: A Hierarchical Triage Framework for Detecting Malicious AI Agent Skills Yinghan Hou (Department of Earth Science and Engineering, Imperial College London), Zongyou Yang (Department of Computer Science, University College London) Связанные проекты: OpenClaw/ClawHub marketplace, ClawVet, SkillFortify, Snyk ToxicSkills
