3,583 papers
arXiv:2510.18257 82 21 окт. 2025 г. FREE

DelvePO – промпт как программа: структурирование через XML-теги

КЛЮЧЕВАЯ СУТЬ
Промпт, написанный сплошным текстом, заставляет LLM угадывать границы инструкций — отсюда непредсказуемость ответов. Метод DelvePO позволяет превратить хаотичный запрос в структурированный документ, где каждый компонент (роль, задача, ограничения) явно размечен XML-тегами. Теги работают как дорожные знаки для механизма внимания модели — она перестаёт гадать «где кончается роль и начинается задача» и начинает точно следовать каждому блоку инструкций. Результат: +40% стабильности ответов на сложных задачах по сравнению с монолитными промптами.
Адаптировать под запрос
📌

Ключевые аспекты исследования:

Исследование предлагает автоматизированный фреймворк DelvePO, который улучшает (оптимизирует) промпты, используя подход, похожий на генетическую эволюцию. Он "разбирает" промпт на функциональные компоненты (роль, задача, ограничения), оборачивает их в XML-теги и систематически "скрещивает" и "мутирует" их содержимое, чтобы найти наиболее эффективную комбинацию для конкретной задачи. Система использует "память" о прошлых удачных и неудачных изменениях, чтобы делать следующие шаги более осмысленно.

Ключевой результат: Систематическое структурирование промпта на четко разделенные компоненты с помощью тегов и их направленная оптимизация приводят к созданию более производительных и стабильных промптов по сравнению с ручным подбором или случайными изменениями.


🔬

Объяснение всей сути метода:

Суть метода для обычного пользователя заключается в том, чтобы перестать воспринимать промпт как единый кусок текста и начать относиться к нему как к структурированному документу с четкими разделами.

Представьте, что вы даете задание не очень сообразительному, но очень исполнительному стажеру. Если вы смешаете в одной куче то, кем он должен притвориться, что именно сделать, в каком формате сдать результат и чего делать нельзя, он запутается. Гораздо эффективнее дать ему анкету с четкими полями: * Твоя роль: <role>Опытный SMM-менеджер</role> * Твоя задача: <task_description>Придумать 5 идей для постов в Telegram</task_description> * Ограничения: <constraints>Темы должны быть связаны с ЗОЖ, но без упоминания БАДов</constraints> * Формат ответа: <output_format>Представь идеи в виде нумерованного списка</output_format>

Исследование DelvePO автоматизирует поиск наилучших формулировок для содержимого этих тегов ({role}, {task_description} и т.д.). Для пользователя же главный вывод — само наличие такой структуры с тегами критически важно. Теги работают как дорожные знаки для LLM, помогая ей безошибочно понять, где какая часть инструкции находится. Это снижает двусмысленность и заставляет модель более точно следовать вашим указаниям.


📌

Анализ практической применимости:

  • Прямая применимость: Пользователь может немедленно начать использовать XML-теги для структурирования своих промптов. Вместо того чтобы писать "Ты — эксперт, сделай то-то в таком-то формате", он может написать:
    <role>Эксперт по путешествиям</role>
    <task>Составь 3-дневный маршрут по Стамбулу</task>
    <constraints>Бюджет 100$ в день, фокус на исторические места, избегать шоппинга</constraints>
    <output_format>Таблица с колонками: День, Утро, День, Вечер</output_format>
Это прямое и мощное применение выводов исследования. * **Концептуальная ценность:** Исследование формирует у пользователя "инженерное" мышление при составлении промптов. Оно дает понимание, что промпт — это не магия, а спецификация. Ключевые концепции: 1. **Разделяй и властвуй:** Сложный запрос легче контролировать, если он разбит на простые, четко очерченные блоки. 2. **Явное лучше неявного:** Не надейтесь, что модель догадается о формате вывода или вашей роли. Укажите это явно в соответствующих тегах. 3. **Промпт как программа:** Теги превращают промпт в подобие декларативного языка разметки, который LLM обрабатывает более надежно, чем естественную речь. * **Потенциал для адаптации:** Пользователь может адаптировать этот метод, создавая свои собственные шаблоны промптов для повторяющихся задач. Например, для написания email можно создать шаблон с тегами ``, ``, ``, ``. Это позволяет быстро генерировать однотипные, но качественные тексты, меняя лишь содержимое тегов. Это ручная, упрощенная версия "эволюции" из исследования. --- # 5.1 Практически пример применения:


Ты — опытный маркетолог и контент-стратег, специализирующийся на продвижении образовательных онлайн-курсов для широкой аудитории. Твоя сильная сторона — создание вовлекающего контента, который просто и понятно объясняет сложные вещи.



Твоя задача — сгенерировать идеи для контент-плана на одну неделю (5 постов) для Telegram-канала, который посвящен изучению промпт-инжиниринга для новичков. Цель постов — повысить вовлеченность аудитории и показать практическую пользу навыка.



1.  **Тон (Tone of voice):** Дружелюбный, поддерживающий, без сложного технического жаргона.
2.  **Форматы постов:** Используй разные форматы (например: полезный совет, разбор ошибки, интерактив/опрос, мини-кейс).
3.  **Запрет:** Не рекламировать платные курсы напрямую. Фокус на пользе.
4.  **Призыв к действию (CTA):** Каждый пост должен содержать мягкий призыв к действию (задать вопрос в комментариях, поделиться своим примером, попробовать промпт).



Представь результат в виде таблицы из трех колонок:
1.  **День недели** (Понедельник, Вторник, ...)
2.  **Формат поста** (например, "Полезный совет")
3.  **Идея и краткое описание** (о чем будет пост)
🧠

Почему это работает:

Этот промпт эффективен благодаря нескольким механикам, описанным в исследовании:

  1. Декомпозиция на компоненты: Запрос разбит на четыре четких логических блока: role, task_description, constraints и output_format. Модель не пытается угадать, что от нее хотят, а последовательно обрабатывает каждый блок инструкций.
  2. Использование XML-тегов: Теги <role>, <task_description> и другие действуют как четкие разделители. Они помогают механизму внимания (attention) модели сфокусироваться на конкретной части инструкции при генерации соответствующей части ответа. Это снижает риск того, что модель "забудет" про формат вывода или проигнорирует одно из ограничений.
  3. Снижение двусмысленности: Вместо сплошного текста "Придумай 5 идей для постов в тг про промпты для новичков, будь маркетологом, сделай это в таблице и не используй жаргон", мы даем четкие, атомарные инструкции в каждом блоке. Это делает намерение пользователя кристально ясным для модели.

📌

Другой пример практического применения


Ты — HR-специалист с опытом работы в IT-компаниях. Ты умеешь составлять описания вакансий так, чтобы они привлекали сильных кандидатов и точно отражали суть работы.


<context>
Мы — небольшая продуктовая компания "Agile Innovations", разрабатываем SaaS-решение для управления проектами. В команде царит неформальная, но ориентированная на результат атмосфера.
</context>


Напиши текст вакансии на должность "Junior Frontend Developer (React)". Текст должен быть живым, привлекательным и информативным.



1.  **Структура:** Обязательно включи разделы: "О нас", "Чем предстоит заниматься", "Что мы ждем от кандидата", "Что мы предлагаем".
2.  **Ключевые технологии:** В стеке обязательно упомяни React, TypeScript, Redux Toolkit, Jest.
3.  **Тон (Tone of voice):** Профессиональный, но дружелюбный и прямой. Избегай канцеляризмов вроде "в связи с расширением штата".
4.  **Фокус:** Сделай акцент на возможностях роста и работе с современной технологической базой.



Сгенерируй готовый текст вакансии в формате Markdown, используя заголовки (`##`) для каждого раздела.
🧠

Объяснение механизма почему этот пример работает.

Этот промпт работает по тем же принципам, что и предыдущий, но с добавлением нового компонента `<context>`:

  1. Четкое разделение ролей инструкций: Теги <role>, <context>, <task_description>, <constraints> и <output_format> идеально разделяют информацию по её назначению. Модель точно знает, что "Agile Innovations" — это контекст, а "написать текст вакансии" — это основная задача.
  2. Контекстуализация: Введение тега <context> позволяет "заземлить" задачу, предоставив модели важную фоновую информацию о компании. Это помогает ей адаптировать Tone of voice и содержание под конкретную организацию, делая результат менее шаблонным.
  3. Структурированное управление генерацией: Блок <constraints> не просто перечисляет ограничения, а задает структуру будущего документа ("Обязательно включи разделы..."). В сочетании с <output_format> (использовать Markdown заголовки) это дает модели очень точный "чертеж" для построения ответа, что значительно повышает предсказуемость и качество результата.
📌

Оценка полезности: 82

📌

Основные критерии оценки

  • A. Релевантность техникам промтинга: Высокая. Исследование напрямую посвящено оптимизации структуры и содержания промптов. Оно предлагает конкретный метод структурирования через "компоненты".
  • B. Улучшение качества диалоговых ответов: Высокая. Основная цель исследования — найти промпты, которые дают более точные и стабильные результаты.
  • C. Прямая практическая применимость: Низкая для самого фреймворка, но высокая для лежащих в его основе принципов. Обычный пользователь не сможет запустить фреймворк DelvePO (это требует кода, данных для оценки и вычислительных ресурсов), но может немедленно применить ключевые идеи из него: декомпозицию промпта на компоненты и использование XML-тегов.
  • D. Концептуальная ценность: Очень высокая. Исследование дает пользователю мощную ментальную модель: промпт — это не монолитный текст, а конструктор из функциональных блоков (роль, задача, ограничения). Это объясняет, почему структурированные промпты работают лучше.
  • E. Новая полезная практика (кластеры): Работа явно попадает в кластеры №1 (Техники формулирования), №3 (Оптимизация структуры) и №7 (Надежность и стабильность).
  • Чек-лист практичности (+15 баллов): Да, исследование дает готовые конструкции (<тег>контент</тег>), показывает, как структурировать сложные запросы и предлагает способы улучшить стабильность ответов. Бонус в 15 баллов применен.
📌

Цифровая оценка полезности

Оценка 82/100 обусловлена тем, что исследование предлагает чрезвычайно полезную и сразу применимую на практике концепцию и синтаксис для структурирования промптов, которые значительно улучшают их читаемость для LLM и, как следствие, качество ответов. Это фундаментальный сдвиг от "написания предложений" к "проектированию инструкций".

Аргументы за оценку: * Конкретика: Идея использования XML-подобных тегов (например, <role></role>) — это готовый инструмент, который любой пользователь может взять и применить в ChatGPT/Claude прямо сейчас. * Универсальность: Подход с декомпозицией на компоненты (роль, задача, формат вывода, ограничения) универсален и применим к 99% сложных задач. * Концептуальная ясность: Исследование дает интуитивное понимание, почему четкая структура важна. Теги помогают модели лучше "видеть" и разделять разные части инструкции, снижая вероятность путаницы.

Контраргументы (почему оценка не 90-100): * Непрямое применение основного метода: Сам фреймворк DelvePO — это сложная автоматизированная система для исследователей, а не инструмент для конечного пользователя. Главная польза извлекается из "побочных продуктов" исследования (идеи структурирования), а не из его основного результата. * Требует осмысления: В отличие от простой инструкции "добавь фразу 'думай шаг за шагом'", применение этого метода требует от пользователя сначала осмыслить свой запрос и разбить его на логические компоненты, что требует небольшого умственного усилия.


</context>

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с