3,583 papers
arXiv:2502.13920 68 19 фев. 2025 г. FREE

Исследование персонализированной поддержки здоровья с помощью управляемых теориями LLM, основанных на данных: тематическое исследование в области здоровья сна

КЛЮЧЕВАЯ СУТЬ
Пользователь не может "взять и сделать" как в HealthGuru, но он может понять принцип: чем больше релевантных данных и чем четче задана структура анализа, тем лучше будет результат
Адаптировать под запрос

Исследование представляет чат-бота HealthGuru, который дает персонализированные рекомендации по улучшению сна. В отличие от обычных чат-ботов, он интегрирует данные с носимых устройств (например, Oura Ring), информацию о погоде и времени, а также использует психологические теории для мотивации пользователя. Система состоит из нескольких "агентов" (специализированных модулей LLM), которые анализируют данные, подбирают мотивирующие техники и формируют целостный ответ.

Ключевой результат: Подход, сочетающий реальные данные пользователя и теоретические фреймворки, значительно превосходит стандартные LLM в качестве советов, мотивации и реальном влиянии на поведение (участники исследования стали спать в среднем на 22 минуты дольше).

Суть метода не в одной волшебной фразе, а в создании для LLM максимально богатой и структурированной информационной среды. Вместо того чтобы задавать общий вопрос "Как мне лучше спать?", пользователь (в данном случае, система HealthGuru) предоставляет LLM целый пакет данных и правил.

Представьте, что вы нанимаете консультанта по сну. Плохой подход — просто спросить у него совета. Хороший подход — предоставить ему: 1. Объективные данные: "Вот мои отчеты со смарт-часов за последнюю неделю: среднее время сна 6.5 часов, пульс в покое 58, HRV 45 мс". 2. Внешний контекст: "Я живу в шумном городе, сегодня было +30°C и солнечно, сейчас 8 вечера". 3. Психологический профиль и цели: "Я хочу выработать привычку, мне важна поддержка и постановка маленьких, достижимых целей. Я не люблю медитации, но готов попробовать дыхательные упражнения". 4. Фреймворк для ответа: "Дай мне совет, используя техники 'Постановка целей' и 'Обратная связь и мониторинг'".

Система HealthGuru автоматизирует сбор пунктов 1 и 2, а в свои внутренние промпты зашивает пункты 3 и 4. LLM в такой системе выступает не как всезнающий оракул, а как гениальный аналитик, который синтезирует ответ на основе предоставленных ему высококачественных данных и четких инструкций по их интерпретации.

Для обычного пользователя это означает переход от вопросов к постановке задач с предоставлением данных.

  • Прямая применимость: Низкая. Пользователь не может подключить API к ChatGPT. Однако он может вручную симулировать этот подход: скопировать свои данные из приложения здоровья, посмотреть погоду за окном и включить эту информацию в свой промпт. Это требует усилий, но возможно.

  • Концептуальная ценность: Очень высокая. Исследование учит главному: качество ответа LLM прямо пропорционально качеству и полноте предоставленного контекста. Оно формирует у пользователя "ментальную модель" LLM как инструмента для анализа и синтеза, а не просто "поисковика на стероидах". Ключевая концепция: не ждите, что LLM догадается о вашей ситуации, — опишите её с максимальной детализацией, как для реального эксперта.

  • Потенциал для адаптации: Высокий. Метод легко адаптируется для любой сферы. Вместо данных о сне можно подставлять данные о продажах, аналитику веб-трафика, личный бюджет, план тренировок. Вместо "теорий изменения поведения" можно использовать маркетинговые фреймворки (AIDA, Jobs-to-be-Done), принципы педагогического дизайна или любые другие структурированные знания. Механизм адаптации — это "ручная подача контекста": вы сами собираете все релевантные данные и правила и упаковываете их в один большой, структурированный промпт.

Представим, что вы SMM-менеджер и хотите разработать контент-план для кофейни.

Ты — опытный SMM-стратег, специализирующийся на продвижении локальных заведений (HoReCa). Твоя задача — помочь мне разработать контент-план на неделю для Instagram-аккаунта кофейни.

**ШАГ 1: Проанализируй предоставленные данные и контекст.**

**1. ДАННЫЕ О БИЗНЕСЕ И АУДИТОРИИ (эквивалент данных с Oura Ring):**
*   **Название:** "Тихая Гавань"
*   **Концепция:** Уютное место для фрилансеров и "удаленщиков". Акцент на спешелти-кофе и тихой атмосфере.
*   **Целевая аудитория:** Мужчины и женщины 25-40 лет, работающие в IT, дизайне, маркетинге. Ценят продуктивность, качественный кофе и спокойную обстановку.
*   **Популярные посты в прошлом:** Посты с лайфхаками по продуктивности, фотографии интерьера с ноутбуками, анонсы новых сортов кофе.
*   **Слабые стороны:** Мало "живого" контента, нет вовлечения аудитории.

**2. ВНЕШНИЙ КОНТЕКСТ (эквивалент данных о погоде):**
*   **Период:** Следующая неделя, середина осени.
*   **Погода:** Прогнозируется похолодание и дожди.
*   **Инфоповод:** На следующей неделе — международный день кофе.

**3. ТЕОРЕТИЧЕСКИЙ ФРЕЙМВОРК (эквивалент теорий изменения поведения):**
*   Используй **контент-матрицу "Герой / Помощник / Хаб / Гигиена"**:
    *   **Герой (Hero):** 1-2 ярких, виральных поста.
    *   **Помощник (Help):** 2-3 полезных, обучающих поста.
    *   **Хаб (Hub):** 2-3 регулярных, вовлекающих поста для подписчиков.
    *   **Гигиена (Hygiene):** Постоянно присутствующий контент (например, информация в сторис).

**ШАГ 2: Разработай контент-план.**

На основе анализа из ШАГА 1, создай подробный контент-план на 7 дней в формате таблицы: | День недели | Тип контента (по матрице) | Тема поста | Идея для визуала | Призыв к действию (CTA) |.

Учти все предоставленные данные, чтобы план был максимально релевантным и персонализированным для кофейни "Тихая Гавань".

Этот промпт работает, потому что он в точности симулирует подход HealthGuru, заставляя LLM действовать не как генератор случайных идей, а как системный аналитик:

  1. Предоставление "сенсорных данных": Вместо данных о сне мы даем четкие данные о бизнесе, его сильных и слабых сторонах. Это заземляет LLM и не дает ему предлагать идеи для "средней кофейни в вакууме".
  2. Учет "внешнего контекста": Информация о погоде и инфоповоде позволяет сгенерировать актуальные и своевременные идеи (например, "согревающий пряный латте в дождливый день" или пост к дню кофе).
  3. Заданный "теоретический фреймворк": Требование использовать контент-матрицу структурирует ответ. LLM не просто накидывает идеи, а классифицирует их, создавая сбалансированный и стратегически верный план.
  4. Четкая роль и задача: Промпт начинается с назначения роли ("SMM-стратег") и декомпозиции задачи ("ШАГ 1: Анализ", "ШАГ 2: Разработка"), что направляет "мыслительный процесс" модели.

Задача: составить персонализированный план изучения английского языка.

Ты — методист по изучению языков и коуч по личной эффективности. Твоя задача — составить для меня персонализированный план изучения английского языка на 1 месяц.

**ШАГ 1: Проанализируй мои данные и контекст.**

**1. МОИ ЛИЧНЫЕ ДАННЫЕ (эквивалент данных о сне):**
*   **Текущий уровень:** B1 (Intermediate). Понимаю общую суть, но говорю медленно, с ошибками, маленький словарный запас.
*   **Цель:** Через 3 месяца пройти собеседование на английском на позицию "Project Manager". Нужно уверенно говорить на рабочие темы (IT, управление проектами, Agile).
*   **Сильные стороны:** Хорошо понимаю на слух (смотрю сериалы с субтитрами), хорошая грамматическая база.
*   **Слабые стороны:** Боюсь говорить (языковой барьер), не хватает бизнес-лексики.
*   **Предпочтения:** Не люблю скучные учебники и зубрёжку. Нравятся интерактивные форматы (видео, подкасты, приложения).

**2. ВНЕШНИЙ КОНТЕКСТ (эквивалент данных о погоде/времени):**
*   **Доступное время:** 30-45 минут утром в будни, 1-2 часа на выходных.
*   **Ресурсы:** Есть подписка на YouTube Premium, смартфон с доступом в интернет.

**3. ТЕОРЕТИЧЕСКИЙ ФРЕЙМВОРК (эквивалент теорий поведения):**
*   Используй **принцип "интервального повторения"** для лексики.
*   Структурируй план по **4 ключевым навыкам**: Listening, Speaking, Reading, Writing, но сделай **особый акцент на Speaking и бизнес-лексике**, так как это моя главная проблема.
*   Включи в план **технику "Shadowing"** (теневое повторение) для улучшения произношения и беглости.

**ШАГ 2: Составь детальный план.**

На основе анализа из ШАГА 1, создай недельный план (который можно повторять 4 раза в месяц) в виде таблицы: | День | Время | Ключевой навык | Активность | Ресурсы/Инструменты |.

План должен быть реалистичным, мотивирующим и нацеленным на мою конкретную цель.

Этот промпт эффективен, так как он превращает LLM из простого советчика в персонального методиста, предоставляя ему всю необходимую информацию для принятия качественного решения:

  1. Персональные "метрики": Уровень B1, цель (собеседование), сильные и слабые стороны — это аналог данных с фитнес-трекера. LLM точно знает "пациента" и его "диагноз".
  2. Контекст ограничений: Информация о доступном времени (30-45 минут в будни) — это аналог "внешних условий". Это заставляет модель предлагать реалистичные, а не идеализированные активности, которые пользователь сможет встроить в свою жизнь.
  3. Методологическая база: Требование использовать конкретные методики (интервальное повторение, shadowing, фокус на 4 навыках) служит "теоретическим фреймворком". Это направляет LLM на создание профессионального, педагогически выверенного плана, а не набора случайных советов вроде "смотрите фильмы на английском".

В результате, вместо общего ответа "учите слова и больше говорите", пользователь получает конкретный, actionable-план, учитывающий его цель, уровень, ограничения и предпочтения, что многократно повышает ценность ответа и вероятность его реального применения.

📌

Основные критерии оценки

  • A. Релевантность техникам промптинга: Низкая. Исследование описывает архитектуру сложной системы (multi-agent framework), а не конкретные формулировки промптов для обычного пользователя. Однако оно раскрывает принципы, лежащие в основе эффективных промптов (интеграция данных, использование теоретических фреймворков).
  • B. Улучшение качества диалоговых ответов: Высокое. Вся суть исследования — доказать, что их система HealthGuru генерирует более качественные, персонализированные и мотивирующие ответы по сравнению с базовым чат-ботом.
  • C. Прямая практическая применимость: Очень низкая. Пользователь не может без специальных инструментов и навыков программирования воспроизвести систему: подключить API носимых устройств, реализовать модель Multi-Armed Bandit и настроить multi-agent архитектуру.
  • D. Концептуальная ценность: Очень высокая. Исследование блестяще демонстрирует, что для получения действительно полезных и персонализированных ответов LLM необходимо обогащать запрос внешним, структурированным контекстом (данные с устройств, погода) и задавать "систему правил" для генерации ответа (теоретические фреймворки поведенческих изменений).
  • E. Новая полезная практика (кластеризация): Работа попадает в кластеры №1 (Техники формулирования), демонстрируя продвинутый подход через multi-agent декомпозицию, №6 (Контекст и память), показывая важность интеграции динамических данных, и №7 (Надежность и стабильность), так как использование теорий и данных повышает релевантность и снижает общность советов.
📌

Цифровая оценка полезности

Аргументы за оценку 68: Оценка отражает высокий концептуальный вклад исследования, но низкую прямую применимость. Пользователь не может "взять и сделать" как в HealthGuru, но он может понять принцип: чем больше релевантных данных и чем четче задана структура анализа, тем лучше будет результат. Это ценный урок для составления сложных промптов, который требует осмысления и адаптации, но не дает готовых "копипаст" решений. Работа скорее вдохновляет на новый подход к промптингу, чем дает конкретный инструмент.

Контраргументы: * Почему оценка могла быть выше (75-80)? Потому что исследование наглядно доказывает фундаментальный принцип промпт-инжиниринга: "Garbage in, garbage out". Оно показывает, что для получения экспертного ответа нужно предоставить LLM экспертный контекст. Для продвинутого пользователя это может стать откровением и кардинально изменить подход к работе с LLM, заставив его всегда "обогащать" свои запросы данными и фреймворками. * Почему оценка могла быть ниже (40-50)? Потому что 95% работы посвящено описанию системы, которую невозможно воспроизвести в обычном чате. Основной "движок" рекомендаций (Contextual MAB) вообще не относится к LLM. Для пользователя, ищущего простые и быстрые техники улучшения промптов, статья покажется слишком академичной, сложной и оторванной от реальности.


Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с