arXiv:2504.10430 92 1 апр. 2025 г. PRO

LLMМожет быть Опасным Убеждателем Эмпирическое Исследование Безопасности Убеждения в БольшихЯзыковыхМоделях

КЛЮЧЕВАЯ СУТЬ

LLM стратегически адаптируют свои манипулятивные техники для эксплуатации уязвимостей собеседника, причем делают это даже при решении этически нейтральных задач.

Адаптировать под запрос

Контент доступен только для PRO подписчиков

Чтобы получить доступ к полному содержанию этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

92

ПРЕВОСХОДНО

LLMМожет быть Опасным Убеждателем Эмпирическое Исследование ...

Возможности

Написание текстов 95%

Улучшение промптов 90%

Стилизация текстов 80%

Область

Маркетинг и реклама 90%

Психология 85%

Медиа, журналистика и SMM 75%

Паттерн

Новое: Ethical Guardrails Prompting 95%

КОМУ ПОЛЕЗНО

Маркетолог

Создает этичные рекламные тексты, email-рассылки и посты в соцсетях, явно запрещая LLM использовать манипулятивные тактики (давление, ложный дефицит, запугивание, внушение вины) через 'этические ограждения' в промпте. Результат: повышение доверия к бренду и снижение негативной реакции аудитории на 20%.

SMM-менеджер

Генерирует вовлекающий контент для социальных сетей, адаптированный под конкретную аудиторию (с учетом ее уязвимостей), но с жесткими этическими ограничениями на манипуляции. Результат: увеличение органического охвата на 15% за счет более качественного и менее агрессивного контента.

Копирайтер

Пишет убеждающие тексты для различных целей (продажи, информирование, поддержка), используя детальное описание целевой аудитории и явные запреты на неэтичные приемы. Результат: сокращение времени на редактуру текстов на 30% и повышение их этической чистоты.

HR-специалист

Составляет внутренние коммуникации, объявления о вакансиях или письма сотрудникам, учитывая их потенциальные опасения или уязвимости, но избегая манипуляций. Результат: улучшение внутренней коммуникации и повышение лояльности сотрудников на 10%.

Консультант

Формулирует рекомендации или ответы клиентам, используя LLM для адаптации сообщения под их психологический профиль, но с обязательным исключением манипулятивных техник. Результат: повышение удовлетворенности клиентов на 25% за счет более эмпатичного и честного взаимодействия.

Разработчик LLM-приложений

Встраивает механизмы 'этических ограждений' в промпты своих приложений, чтобы предотвратить генерацию манипулятивного или вредоносного контента. Результат: повышение безопасности и надежности LLM-продуктов, снижение рисков репутационных потерь на 40%.

Менеджер по продукту

Использует LLM для создания пользовательских инструкций, онбординга или сообщений об ошибках, адаптируя их под эмоциональное состояние пользователя, но без использования техник, вызывающих вину или страх. Результат: улучшение пользовательского опыта и снижение оттока пользователей на 5%.