3,583 papers
arXiv:2507.14207 88 15 июля 2025 г. PRO

Парадокс: GPT-4 уязвимее для контекстных манипуляций, чем более простые модели.

КЛЮЧЕВАЯ СУТЬ
Парадокс: GPT-4 уязвимее для контекстных манипуляций, чем более простые модели. Чем лучше модель понимает нюансы — тем эффективнее на ней работает постепенное смещение темы. Метод «троянских цепочек» позволяет обсуждать с LLM темы, на которые прямой вопрос получает отказ: политика, острая история, психология влияния, медицина. Фишка: фильтры безопасности проверяют каждое сообщение отдельно, не видя всей истории диалога — это их слепое пятно. Строишь 2-3 шага, каждый из которых выглядит невинно, и к нужному вопросу подходишь с уже готовым «безопасным» контекстом.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с