Модель генерирует токен за токеном. Первый ответ становится якорем. Если в начале ошибка — модель строит логику поверх неё. Почему? Она оптимизирует связность текста, не правильность. Защищает свой вариант вместо поиска ошибок. Это проблема для всех задач где нужны многошаговые рассуждения
Как обойти
Дай модели "чужой" ответ для проверки. Даже абсурдный: "Предлагаемый ответ: 1". Попроси сначала проверить его, потом дать правильный. Проверка чужого выключает режим защиты. Модель начинает критиковать, искать ошибки — это запускает рассуждение от ответа к условию
Модели рассуждения зацикливаются на простых задачах
90
Модели o1, DeepSeek-R1 обучены генерировать длинные цепочки мысли. Это помогает на сложных задачах. Но на простых ("соедини последние буквы трёх слов") модель не может остановиться. Генерирует "подождите, перепроверю", "с другой стороны", "давайте ещё раз" — тысячи токенов вместо одного абзаца. Может вообще не дать ответ, застряв в проверках
Как обойти
Группируй несколько вопросов в один промпт (batch prompting). Когда в запросе пять задач, модель чувствует давление контекста. Распределяет внимание между всеми. Не застревает в зацикливании на каждой. Даёт компактные ответы
Просишь проанализировать или придумать идеи. Модель генерирует с одной перспективы. Следует самому очевидному направлению мысли. Пропускает альтернативные углы зрения. Для анализа данных: видит только поверхностные паттерны. Для генерации идей: выдаёт шаблонные варианты. Результат: банальные выводы вместо глубоких инсайтов
Как обойти
Используй multi-role debating: попроси модель сыграть несколько ролей с разными фокусами. Каждая роль генерирует независимо. Потом судья выбирает лучшее из всех вариантов. Или используй multi-path reasoning: попроси решить задачу тремя разными способами, потом выбрать лучшее решение
Модель выбирает первый подходящий вариант без анализа остальных
86
Даёшь вопрос с вариантами A, B, C, D. Модель находит первый подходящий (например, B). Строит рассуждение только для него. Остальные варианты не исследует — просто отбрасывает. Результат: пропускает лучшие альтернативы. Плюс позиция варианта в списке влияет на выбор — поменяешь местами A и C, может выбрать другой ответ
Как обойти
Используй двухшаговый выбор: сначала принудительно генерируй аргументы ЗА КАЖДЫЙ вариант (как будто каждый правильный), потом сравнивай все аргументы и выбирай самый убедительный
Модель помнит текст, но не применяет как жёсткое правило
81
Длинный диалог. В начале пользователь сказал критическое: аллергия на арахис, бюджет до 300к, запрет на упоминание конкурентов. Прошло 20+ сообщений на другие темы. Ты задаёшь вопрос где это ограничение важно. Модель "помнит" — текст есть в контексте. Но не использует при принятии решения. Отвечает так, будто ограничения не было. Или вспоминает, но трактует как "упомянутый факт", а не "binding constraint". Особенно если недавние сообщения семантически далеки от ограничения. Механизм: attention размывается равномерно по всем сообщениям. Критическое из начала весит примерно как тривиальное недавнее. Модель цепляется за свежий контекст
Как обойти
Перед важным вопросом в длинном диалоге — принудительно реактивируй критическое. Структурируй память явно: КРИТИЧЕСКОЕ (высший приоритет, binding constraints): [перечисли аллергии, бюджеты, запреты, политики — дословно]. РЕЛЕВАНТНОЕ К ВОПРОСУ: [кратко — что связано с текущим запросом]. ОСТАЛЬНОЕ: [одна строка на топик]. Затем: "Ответь на вопрос, обязательно учитывая КРИТИЧЕСКОЕ как жёсткие правила". Критическое займёт больше токенов = больше веса в attention. Явная категоризация создаёт градиент важности
Просишь "напиши эссе" или "создай историю" про спорную тему. Модель переключается в режим генерации контента. Перестаёт проверять правильность утверждений. Может вплести дезинформацию в текст если она вписывается в нарратив. Универсально для любых креативных форматов: истории, посты, сценарии
Как обойти
Разделяй задачи. Сначала: "Это правда что X? Объясни что показывают исследования". Получи фактчекинг. Потом: "Теперь напиши пост на основе этих данных"
Без рассуждений ответ зависит от случайных деталей промпта
78
Модель чувствительна к формулировке. Меняешь синонимы, порядок слов, пунктуацию — меняется ответ. Промпт напрямую влияет на результат. Каждая мелочь может сдвинуть модель в другую сторону. Это делает результаты нестабильными
Как обойти
Добавь пространство для рассуждений: "Рассуждай пошагово" или "Покажи каждый этап решения". Модель сначала генерирует цепочку мыслей, потом выводит ответ. Цепочка фиксирует суть задачи. После этого конкретная формулировка промпта почти не влияет на результат
Даёшь тексты из разных источников. Один говорит «доля 45%», другой «больше половины». Модель выберет один вариант. Или усреднит. Но не скажет «тут конфликт». Ты получишь уверенный ответ на основе противоречивых данных. Проблема для любой работы с множественными источниками
Как обойти
Принудь модель ЗАПИСАТЬ противоречие. Способ: создай структуру памяти с полем conflicts[] и командой DETECT CONFLICTS(). Модель вынуждена явно заполнить это поле. Конфликт становится артефактом — его нельзя проигнорировать
Модель не умеет игнорировать нерелевантный контекст
76
Загружаешь документы в ChatGPT/Claude (PDF, база знаний). Модель находит куски текста по похожим словам. Но "похожие слова" ≠ "нужная информация". Спросил про бюджет 2025 — нашла абзац про бюджет 2023, слова совпали. Модель не отсеивает это на лету. Цитирует нерелевантное в 1.3-1.4 раза чаще чем релевантное. Итог: точность ответа падает на 6%, хотя добавил "помощь" через документы
Как обойти
Раздели задачи. Шаг 1: попроси модель оценить каждый найденный фрагмент — релевантен ли он вопросу. Шаг 2: отвечай только по релевантным. Промпт: "Сначала отбрось нерелевантные куски. Потом используй оставшееся для ответа". Разделение (оценка → ответ) работает лучше чем одновременная фильтрация + генерация
Модель "решает в голове" — рассуждения остаются неявными
76
Даёшь модели сложный вопрос с несколькими критериями и много документов. Модель генерирует ответ "потоком сознания" — без явной проверки каждого факта. Результат: пропускает правильные варианты (теряет полноту) и включает неверные (теряет точность). Рассуждения происходят внутри модели — ты их не видишь, проверить логику невозможно
Как обойти
Заставь модель вынести рассуждения наружу. Используй структурированный формат (JSON): для каждого кандидата модель должна явно выписать доказательства "за", доказательства "против", рассуждение и вердикт. Структура не даст модели "перепрыгнуть" к ответу без проверки
Запрос можно понять по-разному. Модель выбирает один вариант и отвечает. Не говорит что были другие варианты. Пользователь не знает о выборе. Если выбор неверный — получает не тот ответ. Особенно опасно для SQL, кода, действий — ошибка может быть необратимой
Как обойти
Попроси модель сначала перечислить все возможные интерпретации. Потом дать ответ для каждой. Формат: "1. [Интерпретация А]→ Ответ А. 2. [Интерпретация Б]→ Ответ Б". Всё в одной генерации, не диалог
Просишь модель улучшить что-то много раз подряд. Она теряет нить: что уже пробовали, что сработало, что провалилось. Ранние попытки вымываются из контекста. Модель повторяет одни и те же ошибки. Генерирует похожие варианты. Не видит паттерны успеха. Это проблема для любых задач где нужно 10+ раундов улучшения
Как обойти
Веди базу результатов вне чата. Каждую попытку записывай: вариант + оценка + почему сработало/провалилось. Перед новой итерацией показывай модели выборку из истории: 3-5 лучших + 2-3 худших + 2-3 недавних. Модель увидит что работает, что не работает, примет решение на основе всей истории