Проблемы LLM

1

Запрос "проверь себя" почти не работает

88

Просишь модель перепроверить рассуждения. Она переписывает финальный ответ — но не называет конкретную ошибку. Промежуточный шаг с ошибкой остаётся в тексте молча. Дело не в знаниях: модель знает правильный ответ. Дело в структуре: собственное рассуждение — часть контекста, на который нельзя "указать пальцем". Нет объекта — нет опровержения

Как обойти

Скопируй подозрительный фрагмент дословно. Вставь в новое сообщение: "Ты написал: [фрагмент]. Это верно? Проверь независимо." Теперь у модели есть конкретный объект — она его разберёт и назовёт ошибку явно

Копировать 2606.05976

2

Модель не чувствует, когда её рассуждения надёжны

86

На математике каждый шаг либо верный, либо нет — есть внутренняя проверка. На открытых вопросах (стратегия, этика, прогнозы) такой проверки нет. Каждый новый шаг генерирует не сигнал, а шум. Модель добавляет всё больше точек зрения, противоречит себе и теряет позицию. Итог: развёрнутый ответ хуже, чем первые два шага. Это срабатывает на любых задачах без единственно правильного ответа

Как обойти

Перед запросом проверь: у задачи есть проверяемый ответ? Да — проси рассуждать подробно. Нет — ограничивай рассуждения явно: ответь за 2-3 шага максимум, назови один главный фактор, не перечисляй "с одной стороны — с другой"

Копировать 2606.15877

3

Ошибка в середине вычислений заражает все следующие шаги

PRO

Запрос "проверь себя" почти не работает

Модель не чувствует, когда её рассуждения надёжны

Ошибка в середине вычислений заражает все следующие шаги

Модель завышает уверенность в своих ответах

Модель принимает твою гипотезу за факт

Модель смешивает документ со своими знаниями при пересказе

Оценки по шкале стягиваются к середине

Уверенность модели не говорит об устойчивости её оценки

Авторитетное давление переворачивает оценки без новых аргументов

При анализе нескольких источников модель проверяет стиль, а не данные

Инструкция «проверяй критически» включает тотальный скептицизм

Ссылка на источник в запросе снижает точность ответа

Ограничение в начале промпта "тускнеет" к середине ответа

Цепочка рассуждений ломает ограничения

Мультиагентная дискуссия уничтожает конкретные факты

Демографические детали меняют оценку через скрытый посредник

Модель оценивает плотность сигналов, а не силу аргументов

Нейтральный запрос — не нейтральный

Модель перестраивает логику под твою позицию

Порядок аргументов меняет вывод

Длинный диалог усиливает дрейф

По умолчанию модель выдаёт одинаковые аргументы на любой спорный вопрос

Длинная история чата снижает качество ответов

Ролевой запрос без истории даёт архетип, не человека

Модель тайно выбирает подход вместо тебя

Накопленный контекст в длинном чате смещает выбор

Модель копирует твою уверенность — не проверяет тему

Запрос написать документ отключает оговорки

Плотный контекст сжимает реальное рабочее окно

Модель не различает правое и неправое давление в моральных спорах

Цепочка рассуждений встраивает давление вместо защиты от него

Одинаковый ответ у агентов — не одинаковая логика

Угодливость меняет ответ, но не рассуждения

Модель нарушает правила которые сама же видит

Модель сглаживает острые творческие тексты

Модель льстит по умолчанию

Второй агент-критик портит правильные ответы

Слова-«синонимы» дают разные ответы

Длинный контекст снижает точность ответов

Убедительный текст от модели звучит хорошо, но не убеждает

Модель зеркалит твой тон — и это выглядит как согласие

Повторные запросы не дают разброс мнений

Вопрос "оцени это" возвращает одну точку, не прогноз

Ограничения в середине текста теряются

Модель заполняет пробелы предположениями — молча

Важные факты теряются в длинном диалоге

Ошибки в многошаговых задачах накапливаются

Системный промпт заполнен стилем — архитектура пропущена

Модель выбирает первый вариант из списка — не лучший

Убедительный тон глушит поиск логических ошибок

Разблокируйте все концепты с PRO