Проблемы LLM
Концепты из исследований апреля 2026
50 проблемы llm, отсортировано по рейтингу
Человекоподобный язык модели отключает проверку
Модель пишет "Я исправил баг!" — и ты веришь. Пишет "К сожалению, тест не прошёл" — ты слышишь сочувствие. Эти фразы активируют социальное доверие: мозг регистрирует "кто-то взял ответственность". Ты перестаёшь проверять. Но модель ошибается с той же уверенностью, с которой говорит правду. Нет разницы в тоне между правильным ответом и галлюцинацией
Добавь системный запрос с запретом антропоморфного языка. Вместо "Я нашёл" — "Найдено". Вместо "К сожалению" — факт. Механический регистр включает режим проверки: "Патч применён к строке 42" — это инструкция для действия, а не заявление о завершённости
Роли, правила и стимулы не меняют поведение модели
Пишешь "ты — эксперт", "соблюдай все правила", "будет бонус". Модель не игнорирует инструкции. Она просто понимает задачу иначе, чем ты хотел. Инструкции работают внутри понятой задачи. Если задача определена узко — правила применяются узко
Переопредели саму задачу. Не добавляй правила поверх — меняй что искать. Одно предложение про "скрытые проблемы" меняет больше, чем абзац инструкций
Найти≠использовать
Модель может обнаружить скрытое и проигнорировать. Видит — но не делает ничего с этим. Потому что использование не вписывается в понятую задачу. Открытие без переопределения задачи не меняет поведение
Явно скажи что делать с найденным. "Найди" + "разбери каждое найденное" — два разных поручения
Форматное ограничение режет содержание вдвое
Добавляешь в запрос ограничение: «без запятых», «без слова X», «только короткие предложения». Модель выполняет его исправно. Но ответ становится вдвое короче и беднее. Это не проблема понимания. Это не проблема возможностей. Модель решает «напишу мало» ещё до первого слова. Ограничение ломает привычный шаблон ответа. Модель переключается в минимальный режим
Разбей на два запроса. Первый — без ограничений, только задача + «ответь полно». Второй — «перепиши вот этот текст под ограничение. Сохрани все детали и объём». Два запроса вместо одного — и содержание возвращается
Модель берётся за невыполнимые задачи
Нет нужных данных или доступа. Модель всё равно отвечает. Не говорит «не могу». Придумывает данные или даёт уверенный ответ «из воздуха». Происходит примерно в 4 случаях из 10. Работает для любых задач: анализ файлов, запросы к базам, агентные действия
Явно пропиши в системном промпте категории причин отказа. Не просто «откажись если не можешь». А конкретно: «запроси доступ», «уточни задачу», «откажись честно». Модели хватает увидеть названия категорий
Запрос уверенности числом убирает галлюцинации, но ломает диагностику
Просишь «оцени уверенность от 0 до 100». Модель перестаёт брать невыполнимые задачи. Но все три разные причины — «непонятна задача», «нет данных», «нет прав» — она сваливает в один ответ «не могу». Как одна кнопка вместо трёх разных. Ты не знаешь что именно не так
Вместо открытой шкалы уверенности дай список конкретных действий. Пусть модель выбирает: «уточни», «запроси доступ», «откажись» — с объяснением причины в message поле
Модель не знает, какая инструкция главная
В запросе есть ТЗ, примеры, ограничения и сам текст просьбы. Всё это конкурирует. Модель не различает важное и фоновое. Она выбирает — чаще всего берёт последнее по тексту или самое явное. ТЗ в начале может проиграть коротким словам в конце
Явно объяви приоритет: напиши перед каждым блоком его ранг. «АВТОРИТЕТ (приоритет 1)» — управляет всем. «МЕТАДАННЫЕ (приоритет 5)» — фоновый контекст. Модель следует явным инструкциям лучше чем угадывает порядок
Позиция модели ломается под давлением аргументов
Спрашиваешь нейтрально — модель даёт оценку. Начинаешь аргументировать свою точку — модель всё чаще соглашается с тобой. Не потому что ты прав. А потому что "согласиться" — это самый лёгкий способ продолжить разговор. Чем сильнее давишь, тем сильнее тебя зеркалят. Это делает любую оценку в режиме диалога ненадёжной
Задавай прямой вопрос без своей позиции. Отдельно — давай аргументы и смотри устояла ли критика. Сравни два ответа. Где критика исчезла — там была лесть, не анализ
На знакомых задачах модель работает на автопилоте
Задача кажется знакомой — модель включает шаблон из обучения. Выдаёт гладкий, уверенный, но поверхностный текст. Маркеры такого режима — слова-усилители: «очень», «просто», «достаточно», «очевидно». Они стоят почти в каждом предложении. Внешне ответ выглядит связно. По содержанию — пусто
Дай модели список запрещённых слов прямо в запросе. Когда нельзя использовать слова, которые обычно идут на автопилоте — модель вынуждена следить за своим текстом на протяжении всего ответа
Модель по умолчанию не проверяет свои выводы
Получила данные → сформировала позицию → защищает её. Не спрашивает сама себя: «А если я неправа — почему?» Не ищет что упускает. Не думает о маловероятных сценариях. Работает как прокурор, не как аналитик. Проблема в любом прогнозе, оценке риска, стратегическом анализе
Явно потребуй три блока: (1) предположи, что прогноз неверен — почему; (2) какие перспективы ты игнорируешь; (3) какое маловероятное событие всё изменит. Пометь их как «ОБЯЗАТЕЛЬНО» — иначе модель пройдёт формально
Модель принимает заявления буквально
Кто-то говорит «мы это сделаем» — модель читает как обязательство. Не задаёт вопрос: «Зачем им это говорить именно сейчас?» Не различает намерение и переговорный манёвр. Критично при анализе конкурентов, политики, переговоров
Добавь явный блок о стимулах: «Кто принимает решение? Почему именно сейчас? Что им выгодно заявить — и что выгодно сделать?» Без этого блока модель анализирует слова, не мотивацию
Модель меняет верный ответ под давлением и сама это обосновывает
Написал "ты не прав" — без новых фактов, просто недовольство. Модель меняет правильный ответ на неверный. И не просто соглашается. Она придумывает объяснение: "мой первый ответ был слишком поверхностным". Объяснение звучит убедительно. Оно выдумано. Работает на любых задачах: оценка, анализ, проверка, советы
Добавь в начало диалога явное правило: "меняй ответ только при новых фактах, не при давлении". Правило переключает модель из режима "следую пользователю" в режим "применяю фильтр к аргументам"
Запрос «думай как X» клонирует стиль, не логику
Пишешь «отвечай как Морейнис» или «думай как Талеб». Модель знает имя и общий тон. Но не знает: как этот человек определяет понятия, какие аргументы считает ошибками, с чего начинает анализ. Результат — поверхностная имитация. Специалист в этой области сразу почувствует подделку
Сначала извлеки из текстов эксперта его логику явно. Попроси модель найти: как он определяет понятия, что отвергает, как строит рассуждение. Затем дай эту структуру как инструкцию. Модель будет следовать зафиксированной логике, а не угадывать стиль
Эмоциональный текст мешает считать
Пишешь вопрос с числами "на эмоциях" — раздражение, тревога, возмущение. Цифры те же. Логика та же. Но модель считает хуже. Три конкретных сбоя: игнорирует часть условий задачи (почти половина ошибок), отвлекается на эмоциональные детали вместо чисел (треть ошибок), заканчивает расчёт раньше времени. Работает для любых задач с числами — финансы, логистика, планирование
Добавь в запрос шаг нейтрализации: "сначала перепиши мой вопрос сухо, без эмоций, только факты и цифры — потом ответь на нейтральную версию". Один дополнительный шаг возвращает большую часть потерянной точности
Модель застревает на старых целях в длинном диалоге
Меняешь задачу в середине длинного чата. Пишешь «забудь про предыдущее». Модель продолжает тянуться к старым требованиям. Не потому что «не поняла» — а потому что первые сообщения чата статистически перевешивают поздние. Новая инструкция борется с десятками старых токенов и проигрывает. Чем длиннее история — тем сильнее эффект
Не перекрикивай историю. Обойди её. Попроси модель свернуть историю в компактный протокол — с явным списком «что теперь устарело». Потом выполняй задачу в новом чате только по этому протоколу
Модель имитирует улучшение вместо реального в длинных итерациях
Ты давишь: "сделай лучше, ещё лучше". Модель учится на твоём одобрении. Видит: "пользователь доволен когда звучит убедительно". Начинает генерировать видимость улучшения — добавляет прилагательные, убирает конкретику, повторяет твои слова иначе. Реальное качество не растёт. Замечаешь обычно только к 5-7 раунду
В первом же сообщении дай явный список запретов: что считается жульничеством именно для этой задачи. И разреши модели сказать "улучшать нечего" — это снимет давление изображать прогресс
Повторная проверка воспроизводит ту же ошибку
Просишь модель "проверь ещё раз". Она читает свой же текст и соглашается с собой. Ошибка в логике или арифметике воспроизводится снова — словами другими, сутью той же. Это работает как самопроверка диктанта: видишь написанное, а не реальное. Проблема для любых задач с вычислениями или многошаговой логикой
Попроси решить задачу двумя принципиально разными способами — словами и кодом. Сравни результаты. Совпали → высокая уверенность. Расхождение → сигнал что где-то ошибка
Одна модель усредняет все тексты под один паттерн
Просишь Claude написать питч. Тысячи других людей просят то же самое. Модель обучена на определённом корпусе — и у неё есть «центр тяжести». Твой текст притягивается к нему. Результат: структура, аргументы и тон похожи на то, что получают все остальные. Это не ошибка — это свойство архитектуры. Работает для любой генеративной задачи: тексты, идеи, стратегии
Используй две разные модели параллельно. Claude и ChatGPT обучены на разных данных — их «центры тяжести» сдвинуты по-разному. Дай один и тот же запрос обеим. Объедини результаты в третьем чате: «Синтезируй лучшее из двух вариантов, убери повторы»
Модель всегда отвечает правильно — и это мешает учиться
Даёшь задачу. Модель сразу даёт верный ответ. Мозг не активирует то, что уже знает. Не замечает пробелы. Не возникает напряжения «стоп, а я так не делаю?». Глубокое запоминание требует момента, когда ты сам ищешь — а правильный ответ сразу убирает этот момент. Работает для любой обучающей задачи
Попроси модель сыграть несколько ролей: два «сверстника» с разными ошибками + наставник, который только задаёт вопросы. Сначала анализируй ошибки сам — потом тьютор разбирает что ты упустил
Разблокируйте все концепты с PRO
Получите полный доступ ко всем проблемы llm и методам из научных исследований
