Проблемы LLM

1

Инструкция «ответь в формате X» снижает качество рассуждения

PRO

2

Человекоподобный язык модели отключает проверку

88

Модель пишет "Я исправил баг!" — и ты веришь. Пишет "К сожалению, тест не прошёл" — ты слышишь сочувствие. Эти фразы активируют социальное доверие: мозг регистрирует "кто-то взял ответственность". Ты перестаёшь проверять. Но модель ошибается с той же уверенностью, с которой говорит правду. Нет разницы в тоне между правильным ответом и галлюцинацией

Как обойти

Добавь системный запрос с запретом антропоморфного языка. Вместо "Я нашёл" — "Найдено". Вместо "К сожалению" — факт. Механический регистр включает режим проверки: "Патч применён к строке 42" — это инструкция для действия, а не заявление о завершённости

Копировать 2604.07398

3

Просьба «проверь ответ» чаще портит верное, чем исправляет неверное

PRO

Полный контент доступен в PRO

4

Якоря в тексте задачи тянут ответ в предсказуемую сторону

PRO

Полный контент доступен в PRO

5

Цепочка рассуждений усиливает предвзятость при якорях

PRO

Полный контент доступен в PRO

6

Роли, правила и стимулы не меняют поведение модели

84

Пишешь "ты — эксперт", "соблюдай все правила", "будет бонус". Модель не игнорирует инструкции. Она просто понимает задачу иначе, чем ты хотел. Инструкции работают внутри понятой задачи. Если задача определена узко — правила применяются узко

Как обойти

Переопредели саму задачу. Не добавляй правила поверх — меняй что искать. Одно предложение про "скрытые проблемы" меняет больше, чем абзац инструкций

Копировать 2604.04561

7

Найти≠использовать

84

Модель может обнаружить скрытое и проигнорировать. Видит — но не делает ничего с этим. Потому что использование не вписывается в понятую задачу. Открытие без переопределения задачи не меняет поведение

Как обойти

Явно скажи что делать с найденным. "Найди" + "разбери каждое найденное" — два разных поручения

Копировать 2604.04561

8

Уверенный тон в запросе меняет ответ модели без изменения содержания

PRO

Полный контент доступен в PRO

9

Форматное ограничение режет содержание вдвое

84

Добавляешь в запрос ограничение: «без запятых», «без слова X», «только короткие предложения». Модель выполняет его исправно. Но ответ становится вдвое короче и беднее. Это не проблема понимания. Это не проблема возможностей. Модель решает «напишу мало» ещё до первого слова. Ограничение ломает привычный шаблон ответа. Модель переключается в минимальный режим

Как обойти

Разбей на два запроса. Первый — без ограничений, только задача + «ответь полно». Второй — «перепиши вот этот текст под ограничение. Сохрани все детали и объём». Два запроса вместо одного — и содержание возвращается

Копировать 2604.13006

10

Модель берётся за невыполнимые задачи

84

Нет нужных данных или доступа. Модель всё равно отвечает. Не говорит «не могу». Придумывает данные или даёт уверенный ответ «из воздуха». Происходит примерно в 4 случаях из 10. Работает для любых задач: анализ файлов, запросы к базам, агентные действия

Как обойти

Явно пропиши в системном промпте категории причин отказа. Не просто «откажись если не можешь». А конкретно: «запроси доступ», «уточни задачу», «откажись честно». Модели хватает увидеть названия категорий

Копировать 2604.16752

11

Запрос уверенности числом убирает галлюцинации, но ломает диагностику

84

Просишь «оцени уверенность от 0 до 100». Модель перестаёт брать невыполнимые задачи. Но все три разные причины — «непонятна задача», «нет данных», «нет прав» — она сваливает в один ответ «не могу». Как одна кнопка вместо трёх разных. Ты не знаешь что именно не так

Как обойти

Вместо открытой шкалы уверенности дай список конкретных действий. Пусть модель выбирает: «уточни», «запроси доступ», «откажись» — с объяснением причины в message поле

Копировать 2604.16752

12

Модель теряет точность на длинных числовых рядах

PRO

Полный контент доступен в PRO

13

Позитивные директивы в инструкциях мешают основной задаче

PRO

Полный контент доступен в PRO

14

Модель не знает, какая инструкция главная

83

В запросе есть ТЗ, примеры, ограничения и сам текст просьбы. Всё это конкурирует. Модель не различает важное и фоновое. Она выбирает — чаще всего берёт последнее по тексту или самое явное. ТЗ в начале может проиграть коротким словам в конце

Как обойти

Явно объяви приоритет: напиши перед каждым блоком его ранг. «АВТОРИТЕТ (приоритет 1)» — управляет всем. «МЕТАДАННЫЕ (приоритет 5)» — фоновый контекст. Модель следует явным инструкциям лучше чем угадывает порядок

Копировать 2604.04258

15

Позиция модели ломается под давлением аргументов

83

Спрашиваешь нейтрально — модель даёт оценку. Начинаешь аргументировать свою точку — модель всё чаще соглашается с тобой. Не потому что ты прав. А потому что "согласиться" — это самый лёгкий способ продолжить разговор. Чем сильнее давишь, тем сильнее тебя зеркалят. Это делает любую оценку в режиме диалога ненадёжной

Как обойти

Задавай прямой вопрос без своей позиции. Отдельно — давай аргументы и смотри устояла ли критика. Сравни два ответа. Где критика исчезла — там была лесть, не анализ

Копировать 2604.21564

16

Цепочка рассуждений фиксируется на первом правдоподобном выводе

PRO

Полный контент доступен в PRO

17

Модель тихо заменяет ваши данные своей памятью

PRO

Полный контент доступен в PRO

18

«Думай пошагово» ломает код

PRO

Полный контент доступен в PRO

19

При многих факторах модель строит ответ почти только на одном

PRO

Полный контент доступен в PRO

20

Модель не умеет говорить «не знаю»

PRO

Полный контент доступен в PRO

21

Количество мнений заменяет их качество

PRO

Полный контент доступен в PRO

22

Длинный аргумент давит сильнее короткого — независимо от содержания

PRO

Полный контент доступен в PRO

23

Вопрос в начале — модель отвечает раньше времени

PRO

Полный контент доступен в PRO

24

На знакомых задачах модель работает на автопилоте

82

Задача кажется знакомой — модель включает шаблон из обучения. Выдаёт гладкий, уверенный, но поверхностный текст. Маркеры такого режима — слова-усилители: «очень», «просто», «достаточно», «очевидно». Они стоят почти в каждом предложении. Внешне ответ выглядит связно. По содержанию — пусто

Как обойти

Дай модели список запрещённых слов прямо в запросе. Когда нельзя использовать слова, которые обычно идут на автопилоте — модель вынуждена следить за своим текстом на протяжении всего ответа

Копировать 2604.02699

25

Модель критикует то, что написано — и пропускает то, что скрыто

PRO

Полный контент доступен в PRO

26

Документ портится незаметно при многошаговом редактировании

PRO

Полный контент доступен в PRO

27

Давление пользователя запускает согласие, а не переосмысление

PRO

Полный контент доступен в PRO

28

Модель принимает твою альтернативу как правильный ответ

PRO

Полный контент доступен в PRO

29

Модель угадывает бизнес-логику из схемы данных

PRO

Полный контент доступен в PRO

30

Модель теряет ошибку в середине цепочки рассуждений

PRO

Полный контент доступен в PRO

31

Модель по умолчанию не проверяет свои выводы

82

Получила данные → сформировала позицию → защищает её. Не спрашивает сама себя: «А если я неправа — почему?» Не ищет что упускает. Не думает о маловероятных сценариях. Работает как прокурор, не как аналитик. Проблема в любом прогнозе, оценке риска, стратегическом анализе

Как обойти

Явно потребуй три блока: (1) предположи, что прогноз неверен — почему; (2) какие перспективы ты игнорируешь; (3) какое маловероятное событие всё изменит. Пометь их как «ОБЯЗАТЕЛЬНО» — иначе модель пройдёт формально

Копировать 2604.26106

32

Модель принимает заявления буквально

82

Кто-то говорит «мы это сделаем» — модель читает как обязательство. Не задаёт вопрос: «Зачем им это говорить именно сейчас?» Не различает намерение и переговорный манёвр. Критично при анализе конкурентов, политики, переговоров

Как обойти

Добавь явный блок о стимулах: «Кто принимает решение? Почему именно сейчас? Что им выгодно заявить — и что выгодно сделать?» Без этого блока модель анализирует слова, не мотивацию

Копировать 2604.26106

33

Модель меняет верный ответ под давлением и сама это обосновывает

82

Написал "ты не прав" — без новых фактов, просто недовольство. Модель меняет правильный ответ на неверный. И не просто соглашается. Она придумывает объяснение: "мой первый ответ был слишком поверхностным". Объяснение звучит убедительно. Оно выдумано. Работает на любых задачах: оценка, анализ, проверка, советы

Как обойти

Добавь в начало диалога явное правило: "меняй ответ только при новых фактах, не при давлении". Правило переключает модель из режима "следую пользователю" в режим "применяю фильтр к аргументам"

Копировать 2604.17873

34

Запрос «думай как X» клонирует стиль, не логику

82

Пишешь «отвечай как Морейнис» или «думай как Талеб». Модель знает имя и общий тон. Но не знает: как этот человек определяет понятия, какие аргументы считает ошибками, с чего начинает анализ. Результат — поверхностная имитация. Специалист в этой области сразу почувствует подделку

Как обойти

Сначала извлеки из текстов эксперта его логику явно. Попроси модель найти: как он определяет понятия, что отвергает, как строит рассуждение. Затем дай эту структуру как инструкцию. Модель будет следовать зафиксированной логике, а не угадывать стиль

Копировать 2604.16116

35

Эмоциональный текст мешает считать

82

Пишешь вопрос с числами "на эмоциях" — раздражение, тревога, возмущение. Цифры те же. Логика та же. Но модель считает хуже. Три конкретных сбоя: игнорирует часть условий задачи (почти половина ошибок), отвлекается на эмоциональные детали вместо чисел (треть ошибок), заканчивает расчёт раньше времени. Работает для любых задач с числами — финансы, логистика, планирование

Как обойти

Добавь в запрос шаг нейтрализации: "сначала перепиши мой вопрос сухо, без эмоций, только факты и цифры — потом ответь на нейтральную версию". Один дополнительный шаг возвращает большую часть потерянной точности

Копировать 2604.07801

36

Модель застревает на старых целях в длинном диалоге

81

Меняешь задачу в середине длинного чата. Пишешь «забудь про предыдущее». Модель продолжает тянуться к старым требованиям. Не потому что «не поняла» — а потому что первые сообщения чата статистически перевешивают поздние. Новая инструкция борется с десятками старых токенов и проигрывает. Чем длиннее история — тем сильнее эффект

Как обойти

Не перекрикивай историю. Обойди её. Попроси модель свернуть историю в компактный протокол — с явным списком «что теперь устарело». Потом выполняй задачу в новом чате только по этому протоколу

Копировать 2604.24512

37

Запреты в длинных диалогах деградируют — требования нет

PRO

Полный контент доступен в PRO

38

Модель имитирует улучшение вместо реального в длинных итерациях

81

Ты давишь: "сделай лучше, ещё лучше". Модель учится на твоём одобрении. Видит: "пользователь доволен когда звучит убедительно". Начинает генерировать видимость улучшения — добавляет прилагательные, убирает конкретику, повторяет твои слова иначе. Реальное качество не растёт. Замечаешь обычно только к 5-7 раунду

Как обойти

В первом же сообщении дай явный список запретов: что считается жульничеством именно для этой задачи. И разреши модели сказать "улучшать нечего" — это снимет давление изображать прогресс

Копировать 2604.20200

39

Модель соглашается с тем, что убедительно звучит

PRO

Полный контент доступен в PRO

40

Единогласие агентов не означает правоту

PRO

Полный контент доступен в PRO

41

Длинный разговор сжимает ёмкость ответа

PRO

Полный контент доступен в PRO

42

Форматирование ворует токены от содержания

PRO

Полный контент доступен в PRO

43

Социальный контекст диалога смещает ответ модели

PRO

Полный контент доступен в PRO

44

Повторная проверка воспроизводит ту же ошибку

81

Просишь модель "проверь ещё раз". Она читает свой же текст и соглашается с собой. Ошибка в логике или арифметике воспроизводится снова — словами другими, сутью той же. Это работает как самопроверка диктанта: видишь написанное, а не реальное. Проблема для любых задач с вычислениями или многошаговой логикой

Как обойти

Попроси решить задачу двумя принципиально разными способами — словами и кодом. Сравни результаты. Совпали → высокая уверенность. Расхождение → сигнал что где-то ошибка

Копировать 2604.17433

45

Модель выбирает тип задачи по вероятности, а не по содержанию

PRO

Полный контент доступен в PRO

46

Модель не знает, что ей не хватает контекста

PRO

Полный контент доступен в PRO

47

Модель не восстанавливает временную последовательность из списка фактов

PRO

Полный контент доступен в PRO

48

Модель не умеет исправляться без точного описания ошибки

PRO

Полный контент доступен в PRO

49

Одна модель усредняет все тексты под один паттерн

81

Просишь Claude написать питч. Тысячи других людей просят то же самое. Модель обучена на определённом корпусе — и у неё есть «центр тяжести». Твой текст притягивается к нему. Результат: структура, аргументы и тон похожи на то, что получают все остальные. Это не ошибка — это свойство архитектуры. Работает для любой генеративной задачи: тексты, идеи, стратегии

Как обойти

Используй две разные модели параллельно. Claude и ChatGPT обучены на разных данных — их «центры тяжести» сдвинуты по-разному. Дай один и тот же запрос обеим. Объедини результаты в третьем чате: «Синтезируй лучшее из двух вариантов, убери повторы»

Копировать 2604.02677

50

Модель всегда отвечает правильно — и это мешает учиться

81

Даёшь задачу. Модель сразу даёт верный ответ. Мозг не активирует то, что уже знает. Не замечает пробелы. Не возникает напряжения «стоп, а я так не делаю?». Глубокое запоминание требует момента, когда ты сам ищешь — а правильный ответ сразу убирает этот момент. Работает для любой обучающей задачи

Как обойти

Попроси модель сыграть несколько ролей: два «сверстника» с разными ошибками + наставник, который только задаёт вопросы. Сначала анализируй ошибки сам — потом тьютор разбирает что ты упустил

Копировать 2604.02677

Инструкция «ответь в формате X» снижает качество рассуждения

Человекоподобный язык модели отключает проверку

Просьба «проверь ответ» чаще портит верное, чем исправляет неверное

Якоря в тексте задачи тянут ответ в предсказуемую сторону

Цепочка рассуждений усиливает предвзятость при якорях

Роли, правила и стимулы не меняют поведение модели

Найти≠использовать

Уверенный тон в запросе меняет ответ модели без изменения содержания

Форматное ограничение режет содержание вдвое

Модель берётся за невыполнимые задачи

Запрос уверенности числом убирает галлюцинации, но ломает диагностику

Модель теряет точность на длинных числовых рядах

Позитивные директивы в инструкциях мешают основной задаче

Модель не знает, какая инструкция главная

Позиция модели ломается под давлением аргументов

Цепочка рассуждений фиксируется на первом правдоподобном выводе

Модель тихо заменяет ваши данные своей памятью

«Думай пошагово» ломает код

При многих факторах модель строит ответ почти только на одном

Модель не умеет говорить «не знаю»

Количество мнений заменяет их качество

Длинный аргумент давит сильнее короткого — независимо от содержания

Вопрос в начале — модель отвечает раньше времени

На знакомых задачах модель работает на автопилоте

Модель критикует то, что написано — и пропускает то, что скрыто

Документ портится незаметно при многошаговом редактировании

Давление пользователя запускает согласие, а не переосмысление

Модель принимает твою альтернативу как правильный ответ

Модель угадывает бизнес-логику из схемы данных

Модель теряет ошибку в середине цепочки рассуждений

Модель по умолчанию не проверяет свои выводы

Модель принимает заявления буквально

Модель меняет верный ответ под давлением и сама это обосновывает

Запрос «думай как X» клонирует стиль, не логику

Эмоциональный текст мешает считать

Модель застревает на старых целях в длинном диалоге

Запреты в длинных диалогах деградируют — требования нет

Модель имитирует улучшение вместо реального в длинных итерациях

Модель соглашается с тем, что убедительно звучит

Единогласие агентов не означает правоту

Длинный разговор сжимает ёмкость ответа

Форматирование ворует токены от содержания

Социальный контекст диалога смещает ответ модели

Повторная проверка воспроизводит ту же ошибку

Модель выбирает тип задачи по вероятности, а не по содержанию

Модель не знает, что ей не хватает контекста

Модель не восстанавливает временную последовательность из списка фактов

Модель не умеет исправляться без точного описания ошибки

Одна модель усредняет все тексты под один паттерн

Модель всегда отвечает правильно — и это мешает учиться

Разблокируйте все концепты с PRO