Проблемы LLM

1

Первый ответ — самый стереотипный, не самый честный

98

Модель оптимизирована под "полезный и позитивный" ответ. Она знает про риски, контраргументы и ограничения. Но не выдаёт их первым делом. Даёт самую популярную версию. Уверенно. Без оговорок. Ты не знаешь что за кадром осталась половина картины

Как обойти

После первого ответа спроси: «А в чём ты можешь ошибаться?» Модель переключается в режим критика. Достаёт из своей базы то, что скрыла

Копировать 2507.10124

2

При извлечении данных модель чаще пропускает, чем придумывает

PRO

Первый ответ — самый стереотипный, не самый честный

При извлечении данных модель чаще пропускает, чем придумывает

Модель хуже читает конец длинного контекста

Модель домысливает факты, которых нет в вашем тексте

Один сложный запрос даёт поверхностный ответ

Модель отвечает на сложный вопрос за один проход

Прямой запрос на адаптацию даёт поверхностную замену

Модель превышает лимит слов даже при явном запрете

Монолог вместо диалога — нет учёта нужд пользователя

Нехватка контекста→завышенные оценки, а не признание неопределённости

Модель додумывает недостающее вместо того чтобы спросить

Качество ответов падает при долгой однотипной работе

Модель слепо выполняет инструкции из внешних данных

Модель пропускает информацию из середины длинного текста

Одна модель склонна подтверждать первую гипотезу

Многошаговые вопросы ломают цепочку фактов

Примеры после вопроса ломают ответ

Модель теряет точность в длинных плоских текстах

Сложные инструкции мешают сильным моделям

Без фактических данных модель придумывает причины мнений

В многошаговом диалоге модель не держит порядок шагов

Модель выдаёт похожие ответы даже при разнообразном контексте

Модель подтверждает свои же ошибки при самопроверке

Модель выбирает вариант по позиции, не по качеству

Модель создаёт логичные, но эмоционально плоские образы

Чистые примеры не учат модель думать глубоко

Рассуждения и финальный ответ не связаны

Модель склонна соглашаться с утверждениями

Нет инструкции на провал — модель додумывает

Вердикт без объяснения не помогает принять решение

Прямой запрос "выбери лучшее" даёт слабый результат

Прямой запрос на сложное преобразование даёт поверхностный результат

Промпты ломаются при обновлении модели

Сложный запрос в одном промпте провоцирует галлюцинации

Модель систематически одобряет — даже когда ответ неверен

Модель заполняет пробелы выдумкой, если нет явного запрета

Короткий вопрос — плохой контекст для сложного ответа

Модель не останавливается без явного запрета

Без порядка важности модель извлекает всё одинаково

Модель галлюцинирует когда данных нет

Модель не различает "знаю из памяти" и "нашёл в документе"

Без контекста о получателе модель пишет для всех — и ни для кого

Модель не критикует свой же первый ответ

Лишние определения создают шум

Модель выполняет команду буквально, игнорируя цель

Негативный тон блокирует критический ответ

Модель не замечает смену темы и продолжает старый разговор

Пошаговые рассуждения ломают задачи синтеза

Поведение по умолчанию давит на ответ

Модель додумывает вместо того чтобы спросить

Разблокируйте все концепты с PRO