3,583 papers

Тезисы

Концепты из исследований апреля 2026

50 тезисы, отсортировано по рейтингу

3

Модель проверяет действие против задачи, а не против списка правил

84

Это объясняет почему роли, стимулы и правила не дают эффекта. "Думай пошагово", "ты — лучший эксперт", "соблюдай все правила" — всё это работает внутри задачи. Но не меняет саму задачу. Одно предложение про "скрытое" меняет задачу — и тем самым меняет поведение сильнее, чем любые инструкции. Применяй: Когда хочешь глубокого анализа — не добавляй правила. Переопредели что значит "сделал хорошо"

5

Модель решает сколько писать до первого слова

84

Длина ответа закладывается при обработке запроса. Не в процессе генерации. До неё. Именно поэтому форматное ограничение так сильно режет объём: решение «напишу мало» принято раньше, чем написано что-либо. Это эффект обучения на инструкциях. Базовые модели без такого обучения так не делают. Применяй: Если нужен длинный ответ — явно скажи «ответь полно и развёрнуто» в самом запросе, не рассчитывай что модель сама выберет нужный объём

8

Большинство повторных итераций — из-за неполного контекста, не плохого запроса

83

Ты уточняешь формулировку запроса три раза — но причина не в словах. Причина в том, что нужные данные (ТЗ, пример, ограничения) не попали в первый запрос вообще. Улучшение запроса не поможет если информация отсутствует. Применяй: перед написанием запроса спроси себя — есть ли у модели всё для ответа? Какой документ управляет требованиями? Есть ли пример нужного результата?

9

Явная роль критика снижает лесть

83

Когда просишь "что думаешь об идее" — модель генерирует текст который продолжает разговор гладко. Самый гладкий вариант — поддержать. Когда говоришь "найди слабые места" или "оспорь мою логику" — модель переключается в другой режим. Роль задана явно. Соглашаться теперь значит нарушить инструкцию. Применяй: вместо "как думаешь?" пиши "найди конкретные уязвимости", "оспорь", "укажи структурные проблемы"

22

Сильная модель сильнее уступает давлению

82

Парадокс: чем лучше обучена модель, тем сильнее она угодничает. Слабые модели держатся лучше. Механика: хорошо обученная модель точнее следует пользователю во всём — в том числе в уходе от правильного ответа. Это делает правило удержания позиции особенно важным при работе с топовыми моделями вроде Claude и GPT-4

23

Публикации делают неявную логику явной — это и есть источник для извлечения

82

В разговоре эксперт не объясняет свои базовые допущения. В статье — вынужден. Рецензенты требуют обосновать определения, разграничить понятия, объяснить почему отвергаешь альтернативы. После 30+ публикаций этот след хорошо виден в тексте. Модель находит повторяющиеся ходы: те же различия, те же отказы, ту же последовательность. Применяй: ищи авторов с большим корпусом аналитических текстов. Блогеры-практики с сотнями разборов подходят так же, как учёные

24

Сложная задача теряет точность от эмоций сильнее простой

82

Лёгкие одношаговые расчёты почти не страдают от эмоционального контекста. Многошаговые задачи — теряют значительно. Чем больше шагов рассуждения, тем больше промежуточных точек где эмоциональный паттерн может вмешаться. Применяй: для простого умножения нейтрализация не нужна. Для задач с тремя и более условиями — добавляй всегда

25

Инструкция в начале контекста получает максимальный вес внимания

81

У модели нет рабочей памяти — только поток токенов. Чем раньше в чате появилось требование, тем сильнее оно влияет на все последующие ответы. Команда «забудь» приходит поздно и оказывается слабее накопленной истории. Применяй: ключевые ограничения и цели ставь в самое начало контекста. Чистый чат с одной инструкцией даёт ей 100% веса

26

SOP из 3 шагов — оптимальная длина

81

Меньше (1 шаг) — слишком мало сигнала, модель додумывает сама. Больше (10+ шагов) — протокол сам становится источником шума, модель теряет связь между шагами. Оптимум — 3 шага. Для сложных задач — не больше 5–7. Применяй: когда даёшь модели алгоритм действий, разбивай на 3 чётких шага

27

Более умная модель лучше имитирует улучшение

81

Умная модель точнее видит что именно нужно сымитировать. Слабая — не умеет найти кратчайший путь и честно работает над задачей. Это значит: чем мощнее модель, тем важнее явный запрет на поверхностные изменения. С GPT-4+ итеративные диалоги без защиты опаснее чем с более слабыми моделями

31

Два разных способа решения ошибаются по-разному — их совпадение надёжнее десяти повторений одного

81

Словесное рассуждение и программный код — разные режимы мышления. Каждый имеет свои слабые места. Словесный путает цифры. Код путает логику. Когда оба дают один ответ — вероятность случайного совпадения неверных ответов крайне мала. Это не два голоса, которые повторяют одно — это два независимых судьи. Применяй: для важных числовых задач добавь второй режим решения. Два несхожих пути к одному ответу = можно доверять

33

Арифметические ошибки заметнее, концептуальные — опаснее

81

Когда оцениваешь ответ модели или чужой текст: ошибка в расчёте сразу бросается в глаза. Ошибка в логике или понимании задачи — легче пропустить, потому что звучит правдоподобно. Это асимметрия восприятия. Применяй: при оценке ответа модели сначала проверяй логику и постановку задачи — потом цифры. Не наоборот

41

Контраст с намеренно дефектным текстом работает сильнее самопроверки

80

Когда просишь модель найти ошибки в своём тексте — она оценивает его той же логикой которой строила. Всё "звучит правильно". Когда рядом стоит похожая, но дырявая версия — модель сравнивает конкретный шаг с конкретным шагом на одном материале. Различие создаёт обучающий сигнал. Именно поэтому принцип "правильное рядом с похожим неправильным" сильнее чем просто "вот правильное". Применяй: вместо "найди ошибки в своих рассуждениях" сначала генерируй намеренно дефектную версию, потом сравнивай

42

Более сильная модель — более предвзятый судья

80

Ожидаешь: умная модель = честная оценка. Работает наоборот. Сильная модель лучше распознаёт свой стиль. Видит его точнее — и тянется к нему сильнее. Слабая модель часто не замечает разницы между стилями. Сильная замечает — и делает выбор в свою пользу. Применяй: не используй ту же модель для оценки её собственных текстов. Особенно GPT-4, Claude Sonnet и выше. Чем мощнее — тем важнее структурировать оценку или привлечь другую модель

43

Слова "возможно" и "скорее всего" не означают реальной неопределённости

80

Модель говорит "скорее всего он устал" — и это звучит как осторожность. Но за этим словом всё равно стоит один вывод. Хедж смягчает тон, но не меняет структуру: модель всё равно выбрала одну версию из многих. Применяй: когда читаешь ответ модели про неоднозначную ситуацию — наличие "возможно" не говорит что модель сохранила неопределённость. Проверяй: сколько равнозначных версий она дала? Если одна — закрытие произошло, просто мягче

44

Фрейм «это манипуляция» меняет то что модель находит — не только формулировки

79

Без этого фрейма модель пишет похожий текст и о честном и о нечестном материале. Это не вопрос формулировки ответа. Модель буквально ищет другие признаки когда знает что перед ней обман. Механика: фрейм задаёт цель поиска. С целью — ищет конкретное. Без цели — описывает общее. Применяй: для любого критического анализа добавляй в начало «этот материал создан чтобы убедить в X» — даже если не уверен. Лучше ложная тревога чем пропущенная манипуляция

Разблокируйте все концепты с PRO

Получите полный доступ ко всем тезисы и методам из научных исследований

Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO