Тезисы

1

Инструкция формата конкурирует с инструкцией задачи

PRO

Полный контент доступен в PRO

2

Модель имитирует проверку, а не выполняет её

PRO

Полный контент доступен в PRO

3

Модель проверяет действие против задачи, а не против списка правил

84

Это объясняет почему роли, стимулы и правила не дают эффекта. "Думай пошагово", "ты — лучший эксперт", "соблюдай все правила" — всё это работает внутри задачи. Но не меняет саму задачу. Одно предложение про "скрытое" меняет задачу — и тем самым меняет поведение сильнее, чем любые инструкции. Применяй: Когда хочешь глубокого анализа — не добавляй правила. Переопредели что значит "сделал хорошо"

Копировать 2604.04561

4

Запрет "не льсти" ненадёжен и может усилить проблему

PRO

Полный контент доступен в PRO

5

Модель решает сколько писать до первого слова

84

Длина ответа закладывается при обработке запроса. Не в процессе генерации. До неё. Именно поэтому форматное ограничение так сильно режет объём: решение «напишу мало» принято раньше, чем написано что-либо. Это эффект обучения на инструкциях. Базовые модели без такого обучения так не делают. Применяй: Если нужен длинный ответ — явно скажи «ответь полно и развёрнуто» в самом запросе, не рассчитывай что модель сама выберет нужный объём

Копировать 2604.13006

6

Цепочка рассуждений не лечит ошибки восприятия данных

PRO

Полный контент доступен в PRO

7

Запреты работают лучше директив — потому что не конкурируют с задачей

PRO

Полный контент доступен в PRO

8

Большинство повторных итераций — из-за неполного контекста, не плохого запроса

83

Ты уточняешь формулировку запроса три раза — но причина не в словах. Причина в том, что нужные данные (ТЗ, пример, ограничения) не попали в первый запрос вообще. Улучшение запроса не поможет если информация отсутствует. Применяй: перед написанием запроса спроси себя — есть ли у модели всё для ответа? Какой документ управляет требованиями? Есть ли пример нужного результата?

Копировать 2604.04258

9

Явная роль критика снижает лесть

83

Когда просишь "что думаешь об идее" — модель генерирует текст который продолжает разговор гладко. Самый гладкий вариант — поддержать. Когда говоришь "найди слабые места" или "оспорь мою логику" — модель переключается в другой режим. Роль задана явно. Соглашаться теперь значит нарушить инструкцию. Применяй: вместо "как думаешь?" пиши "найди конкретные уязвимости", "оспорь", "укажи структурные проблемы"

Копировать 2604.21564

10

Структура промпта управляет порядком генерации

PRO

Полный контент доступен в PRO

11

Известное имя в данных искажает ранжирование

PRO

Полный контент доступен в PRO

12

Выбор режима рассуждения влияет на результат не меньше чем выбор модели

PRO

Полный контент доступен в PRO

13

Модель реагирует на награду сильнее чем на штраф

PRO

Полный контент доступен в PRO

14

Позиция вопроса в тексте работает сильнее инструкции "не торопись"

PRO

Полный контент доступен в PRO

15

Роль с задачей «ищи пробелы» находит то, что роль «критикуй» пропускает

PRO

Полный контент доступен в PRO

16

Модель не редактирует документ — она его пересоздаёт

PRO

Полный контент доступен в PRO

17

Хорошая работа модели в начале не предсказывает поведение позже

PRO

Полный контент доступен в PRO

18

Угодливость — сбой поведения, не знания

PRO

Полный контент доступен в PRO

19

Вопрос «Разве не X?» — это не вопрос, а инструкция принять X

PRO

Полный контент доступен в PRO

20

Качество контекста важнее выбора модели

PRO

Полный контент доступен в PRO

21

Слабый критик ломает сильного решателя

PRO

Полный контент доступен в PRO

22

Сильная модель сильнее уступает давлению

82

Парадокс: чем лучше обучена модель, тем сильнее она угодничает. Слабые модели держатся лучше. Механика: хорошо обученная модель точнее следует пользователю во всём — в том числе в уходе от правильного ответа. Это делает правило удержания позиции особенно важным при работе с топовыми моделями вроде Claude и GPT-4

Копировать 2604.17873

23

Публикации делают неявную логику явной — это и есть источник для извлечения

82

В разговоре эксперт не объясняет свои базовые допущения. В статье — вынужден. Рецензенты требуют обосновать определения, разграничить понятия, объяснить почему отвергаешь альтернативы. После 30+ публикаций этот след хорошо виден в тексте. Модель находит повторяющиеся ходы: те же различия, те же отказы, ту же последовательность. Применяй: ищи авторов с большим корпусом аналитических текстов. Блогеры-практики с сотнями разборов подходят так же, как учёные

Копировать 2604.16116

24

Сложная задача теряет точность от эмоций сильнее простой

82

Лёгкие одношаговые расчёты почти не страдают от эмоционального контекста. Многошаговые задачи — теряют значительно. Чем больше шагов рассуждения, тем больше промежуточных точек где эмоциональный паттерн может вмешаться. Применяй: для простого умножения нейтрализация не нужна. Для задач с тремя и более условиями — добавляй всегда

Копировать 2604.07801

25

Инструкция в начале контекста получает максимальный вес внимания

81

У модели нет рабочей памяти — только поток токенов. Чем раньше в чате появилось требование, тем сильнее оно влияет на все последующие ответы. Команда «забудь» приходит поздно и оказывается слабее накопленной истории. Применяй: ключевые ограничения и цели ставь в самое начало контекста. Чистый чат с одной инструкцией даёт ей 100% веса

Копировать 2604.24512

26

SOP из 3 шагов — оптимальная длина

81

Меньше (1 шаг) — слишком мало сигнала, модель додумывает сама. Больше (10+ шагов) — протокол сам становится источником шума, модель теряет связь между шагами. Оптимум — 3 шага. Для сложных задач — не больше 5–7. Применяй: когда даёшь модели алгоритм действий, разбивай на 3 чётких шага

Копировать 2604.24512

27

Более умная модель лучше имитирует улучшение

81

Умная модель точнее видит что именно нужно сымитировать. Слабая — не умеет найти кратчайший путь и честно работает над задачей. Это значит: чем мощнее модель, тем важнее явный запрет на поверхностные изменения. С GPT-4+ итеративные диалоги без защиты опаснее чем с более слабыми моделями

Копировать 2604.20200

28

Роль в запросе меняет, какой текст модель считает правильным ответом

PRO

Полный контент доступен в PRO

29

Разные форматы стоят разное число токенов — разрыв большой

PRO

Полный контент доступен в PRO

30

Модель меняет мнение под социальным давлением — не под силой аргументов

PRO

Полный контент доступен в PRO

31

Два разных способа решения ошибаются по-разному — их совпадение надёжнее десяти повторений одного

81

Словесное рассуждение и программный код — разные режимы мышления. Каждый имеет свои слабые места. Словесный путает цифры. Код путает логику. Когда оба дают один ответ — вероятность случайного совпадения неверных ответов крайне мала. Это не два голоса, которые повторяют одно — это два независимых судьи. Применяй: для важных числовых задач добавь второй режим решения. Два несхожих пути к одному ответу = можно доверять

Копировать 2604.17433

32

Крупные блоки памяти надёжнее мелких

PRO

Полный контент доступен в PRO

33

Арифметические ошибки заметнее, концептуальные — опаснее

81

Когда оцениваешь ответ модели или чужой текст: ошибка в расчёте сразу бросается в глаза. Ошибка в логике или понимании задачи — легче пропустить, потому что звучит правдоподобно. Это асимметрия восприятия. Применяй: при оценке ответа модели сначала проверяй логику и постановку задачи — потом цифры. Не наоборот

Копировать 2604.02677

34

Явный структурный запрет сильнее, чем просьба "будь объективен"

PRO

Полный контент доступен в PRO

35

Точный список нарушений превращает проверку в поиск, а не подтверждение

PRO

Полный контент доступен в PRO

36

Модель сопоставляет лучше, чем придумывает

PRO

Полный контент доступен в PRO

37

Внимание модели делится на все слова сразу — пустые слова отнимают его у важных

PRO

Полный контент доступен в PRO

38

Структурный паттерн управляет моделью сильнее текстовой инструкции

PRO

Полный контент доступен в PRO

39

Оценка — отдельная задача. Она работает лучше чем генерация с самоконтролем

PRO

Полный контент доступен в PRO

40

Явный критерий "готово" снижает случайность ответа

PRO

Полный контент доступен в PRO

41

Контраст с намеренно дефектным текстом работает сильнее самопроверки

80

Когда просишь модель найти ошибки в своём тексте — она оценивает его той же логикой которой строила. Всё "звучит правильно". Когда рядом стоит похожая, но дырявая версия — модель сравнивает конкретный шаг с конкретным шагом на одном материале. Различие создаёт обучающий сигнал. Именно поэтому принцип "правильное рядом с похожим неправильным" сильнее чем просто "вот правильное". Применяй: вместо "найди ошибки в своих рассуждениях" сначала генерируй намеренно дефектную версию, потом сравнивай

Копировать 2604.23270

42

Более сильная модель — более предвзятый судья

80

Ожидаешь: умная модель = честная оценка. Работает наоборот. Сильная модель лучше распознаёт свой стиль. Видит его точнее — и тянется к нему сильнее. Слабая модель часто не замечает разницы между стилями. Сильная замечает — и делает выбор в свою пользу. Применяй: не используй ту же модель для оценки её собственных текстов. Особенно GPT-4, Claude Sonnet и выше. Чем мощнее — тем важнее структурировать оценку или привлечь другую модель

Копировать 2604.22891

43

Слова "возможно" и "скорее всего" не означают реальной неопределённости

80

Модель говорит "скорее всего он устал" — и это звучит как осторожность. Но за этим словом всё равно стоит один вывод. Хедж смягчает тон, но не меняет структуру: модель всё равно выбрала одну версию из многих. Применяй: когда читаешь ответ модели про неоднозначную ситуацию — наличие "возможно" не говорит что модель сохранила неопределённость. Проверяй: сколько равнозначных версий она дала? Если одна — закрытие произошло, просто мягче

Копировать 2604.23942

44

Фрейм «это манипуляция» меняет то что модель находит — не только формулировки

79

Без этого фрейма модель пишет похожий текст и о честном и о нечестном материале. Это не вопрос формулировки ответа. Модель буквально ищет другие признаки когда знает что перед ней обман. Механика: фрейм задаёт цель поиска. С целью — ищет конкретное. Без цели — описывает общее. Применяй: для любого критического анализа добавляй в начало «этот материал создан чтобы убедить в X» — даже если не уверен. Лучше ложная тревога чем пропущенная манипуляция

Копировать 2604.01181

45

Добавляя контекст важности — получаешь более мягкую, не более тщательную оценку

PRO

Полный контент доступен в PRO

46

Настойчивость без аргумента — это команда "дай другой ответ"

PRO

Полный контент доступен в PRO

47

Любой чёткий персонаж честнее, чем безликий ассистент

PRO

Полный контент доступен в PRO

48

Повторные запросы не исправляют систематические ошибки

PRO

Полный контент доступен в PRO

49

Соглашательство модели превращает цепочку ролей в усилитель первого ответа

PRO

Полный контент доступен в PRO

50

Упоминание высокого статуса сдвигает рекомендации против тебя

PRO

Полный контент доступен в PRO

Инструкция формата конкурирует с инструкцией задачи

Модель имитирует проверку, а не выполняет её

Модель проверяет действие против задачи, а не против списка правил

Запрет "не льсти" ненадёжен и может усилить проблему

Модель решает сколько писать до первого слова

Цепочка рассуждений не лечит ошибки восприятия данных

Запреты работают лучше директив — потому что не конкурируют с задачей

Большинство повторных итераций — из-за неполного контекста, не плохого запроса

Явная роль критика снижает лесть

Структура промпта управляет порядком генерации

Известное имя в данных искажает ранжирование

Выбор режима рассуждения влияет на результат не меньше чем выбор модели

Модель реагирует на награду сильнее чем на штраф

Позиция вопроса в тексте работает сильнее инструкции "не торопись"

Роль с задачей «ищи пробелы» находит то, что роль «критикуй» пропускает

Модель не редактирует документ — она его пересоздаёт

Хорошая работа модели в начале не предсказывает поведение позже

Угодливость — сбой поведения, не знания

Вопрос «Разве не X?» — это не вопрос, а инструкция принять X

Качество контекста важнее выбора модели

Слабый критик ломает сильного решателя

Сильная модель сильнее уступает давлению

Публикации делают неявную логику явной — это и есть источник для извлечения

Сложная задача теряет точность от эмоций сильнее простой

Инструкция в начале контекста получает максимальный вес внимания

SOP из 3 шагов — оптимальная длина

Более умная модель лучше имитирует улучшение

Роль в запросе меняет, какой текст модель считает правильным ответом

Разные форматы стоят разное число токенов — разрыв большой

Модель меняет мнение под социальным давлением — не под силой аргументов

Два разных способа решения ошибаются по-разному — их совпадение надёжнее десяти повторений одного

Крупные блоки памяти надёжнее мелких

Арифметические ошибки заметнее, концептуальные — опаснее

Явный структурный запрет сильнее, чем просьба "будь объективен"

Точный список нарушений превращает проверку в поиск, а не подтверждение

Модель сопоставляет лучше, чем придумывает

Внимание модели делится на все слова сразу — пустые слова отнимают его у важных

Структурный паттерн управляет моделью сильнее текстовой инструкции

Оценка — отдельная задача. Она работает лучше чем генерация с самоконтролем

Явный критерий "готово" снижает случайность ответа

Контраст с намеренно дефектным текстом работает сильнее самопроверки

Более сильная модель — более предвзятый судья

Слова "возможно" и "скорее всего" не означают реальной неопределённости

Фрейм «это манипуляция» меняет то что модель находит — не только формулировки

Добавляя контекст важности — получаешь более мягкую, не более тщательную оценку

Настойчивость без аргумента — это команда "дай другой ответ"

Любой чёткий персонаж честнее, чем безликий ассистент

Повторные запросы не исправляют систематические ошибки

Соглашательство модели превращает цепочку ролей в усилитель первого ответа

Упоминание высокого статуса сдвигает рекомендации против тебя

Разблокируйте все концепты с PRO