Все концепты

1

Победу в конкурсе по генерации бизнес-идей принёс не дообученный GPT и не сложный многошаговый пайплайн.

3 концепта

98

Методы (2)

Конкретный вопрос-проверка в конце запроса

Вместо "проверь себя" добавляй в конец запроса конкретный вопрос с единственно верным ответом. Пример: "Можно ли решить эту задачу без этого конкретного ограничения? Если да — переделай". Модель вынуждена сверить результат с главным требованием. Почему работает: абстрактная самопроверка ("убедись что ответ хороший") не создаёт реального фильтра. Конкретный вопрос создаёт чёткий критерий "да/нет" и заставляет пересмотреть ответ. Когда применять: задачи с одним ключевым ограничением (бюджет, целевая аудитория, обязательное условие). Когда не работает: несколько равнозначных критериев — один вопрос не охватит всё.

Критерии оценки до генерации

Пропиши критерии оценки ответа ДО того, как модель начнёт генерировать. Пример: "Ответ будет хорошим если: 1) практично, 2) без воды, 3) до 200 слов". Почему работает: критерии до генерации — это цель для оптимизации. Критерии после — это ретроспективная оценка. Модель оптимизирует то, что видит до начала работы. Когда применять: любая задача где есть несколько измеримых требований к качеству.

Тезисы (1)

Важные ограничения лучше повторить в конце запроса

LLM хуже следует требованиям из начала длинного запроса — они "тонут" в контексте. Если требование критично (лимит длины, обязательный формат, ключевое условие) — повтори его последним абзацем, прямо перед точкой генерации. Применяй: добавляй в конец запроса одну строку с самым важным: "Напоминание: ответ строго до 3 предложений" или "Обязательно: только факты, без советов".

2

LLM в первом ответе прячет всё, что знает против своего же совета.

2 концепта

98

Проблемы (1)

Первый ответ — самый стереотипный, не самый честный

Модель оптимизирована под "полезный и позитивный" ответ. Она знает про риски, контраргументы и ограничения. Но не выдаёт их первым делом. Даёт самую популярную версию. Уверенно. Без оговорок. Ты не знаешь что за кадром осталась половина картины

Как обойти

После первого ответа спроси: «А в чём ты можешь ошибаться?» Модель переключается в режим критика. Достаёт из своей базы то, что скрыла

Методы (1)

Двухшаговый диалог — запрос + самокритика

Шаг 1: задай вопрос как обычно. Получи ответ. Шаг 2: добавь второй запрос: «А в чём ты можешь ошибаться?» или «Где твой анализ может быть неполным?» Модель сделала шаг назад и провела разбор своего же ответа. Выдала контраргументы, риски, альтернативы. Почему работает: первый режим — "помощник". Второй вопрос переключает в режим — "скептик". Это разные режимы извлечения знаний. Когда особенно нужно: оцениваешь план, выбираешь между вариантами, принимаешь решение с последствиями. Можно усилить: вместо общего вопроса задай конкретный угол: «Какие группы людей пострадают от этого решения?» или «Представь что ты скептик. Раскритикуй этот план»

3

Парадокс: LLM реагирует на вымышленные последствия как на настоящие.

2 концепта

96

Методы (1)

Контекст ответственности — четыре элемента для глубокого ответа

Структурируй запрос из четырёх частей по порядку. 1. Роль: "Ты — опытный юрисконсульт". Активирует нужный стиль и знания. 2. Ставки: "От этого анализа зависит исход судебного дела. Ошибка недопустима". Повышает значимость задачи. 3. Стандарты: "Ответ должен соответствовать практике крупных юридических фирм". Задаёт планку. 4. Задача: сам запрос. Пример: Ты — старший финансовый аналитик. Совет директоров принимает решение об инвестиции на основании твоего отчёта. Уровень — McKinsey. Задача: оцени риски этого бизнес-плана. Почему работает: Роль сужает диапазон "подходящих" ответов. Ставки отсекают поверхностные варианты — модель внутренне взвешивает варианты ответа, и "общие советы" перестают проходить. Стандарты добавляют явный критерий фильтрации. Когда применять: сложные аналитические задачи, экспертные оценки, структурированные документы. Когда не работает: простые фактические вопросы, где модели незачем "стараться" — контекст ответственности там ничего не добавит.

Тезисы (1)

Ставки отсекают поверхностный ответ сильнее, чем роль

Просто назначить роль ("ты эксперт") — слабый сигнал. Модель остаётся в режиме "дать приемлемый ответ". Добавление последствий ("от этого зависит X, ошибка недопустима") меняет внутренний фильтр: поверхностный вариант перестаёт "подходить" по смыслу ситуации. Механика: у модели есть много вариантов ответа разной глубины. Роль задаёт направление. Ставки поднимают порог минимально приемлемого варианта. Применяй: если роль уже есть, но ответ всё равно общий — добавь последствия. Не "ты юрист", а "ты юрист, и если упустишь риск — клиент проиграет дело".

4

Парадокс: главная проблема LLM при работе с текстом — не галлюцинации, а молчание.

2 концепта

PRO

Победу в конкурсе по генерации бизнес-идей принёс не дообученный GPT и не сложный многошаговый пайплайн.

LLM в первом ответе прячет всё, что знает против своего же совета.

Парадокс: LLM реагирует на вымышленные последствия как на настоящие.

Парадокс: главная проблема LLM при работе с текстом — не галлюцинации, а молчание.

LLM читает твой документ как студент на скучной лекции — начало конспектирует внимательно, к концу клюёт носом и начинает от себя додумывать.

Парадокс: чем точнее описываешь LLM идеальный результат — тем хуже она его выдаёт.

Парадокс: «дебаты» между несколькими LLM проиграли скучному детальному промпту с примерами.

LLM без инструкции — способный стажёр, который не знает с чего начать: делает что-то общее, часто выдуманное.

LLM — плохой универсал, но отличный специалист.

Плохой ответ от LLM — почти всегда плохое задание, а не плохая модель.

LLM как врач, которого спрашивают диагноз через стену — он что-то услышал, добавил догадки и выдал уверенный ответ.

Попросить LLM перевести шутку напрямую — как попросить иностранца пересказать анекдот: слова передаст, смысл убьёт.

Обнаружено: LLM — не собеседник, а исполнитель технического задания.

«Перепиши лучше» — команда, которая ничего не меняет.

LLM умеет не только писать — он умеет судить.

Стандартный сценарий: попросил объяснить — получил стену текста.

LLM никогда не скажет «мне не хватает данных» — он просто заполнит пробелы домыслами и выдаст уверенный ответ.

Плохой ответ от LLM — это почти всегда плохой вопрос.

Парадокс: подробные примеры («смотри, как правильно — действуй по аналогии») проигрывают простому принудительному рассуждению вслух.

2 Объяснение механизма почему этот пример работает.

Модель прочитала весь документ — но ответила только по первому и последнему абзацу.

Парадокс: попросишь LLM 'взвешенно проанализировать' — получишь размытую кашу на полутонах.

Обнаружено: не только КАКИЕ примеры ты даёшь модели — важно ГДЕ в промпте они стоят.

LLM теряется в длинных документах — не потому что глупая, а потому что вы просите её одновременно ориентироваться в структуре и искать конкретный факт.

2 Объяснение механизма почему этот пример работает.

Проблема: небольшие модели ломаются не только на точности — они ещё и формат ответа путают.

Сложный промпт, который вы потратили час на написание, может снизить точность мощной модели — не улучшить, а именно снизить.

LLM пишет слабые тексты не потому что плохо понимает язык — а потому что вы не объяснили, что именно вы считаете хорошим результатом.

Написал промпт — получил мусор.

Разблокируйте все концепты с PRO