3,583 papers
arXiv:2606.16778 73 15 июня 2026 г. FREE

GPT пишет длиннее и формальнее, чем нужно: находки об адаптации текстов под аудиторию

КЛЮЧЕВАЯ СУТЬ
GPT пишет детский текст вдвое длиннее, чем пишут живые люди — и правит даже то, что уже подходит. У модели нет порога «и так сойдёт»: она видит задачу «адаптируй для детей» и переписывает всё подряд, делая язык технически проще, но мертво-правильным. Метод двухшагового промпта позволяет адаптировать тексты под аудиторию без лишней переписки и без потери живого тона. Фишка: разделить «нужно ли вообще редактировать» и «как редактировать» — модель перестаёт трогать уже подходящие тексты и начинает работать точнее.
Адаптировать под запрос

TL;DR

Когда просишь GPT адаптировать текст под аудиторию — он переписывает слишком много, слишком длинно и слишком правильно. Исследование сравнивало, как GPT-4o и живые люди редактировали тексты под разные аудитории (дети, менеджеры). Оказалось, что GPT пишет версии для детей вдвое длиннее, чем это делают люди, — и с более правильным языком, хотя дети привыкли к небрежной живой речи.

Главная находка: у LLM нет человеческих "несовершенств" — и это проблема. Люди, адаптируя текст для детей, инстинктивно делают язык ломаным, коротким, с паузами. GPT делает язык технически простым, но мертво-правильным. Плюс модель слишком рьяно переписывает — правит текст даже когда он уже подходит под аудиторию. Человек при такой же задаче чаще просто удаляет лишние куски, не перефразируя.

Из этого вытекают два применимых вывода: двухшаговый промпт (сначала проверь — потом редактируй, не сразу) и явный список предпочтений вместо примеров. Второй подход — когда пишешь модели "вот твои правила стиля" явным текстом — работает лучше, чем просто показывать примеры редактуры и надеяться, что она сама поймёт паттерн.


🔬

Схема метода

Два отдельных запроса подряд:

ПРОМПТ 1 (ПРОВЕРКА):
Текст: {текст}
Аудитория: {описание_аудитории}
Только ответь ДА или НЕТ: этот текст подходит для аудитории?

↓ Если НЕТ →

ПРОМПТ 2 (РЕДАКТУРА):
Отредактируй текст для {аудитория}.
Список стилевых правил: {явный_список_предпочтений}
После редактуры — добавь 3-5 правил, которые ты применил.
Обнови список правил на основе этих изменений.

Логика накопления: после каждого редактирования список правил пополняется. Следующий текст уже получает обновлённый список — модель адаптируется к твоему стилю итеративно.


🚀

Пример применения

Задача: Ты ведёшь детский образовательный Telegram-канал «Наука для пятиклашек» и хочешь адаптировать под него статью о чёрных дырах, написанную для взрослых.

Промпт 1 — Проверка:

Текст: «Чёрная дыра — область пространства-времени, гравитационное притяжение которой настолько велико, что её не может покинуть ни вещество, ни электромагнитное излучение, включая видимый свет.»

Аудитория: дети 10-12 лет, читают Telegram на телефоне во время перемены, привыкли к мемам и коротким фразам, не любят сложные слова.

Только ответь ДА или НЕТ: этот текст подходит для этой аудитории?

Промпт 2 — Редактура:

Отредактируй текст для детей 10-12 лет (Telegram-канал, перемена, мемы, короткие фразы).

Список стилевых правил:
— Максимум 50-60 слов
— Никаких терминов без объяснения
— Разговорный тон, можно одно сравнение из жизни
— Одно-два предложения максимум на мысль

После редактуры добавь 3-5 правил, которые применил. 
Обнови итоговый список правил.

Текст для редактуры: «Чёрная дыра — область пространства-времени...»

Результат: Промпт 1 даст короткий ответ «НЕТ» — без лишней редактуры. Промпт 2 выдаст адаптированный текст плюс обновлённый список правил. Этот список можно копировать в следующий запрос — так накапливается персональный стиль канала.


🧠

Почему это работает

Без двухшагового промпта GPT переписывает всё подряд. Это показало исследование напрямую: когда модели давали задачу "просто отредактируй", она правила даже уже подходящие тексты. Люди так не делают — если текст «достаточно хорош», человек жмёт «окей» и идёт дальше. Проверочный шаг ДА/НЕТ имитирует это человеческое поведение.

Явный список правил работает лучше примеров. Когда модель видит 5 примеров твоей редактуры и должна сама понять паттерн — она угадывает неточно. Когда список правил написан явно — "короче 60 слов, разговорный тон, никаких терминов" — она следует им точнее. Это подтвердилось на реальных участниках: rolling preferences (явный список) дал значимое улучшение, а in-context examples — нет.

Рычаги управления: - Длина списка правил → 3-5 правил достаточно; длинный список путает модель - Точность описания аудитории → чем конкретнее ("читают на перемене с телефона"), тем точнее результат - Порог проверки → вместо ДА/НЕТ можно поставить шкалу 1-10 и редактировать только если ниже 7


📋

Шаблон промпта

Шаг 1 — Проверка:

Текст: {текст}
Аудитория: {описание_аудитории — кто, где читает, что любит, что не любит}

Только ответь ДА или НЕТ: этот текст подходит для этой аудитории?

Шаг 2 — Редактура (запускай только если получил НЕТ):

Отредактируй текст для аудитории: {описание_аудитории}

Список стилевых правил:
{правило_1}
{правило_2}
{правило_3}

После редактуры:
1. Перечисли 3-5 правил, которые применил
2. Обнови итоговый список правил

Текст: {текст}

Плейсхолдеры: - {текст} — исходник для редактуры - {описание_аудитории} — конкретно: возраст, платформа, контекст чтения, привычки - {правило_1-3} — стартовый список: длина, тон, запрещённые приёмы


🚀 Быстрый старт — вставь в чат:

Вот двухшаговый шаблон для адаптации текстов под аудиторию. 
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит про аудиторию и стартовый список правил — потому что без них модель не знает, в какую сторону редактировать и что накапливать.


📌

Почему ещё важно знать

Одна находка — не про промптинг, а про здравый смысл при работе с LLM:

Если ты проверяешь идею, текст или продукт через "спроси GPT, как отреагирует аудитория" — результат будет слишком оптимистичным. Модель симулирует идеального пользователя: терпеливого, внимательного, не уставшего. Живые люди устают, халтурят, не дочитывают.

Вывод прямой: используй LLM для подготовки к тестированию с людьми, не вместо него. Симуляция помогает быстро сравнить варианты и отсечь явно слабые — но финальный ответ даёт только живая аудитория.


⚠️

Ограничения

⚠️ LLM не заменяет живую аудиторию для детского и неформального контента: модель систематически делает язык длиннее и правильнее, чем нужно. Даже при явном промпте "пиши для детей" — контролируй длину и тон вручную.

⚠️ Список правил нужно стартовать вручную: метод накопления предпочтений только улучшает то, что уже есть. Если стартовый список пустой или неточный — адаптация идёт медленно.

⚠️ Для менеджерской/деловой аудитории модель справляется лучше: GPT по умолчанию пишет ближе к тому, что нужно CEO и руководителям. Двухшаговая схема там менее критична.


🔗

Ресурсы

Статья: A comparison of human and LLM-simulated participants in a writing style task

Авторы: Felix Gröner, Erin K. Chiou — Arizona State University, Mesa, Arizona, USA

Опирается на: PRELUDE framework (Gao et al., 2024) — фреймворк обучения на основе пользовательских правок; Aroca-Ouellette et al. (2024) — критика PRELUDE


📋 Дайджест исследования

Ключевая суть

GPT пишет детский текст вдвое длиннее, чем пишут живые люди — и правит даже то, что уже подходит. У модели нет порога «и так сойдёт»: она видит задачу «адаптируй для детей» и переписывает всё подряд, делая язык технически проще, но мертво-правильным. Метод двухшагового промпта позволяет адаптировать тексты под аудиторию без лишней переписки и без потери живого тона. Фишка: разделить «нужно ли вообще редактировать» и «как редактировать» — модель перестаёт трогать уже подходящие тексты и начинает работать точнее.

Принцип работы

Не давай модели сразу редактировать — сначала спроси, нужно ли. Стандартный путь: «вот текст, адаптируй для детей» — модель переписывает всё. Двухшаговый путь: сначала «подходит этот текст — да или нет», потом если нет — редактура с явным списком правил. Явный список правил («не длиннее 60 слов, разговорный тон, никакой официальщины») работает точнее, чем примеры редактур. Когда видит примеры — угадывает паттерн, часто мимо. Когда видит правила — следует им.

Почему работает

Люди при адаптации текста инстинктивно находят точку «достаточно хорошо» и останавливаются. Модель такого порога не имеет — правит, пока не израсходует задачу. Проверочный шаг «да/нет» имитирует это человеческое поведение и отсекает лишнюю работу. Явный список правил бьёт примеры: исследование показало значимое улучшение для накопительного списка предпочтений — и ноль эффекта от примеров редактур. Модель плохо угадывает паттерн из чужих правок, но хорошо следует прямым инструкциям.

Когда применять

Адаптация текстов под конкретную аудиторию — соцсети, письма, детский контент, деловая переписка — особенно когда тон и длина критичны. Для деловой и управленческой аудитории модель справляется ближе к норме по умолчанию, двухшаговая схема там менее обязательна. НЕ подходит как замена живому тестированию: GPT симулирует идеального читателя — терпеливого, внимательного, не уставшего. Реальная аудитория такой не бывает.

Мини-рецепт

1. Опиши аудиторию конкретно: не «для детей», а «дети 10-12 лет, читают Telegram на телефоне на перемене, любят мемы, не дочитывают длинное».
2. Запусти проверку: Текст: {текст}. Аудитория: {описание}. Только ответь ДА или НЕТ: этот текст подходит для этой аудитории?
3. Если получил НЕТ — запусти редактуру с явным списком: Отредактируй текст для {аудитория}. Список стилевых правил: {правило 1}, {правило 2}, {правило 3}. После редактуры перечисли 3-5 правил, которые применил, и обнови список.
4. Накапливай правила: обновлённый список из шага 3 вставляй в следующий запрос. Так модель итеративно подстраивается под твой стиль — каждый следующий текст получает уже обкатанный набор правил.

Примеры

[ПЛОХО] : Адаптируй эту статью о чёрных дырах для детей
[ХОРОШО] : Шаг 1: Текст: «Чёрная дыра — область пространства-времени, гравитационное притяжение которой настолько велико, что её не может покинуть ни вещество, ни излучение». Аудитория: дети 10-12 лет, Telegram, перемена, мемы, не любят длинное. Только ДА или НЕТ: текст подходит? → получаешь НЕТ → Шаг 2: Отредактируй для детей 10-12 лет. Правила: не длиннее 50 слов, разговорный тон, одно сравнение из жизни, никаких терминов без объяснения. После редактуры перечисли что применил и обнови список правил.
Источник: A comparison of human and LLM-simulated participants in a writing style task
ArXiv ID: 2606.16778 | Сгенерировано: 2026-06-16 05:36

Проблемы LLM

ПроблемаСутьКак обойти
Модель редактирует даже то, что уже готовоДаёшь задачу "адаптируй текст". Модель переписывает всё подряд. Даже если текст уже подходит аудитории. У неё нет порога "достаточно хорошо". Человек на её месте сказал бы "и так сойдёт" и не трогалДобавь шаг проверки перед редактурой. Сначала спроси "подходит или нет — ДА/НЕТ?". Запускай редактуру только если получил НЕТ
Модель пишет длиннее и официальнее, чем нужноПросишь адаптировать под детей или неформальную аудиторию. Модель делает текст технически простым, но мертво-правильным. Без живых пауз, без разговорных оборотов. Для детского или неформального контента — не тоЗадавай явный ограничитель длины в словах. Добавляй в запрос конкретный тон: "разговорный", "с паузами", "как в мессенджере". Контролируй вручную после — это системный уклон модели, не баг запроса

Методы

МетодСуть
Двухшаговый запрос для редактурыШаг 1: Текст: {текст}. Аудитория: {описание}. Только ДА или НЕТ: текст подходит? Шаг 2 — только если НЕТ: Отредактируй для {аудитория}. Список правил: {правила}. Почему работает: модель без этого шага редактирует всегда — нет внутреннего стопа. Явная проверка создаёт его искусственно. Когда применять: любая задача адаптации текста под аудиторию. Когда не нужно: если текст точно не подходит — пропускай шаг 1, сразу к редактуре
Накопительный список правил стиляВместо примеров редактуры пиши явные правила: — максимум 60 слов / — разговорный тон / — никаких терминов без объяснения. После каждой редактуры добавляй в промпт: Перечисли 3-5 правил, которые применил. Обнови список. В следующий запрос вставляй обновлённый список. Почему работает: явные правила модель выполняет точнее, чем угадывает паттерн из примеров. Список растёт — модель всё лучше попадает в твой стиль. Когда применять: серийная работа с текстами для одной аудитории

Тезисы

ТезисКомментарий
Явные правила стиля работают лучше примеровКогда даёшь модели 5 примеров своей редактуры и просишь "делай как здесь" — она угадывает паттерн неточно. Когда пишешь правила прямо ("короче 60 слов, разговорный тон, без терминов") — следует им точнее. Механика: из примеров модель строит неявный паттерн с ошибками. Из списка — выполняет конкретные инструкции. Применяй: вместо "вот мой пример, пиши так же" пиши "вот мои правила: пункт 1, пункт 2, пункт 3"
📖 Простыми словами

A comparison of human andLLM-simulated participants in a writing style task

arXiv: 2606.16778

Когда ты просишь нейронку адаптировать текст, она ведет себя как гиперопекающая нянька. Проблема в самой механике LLM: модель обучена быть максимально полезной и «правильной», поэтому она перестраховывается и переписывает всё с нуля. В итоге вместо легкой правки ты получаешь стерильный и раздутый текст, который в два раза длиннее оригинала. Модель просто не умеет вовремя остановиться, превращая живую мысль в бесконечную объяснительную записку.

Это как если бы ты попросил друга поправить галстук, а он вместо этого заставил тебя переодеть весь костюм, побриться налысо и переехать в другой город. Формально задача выполнена, но ты просто хотел выглядеть чуть аккуратнее. GPT-4o в этом плане — абсолютный отличник-зануда: там, где человек оставит разговорную небрежность, понятную ребенку, нейронка выкатит академически выверенный трактат, убивая всю естественность.

Исследователи нащупали рабочий костыль — двухшаговый промпт. Сначала ты заставляешь модель ответить на вопрос: «Нужно ли здесь вообще что-то менять?» и только потом даешь команду на правку. Этот простой фильтр ДА/НЕТ имитирует человеческую лень в хорошем смысле слова. Если текст уже «ок», человек не будет его трогать, а нейронка без этого стоп-крана начнет «улучшать» до тех пор, пока смысл не утонет в воде.

Этот принцип универсален и применим везде: от ведения детского канала про науку до переписки с топ-менеджментом. Если не ставить модели жесткий барьер, она будет галлюцинировать пользой там, где ее не просят. SEO-тексты, посты в телегу или письма клиентам — всё это страдает от «синдрома отличника», который лечится только принудительным шагом верификации.

Короче, хватит давать нейронке карт-бланш на редактирование. Либо ты ставишь ей фильтр на входе, либо получаешь тонны текста, который никто не дочитает. GPT переписывает слишком много и слишком скучно, и единственный способ заставить её звучать по-человечески — это сначала спросить, стоит ли ей вообще открывать рот. Иначе твой контент превратится в бесконечный белый шум, который выглядит правильно, но не цепляет.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с