TL;DR
Читатели в интернете стали массово обвинять тексты в «AI slop» — но обвинения не попадают в реальные маркеры AI-текста. Это главный сюрприз исследования: есть конкретные, статистически доказанные лингвистические признаки AI-текста, и есть то, за что людей реально обвиняют — и это разные вещи. Первое измеримо и поддаётся управлению. Второе — социальный ритуал.
Реальные маркеры AI-текста — меньше сокращений («не» вместо «нету», «это» вместо «это ж»), больше формальных наречий («безусловно», «действительно», «несомненно»), выше плотность предлогов, более однородная длина предложений. Плюс триггерные слова: em-dash, «delve» («погрузиться»), стандартные зачины вроде «в быстро меняющемся мире», «богатая палитра», «стоит отметить». Это можно убрать промптом.
Но обвинения в «AI slop» сорно не отслеживают эти маркеры — они стали социальным инструментом отбора «своих» в онлайн-сообществах. Понимание этого разрыва даёт два типа пользы: знаешь, что реально делает текст похожим на AI — и можешь это контролировать.
Схема инсайта
СЛОЙ 1: Реальные AI-маркеры (измеримые, управляемые)
- Низкий процент сокращений → добавь разговорность
- Высокая плотность формальных наречий → убирай «безусловно», «несомненно»
- Равномерная длина предложений → варьируй ритм
- Триггерные слова → прямой запрет в промпте
СЛОЙ 2: Социальные триггеры обвинений (не предсказывают реальный AI)
- «AI slop» = сигнал принадлежности к группе
- Обвинение функционирует как контроль доступа, не детекция
- Даже человеческий текст обвиняют — если он «подозрительный»
Оба слоя работают в одном промпте — не нужны отдельные запросы.
Пример применения
Задача: Ты ведёшь Telegram-канал про инвестиции в российский рынок. Пишешь разборы с помощью AI — но хочешь, чтобы посты не выглядели как «ChatGPT-на-минималках» и не собирали комменты «очередной бот, ай слоп».
Промпт:
Напиши пост для Telegram-канала про инвестиции на тему:
[тема — например: «почему Сбер сейчас интереснее, чем кажется»]
Требования к стилю — строго:
— Используй сокращения и разговорные обороты: «нет смысла», «ну и», «короче», «это ж очевидно»
— НЕ используй: em-dash (—), слово «погрузиться», «стоит отметить», «в современном мире», «богатый», «ключевой» без необходимости
— Варьируй длину предложений: короткие (3–6 слов) и длинные (15–20 слов) — вперемешку
— Избегай формальных наречий: «безусловно», «несомненно», «действительно» — режь их
— Пиши как человек, который разбирается в теме и объясняет другу, а не составляет отчёт
— Один конкретный тезис — не три «с одной стороны... с другой стороны»
Целевая аудитория: частные инвесторы 28–40 лет, Москва и крупные города, следят за РБК и Коммерсантом.
Результат: Модель выдаст текст заметно плотнее и «голосистее» обычного AI-вывода. Формальные связки исчезнут — появится ритм с перебивками. Сравни с тем же заданием без инструкций по стилю — разница будет слышна сразу.
Почему это работает
Почему AI-текст вообще звучит «как AI»? Модели обучались на огромных массивах формального текста — статьи, документы, энциклопедии. Поэтому они по умолчанию генерируют формальный регистр: ровные предложения, много предлогов, мало сокращений, высокая «плотность» наречий. Это не баг — это паттерн обучения.
Что умеет LLM хорошо? Следить за явными инструкциями в промпте. Если ты конкретно прописал «не используй em-dash», «добавь короткие предложения», «убери формальные наречия» — модель выполнит. Это не сложно, если знаешь, что именно запрещать.
Главный рычаг: Список запретных паттернов + требование варьировать длину предложений. Именно однородность длины предложений — один из самых сильных статистических маркеров AI-текста по данным исследования. Добавь в промпт: «короткие и длинные предложения вперемешку» — и результат уже ощутимо другой.
Рычаги управления: - Список запретных слов → расширяй под свою нишу (у юридических текстов свои триггеры, у маркетинга — свои) - Аудитория + контекст → чем конкретнее описан читатель, тем точнее модель попадает в тон - Пример «голоса» → вставь в промпт 2-3 предложения в нужном тоне: модель подстроится
Шаблон промпта
Напиши {тип текста} на тему: {тема}
Стилевые ограничения — обязательно:
— Добавь разговорные сокращения и живые обороты
— НЕ используй: em-dash (—), «погрузиться», «стоит отметить», «в современном мире», «ключевой», «безусловно», «несомненно», «действительно»
— Варьируй длину предложений: чередуй очень короткие (3–7 слов) с длинными (15–25 слов)
— Избегай структуры «с одной стороны... с другой стороны» — один конкретный угол
— Пиши как {голос: эксперт-практик / скептик / энтузиаст} объясняет {аудитория} без снисхождения
Аудитория: {описание читателя}
Длина: {количество слов или знаков}
Что подставлять:
- {тип текста} — пост, письмо, статья, описание продукта, скрипт
- {голос} — скептик, практик, инсайдер, критик — чем конкретнее, тем лучше
- {аудитория} — не «широкая аудитория», а «стартапер 30 лет, который уже пробовал AI-инструменты»
🚀 Быстрый старт — вставь в чат:
Вот шаблон для написания текста без AI-маркеров.
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.
[вставить шаблон выше]
LLM спросит про тип текста, аудиторию и нужный тон — потому что без этого невозможно правильно настроить стилевые ограничения под конкретный контекст.
Ограничения
⚠️ Социальные обвинения не победить стилем: Исследование показало — обвинения в «AI slop» не отслеживают реальные маркеры. Значит, даже идеально написанный текст может получить ярлык. Управление маркерами снижает объективный «AI-сигнал», но не гарантирует защиты от социального клейма.
⚠️ Триггерные слова — живые: Список «палевных» слов меняется. «Delve» и em-dash — 2024 год. Через год будут другие. Шаблон нужно периодически обновлять.
⚠️ Работает для написания, не для детекции: Эти маркеры помогают производить менее детектируемый текст. Они не дают надёжного способа определить, написан ли чужой текст AI — исследование это прямо доказало.
⚠️ Контекст важен: В технических и академических сообществах (Stack Overflow, Хабр) обвинения чаще попадают в цель, чем в развлекательных. В профессиональных сообществах аудитория острее чувствует паттерны.
Как исследовали
Идея была простой и масштабной: взять 25 миллионов комментариев с Hacker News и Reddit за три с лишним года (2023–2026) и посмотреть, как менялись обвинения в AI-авторстве. Исследователи составили 137-паттерный словарь — от прямых обвинений («ChatGPT это написал») до пейоративов («AI slop», «GPT-мусор»), стилевых триггеров (em-dash, «delve») и пародий («дорогие соплеменники-люди»).
Чтобы проверить, не просто ли люди стали подозрительнее в целом, добавили контрольную группу — словарь старого языка недоверия: «астротёрфинг», «шилл», «купленный». Если бы росло общее недоверие, оба словаря росли бы вместе. Но «шиллы» остались плоскими или упали — значит, рост AI-обвинений специфический, не общий тренд паранойи.
Самый неожиданный эксперимент — matched-control test. Взяли 421 комментарий, который реально получил обвинение в AI, нашли сопоставимые комментарии из тех же тредов и того же объёма, которые обвинений не получили. Затем измерили шесть лингвистических маркеров, которые статистически хорошо отличают AI-текст от человеческого. Результат: ни один маркер не предсказывал, кого обвинят. Люди обвиняют не текст — они обвиняют подозрительность. Это перевернуло исходную гипотезу исследования.
Адаптации и экстраполяции
🔧 Техника: «голосовой якорь» в промпте
Добавь 2-3 предложения в нужном тоне прямо в промпт как пример. Модель подстраивается под ритм и лексику образца быстрее, чем под любые абстрактные инструкции «пиши живо». Это работает потому что few-shot (показ примеров) — один из самых надёжных механизмов управления выводом.
Пиши в таком тоне: «Сбер торгуется по 270 — ну и что? Все ждут 300. Я бы не ждал. Вот почему.» Сохрани эту плотность и короткость.
🔧 Техника: итерация через «сделай более человеческим»
Напиши текст обычным промптом → затем отдельным запросом: «Прочитай этот текст и убери все признаки AI: добавь сокращения, разбей монотонные предложения, вырежи формальные наречия, замени em-dash на тире или точку». Двухшаговый процесс часто даёт лучший результат, чем один сложный промпт.
Ресурсы
«That's AI Slop, You Bot!": Studying Accusations, Evidence, and Credibility in Online Discourse Towards LLM-Generated Comments
Авторы: Jason Miklian (University of Oslo), John E. Katsos (American University of Sharjah)
Данные: Hacker News (Algolia archive), Reddit (Arctic Shift archive), 25 млн комментариев, январь 2023 — май 2026
Смежные работы упомянутые в статье: Jakesch et al. (2023) — про систематически неверные человеческие эвристики определения AI-текста; Akerlof (1970) — рынок «лимонов»; теория энрегистрации Agha (2003, 2007)
