TL;DR
AI-текст надёжно отличается от человеческого по одному признаку — лексической бедности. LLM повторяет слова чаще, использует меньше синонимов, возвращается к одним и тем же лексическим единицам снова и снова. Исследователи проверили 284 лингвистических признака на текстах 27 моделей в 10 тематических доменах — и только словарное разнообразие оказалось стабильным сигналом, который работает везде.
Почему так происходит. Человек пишет, вытаскивая слова из разных ящиков памяти — опыт, ассоциации, контекст тянут к разным формулировкам. LLM генерирует следующий токен по вероятности: "выгодные" слова побеждают снова и снова. Текст выходит связным и грамотным, но монотонным по словарю — как будто один и тот же набор слов крутится по кругу. Все остальные "AI-признаки" — синтаксис, эмоциональная окраска, читаемость, длина предложений — оказались ненадёжными: они работают в одном домене, но ломаются в другом.
Из этого два практических вывода. Хочешь, чтобы AI-текст звучал человечнее — явно проси разнообразить лексику и избегать повторений: это единственное, что резко улучшает "человечность" текста. Хочешь быстро проверить текст на AI-шность — ищи не "слишком правильный синтаксис" или "нейтральный тон", а именно словарную монотонность: одни и те же слова, минимум синонимов, повторяющиеся конструкции.
Схема метода
Метод — не пошаговый алгоритм, а принцип, который добавляется к любому промпту на написание текста.
БАЗОВЫЙ ПРОМПТ: [задача на написание текста]
+
НАДСТРОЙКА: [инструкция на лексическое разнообразие]
↓
РЕЗУЛЬТАТ: текст, который сложнее детектировать как AI
Надстройка работает в одном запросе — отдельных шагов не нужно.
Пример применения
Задача: Написать отзыв на языковые курсы для Яндекс.Карт — так, чтобы он не звучал как ChatGPT.
Промпт:
Напиши отзыв на языковые курсы английского в Москве для Яндекс.Карт.
Я занимался 4 месяца, цель была — выйти на B2, удалось.
Требования к тексту:
— Не повторяй одно и то же слово дважды в одном абзаце
— Используй синонимы там, где это органично
— Чередуй длину предложений: короткие и длинные вперемешку
— Разные начала предложений — не все с "Я" или с "Курсы"
— Пиши как человек, который немного устал после работы, но доволен результатом
Объём: 5-7 предложений.
Результат: Модель выдаст текст с заметно большим словарным разнообразием: меньше повторов, разные союзы и вводные конструкции, смена ритма предложений. Это не гарантирует, что детектор не распознает текст, но убирает самый сильный сигнал — лексическую монотонность.
Почему это работает
LLM — вероятностная машина, а не писатель. Когда нужно сказать "хороший результат", модель с высокой вероятностью выберет слово результат снова, потому что оно только что было в контексте. Человек бы написал итог, достижение, то, чего добился — интуитивно уходя от повторов. LLM этого не делает без явной инструкции.
Почему остальные "AI-признаки" ненадёжны. Синтаксис, длина предложений, эмоциональность — всё это сильно зависит от темы и модели. Новостной текст от GPT выглядит иначе, чем рецензия от LLaMA. Но лексическая бедность встречается у всех и везде — потому что это следствие самого механизма генерации, а не стиля конкретной модели.
Рычаг: Явная инструкция на разнообразие лексики работает лучше, чем абстрактное "пиши как человек". Лучше дать конкретные правила — не повторять слово в одном абзаце, чередовать длину предложений, менять начала. Модель следует структурированным инструкциям точнее, чем размытым пожеланиям.
Шаблон промпта
{задача на написание текста}
Требования к лексике и ритму:
— Не повторяй одно и то же слово в одном абзаце — используй синонимы
— Чередуй длину предложений: короткие и развёрнутые вперемешку
— Разные конструкции в начале предложений — не все с "{повторяющееся слово}"
— Избегай канцелярских клише: "{клише_1}", "{клише_2}"
— Стиль: {описание тона — усталый, живой, ироничный, деловой}
Объём: {количество} предложений / слов.
Что подставлять:
- {задача} — что нужно написать: отзыв, пост, письмо, описание товара
- {повторяющееся слово} — то, с чего модель обычно начинает всё подряд: "Я", "Это", "Данный"
- {клише} — типичные AI-обороты для вашей темы: "в заключение следует отметить", "немаловажно подчеркнуть"
- {тон} — эмоциональный регистр, который нужен
🚀 Быстрый старт — вставь в чат:
Вот шаблон для написания текста с человеческой лексикой.
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы уточнить детали.
[вставить шаблон выше]
LLM спросит про тему, тон, объём и типичные клише вашей области — потому что без этого она не сможет настроить правила разнообразия конкретно под вашу задачу.
Ограничения
⚠️ Не панацея от детекторов: Современные детекторы AI-текста используют не только лингвистические признаки, но и статистику вероятностей токенов. Лексическое разнообразие убирает самый надёжный сигнал, но не делает текст невидимым для всех систем детектирования.
⚠️ Зависимость от домена: Исследование показало, что разные текстовые домены реагируют по-разному. Научный текст (SciGen) детектировался стабильно даже из домена, которого не было в обучении. Для разговорных форматов (DialogSum) точность падала резко — вероятно, там сам жанр требует характерной лексики.
⚠️ Неработает для простых моделей: Более старые и простые LLM (OPT, Eleuther) оставляют настолько явные лингвистические следы, что один признак лексической бедности погоды не делает — там детектируется буквально всё.
⚠️ Инструкция не гарантирует исполнение: Модель может следовать правилу неравномерно — в начале текста аккуратнее, к концу забывает. Для длинных текстов стоит делать несколько запросов или проверять вручную.
Как исследовали
Команда из Университета Штутгарта и института GESIS взяла датасет MAGE — большой бенчмарк, где человеческие тексты из 10 источников (новости, рецензии, научные статьи, истории, вопрос-ответ и другие) спарены с продолжениями от 27 LLM семи семейств: от GPT до LLaMA и устаревших OPT. Итого — сотни тысяч текстовых пар.
Идея была простая: вместо чёрного ящика (нейросети-детектора) натренировать классический классификатор на 284 интерпретируемых лингвистических признаках — чтобы можно было сказать почему текст выглядит машинным, а не просто "нейросеть так решила". Потом методично убирали группы признаков и смотрели, что ломается.
Главный сюрприз: когда убирали лексическое разнообразие — точность падала на 13%. Когда убирали всё остальное по одному — падение было меньше 0,5%. В режиме "невиданных доменов" (тексты из областей, которых не было при обучении) убирание почти всех признаков, кроме лексических, повышало точность — шум уходил, сигнал оставался. Это нетривиально: исследователи ожидали, что чем больше признаков, тем лучше. Оказалось — большинство признаков добавляют шум, а не сигнал.
Адаптации и экстраполяции
🔧 Техника: явный запрет повторов на уровне абзаца → точечный контроль
Вместо общей инструкции "используй разнообразные слова" — дай модели конкретное правило с единицей измерения:
Правило: ни одно существительное и глагол не должны
встречаться в одном абзаце дважды в той же форме.
Исключения — служебные слова (и, но, в, на, это).
Конкретное ограничение с единицей ("абзац", "дважды") работает точнее, чем абстрактное пожелание.
🔧 Техника: режим аудита → найти AI-шные места в готовом тексте
Принцип исследования можно перевернуть — не "пиши разнообразнее", а "найди где ты повторяешься":
Прочитай текст ниже и найди:
1. Слова, которые встречаются чаще 3 раз — предложи синонимы
2. Предложения, которые начинаются одинаково — переформулируй
3. Абзацы с одинаковой длиной предложений подряд — разбей ритм
[текст]
Модель вернёт конкретные места и варианты замены — быстрая редактура под человеческий стиль.
Ресурсы
Название работы: A Systematic Analysis of Linguistic Features in AI-Generated Text Detection Across Domains and Models
Авторы: Yassir El Attar, Esra Dönmez, Maximilian Maurer, Agnieszka Falenska
Организации: Institute for Natural Language Processing, University of Stuttgart; Interchange Forum for Reflecting on Intelligent Systems, University of Stuttgart; GESIS Leibniz Institute for the Social Sciences; Heinrich-Heine University Düsseldorf
Датасет: MAGE benchmark (Li et al., 2024)
Инструмент извлечения признаков: elfen Python package (Maurer, 2026)
