3,583 papers
arXiv:2602.19560 70 23 фев. 2026 г. FREE

Identify → Explain → Correct: LLM как спеллчекер для текстов с предвзятостью

КЛЮЧЕВАЯ СУТЬ
Парадокс: люди с инвалидностью предпочли объяснения AI объяснениям живых экспертов. Не потому что AI умнее — а потому что давал нейтральный последовательный разбор без эмоций, как спеллчекер, а не как упрёк. Метод Identify → Explain → Correct позволяет проверить любой текст на предвзятый язык — получить конкретные слова, объяснение почему они проблемны, и готовую замену — а не расплывчатое «это звучит некорректно». Фишка: структура работает на двух уровнях одновременно — конкретные слова в каждом предложении и общий фрейм текста целиком. Вместе они ловят и «прикован к инвалидному креслу», и логику «инвалидность как преодоление», из которой эти слова вырастают.
Адаптировать под запрос

TL;DR

Identify → Explain → Correct — трёхшаговый фреймворк для проверки текста на некорректный язык. Ты даёшь модели текст и просишь последовательно: выдели проблемные слова, объясни почему они некорректны, предложи замену. Причём на двух уровнях: сначала по каждому предложению, потом по общей концепции текста целиком.

Главная находка — тон имеет значение. Когда авторы попросили людей с инвалидностью оценить аннотации AI и живых экспертов, AI выиграл по предпочтениям. Не потому что был «умнее» — а потому что давал ясные, последовательные объяснения в нейтральном образовательном тоне, похожем на спеллчекер. Люди объясняли с эмоциями и личным опытом — это ценно, но воспринимается иначе. AI — как инструкция, не как упрёк.

Метод работает в два уровня внутри одного промпта: уровень предложения (конкретные слова и фразы) и уровень текста целиком (общие концепции и фрейминг). Вместе они дают полную картину — и локальные слова, и то, что проблема «зашита» в саму логику истории.


🔬

Схема метода

ОДИН ПРОМПТ, ДВА УРОВНЯ АНАЛИЗА:

УРОВЕНЬ 1 — по каждому предложению:
  ШАГ 1: Идентификация → какие слова/фразы проблемны (точные цитаты)
  ШАГ 2: Объяснение   → почему они некорректны (нейтральный тон, 2-3 предложения)
  ШАГ 3: Исправление  → переписать предложение целиком с заменой

УРОВЕНЬ 2 — по тексту в целом:
  ШАГ 1: Идентификация → какие общие концепции или фрейминг проблемны
  ШАГ 2: Объяснение   → почему это некорректно
  ШАГ 3: Исправление  → как переработать текст на уровне идеи

Оба уровня — в одном запросе. Никаких дополнительных итераций.


🚀

Пример применения

Задача: HR-менеджер готовит пресс-релиз «Люди компании» — историю о сотруднике колл-центра с ДЦП. Хочет проверить, не звучит ли текст покровительственно, прежде чем публиковать на сайте.

Промпт:

Ты — редактор по инклюзивному языку. Твоя роль — анализировать тексты 
как умный спеллчекер: объективно и образовательно, без оценки автора, 
без личных примеров, без эмоций.

Проанализируй текст на некорректный язык — формулировки, которые 
могут показаться покровительственными, пренебрежительными или 
основанными на стереотипах о людях с инвалидностью.

Текст:
«Несмотря на ДЦП, Андрей каждый день преодолевает трудности и 
приходит на работу с улыбкой. Он прикован к инвалидному креслу, 
но это не мешает ему быть одним из лучших операторов. Коллеги 
восхищаются его силой духа и тем, как он справляется со своим 
недугом. Каждый звонок — маленькая победа для него.»

УРОВЕНЬ 1 — анализ по предложениям:
Для каждого предложения, где есть проблема:

Идентификация: [точные слова или фразы из предложения через запятую]
Объяснение: [2-3 предложения — почему это некорректно, тон как у 
редакционного руководства]
Исправление: [полное предложение с заменой]

УРОВЕНЬ 2 — анализ текста целиком:
Идентификация: [общие концепции или фреймы, которые делают текст 
некорректным]
Объяснение: [почему это проблема на уровне идеи]
Исправление: [как переработать текст концептуально]

Результат: Модель пройдёт по каждому предложению отдельно: выделит конкретные слова («прикован», «недуг», «несмотря на», «маленькая победа»), объяснит почему каждое из них проблемно (стереотип беспомощности, медикализация, infantilization), предложит замену. Затем на уровне текста укажет общий фрейм — «инвалидность как преодоление» — и предложит переформулировать историю Андрея как историю профессионала, а не человека, который «справляется».


🧠

Почему это работает

Слабость LLM при обычном запросе. Если просто написать «проверь текст на инклюзивность» — модель даёт расплывчатый ответ. Она не знает, что именно искать, и смешивает объяснение проблемы с переписыванием.

Сила LLM — в следовании чёткой структуре. Модель отлично работает, когда задача разбита на последовательные именованные шаги с понятным форматом вывода. Три чётких шага — найди, объясни, исправь — убирают двусмысленность. Модель не гадает что делать, а следует схеме.

Метод использует это напрямую. Два уровня анализа + три шага на каждом = модель идёт по жёстким рельсам. Тон «как спеллчекер» — отдельный ключевой элемент: он убирает морализаторство и делает вывод более воспринимаемым. Исследование показало, что именно последовательность и нейтральность объяснений сделали AI-аннотации предпочтительнее человеческих.

Рычаги управления: - Тип предвзятости → замени «инвалидность» на «возраст», «пол», «национальность» — фреймворк работает для любой чувствительной темы - Тон → «как спеллчекер» можно заменить на «как редактор Forbes» или «как HR-юрист» — меняется строгость и стиль - Уровни → можно использовать только уровень 2 (общий фрейм) для быстрой проверки концепции - Формат вывода → добавь «только исправленный текст без объяснений» если нужно просто переписать


📋

Шаблон промпта

Ты — редактор по инклюзивному языку. Анализируй текст как умный 
спеллчекер: объективно, образовательно, без оценки автора и 
личных примеров.

Проверь текст на {тип_предвзятости} — формулировки, которые могут 
воспроизводить стереотипы, покровительство или некорректный фрейминг 
в отношении {группа}.

Текст:
{вставь текст}

УРОВЕНЬ 1 — по предложениям:
Для каждого проблемного предложения:
Идентификация: [точные слова/фразы через запятую]
Объяснение: [2-3 предложения, нейтральный образовательный тон]
Исправление: [полное предложение с заменой]

УРОВЕНЬ 2 — по тексту целиком:
Идентификация: [общие концепции или фреймы]
Объяснение: [почему это проблема на уровне идеи]
Исправление: [как переработать концептуально]

Плейсхолдеры: - {тип_предвзятости} — «эйблизм», «сексизм», «эйджизм», «стереотипы о национальностях» - {группа} — «людей с инвалидностью», «женщин», «пожилых сотрудников» - {вставь текст} — любой текст: пресс-релиз, вакансия, статья, скрипт


🚀 Быстрый старт — вставь в чат:

Вот шаблон для проверки текста на некорректный язык. 
Адаптируй под мою задачу: {опиши свою задачу}.
Задавай вопросы, чтобы заполнить нужные поля.

[вставить шаблон выше]

LLM спросит какой тип предвзятости проверять и какой текст анализировать — потому что без этого нельзя настроить уровень анализа. Она возьмёт структуру шаблона и адаптирует под твою конкретную задачу.


⚠️

Ограничения

⚠️ Рекламируемый язык: Слова, которые сообщество людей с инвалидностью использует само о себе («крипл», «псих»), могут быть помечены как некорректные. Модель не всегда различает стереотип извне и самоидентификацию.

⚠️ Изолированные фразы: Метод лучше работает на связных текстах (статья, описание, история), чем на отдельных коротких фразах — контекст нужен для правильного объяснения.

⚠️ Субъективность: Нет универсального стандарта. Разные люди из одной группы часто не соглашаются между собой — и AI это отражает. Результат — рекомендация, не приговор.

⚠️ Эмоциональная глубина: AI даёт точные и ясные объяснения, но упускает культурный и личный контекст. Для финального решения важна экспертиза людей из соответствующего сообщества.


🔍

Как исследовали

Идея была провокационной: авторы намеренно попросили GPT-4o написать истории о людях с разными инвалидностями (зрение, слух, ментальное здоровье, аутизм, мобильность и другие) с инструкцией «пиши о человеке с [инвалидностью], который делает свою работу» — метод, который в предыдущих работах стабильно генерировал эйблизм. Это сырьё для эксперимента.

Затем 110 участников из сообщества людей с инвалидностью аннотировали эти истории вручную — отмечали проблемные слова, объясняли почему, предлагали замены. Параллельно GPT-4o делал то же самое с тем же форматом. Потом отдельная группа из 108 человек смотрела на оба варианта — не зная, который человеческий, а который AI — и оценивала.

Любопытный поворот: люди предпочли AI, хотя степень согласия с содержанием была одинаковой. Причина — не точность, а стиль: AI давал ясные, структурированные, нейтральные объяснения без личного тона. Это неожиданно, потому что интуитивно кажется, что живой опыт должен выигрывать. Инсайт: в обучающих контекстах понятность и последовательность могут быть важнее аутентичности.


💡

Адаптации и экстраполяции

1. Расширение на другие типы предвзятости

🔧 Техника: смени {тип_предвзятости} → та же схема работает для других чувствительных тем

Фреймворк не специфичен для эйблизма. «Проверь на сексизм», «проверь на эйджизм», «проверь на стереотипы о профессиях» — структура та же, меняется только фокус. Особенно полезно для HR-текстов, маркетинга, журналистики.


2. Быстрый режим — только Уровень 2

🔧 Техника: убери Уровень 1 → быстрая проверка концепции без деталей

Если нужна концептуальная проверка идеи, а не редактура текста — используй только «УРОВЕНЬ 2». Три вопроса: какой фрейм проблемен, почему, как переосмыслить. Экономит токены и время когда текст ещё на уровне брифа.


3. Комбинация с ролевым промптом

🔧 Техника: замени «спеллчекер» на конкретную роль → меняется строгость и перспектива

Ты — редактор крупного медиа с редакционной политикой инклюзивности.
Проверь текст как при финальной корректуре перед публикацией...

«Редактор Forbes» даст деловой взгляд. «HR-юрист» — правовую перспективу. «Читатель из целевой аудитории» — взгляд изнутри. Роль меняет угол, структура остаётся.


🔗

Ресурсы

Статья: Identifying, Explaining, and Correcting Ableist Language with AI — CHI '26, Barcelona

Авторы: Kynnedy Simone Smith (Carnegie Mellon University), Lydia B Chilton (Columbia University), Danielle Bragg (Microsoft Research)

DOI: https://doi.org/10.1145/3772318.3790533

Датасет аннотаций: https://doi.org/10.5281/zenodo.18386877

Источники по инклюзивному языку, использованные в работе: - Access Living — определение эйблизма: accessliving.org - APA Inclusive Language Guide - UN Disability Inclusive Language Guidelines - National Center on Disability and Journalism Style Guide


📋 Дайджест исследования

Ключевая суть

Парадокс: люди с инвалидностью предпочли объяснения AI объяснениям живых экспертов. Не потому что AI умнее — а потому что давал нейтральный последовательный разбор без эмоций, как спеллчекер, а не как упрёк. Метод Identify → Explain → Correct позволяет проверить любой текст на предвзятый язык — получить конкретные слова, объяснение почему они проблемны, и готовую замену — а не расплывчатое «это звучит некорректно». Фишка: структура работает на двух уровнях одновременно — конкретные слова в каждом предложении и общий фрейм текста целиком. Вместе они ловят и «прикован к инвалидному креслу», и логику «инвалидность как преодоление», из которой эти слова вырастают.

Принцип работы

Без структуры — модель мямлит. Попроси «проверь на инклюзивность» — получишь что-то вроде «в тексте есть потенциально некорректные формулировки». Бесполезно. С тремя именованными шагами — модель идёт по жёстким рельсам: Идентификация даёт точные цитаты, Объяснение отвечает почему, Исправление переписывает целиком. Два уровня внутри одного промпта делают разное: уровень предложения ловит слова («недуг», «несмотря на», «маленькая победа»), уровень текста ловит идею — то, что проблема зашита в саму логику истории, а не только в отдельные слова. Тон «как спеллчекер» — отдельный рычаг. Он убирает морализаторство. Модель не осуждает автора — она указывает на паттерн. Именно это и сделало AI-аннотации предпочтительнее человеческих: люди объясняли с личным опытом и эмоциями — ценно, но воспринимается как претензия. AI — как инструкция.

Почему работает

Модель хорошо работает, когда задача разбита на последовательные шаги с понятным форматом вывода. Когда пишешь «Идентификация: [точные слова через запятую]» — модель не гадает что делать, а заполняет слот. Два уровня анализа в одном промпте — это не удобство, а суть метода: локальные слова и общий фрейм текста — разные вещи, и без второго уровня правки остаются косметическими. Ты меняешь «прикован к инвалидному креслу» на «использует инвалидное кресло» — но история всё равно про то, как человек «справляется» и «преодолевает». Исследование показало: именно последовательность и нейтральность объяснений — а не глубина анализа — сделала AI-аннотации предпочтительными. Люди хотят понять что не так и как исправить, а не получить лекцию.

Когда применять

HR → пресс-релизы о сотрудниках, описания вакансий, внутренние истории «люди компании». Редакция → статьи, образовательные материалы, скрипты для видео. PR → любой публичный текст о людях из уязвимых групп. Замени «инвалидность» на «возраст», «пол», «национальность» — фреймворк работает для любой чувствительной темы. НЕ подходит для: отдельных коротких фраз без контекста (модели нужен связный текст, чтобы объяснить почему что-то проблемно), и для финального решения по текстам где важна самоидентификация группы — там нужна живая экспертиза.

Мини-рецепт

1. Задай роль: скажи модели что она редактор по инклюзивному языку, который работает как спеллчекер — объективно и образовательно, без оценки автора и личных примеров.

2. Назови тип предвзятости и группу: не «проверь на инклюзивность», а конкретно — <тип>эйблизм — стереотипы о людях с инвалидностью. Это сужает задачу и убирает расплывчатость.

3. Настрой Уровень 1 — по предложениям: три именованных шага: Идентификация: [точные слова/фразы из предложения], Объяснение: [2-3 предложения, нейтральный тон], Исправление: [полное предложение с заменой].

4. Настрой Уровень 2 — по тексту целиком: те же три шага, но на уровне общих концепций и фрейминга — что проблемно в самой логике текста, а не только в словах.

5. Вставь текст и отправь. Оба уровня — в одном запросе, без дополнительных итераций.

Примеры

[ПЛОХО] : Проверь этот пресс-релиз на инклюзивность и предложи правки
[ХОРОШО] : Ты — редактор по инклюзивному языку. Работай как спеллчекер: объективно, образовательно, без оценки автора и личных примеров. Проверь текст на эйблизм — формулировки, которые могут воспроизводить стереотипы или покровительственный фрейминг в отношении людей с инвалидностью. Текст: [вставь текст] УРОВЕНЬ 1 — по предложениям: Для каждого проблемного предложения: Идентификация: [точные слова или фразы через запятую] Объяснение: [2-3 предложения, нейтральный образовательный тон] Исправление: [полное предложение с заменой] УРОВЕНЬ 2 — по тексту целиком: Идентификация: [общие концепции или фреймы которые делают текст некорректным] Объяснение: [почему это проблема на уровне идеи] Исправление: [как переработать текст концептуально] Разница: в первом случае модель даст расплывчатый список «потенциально некорректных фраз». Во втором — пройдёт по каждому предложению, назовёт конкретные слова, объяснит механику стереотипа и перепишет целиком. Плюс укажет что история про «преодоление» — это проблема на уровне идеи, а не только отдельных слов.
Источник: Identifying, Explaining, and Correcting Ableist Language with AI
ArXiv ID: 2602.19560 | Сгенерировано: 2026-02-24 06:28

Методы

МетодСуть
Двухуровневый анализ текста — слова и логика одновременноРазбей задачу на два уровня в одном запросе. Уровень 1 — локальный: для каждого предложения найди конкретные слова, объясни что не так, предложи замену. Уровень 2 — концептуальный: найди общий фрейм или логику текста целиком, объясни проблему на уровне идеи, предложи переработку. Структура в запросе: УРОВЕНЬ 1 — по предложениям: Идентификация / Объяснение / Исправление. УРОВЕНЬ 2 — по тексту целиком: Идентификация / Объяснение / Исправление. Почему работает: Проблемы бывают двух типов. Одни — на уровне слов («прикован к креслу»). Другие — на уровне фрейма («история о преодолении», хотя человек просто работает). Один уровень без другого даёт неполную картину. Когда применять: любой связный текст — статья, вакансия, пресс-релиз, скрипт. Не работает: отдельные короткие фразы без контекста — модели не на что опереться
📖 Простыми словами

Identifying, Explaining, and Correcting AbleistLanguagewith AI

arXiv: 2602.19560

Проблема в том, что современные нейронки по умолчанию — те еще лицемеры. Если ты просто попросишь ChatGPT «сделать текст инклюзивным», она выдаст тебе водянистую кашу, потому что сама толком не понимает, где именно накосячила. Суть метода Identify-Explain-Correct в том, чтобы заставить модель работать как дотошного редактора-лингвиста: сначала она должна ткнуть пальцем в конкретное слово, потом внятно обосновать, почему это эйблизм, и только в самом конце предложить замену. Без этой цепочки AI просто гадает на кофейной гуще, пытаясь угадать твои ожидания.

Это как если бы ты пришел к врачу, а он, даже не глядя на тебя, выписал рецепт на таблетки «от всего». Вроде лечение есть, а толку ноль. Метод работает иначе: врач сначала находит очаг воспаления, объясняет тебе на снимке, что именно пошло не так, и только потом назначает конкретное лекарство. Без этапа объяснения модель часто «галлюцинирует» или исправляет то, что и так работало нормально, превращая живой текст в стерильный корпоративный булшит.

В основе лежат три четких шага: выделение, анализ и коррекция. Сначала модель сканирует текст на уровне предложений, выцепляя фразы вроде «прикован к креслу» или «несмотря на свой недуг». Затем она объясняет, что это звучит покровительственно и лишает человека субъектности. И только когда логическая цепочка выстроена, она переписывает фрагмент. Важный нюанс — проверка идет на двух уровнях: сначала копаемся в деталях каждого предложения, а потом смотрим на общий контекст, чтобы весь текст целиком не выглядел как жалостливая ода.

Хотя исследование проводили на теме инвалидности, этот трехшаговый фреймворк — абсолютно универсальная штука. Его можно и нужно натравливать на любой сложный контент: от юридических договоров, где нужно найти «подводные камни», до токсичных комментариев или маркетинговых текстов. Принцип везде один: если ты хочешь от AI качественный результат, не давай ей прыгать сразу к финишу. Заставляй её аргументировать каждый шаг, иначе на выходе получишь рандомную фигню.

Короче, хватит кидать в модель запросы в духе «сделай мне красиво» — это путь в никуда. Используй структурированный подход, разделяй поиск ошибок и их исправление. Если модель сначала объяснит тебе проблему, шанс на адекватный результат вырастает в разы. Кто продолжит пользоваться «ленивыми» промптами, так и будет получать мусор на входе и мусор на выходе, пока конкуренты делают чистый и профессиональный контент.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с