TL;DR
Когда просишь LLM писать от лица эксперта, добавление явных профессиональных правил плюс реальных справочных документов резко улучшает результат. Исследователи проверили три конфигурации: только правила НКО (эмпатия, уважительный тон), только правила фактчекеров (точность, источники, нейтральный стиль) и смешанная — оба набора правил и оба типа документов одновременно.
Ключевая находка: LLM при воплощении профессиональной роли начинает "шаблонить". Для роли НКО — штампует фразы "важно понимать", "важно признавать". Для роли фактчекера — "утверждение является ложным". Модель пишет не как профессионал, а как стереотип профессионала. Это проблема любого ролевого промпта, где нет явных правил стиля и фактической базы.
Смешанная стратегия решает это: один промпт с правилами двух ролей + документы обоих типов дали лучшее качество по всем критериям. Меньше правок от экспертов, выше читаемость, больше фактической точности и эмпатии одновременно — без компромиссов.
Схема метода
Всё делается в одном промпте или в нескольких запросах — зависит от объёма материалов.
ШАГ 1: Определить две дополняющих роли
→ Роль А (фактическая точность) + Роль Б (человечный тон)
ШАГ 2: Собрать два типа материалов
→ Документ/статья с фактами по теме
→ Документ/разбор со смысловым контекстом (история, нюансы)
ШАГ 3: Написать смешанные правила в промпте
→ От Роли А: что делать с фактами (цитировать источники, точный язык)
→ От Роли Б: что делать с тоном (эмпатия, без осуждения человека)
→ Явный запрет шаблонных фраз
ШАГ 4: Вставить оба документа + задачу → получить текст
Пример применения
Задача: Владелец небольшого производства пишет ответ на Авито-отзыв, где покупатель утверждает что "китайская сборка, всё разваливается через месяц" — и это неправда, но другие читатели верят. Нужен ответ: фактически точный, но не агрессивный и не казённый.
Промпт:
Ты отвечаешь на отзыв покупателя от лица компании.
Используй два подхода одновременно:
ПРАВИЛА ТОЧНОСТИ (как фактчекер):
— Опирайся только на конкретные факты из документа ниже
— Приводи точные характеристики и источники
— Без эмоций, без расплывчатых обещаний
— Не говори "утверждение является ложным" — просто приводи факты
ПРАВИЛА ТОНА (как специалист поддержки):
— Выражай понимание ситуации покупателя
— Не атакуй человека, атакуй недопонимание
— Без фраз "важно понимать", "важно признавать", "мы рады сообщить"
— Тон: спокойный, уважительный, конкретный
ОТЗЫВ:
"Китайская сборка, всё разваливается через месяц. Не берите."
ФАКТЫ О ПРОДУКТЕ (вставь сюда: страна сборки, материалы, сертификаты, гарантийные данные):
[вставить реальные данные о товаре]
Напиши ответ до 100 слов. Без заголовков.
Результат: Модель выдаст ответ, который одновременно содержит конкретные факты (страна, материалы, статистика возвратов) и человечный тон без агрессии и корпоративных штампов. Отдельно можно проверить: нет ли в тексте фраз-шаблонов, которые нужно убрать вручную.
Почему это работает
LLM при получении роли (например, "отвечай как эксперт") делает самое простое: воспроизводит самый частый паттерн для этой роли из обучающих данных. Для "сотрудника поддержки" это "мы рады сообщить", "важно понимать". Для "аналитика" это "данное утверждение является ложным". Роль без правил — это штамп, не экспертиза.
LLM хорошо умеет одно: следовать явным инструкциям и обрабатывать конкретный текст. Если дать реальный документ с фактами — модель не выдумывает, а работает с тем что есть. Если дать явные правила стиля — соблюдает их точнее, чем просто "пиши профессионально".
Смешанная стратегия использует это: два набора правил устанавливают два независимых ограничения — на содержание и на тон. Они не конкурируют, а дополняют друг друга. Запрет шаблонных фраз прямым текстом в промпте даёт модели явный сигнал избегать именно их.
Рычаги управления: - "Без фраз: [список]" → замени на список штампов из своей темы — удаляет роботизированность - Объём документов → чем больше реальных фактов вставишь, тем точнее и конкретнее ответ - Баланс ролей → если нужна чистая точность — убери правила тона; если только человечность — убери правила точности - Явное ограничение длины → без него модель "разбавляет" конкретику водой
Шаблон промпта
Напиши {тип текста} по следующим правилам:
ПРАВИЛА ТОЧНОСТИ:
— Используй только факты из документа ниже
— Приводи конкретные данные: цифры, характеристики, источники
— Без расплывчатых утверждений
— Без фраз: {список шаблонных фраз для этой темы}
ПРАВИЛА ТОНА:
— {тон и стиль: эмпатия / нейтральность / прямота}
— Не {что избегать по стилю}
— Без фраз: {список штампов тона}
ЗАДАЧА:
{описание ситуации или исходный текст для ответа}
СПРАВОЧНЫЙ МАТЕРИАЛ:
{вставить реальные факты, документ, статью, данные}
Объём: {количество слов}. Без заголовков.
Что подставлять:
- {тип текста} — ответ на отзыв, письмо клиенту, пост, объяснение
- {список шаблонных фраз} — подумай что раздражает тебя в AI-текстах на эту тему и просто перечисли
- {справочный материал} — реальные данные, которые модель должна использовать, а не выдумывать
🚀 Быстрый старт — вставь в чат:
Вот шаблон для написания профессионального текста с двумя ролями.
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.
[вставить шаблон выше]
LLM спросит какой тип текста нужен, какой стиль и тон, какие факты есть — потому что без конкретного материала и правил стиля шаблон не заработает. Она возьмёт структуру двух ролей и адаптирует под твою ситуацию.
Ограничения
⚠️ Нет реального документа — нет точности: Если не вставить реальные факты, модель вернётся к выдумкам. Шаблон работает только когда ты даёшь конкретный материал.
⚠️ Чем длиннее документ, тем выше риск галлюцинаций: Модель может смешать факты из разных частей документа или добавить своё. Готовый текст стоит проверить на точность если ставки высоки.
⚠️ Смешанная стратегия требует усилий при подготовке: Нужно собрать два типа материалов и две группы правил. Для простого письма — избыточно. Метод оправдывает себя при регулярно повторяющейся задаче где нужно сочетать точность и человечность.
⚠️ Запрет штампов работает не всегда: Модель может заменить "важно понимать" на "следует учитывать". Перечитывай и дополняй список фраз.
Как исследовали
Команда из Fondazione Bruno Kessler (Италия) построила довольно трудоёмкий эксперимент: вручную собрала 427 фактчекинговых статей и 280 НКО-отчётов, из них составила 108 пар "токсичное сообщение + справочный материал". Для каждого из 108 сообщений сгенерировала три варианта контрпослания — по схеме НКО, по схеме фактчекера и по смешанной схеме. Всего 324 пары.
Самое интересное — проверка качества. 23 эксперта (11 реальных фактчекеров и 12 сотрудников НКО из 7 организаций четырёх стран) лично редактировали сгенерированные тексты и оценивали, насколько плотно пришлось вмешиваться. Метрика HTER (отношение правок к объёму текста) показала: 40% случаев эксперты не тронули вовсе, в остальных правили в основном одно и то же — шаблонные фразы и слишком сложные синтаксические конструкции.
Главный сюрприз: смешанная стратегия потребовала меньше усилий от обеих групп экспертов — и фактчекеров, и НКО-операторов — по сравнению с "родными" для них стратегиями. Это неочевидно: казалось бы, два набора правил создают конфликт. Но на практике объединение перспектив давало более сбалансированный результат, который обеим сторонам нравился больше. Вывод: синтез экспертиз работает лучше специализации, когда задача требует и точности, и человечности одновременно.
Адаптации и экстраполяции
🔧 Техника: Явный "чёрный список" фраз → устранение роботизированности
Самая простая адаптация из находки про шаблонирование: перед любым ролевым промптом добавь блок запрещённых фраз под твою тему. Для деловой переписки: "Без фраз: 'Обращаем ваше внимание', 'В данном контексте', 'Следует отметить'". Для маркетинга: "'Уникальный', 'Инновационный', 'Лучший в своём классе'".
🔧 Техника: Три роли вместо двух → для задач с несколькими стейкхолдерами
Принцип масштабируется. Например, для письма инвесторам: Роль А (аналитик — цифры и факты) + Роль Б (маркетолог — ценностное предложение) + Роль В (юрист — без обещаний, которые нельзя выполнить). Три блока правил в одном промпте.
Ресурсы
Название работы: Assisted Counterspeech Writing at the Crossroads of Hate Speech and Misinformation
Авторы: Genoveffa Martone, Helena Bonaldi, Marco Guerini — Fondazione Bruno Kessler (Italy), Università Cattolica del Sacro Cuore (Italy)
Датасет и материалы: https://github.com/LanD-FBK/counterspeech_against_hate_and_misinfo
Связанные ресурсы: European Code of Standards for Independent Fact-Checking Organizations (efcsn.com), Get the Trolls Out project (getthetrollsout.org)
