3,583 papers
arXiv:2509.01962 84 2 сент. 2025 г. FREE

DRAssist Framework: структурный анализ споров через пошаговую оценку аргументов

КЛЮЧЕВАЯ СУТЬ
Обнаружено: LLM выбирает в споре не сильную сторону, а громкую — кто больше написал или эмоциональнее выразился. Точность прыгает от 44% до 71% в зависимости от формулировки. DRAssist позволяет получать обоснованные решения в конфликтах — не угадывание победителя, а детальный разбор силы каждого аргумента. Фишка: не спрашивай сразу "кто прав?" — сначала оцени каждый аргумент как STRONG или WEAK, потом реши по каждому требованию (принято/отклонено), и только в финале — общий вывод. Точность подскакивает до 80% vs 44-71% при прямом вопросе.
Адаптировать под запрос

TL;DR

DRAssist — метод разрешения споров, который разбивает конфликт на структурированные элементы (факты, точки разногласия, требования, аргументы) и анализирует их пошагово. Вместо того чтобы сразу ответить "кто прав", система сначала оценивает силу каждого аргумента обеих сторон, потом принимает решение по каждому требованию, и только в финале делает общий вывод.

Исследователи из TCS Research проверили метод на 455 реальных спорах — автостраховых и доменных. Выяснилось: модели хуже всего справляются когда пытаются сразу назвать победителя. Точность прыгает от 44% до 71% в зависимости от промпта. Причина — отсутствие промежуточных шагов рассуждения. Модель либо угадывает, либо цепляется за поверхностные признаки (кто громче кричал в аргументах).

Метод решает проблему через Chain-of-Thought для споров: сначала оценить каждый аргумент по критериям (есть ли факты, логика, прецеденты), потом сравнить силу позиций, и только тогда выносить вердикт. Так точность подскакивает до 80% (ensemble из трёх моделей). Bonus: получаешь не просто ответ "сторона А сильнее", а детальный разбор — какие аргументы сильные, какие слабые, почему каждое требование принято или отклонено.

🔬

Схема метода

ШАГ 1: Структурирование спора
→ Факты (согласованные обеими сторонами)
→ Точки разногласия
→ Требования каждой стороны
→ Аргументы каждой стороны
→ Прецеденты / законы / правила (если применимо)

ШАГ 2: Оценка аргументов (для каждого аргумента каждой стороны)
→ STRONG (сильный) или WEAK (слабый)
→ Краткое обоснование оценки

ШАГ 3: Решение по требованиям (для каждого требования каждой стороны)
→ ACCEPTED (принято) или REJECTED (отклонено)
→ Обоснование на основе силы аргументов

ШАГ 4: Общий вывод
→ Определение более сильной стороны
→ Обоснование через баланс сильных/слабых аргументов

Все шаги выполняются в одном промпте. Модель сразу видит всю структуру и заполняет её последовательно.

🚀

Пример применения

Задача: Ты продал кроссовки Nike на Авито за 8000₽. Покупатель получил их, но теперь требует вернуть 3000₽, потому что "состояние хуже чем на фото — подошва стёрта, на носке потёртость". Ты уверен что фото честные и показывали все дефекты. Покупатель угрожает жалобой в поддержку Авито. Нужно понять: насколько сильна твоя позиция и что делать.

Промпт:

Проанализируй спор и помоги оценить позиции обеих сторон.

СТРУКТУРА СПОРА:

Факты, согласованные обеими сторонами:
- Кроссовки Nike проданы за 8000₽ на Авито
- Товар доставлен и получен покупателем
- В описании указано "б/у, носил 6 месяцев"
- Фотографии прилагались к объявлению

Точки разногласия:
- Продавец утверждает: все дефекты показаны на фото
- Покупатель утверждает: состояние хуже чем на фото, потёртости не были видны

Требования покупателя:
- Вернуть 3000₽ из-за скрытых дефектов
- Если откажешь — пожалуюсь в поддержку Авито

Требования продавца:
- Ничего не возвращать, т.к. фото честные
- Покупатель согласился с ценой и состоянием при покупке

Аргументы покупателя:
- Потёртость на носке не видна на фото
- Подошва стёрта сильнее чем казалось
- В описании не было деталей про дефекты

Аргументы продавца:
- Сделал 5 фото под разными углами, всё видно
- Цена 8000₽ уже учитывала состояние (новые стоят 15000₽)
- Покупатель не задавал вопросов перед покупкой

---

ИНСТРУКЦИЯ:

1. Оцени каждый аргумент обеих сторон как STRONG или WEAK.

Критерии сильного аргумента:
- Подтверждается фактами
- Логически связный
- Опирается на правила площадки или общепринятые нормы

2. Для каждого требования определи: ACCEPTED или REJECTED.
 Учти силу аргументов и баланс позиций.

3. Определи общую более сильную сторону в споре.
 Объясни почему через баланс сильных и слабых аргументов.

ФОРМАТ ОТВЕТА:

АРГУМЕНТЫ ПОКУПАТЕЛЯ:
[аргумент]: [STRONG/WEAK] — [обоснование]

АРГУМЕНТЫ ПРОДАВЦА:
[аргумент]: [STRONG/WEAK] — [обоснование]

РЕШЕНИЕ ПО ТРЕБОВАНИЯМ ПОКУПАТЕЛЯ:
[требование]: [ACCEPTED/REJECTED] — [обоснование]

РЕШЕНИЕ ПО ТРЕБОВАНИЯМ ПРОДАВЦА:
[требование]: [ACCEPTED/REJECTED] — [обоснование]

ОБЩИЙ ВЫВОД:
Более сильная сторона: [покупатель/продавец]
Обоснование: [почему, через анализ аргументов]

Результат:

Модель выдаст пошаговый разбор:

  • Оценку каждого аргумента с меткой STRONG/WEAK
  • Решение по каждому требованию (возврат 3000₽, жалоба, отказ и т.д.)
  • Общий вывод с обоснованием кто в более сильной позиции

Ты увидишь не просто "продавец прав" или "покупатель прав", а детальный анализ: какие аргументы проходят (например, "5 фото под разными углами" — STRONG), какие проваливаются (например, "не задавал вопросов" — WEAK, потому что это не освобождает продавца от обязанности показать состояние). На основе этого — решение по каждому пункту и итоговая рекомендация.

🧠

Почему это работает

LLM плохо справляются с субъективными оценками когда нужно взвесить позиции двух сторон. Если спросить напрямую "кто прав в споре?", модель либо выберет случайно, либо зацепится за громкость аргументов (кто больше написал или эмоциональнее выразился), а не за их силу.

Но LLM хорошо умеют применять критерии к конкретным утверждениям. Дай модели чёткие критерии оценки ("есть ли факты?", "логично ли?", "есть ли прецедент?") и попроси оценить каждый аргумент отдельно — она справится гораздо лучше.

Метод использует эту сильную сторону: вместо одного сложного вопроса ("кто прав?") даёт серию простых ("этот аргумент сильный?", "это требование обосновано?"). Модель сначала разбирается с простыми вопросами, создаёт промежуточные выводы (баланс сильных/слабых аргументов), и только потом делает финальное заключение на основе этих выводов. Так снижается вероятность случайного выбора и появляется прозрачность — ты видишь ход рассуждений.

Рычаги управления промптом:

  1. Критерии оценки аргументов — можешь адаптировать под свой контекст:
    • Для бизнес-спора добавь "экономическая обоснованность"
    • Для технического спора добавь "соответствие стандартам"
    • Для морального спора добавь "соответствие ценностям"
  2. Структура спора — убери элементы если не нужны:
    • Нет прецедентов? Убери этот блок
    • Нет точных требований? Сформулируй их сам в промпте
    • Простой спор? Оставь только факты и аргументы
  3. Формат вывода — можешь запросить:
    • Только оценку аргументов (без общего вывода)
    • Только решение по требованиям
    • Полный разбор + тактические рекомендации
  4. Уровень детализации — управляй через инструкцию:
    • "Краткие обоснования (1 предложение)" → экономия токенов
    • "Развёрнутые обоснования со ссылками на факты" → глубина анализа
📋

Шаблон промпта

Проанализируй спор между {сторона_А} и {сторона_Б}.

СТРУКТУРА СПОРА:

Факты, согласованные обеими сторонами:
{согласованные_факты}

Точки разногласия:
{точки_разногласия}

Требования {сторона_А}:
{требования_А}

Требования {сторона_Б}:
{требования_Б}

Аргументы {сторона_А}:
{аргументы_А}

Аргументы {сторона_Б}:
{аргументы_Б}

[Опционально] Прецеденты / правила / законы:
{прецеденты_и_правила}

---

ИНСТРУКЦИЯ:

1. Оцени каждый аргумент обеих сторон как STRONG или WEAK.

Критерии сильного аргумента:
- Подтверждается проверяемыми фактами
- Логически связный и последовательный
- Опирается на прецеденты, правила или общепринятые нормы
- Юридически/морально/экономически обоснован

2. Для каждого требования каждой стороны определи: ACCEPTED или REJECTED.
 Учти силу соответствующих аргументов.
 Убедись что противоположные требования не получили одинаковый статус.

3. Определи общую более сильную сторону в споре.
 Объясни через баланс сильных и слабых аргументов.

ФОРМАТ ОТВЕТА:

АРГУМЕНТЫ {сторона_А}:
[аргумент]: [STRONG/WEAK] — [обоснование]

АРГУМЕНТЫ {сторона_Б}:
[аргумент]: [STRONG/WEAK] — [обоснование]

РЕШЕНИЕ ПО ТРЕБОВАНИЯМ {сторона_А}:
[требование]: [ACCEPTED/REJECTED] — [обоснование]

РЕШЕНИЕ ПО ТРЕБОВАНИЯМ {сторона_Б}:
[требование]: [ACCEPTED/REJECTED] — [обоснование]

ОБЩИЙ ВЫВОД:
Более сильная сторона: [{сторона_А} / {сторона_Б}]
Обоснование: [почему, через анализ сильных и слабых аргументов]

Что подставлять:

  • {сторона_А} / {сторона_Б} — названия или роли сторон (например: "продавец" и "покупатель", "работодатель" и "сотрудник")
  • {согласованные_факты} — факты которые обе стороны признают
  • {точки_разногласия} — по каким вопросам позиции расходятся
  • {требования_А} / {требования_Б} — что каждая сторона хочет получить
  • {аргументы_А} / {аргументы_Б} — обоснования каждой стороны
  • {прецеденты_и_правила} — применимые законы, правила площадки, условия договора (опционально)
⚠️

Ограничения

⚠️ Bias к одной из сторон: В исследовании модели показали систематический перекос в пользу определённой стороны. Например, Mistral почти всегда выбирала "жалобщика" в доменных спорах (349 из 351 случая). Причина неясна, но предположительно связана с тональностью текста — сторона которая активнее жалуется и требует, выглядит "сильнее" для модели.

Практический совет: используй ensemble из нескольких моделей (GPT + Claude + Mistral) и сравнивай выводы. Если все три пришли к одному — вероятность bias ниже.

⚠️ Зависимость от структурирования: Метод требует предварительного структурирования спора. Если ты скормишь модели просто "вот переписка между мной и покупателем, кто прав?" — точность упадёт. Нужно сначала выделить факты, разногласия, требования и аргументы. Это можно сделать отдельным промптом (попросить модель саму структурировать), но это добавит шаг.

⚠️ Ошибки в аргументах: Если при структурировании (вручную или через LLM) искажён аргумент одной из сторон или пропущен важный факт — финальный вывод будет неверным. Это мусор-на-входе-мусор-на-выходе. Критично проверять что все аргументы сформулированы точно.

⚠️ Не заменяет юриста: Метод даёт техническую оценку силы позиций, но не учитывает нюансы типа "какой судья будет рассматривать", "какие доказательства можно предъявить", "как толкуется этот закон в последних решениях". Для реальных юридических споров — это помощник для подготовки, не финальный вердикт.

🔍

Как исследовали

Команда из TCS Research взяла 455 реальных спора из двух источников: 104 автостраховых дела из Национальной комиссии по защите прав потребителей Индии (NCDRC) и 351 доменный спор из базы WIPO (Всемирная организация интеллектуальной собственности). Это были завершённые дела с известными решениями.

Сначала исследователи столкнулись с проблемой: споры написаны неструктурировано — стена текста с фактами, аргументами и решениями вперемешку. Пришлось структурировать каждый спор вручную (используя LLM как помощника): выделить факты, разногласия, требования, аргументы, прецеденты. Создали единый формат для всех споров (13 структурных элементов для автострахования, чуть меньше для доменных).

Потом проверили три стратегии промптинга: S₁ — просто спросить "кто сильнее?", S₂ — добавить анализ требований, S₃ — сначала оценить аргументы (Chain-of-Thought). Использовали три LLM: Mistral-7B, Llama-3-8B и GPT-4o-mini. Температуру поставили 0 для стабильности (по рекомендации Renze & Guven, 2024).

Результат удивил: прямой промпт провалился. Точность S₁ — всего 44-71% в зависимости от модели. Это близко к случайному гаданию (baseline 53%). Но когда добавили Chain-of-Thought через оценку аргументов (S₃), точность подскочила до 80% (ensemble из трёх моделей для автостраховых споров).

Почему такая разница? Исследователи заметили: без промежуточных шагов LLM не видит логику. Она просто сканирует текст и ищет сигналы "кто громче кричит" или "у кого больше пунктов в списке аргументов". А в S₃ модель вынуждена сначала оценить каждый аргумент по критериям, создать промежуточные выводы ("у стороны А три сильных аргумента, у стороны Б — один"), и только потом делать финальный вывод. Это механически убирает возможность угадывания.

Также обнаружили неожиданный bias: Mistral почти всегда выбирала "жалобщика" в доменных спорах (349/351), даже когда факты были против. Это намекает на проблему тональности — модель путает "кто активнее требует" с "кто прав". Ensemble помог сгладить это в автостраховых делах, но в доменных bias остался.

Финальный инсайт: простые шаги лучше сложных решений. Вместо одного вопроса "кто прав?" (субъективно и сложно) — задай серию простых вопросов ("этот аргумент сильный?"). Модель справится лучше и даст прозрачный результат.

💡

Адаптации и экстраполяции

💡 Адаптация для переговоров (вместо спора):

Метод работает не только для завершённых споров, но и для активных переговоров — когда ты хочешь понять силу своей позиции ДО встречи с оппонентом.

Оцени силу моей позиции в переговорах.

КОНТЕКСТ:
Я предлагаю клиенту услугу за 150 000₽. Он говорит "дорого, давайте 100 000₽".

СТРУКТУРА:

Факты, согласованные обеими сторонами:
- Проект займёт 2 месяца
- Аналогичные услуги на рынке — 120-180 тыс₽
- У меня есть портфолио из 5 похожих проектов

Точки разногласия:
- Я считаю: 150к справедливая цена с учётом качества
- Клиент считает: 100к достаточно, т.к. "это быстрая работа"

Мои требования:
- 150 000₽ или минимум 130 000₽ с урезанным объёмом

Требования клиента:
- 100 000₽ за полный объём

Мои аргументы:
- Портфолио из 5 проектов — подтверждённое качество
- Рыночная цена 120-180к — я посередине
- Срок 2 месяца — нужно заложить риски

Аргументы клиента:
- "Это быстрая работа" — не должна стоить дорого
- "У меня бюджет ограничен"

---

Оцени мои аргументы как STRONG/WEAK. Оцени требования как ACCEPTED/REJECTED. Скажи: моя позиция сильнее или слабее?

Результат: видишь где позиция крепкая (портфолио + рыночные цены), где слабая ("риски" без конкретики). Это база для тактики: на чём стоять твёрдо, где можно уступить.


🔧 Техника: Двусторонний анализ → Тактические рекомендации

Добавь в конец промпта:

ДОПОЛНИТЕЛЬНО:
На основе оценки аргументов дай 3 тактических совета:
1. На каких аргументах мне стоять твёрдо (STRONG)
2. Какие аргументы оппонента я могу оспорить (его WEAK)
3. Где мне стоит уступить или предложить компромисс

Это превращает аналитический инструмент в тактический. Ты получаешь не просто "кто сильнее", а план действий.


💡 Адаптация для внутренних решений (один актор, две опции):

Метод работает даже когда нет оппонента — просто две твои опции в конфликте.

Пример: Ты думаешь уволиться или остаться. Оформи это как "спор" между версией-себя-которая-хочет-уйти и версией-которая-хочет-остаться.

СТРУКТУРА:

Факты, согласованные обеими "сторонами":
- Работаю 2 года в компании
- Зарплата 120к, рынок 140-160к
- Есть оффер от конкурента за 150к

Требования "версии-уйти":
- Принять оффер, расти дальше

Требования "версии-остаться":
- Попросить повышение до 150к здесь

Аргументы "версии-уйти":
- Новая компания — новые вызовы
- +30к — это серьёзно
- Здесь потолок зарплаты виден

Аргументы "версии-остаться":
- Знаю процессы, не нужна адаптация
- Коллектив классный
- Через год возможен рост до тимлида

---

Оцени аргументы. Определи более сильную позицию.

Это структурирует мысли и убирает эмоции из решения. Видишь голую логику.

🔗

Ресурсы

DRAssist: Dispute Resolution Assistance using Large Language Models Sachin Pawar, Manoj Apte, Girish K. Palshikar, Basit Ali, Nitin Ramrakhiyani TCS Research, Tata Consultancy Services Limited, Pune, India

Статья опубликована в 2024. Авторы разработали систему для помощи в разрешении споров с использованием LLM, протестировали на реальных делах из NCDRC (Индия) и WIPO (международные доменные споры).


📋 Дайджест исследования

Ключевая суть

Обнаружено: LLM выбирает в споре не сильную сторону, а громкую — кто больше написал или эмоциональнее выразился. Точность прыгает от 44% до 71% в зависимости от формулировки. DRAssist позволяет получать обоснованные решения в конфликтах — не угадывание победителя, а детальный разбор силы каждого аргумента. Фишка: не спрашивай сразу "кто прав?" — сначала оцени каждый аргумент как STRONG или WEAK, потом реши по каждому требованию (принято/отклонено), и только в финале — общий вывод. Точность подскакивает до 80% vs 44-71% при прямом вопросе.

Принцип работы

Не давай модели один сложный вопрос «кто прав в споре?» — раздели на серию простых: этот аргумент сильный? это требование обосновано? Модель сначала оценивает каждый аргумент обеих сторон по критериям (есть ли факты? логично? есть прецеденты?), потом принимает решение по каждому требованию отдельно, и только в конце — общий вывод через баланс сильных и слабых аргументов. Все шаги в одном промпте, но последовательно — сначала простые оценки, потом финальное заключение на их основе.

Почему работает

LLM плохо справляются с субъективными оценками когда нужно взвесить две позиции целиком. Спросишь напрямую — модель либо угадывает, либо цепляется за тональность текста (кто активнее жалуется). Но LLM отлично применяют критерии к конкретным утверждениям. Дай чёткие критерии («есть ли факты?», «логично ли?») и попроси оценить каждый аргумент отдельно — модель справится гораздо лучше. Метод использует эту сильную сторону: создаёт промежуточные выводы (баланс сильных/слабых аргументов), снижает вероятность случайного выбора, добавляет прозрачность — ты видишь ход рассуждений. Проверено на 455 реальных спорах (автостраховые и доменные конфликты).

Когда применять

Споры где нужно взвесить силу позиций обеих сторон → конкретно для конфликтов продавец-покупатель (возвраты, претензии по качеству), партнёрских разногласий (кто не выполнил условия), внутренних споров в команде (распределение ответственности), особенно когда каждая сторона уверена что права. НЕ подходит для юридических решений требующих знания нюансов толкования законов — это помощник для подготовки позиции, не финальный вердикт.

Мини-рецепт

1. Структурируй спор: выдели факты (согласованные обеими сторонами), точки разногласия, требования каждой стороны, аргументы каждой стороны. Можно сделать отдельным промптом: Структурируй спор из этой переписки: [текст]. Выдели факты, разногласия, требования и аргументы обеих сторон
2. Задай критерии оценки: сильный аргумент = подтверждается фактами + логически связный + опирается на правила/нормы/прецеденты
3. Попроси оценить каждый аргумент: формат STRONG/WEAK с кратким обоснованием
4. Попроси решение по каждому требованию: ACCEPTED/REJECTED на основе силы соответствующих аргументов
5. Попроси общий вывод: определить более сильную сторону через баланс сильных и слабых аргументов
6. Для снижения перекоса: используй связку из 2-3 моделей (GPT + Claude + Mistral) и сравни выводы — если все сошлись, вероятность случайного выбора ниже

Примеры

[ПЛОХО] : Вот переписка между мной и покупателем по возврату товара. Кто прав в этом споре?
[ХОРОШО] : Проанализируй спор. ФАКТЫ согласованные обеими сторонами: [список]. ТОЧКИ РАЗНОГЛАСИЯ: продавец утверждает X, покупатель утверждает Y. ТРЕБОВАНИЯ покупателя: [список]. АРГУМЕНТЫ покупателя: [список]. ТРЕБОВАНИЯ продавца: [список]. АРГУМЕНТЫ продавца: [список]. ИНСТРУКЦИЯ: 1) Оцени каждый аргумент как STRONG или WEAK (критерии: подтверждается фактами, логичен, опирается на правила). 2) Для каждого требования определи ACCEPTED или REJECTED. 3) Определи более сильную сторону через баланс аргументов. ФОРМАТ: [аргумент]: [STRONG/WEAK] — [обоснование]
Источник: DRAssist: Dispute Resolution Assistance using Large Language Models
ArXiv ID: 2509.01962 | Сгенерировано: 2026-01-12 01:22

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с