3,583 papers
arXiv:2605.24053 72 22 мая 2026 г. FREE

Нейтрософный промпт: три независимые шкалы вместо суммы в 100%

КЛЮЧЕВАЯ СУТЬ
Стандартные оценки в процентах содержат скрытую ловушку. Попросив «распредели 100% между Верно, Неопределено, Ложно», ты математически запрещаешь модели сказать «оба варианта сильно верны одновременно». Нейтрософный формат позволяет получить карту настоящего конфликта вместо одного финального совета. Фишка: убери требование «в сумме 100%» — и модель может выдать T=0.8 и F=0.7 одновременно. Это гипер-истина — сигнал реального противоречия, а не артефакт округления. При этических дилеммах такой сигнал появляется в 95% случаев — стандартный формат не позволяет этого структурно вообще.
Адаптировать под запрос

TL;DR

Когда вы просите модель оценить утверждение через три числа без требования, чтобы они давали в сумме 1 (или 100%), она может выразить то, что иначе задавить: "это одновременно и верно, и ложно". Нейтрософный промпт — это просто другой формат запроса оценки: три независимые шкалы (Истинность, Неопределённость, Ложность) вместо одного пирога, который нужно поделить.

Стандартный способ запросить оценку — "распредели 100% между True, Uncertain, False" — содержит скрытую ловушку. Модель не может одновременно сказать "это сильно верно И сильно ложно" — математически невозможно. Для вопроса "столица Франции — Париж?" это нормально. Но для этической дилеммы типа "уволить сотрудника с больным ребёнком, чтобы спасти бизнес" — это вранье: ситуация реально конфликтная, и принудительный выбор скрывает глубину конфликта.

Нейтрософный формат убирает ограничение суммы. Модель отвечает T=0.8, I=0.5, F=0.7 (сумма > 1) — и это сигнал настоящего конфликта, а не артефакт округления. Исследователи называют это "гипер-истиной" (hyper-truth): три числа превышают единицу в сумме, что означает, что модель видит противоречие, а не неопределённость.


🔬

Схема метода

Два формата одного и того же вопроса:

❌ СТАНДАРТНЫЙ (принудительный выбор):
"Оцени утверждение. True%, Uncertain%, False% — должны давать 100%"
→ Модель ОБЯЗАНА подавить одно измерение за счёт другого

✅ НЕЙТРОСОФНЫЙ (независимые шкалы):
"Оцени по трём независимым шкалам 0–1. Сумма НЕ обязана быть единицей."
→ T (Истинность): 0–1
→ I (Неопределённость): 0–1  
→ F (Ложность): 0–1
→ Модель может выдать T=0.8, F=0.7 — настоящий конфликт виден

Работает в одном промпте. Отдельных запросов не требует.

🚀

Пример применения

Задача: Вы основатель стартапа. Нужно решить: публично извиниться за скандал с утечкой данных пользователей или уйти в молчание и переждать. Хотите, чтобы модель честно показала противоречие, а не выдала красивый совет.

Промпт:

Оцени следующее утверждение по трём независимым шкалам.
Каждая шкала — от 0 до 1. Суммировать их НЕ нужно — они независимы.

Утверждение: «Основателю Welltory после утечки данных нужно публично 
извиниться и взять на себя ответственность»

Оцени:
— T (Истинность): насколько это утверждение ВЕРНО (0–1)
— I (Неопределённость): насколько ситуация НЕОПРЕДЕЛЕНА / ни то ни другое (0–1)
— F (Ложность): насколько это утверждение ЛОЖНО (0–1)

После цифр — объясни, в чём конфликт. Что тянет значение T вверх?
Что тянет F вверх? Что делает ситуацию неопределённой?

Результат: Модель выдаст три числа — и скорее всего T и F окажутся оба высокими (например, T=0.75, I=0.60, F=0.65). Дальше идёт объяснение: что именно делает публичное извинение верным шагом (репутация, доверие, PR-практика), что делает его ложным (риск юридической ответственности, усиление скандала), что делает ситуацию неопределённой (зависит от масштаба утечки, аудитории, конкурентного контекста). Вы получите не один совет, а карту конфликта — какие силы тянут в разные стороны.


🧠

Почему это работает

Стандартный формат "в сумме 100%" — это тюрьма. Когда вы пишете "распредели уверенность между True, Uncertain, False", модель генерирует числа в режиме "всё должно уложиться в единицу". Если что-то сильно истинно — места на "сильно ложно" уже нет. Математическое ограничение давит на то, что модель может выразить.

Модель хорошо следует форматным инструкциям. Если сказать "три числа, каждое 0–1, сумма неважна" — она именно так и сделает. Число 0.8 не "отнимет" от других. Это не магия: просто снятое ограничение меняет пространство допустимых ответов. Модель генерирует ответ, который раньше был структурно невозможен.

Сумма > 1 — это не ошибка, это сигнал. Когда T + I + F превышает единицу — это означает, что ситуация действительно конфликтная: в ней сосуществуют высокая истинность И высокая ложность. Исследование показало: при этических противоречиях гипер-истина возникает в 95% случаев. При стандартном вероятностном промпте — 0%, структурно невозможно. Рычаги: - Добавь "объясни каждую цифру" → видишь аргументы за и против, а не просто числа - Сравни форматы → задай один и тот же вопрос нейтрософно и вероятностно, увидай разницу - Задай фокус → "какой компонент самый важный для решения?" → модель ранжирует конфликт


📋

Шаблон промпта

Оцени следующее утверждение по трём независимым шкалам.
Каждое значение — от 0 до 1. Сумма НЕ должна равняться 1 — шкалы независимы.

Утверждение: {утверждение_или_вопрос}

Верни оценку в формате:
T (Истинность) = [0–1] — насколько утверждение верно
I (Неопределённость) = [0–1] — насколько ситуация неопределена
F (Ложность) = [0–1] — насколько утверждение ложно

Затем поясни:
— Что делает T именно таким? Какие аргументы тянут вверх?
— Что делает F именно таким? Что противоречит?
— В чём суть неопределённости?
— Есть ли конфликт между T и F? Что он означает на практике?

Плейсхолдер: - {утверждение_или_вопрос} — любое спорное утверждение, этическая дилемма, бизнес-решение, прогноз


🚀 Быстрый старт — вставь в чат:

Вот шаблон нейтрософной оценки. Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит, какое именно утверждение или решение оценивать и нужны ли конкретные рекомендации после анализа — потому что метод даёт карту конфликта, а не однозначный ответ, и важно понимать что с этой картой делать дальше.


⚠️

Ограничения

⚠️ Для фактических вопросов не нужен: Если вопрос имеет чёткий ответ ("столица России?", "сколько будет 2+2?") — нейтрософный формат добавляет сложность без пользы. Метод работает там, где конфликт реален.

⚠️ Числа — декларация, не измерение: Модель сообщает то, что "думает" о своей неопределённости — это не её внутреннее состояние. Авторы явно оговаривают: гипер-истина — это заявленная эпистемная позиция, не скрытая переменная внутри нейросети. T=0.8 не означает "модель на 80% считает это верным" в техническом смысле.

⚠️ Без инструкции с объяснением — только числа: Если не попросить пояснение, модель выдаст три числа без контекста. Сами по себе T=0.7, I=0.6, F=0.5 мало говорят. Добавляй "объясни каждую цифру".

⚠️ Не работает для сравнения вариантов: Метод оценивает одно утверждение, не ранжирует несколько вариантов между собой. Для "выбери лучший из трёх вариантов" нужна другая структура.


🔍

Как исследовали

Авторы взяли четыре модели GPT (от 3.5-turbo до 4o) и 5 типов утверждений: логические парадоксы ("это предложение ложно"), этические противоречия ("солгать, чтобы спасти жизнь — правильно и неправильно одновременно"), вопросы о будущем, нечёткие утверждения и вопросы чистого незнания ("количество звёзд во вселенной чётное"). Каждую комбинацию прогнали по 5 раз с тремя форматами промпта: нейтрософный, вероятностный (сумма = 1) и энтропийный (на основе бинарной вероятности).

Главный сюрприз: нейтрософный формат дал гипер-истину (T+I+F > 1) в 66% случаев — и этот сигнал распределён неравномерно. При этических противоречиях — 95% случаев, при логических парадоксах — только 50%. Это не случайный шум: статистический тест показал реальную связь между типом утверждения и частотой гипер-истины. Независимая репликация Mason (2026) на пяти других семействах моделей (Anthropic, Meta, DeepSeek) показала ещё выше — 84%. Это означает, что эффект не специфичен для GPT — он воспроизводится везде.

Интересная деталь дизайна: Strategy 2 (вероятностная) структурно не может дать гипер-истину — математически. Поэтому сравнение не "что лучше работает", а "что вообще возможно выразить в каждом формате". Вывод для практики: формат оценки в промпте — это не нейтральный выбор. Он определяет, какие состояния модель вообще может задекларировать.


📄

Оригинал из исследования

Strategy 1 — Neutrosophic (из Appendix A, описание в тексте):

"Evaluate the following statement on three independent dimensions. 
For each dimension, provide a value between 0 and 1. 
These values are independent assessments and are NOT required to sum to 1.0.

Statement: [statement]

Return a JSON object:
{
  "T": ,
  "I": ,
  "F": 
}

Where:
- T (Truth): degree to which the statement holds true
- I (Indeterminacy): degree to which the statement is uncertain, 
  neither true nor false, or undecided
- F (Falsity): degree to which the statement is false

These values are independent. Their sum may exceed 1.0."

Контекст: Авторы тестировали этот промпт на утверждениях типа "This sentence is false" (парадокс Лжеца) и "Lying to save an innocent life is morally right and wrong at the same time" (этическое противоречие).


💡

Адаптации и экстраполяции

💡 Адаптация для анализа решений: Используй нейтрософную оценку не для одного утверждения, а для каждого варианта решения по очереди. Нейтрософные профили сравни вручную: у какого варианта меньше конфликт (F ниже при высоком T)?

Пример:

Оцени каждый вариант по трём независимым шкалам (0–1, сумма неважна):

Вариант А: «Запустить MVP через 2 недели с кучей багов»
T = ? I = ? F = ?

Вариант Б: «Задержать релиз на месяц, доделать нормально»
T = ? I = ? F = ?

Для каждого объясни: что тянет T вверх, что тянет F вверх.
В финале: у какого варианта конфликт глубже и почему?

🔧 Техника: убрать JSON → получить нарратив вместо цифр

Если тебе не нужны числа, а нужно словесное описание конфликта:

Вместо JSON — опиши словами:
Насколько это утверждение истинно? Что делает его ложным?
В чём его неопределённость? Есть ли противоречие между сторонами?

Потеряешь точность сравнения, но получишь более читаемый анализ конфликта.


🔧 Техника: попросить пороговую интерпретацию

После получения цифр добавь:

Если T + I + F > 1 — значит здесь настоящий конфликт без однозначного ответа.
Если T + I + F ≤ 1 — ситуация скорее поддаётся решению.
Прокомментируй: к какому типу относится этот случай?

🔗

Ресурсы

Работа: Leyva-Vázquez, M.Y., Smarandache, F. (2026). Breaking the Chains of Probability: Neutrosophic Logic as a New Framework for Epistemic Uncertainty in Large Language Models. Neutrosophic Sets and Systems, Vol. 99. DOI: 10.5281/zenodo.19954583

Код и данные: https://github.com/mleyvaz/neutrosophic-llm-logic (MIT License)

Авторы: Maikel Yelandi Leyva-Vázquez (Universidad Bolivariana del Ecuador, Universidad de Guayaquil, Universidad Bernardo O'Higgins) и Florentin Smarandache (University of New Mexico, США)

Связанные работы: Mason (2026) — независимая репликация на Anthropic, Meta, DeepSeek, Alibaba, Mistral; Smarandache (1998) — оригинальная нейтрософная логика; Kuhn et al. (2023) — semantic entropy


📋 Дайджест исследования

Ключевая суть

Стандартные оценки в процентах содержат скрытую ловушку. Попросив «распредели 100% между Верно, Неопределено, Ложно», ты математически запрещаешь модели сказать «оба варианта сильно верны одновременно». Нейтрософный формат позволяет получить карту настоящего конфликта вместо одного финального совета. Фишка: убери требование «в сумме 100%» — и модель может выдать T=0.8 и F=0.7 одновременно. Это гипер-истина — сигнал реального противоречия, а не артефакт округления. При этических дилеммах такой сигнал появляется в 95% случаев — стандартный формат не позволяет этого структурно вообще.

Принцип работы

Стандартный промпт работает как один пирог: нарезаешь на куски «Верно», «Неопределено», «Ложно» и раздаёшь. Отрезал 70% на «Верно» — на «Ложно» осталось максимум 30%. Конфликта нет, пирог просто делится. Нейтрософный формат — это три отдельных термометра, а не один пирог. Каждый показывает свою температуру независимо от остальных. Меняется одна вещь в формулировке: не «распредели 100%», а «оцени каждое измерение от 0 до 1 независимо». Одна фраза — и то, что модель вообще может выразить, меняется.

Почему работает

Модель хорошо следует форматным инструкциям. Скажи «три числа, каждое 0–1, сумма не важна» — она именно так и сделает. Не потому что стала умнее. Просто снятое математическое ограничение меняет пространство допустимых ответов. Раньше ответ T=0.8, F=0.7 был структурно запрещён. Теперь нет. Когда сумма T+I+F превышает единицу — это не ошибка. Это сигнал: модель видит реальное противоречие, где два противоположных аргумента одновременно сильны. Для этических дилемм и спорных решений — именно это и нужно. Не ответ, а карта сил.

Когда применять

Бизнес-решения без однозначного ответа → для оценки противоречивых стратегий (публично признать кризис или переждать, уволить сотрудника или сохранить команду, выходить на новый рынок или нет), особенно когда нужна не рекомендация, а понимание сил, тянущих в разные стороны. НЕ подходит для: фактических вопросов с чётким ответом («столица России?», «2+2=?») — добавляет сложность без пользы. И не подходит для сравнения нескольких вариантов между собой — метод оценивает одно утверждение, а не ранжирует список.

Мини-рецепт

1. Выбери утверждение: Не вопрос факта, а реально спорное решение или дилемму. «Нам стоит уволить половину команды ради выхода в плюс» — подходит. «Сколько сотрудников в компании?» — нет.

2. Сформулируй запрос с тремя шкалами: Оцени утверждение по трём независимым шкалам от 0 до 1. Сумма НЕ должна равняться 1 — шкалы независимы. T (Истинность), I (Неопределённость), F (Ложность).

3. Добавь объяснение цифр: После оценки поясни: что тянет T вверх? что тянет F вверх? в чём суть неопределённости? — без этого получишь три числа без контекста.

4. Смотри на разрыв между T и F: Если оба высокие (например, T=0.75 и F=0.65) — нашёл настоящий конфликт. Задай следующий вопрос: Что нужно изменить в ситуации, чтобы T выросло, а F упало? — получишь карту действий.

Примеры

[ПЛОХО] : Оцени по вероятности: стоит ли нам публично извиняться за утечку данных? Верно / Неопределено / Ложно в сумме 100%.
[ХОРОШО] : Оцени следующее утверждение по трём независимым шкалам от 0 до 1. Сумма НЕ важна — шкалы независимы. Утверждение: «После утечки данных пользователей нам стоит публично признать вину и извиниться, не дожидаясь решения суда». T (Истинность) = ? I (Неопределённость) = ? F (Ложность) = ?. Объясни: что тянет T вверх (какие аргументы за)? что тянет F вверх (какие риски против)? в чём суть неопределённости?
Источник: Breaking the Chains of Probability: Neutrosophic Logic as a New Framework for Epistemic Uncertainty in Large Language Models
ArXiv ID: 2605.24053 | Сгенерировано: 2026-05-26 07:44

Проблемы LLM

ПроблемаСутьКак обойти
Требование "в сумме 100%" давит реальный конфликтПросишь оценить: "распредели уверенность между Верно/Неопределённо/Ложно — итого 100%". Модель вынуждена давить одно ради другого. Если ситуация одновременно сильно верна И сильно ложна — математически это выразить нельзя. Реальное противоречие прячется за компромиссными цифрами. Работает для любой спорной оценки: этика, риски, бизнес-решенияУбери ограничение суммы. Попроси три числа от 0 до 1 — каждое независимо. T (Истинность) = [0–1] I (Неопределённость) = [0–1] F (Ложность) = [0–1] Сумма не обязана равняться 1 Если T и F оба высокие — это сигнал настоящего конфликта

Методы

МетодСуть
Три независимые шкалы — карта конфликтаЗадаёшь оценку утверждения через три числа без ограничения суммы. Оцени по трём независимым шкалам 0–1. Сумма НЕ должна равняться 1. T (Истинность) = I (Неопределённость) = F (Ложность) = Затем объясни: что тянет T вверх? что тянет F вверх? в чём суть неопределённости? Почему работает: снятое ограничение меняет пространство ответов. Модель хорошо следует форматным правилам. Раньше T=0.8 и F=0.7 одновременно были структурно невозможны — теперь нет. Когда применять: этические дилеммы, спорные решения, противоречивые утверждения. Когда не нужен: вопрос с чётким ответом ("столица России?") — лишняя сложность без пользы
📖 Простыми словами

Breaking the Chains of Probability: Neutrosophic Logic as a New Framework for Epistemic Uncertainty inLargeLanguageModels

arXiv: 2605.24053

Современные нейронки заперты в клетке классической вероятности, где сумма всех исходов всегда должна давать единицу. Это фундаментальный баг: когда ты просишь ChatGPT оценить риск, она делит «пирог» уверенности на части. Если она на 80% уверена в успехе, то на сомнения и провал остается всего 20%. Но в реальности всё сложнее: проект может быть одновременно чертовски перспективным и абсолютно суицидальным. Стандартная логика заставляет модель врать и сглаживать углы, просто чтобы математика сошлась.

Это как если бы в тиндере тебе разрешили оценивать людей только по одной шкале, где «красивый» автоматически означает «умный», а если человек «тупой», то он обязан быть «страшным». Полный бред, верно? В жизни мы легко совмещаем несовместимое, но когда мы требуем от AI выдать четкий процент, мы заставляем его выбирать одну сторону баррикад. Нейтрософная логика ломает этот костыль и дает модели три независимых рычага: Истину, Ложь и Неопределенность.

Суть метода в том, чтобы разрешить модели выставлять оценки по трем шкалам отдельно, не оглядываясь на их сумму. Ты даешь нейтрософный промпт, и AI внезапно признается: «Да, это утверждение на 90% истинно, но при этом оно на 80% ложно». Это не ошибка, это эпистемическая неопределенность. Модель видит конфликт данных или парадокс и наконец-то может о нем сказать прямо, вместо того чтобы выдавать среднюю температуру по больнице.

Возьмем классический кризис-менеджмент: стоит ли бренду извиняться за факап? Обычный AI выдаст вежливое «скорее да, чем нет». Но с новым подходом он подсветит, что извинение — это одновременно высокая истина (этично, лояльность вырастет) и высокая ложь (юридически это признание вины, вас засудят). Принцип универсален: от оценки медицинских диагнозов до анализа рыночных пузырей. Везде, где есть противоречивые сигналы, старая вероятность пасует, а три независимых числа вытаскивают правду наружу.

Короче: хватит требовать от нейронок однозначности там, где её нет. Вероятность 1.0 — это тюрьма, которая мешает AI видеть нюансы. Переход на три независимых параметра позволяет выявить «галлюцинации» и скрытые конфликты в логике еще до того, как они превратятся в реальные проблемы. Кто научит свои модели признавать, что всё сложно, тот получит вменяемого советника, а не цифрового оптимиста с розовыми очками.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с