3,583 papers
arXiv:2508.18783 78 26 авг. 2025 г. PRO

Theme Detection: категоризация текстов с управляемой детализацией

КЛЮЧЕВАЯ СУТЬ
При категоризации текстов большинство проваливается на одном: либо категории слишком общие («Управление аккаунтом» — бесполезно для анализа), либо слишком дробные («Сброс пароля iOS версии 3.2.1» — данные раздроблены). Метод Theme Detection позволяет калибровать уровень детализации категорий под конкретную задачу — не фиксированный, а подстраиваемый. Фишка: показываешь модели пары-примеры — «эти два вопроса ДОЛЖНЫ быть в одной теме» (should-link) и «эти два НЕ должны» (cannot-link). Модель понимает границу между «похоже, но разное» и «разное, но одно». Результат: нужный уровень обобщения вместо произвольного.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с