TrackRec: итеративная альтернативная обратная связь с цепочкой рассуждений через выравнивание предпочтений для рекомендаций
КЛЮЧЕВАЯ СУТЬ
Обнаружено: LLM катастрофически плохи в прямых рекомендациях — они либо игнорируют контекст, либо выдают общие банальности, потому что пытаются сразу выдать ответ, не формализовав понимание предпочтений. TrackRec позволяет получать персонализированные рекомендации (фильмы, туры, контент, идеи) с точностью, которая ранее требовала fine-tuning модели. Метод разбивает запрос на два явных шага: сначала модель анализирует историю и создаёт RecCoT (Recommendation Chain-of-Thought) — структурированное резюме предпочтений, затем использует это резюме для рекомендации. Вместо «посоветуй мне фильм» → «проанализируй мои 10 просмотров и сформулируй мой вкус, затем предложи фильм на основе этого анализа» — точность рекомендаций вырастает на 23-40% в зависимости от задачи.