3,583 papers
arXiv:2508.21561 86 29 авг. 2025 г. PRO

InsightTab: дистилляция данных в правила для few-shot классификации

КЛЮЧЕВАЯ СУТЬ
Проблема: LLM тонут в табличных данных. Покажи 50 примеров транзакций — модель запутается. Покажи 5 — упустит закономерности. Числа и категории для неё как иностранный язык без словаря. InsightTab позволяет научить LLM классификации табличных данных (банковские транзакции, медкарты, оттоки клиентов) через малое количество примеров (16-128 штук), без дообучения. Метод превращает сырые данные в текстовые правила. Группирует похожие примеры → извлекает закономерности из каждой группы → добавляет правила из ошибок на сложных случаях. Прикол: 5 правил заменяют 50 примеров — модель видит суть, а не детали. Точность растёт на 20-50% vs просто показ примеров.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с