3,583 papers
arXiv:2510.11217 72 13 окт. 2025 г. PRO

RAGen: генерация тренировочных данных для адаптации RAG через концепты документов

КЛЮЧЕВАЯ СУТЬ
Парадокс: Стандартная генерация вопросов по документам даёт 80% примитива уровня 'Что такое X?' и 'Где написано Y?'. Причина — LLM видит только кусок текста, не может связать информацию из разных частей. RAGen позволяет генерировать глубокие вопросы, требующие понимания связей между секциями документа. Фишка: сначала выдели глобальные концепты всего документа, потом собери доказательства из 2-3 разных мест, потом генерируй вопросы. Вместо поверхностных 'запоминаний' получаешь вопросы уровня анализа, оценки, создания по таксономии Блума — от 20% до 60% сложных вопросов.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с