3,583 papers
arXiv:2510.09599 77 10 окт. 2025 г. PRO

P-TTS: создание датасетов через вариации промптов вместо сбора тысяч примеров

КЛЮЧЕВАЯ СУТЬ
Парадокс: не собирать 1000 новых задач для датасета, а обернуть 90 старых в разные промпты — модель показывает 73.3% vs 56.7% на AIME2024. P-TTS (Prompting Test-Time Scaling) позволяет создавать мощные обучающие датасеты без сбора тысяч примеров — берёшь одну задачу и оборачиваешь в 10 разных фреймов: "Я дам $200,000 за отличное решение", "Ты будешь наказан за ошибку", "Думай пошагово". Каждая обёртка извлекает свой аспект рассужденийReward запускает тщательную верификацию, Penalty делает акцент на проверку граничных случаев, Step-by-Step направляет на явную декомпозицию. При дообучении модель учится комбинировать все подходы — в 25 раз меньше задач, а результат лучше.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с