3,583 papers
arXiv:2508.03529 88 5 авг. 2025 г. PRO

Marito: структурирование и создание открытых многоязычных терминологий для южноафриканского NLP

КЛЮЧЕВАЯ СУТЬ
Обнаружено: LLM катастрофически слабы в узкоспециализированных доменах — модель знает общие паттерны языка, но не знает вашего корпоративного жаргона, редких терминов или специфических названий. Метод позволяет получать точные ответы в узких областях (юриспруденция, медицина, внутренний корпоративный контекст) без дообучения модели. Вы даёте модели "шпаргалку" прямо в промпте — глоссарий терминов, определения, список понятий. Модель перестаёт додумывать и начинает следовать справочникуточность перевода специализированных текстов выросла в 2-3 раза (BLEU с 15 до 45, chrF++ с 30 до 70).
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с