3,583 papers
arXiv:2504.04377 80 1 апр. 2025 г. PRO

PolyGuard - многоязычный инструмент модерации безопасности для 17 языков.

КЛЮЧЕВАЯ СУТЬ
Исследователи создали МНОГОЯЗЫЧНУЮ СИСТЕМУ МОДЕРАЦИИ для определения опасного контента в диалогах с LLM на 17 языках. Главное открытие: все системы безопасности, включая их собственную, значительно теряют эффективность при столкновении с промптами, где смешаны несколько языков. Это означает, что CODE-SWITCHING (переключение между языками в одном тексте) создает слепые зоны в системах модерации.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с