TL;DR
SemanticZip — техника сжатия длинного контекста в компактный символьный код. Вместо "полного описания проекта на 3000 слов" — структурированный шифр из аббревиатур, который LLM расшифровывает самостоятельно. Главный принцип: модель уже знает, что значит "4d", "бюджет умеренный", "без аренды авто" — ей не нужен полный текст, если контекст предсказуемый.
Главная находка: у LLM есть встроенные знания о шаблонных ситуациях — путешествия, проекты, технические задачи. Это значит, что предсказуемую часть контекста можно сократить до аббревиатур без потери смысла. Но один и тот же подход не работает для всего: точные числа, медицинские факты, юридические ограничения — модель может "додумать" их неверно.
Суть метода: контекст разбивается на два канала — PROTECTED (точное, критичное, что нельзя потерять) и LOSSY (предсказуемое, низкорисковое, что можно сжать). Для PROTECTED пишешь точно. Для LOSSY — компактный символьный код с заранее определёнными аббревиатурами. LLM принимает оба канала и работает с ними правильно.
Схема метода
ШАГ 1: Определить что критично → попадает в @SAFE{}
(точные числа, жёсткие ограничения, аллергии, бюджетный потолок)
ШАГ 2: Определить что предсказуемо → попадает в @SZIP{}
(стиль работы, предпочтения, типовые форматы, контекст проекта)
ШАГ 3: Создать словарь аббревиатур @DICT/
(один раз — используешь во всех чатах по этому проекту)
ШАГ 4: Собрать всё в один блок → вставить в начало нового чата
Все шаги — ручная подготовка. В чат вставляется готовый блок одним сообщением.
LLM разворачивает смысл автоматически при чтении.
Пример применения
Задача: Ты фаундер B2B SaaS для автоматизации отчётности. Каждый раз начинаешь новый чат с ChatGPT/Claude и тратишь 10 минут на объяснение продукта — кто ты, что за продукт, для кого, какой тон, какие ограничения. Решение: сжать контекст в блок на полшага задачи.
Промпт:
@DICT/PROJ: SMB=малый и средний бизнес; RS=российский сегмент;
B2B=корпоративные продажи; MVP=минимальный жизнеспособный продукт;
1C=1С:Бухгалтерия; tone.exec=деловой без пафоса;
no-jargon=без технических терминов для клиента
@SAFE{
product_name: "ОтчётМастер";
price_range: 4900–19900 руб/мес;
target: бухгалтер или финдир в SMB RS;
hard_limit: не обещать интеграции которых нет (нет SAP, нет Битрикс24);
legal: не говорить "гарантируем возврат налогов"
}
@SZIP{
STAGE:MVP+6мес MARKET:RS/SMB COMP:таблицы Excel+1С
USP:автоотчёт/30мин→3мин NO:enterprise,crm,startup
TONE:tone.exec,no-jargon OUT:короткий текст, потом правки
}
Задача: напиши landing-заголовок и 3 буллета с выгодами для главной страницы.
Аудитория — главбух в компании 20–100 человек.
Результат: Модель прочитает оба блока и сразу начнёт с задачи — без уточняющих вопросов про продукт. В @SAFE она найдёт точные данные: цену, имя продукта, жёсткие ограничения. В @SZIP — расшифрует аббревиатуры через словарь и поймёт контекст: стадия, рынок, тон, запреты. На выходе — заголовок и буллеты в нужном стиле, без фраз про SAP и без обещаний гарантий.
Почему это работает
LLM плохо держит длинный контекст. Когда ты вставляешь три абзаца про продукт — модель читает их, но детали размываются. К тому же длинный контекст = больше токенов = дороже и медленнее при API, а в чате быстро добирается до лимита окна.
LLM хорошо заполняет пропуски в предсказуемых сценариях. "MVP+6мес" — модель знает что это. "tone.exec" с расшифровкой в словаре — запомнит. Аббревиатуры работают как горячие клавиши: одно слово активирует целый паттерн знаний.
Метод разделяет риски. Критичное — пишешь точно в @SAFE, и модель не "додумает". Предсказуемое — сжимаешь в @SZIP, и получаешь 40–46% экономию токенов. Словарь @DICT/ делает код воспроизводимым: определил один раз — используешь в 50 чатах.
Рычаги управления: - Размер @SAFE — чем больше туда положишь, тем надёжнее, но больше токенов. Клади только то, что нельзя потерять. - Детализация @DICT/ — больше расшифровок = меньше ошибок. Стоит пополнять словарь когда модель неправильно поняла аббревиатуру. - Стиль @SZIP — ASCII-аббревиатуры работают надёжнее, чем эмодзи. "NO:car" лучше "🚗❌".
Шаблон промпта
@DICT/{тема_проекта}: {аббревиатура_1}={расшифровка_1};
{аббревиатура_2}={расшифровка_2};
{аббревиатура_тона}={описание_тона}
@SAFE{
название: "{точное_название}";
ключевые_числа: {конкретные_цифры};
целевая_аудитория: {точное_описание};
запреты: {что_нельзя_говорить_или_обещать}
}
@SZIP{
ЭТАП:{стадия} РЫНОК:{рынок} КОНКУРЕНТ:{с_чем_конкурируем}
USP:{главное_преимущество} NO:{что_не_делаем}
ФОРМАТ:{формат_ответа}
}
Задача: {конкретный_запрос}
Что подставлять:
- {тема_проекта} — PROJECT, BRAND, WORK и т.п., любое короткое имя
- @SAFE{} — только то, что модель не должна интерпретировать свободно: числа, имена, запреты
- @SZIP{} — всё что модель "додумает" правильно по контексту: стиль, предпочтения, типовые форматы
- @DICT/ — определяй аббревиатуры которые используешь в @SZIP
🚀 Быстрый старт — вставь в чат:
Помоги мне создать сжатый контекст-блок для проекта по методу SemanticZip.
Задавай вопросы, чтобы заполнить поля. Моя задача: {твой_проект}.
[вставить шаблон выше]
LLM спросит что критично и защищено (для @SAFE), что предсказуемо (для @SZIP), какие аббревиатуры нужны (для @DICT/) — потому что метод требует явного разделения информации по каналам. Она возьмёт структуру из шаблона и соберёт готовый блок под твой проект.
Ограничения
⚠️ Пилотное исследование: Результаты получены на 5 авторских кейсах. Статистических гарантий нет — это демонстрация принципа, не доказанный стандарт.
⚠️ Эмодзи ненадёжны: Символы типа 🚗, 👁️, 📚 модель расшифровывает непредсказуемо — "просмотр", "вид", "вечерняя активность" вместо "смотровая площадка". ASCII-аббревиатуры работают стабильнее.
⚠️ Критичное нельзя сжимать: Точные суммы, медицинские ограничения, юридические запреты, редкие сущности — только в @SAFE. Если потеряется при "разворачивании" — последствия серьёзнее, чем не сэкономить токены.
⚠️ Нет сравнения с конкурентами: Методы типа LLMLingua делают похожее автоматически. SemanticZip — ручной подход. Авторы честно признают: сравнение не проводилось.
⚠️ Первый запуск дороже: Словарь @DICT/ стоит токенов. Окупается только если используешь один контекст в многих чатах.
Как исследовали
Исследователи из Embedded Intelligence Lab взяли 5 авторских кейсов — путешествие, генерация JS-кода, Python-скрипт, React-дашборд, описание исследования — и вручную создали по 6 версий каждого в разных форматах: обычная проза, JSON, два варианта CCL и два варианта SemanticZip. Потом отдельная LLM (gpt-4o-mini, температура 0) без подсказок восстанавливала смысловые "атомы" из каждого сжатого варианта — и авторы считали сколько атомов восстановилось верно.
Главный сюрприз: структурированная проза оказалась лучше всего по точности восстановления. Это ожидаемо — натуральный язык родной для LLM. Неожиданно, что JSON расширяет текст под новым токенизатором OpenAI из-за кавычек и скобок. И совсем неочевидно — эмодзи проиграли ASCII и по сжатию, и по точности одновременно. Авторы предполагают: ASCII-аббревиатуры сохраняют лексические якоря ("4d", "OUT"), а эмодзи слишком многозначны — модель интерпретирует 👁️ то как "вид", то как "смотровая площадка", то как "слежка".
Важная оговорка: авторы сами создавали кейсы, сами размечали атомы и сами определяли пороги совпадения. Это честно описано — исследование называет себя "пилотом", не бенчмарком.
Адаптации и экстраполяции
🔧 Техника: Накапливаемый словарь проекта
Создай отдельный документ с @DICT/ для каждого долгосрочного проекта. После каждого удачного чата — добавляй новые аббревиатуры которые сработали. Через 10 сессий у тебя готовый "язык" проекта на 30–50 токенов, который LLM понимает точно.
В начале:
@DICT/BRAND: RS=российский рынок; SMB=малый бизнес
После 5 чатов: добавилcomp.voice=голос бренда как у Т—Ж,short.b2b=короткий без воды для ЛПР
Результат: контекст стал плотнее, ошибки реже
🔧 Техника: ASCII-шаблоны для повторяющихся задач
Если каждую неделю делаешь одно и то же — разбор продаж, ревью текстов, планирование спринта — сделай один раз @SZIP под эту задачу. Меняй только переменные:
@SZIP{TASK:review_copy PROD:Х5 W:3 TONE:прямой,без-воды
OUT:булл+правки NO:похвала FORMAT:маркд}
Ресурсы
SemanticZip: A Pilot Framework for Lossy Text Compression with LLMs as Semantic Decompressors
Natalia Trukhina, Vadim Vashkelis
Embedded Intelligence Lab (EMILAB), май 2026
Связанное от тех же авторов: Compress the Context, Keep the Commitments (Context Codec — более консервативный предшественник SemanticZip)
Упомянутые методы-конкуренты: LLMLingua, LongLLMLingua, Selective Context
