3,583 papers
arXiv:2602.07815 72 8 фев. 2026 г. PRO

VLM для определения возраста по фото: ChatGPT точнее специализированных сервисов

КЛЮЧЕВАЯ СУТЬ
Парадокс: ChatGPT и Gemini определяют возраст по фотографии точнее специализированных сервисов для распознавания лиц. Бенчмарк на 34 моделях показал: VLM ошибаются на 5.6 лет, специализированные — на 9.9 лет. Лучший Gemini Flash (4.3 года) опережает лучшую узкую модель MiVOLO (5.1) на 15%. Метод позволяет определять возраст людей на фото через обычный ChatGPT/Claude/Gemini — без специализированных платных сервисов. Фишка: VLM анализируют не только лицо, но весь контекст — одежду (школьная форма → подросток, деловой костюм → взрослый), окружение (детская площадка, офис, клуб), аксессуары (соска, очки, седина). Узкоспециализированные модели видят только морщины и форму черт лица — они путают 3-летних с 8-летними и занижают возраст пожилых на 10-15 лет. Холистическое восприятие побеждает узкий фокус.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с