Введение в Aya Vision
Cohere, стартап в области искусственного интеллекта, представил новую модель Aya Vision, которая позиционируется как лучшая в своем классе. Эта мультимодальная модель способна выполнять такие задачи, как создание подписей к изображениям, ответы на вопросы о фотографиях, перевод текста и генерация резюме на 23 основных языках.
Технические особенности
Cohere предлагает Aya Vision в двух версиях: Aya Vision 32B и Aya Vision 8B. Более мощная из них, Aya Vision 32B, превосходит модели в два раза больше, включая Meta’s Llama-3.2 90B Vision. Aya Vision 8B также показывает лучшие результаты в сравнении с моделями, в десять раз превышающими его по размеру.
- Версия Aya Vision 32B превосходит вдвое большую модель конкурентов.
- Версия Aya Vision 8B превосходит модели, большие в десять раз.
Использование синтетических аннотаций
Модель Aya Vision тренируется на основе синтетических аннотаций, что снижает затраты ресурсов. Эта стратегия также применима к другим крупным игрокам, таким как OpenAI, и поддерживается аналитиками, которые прогнозируют, что 60% данных для проектов в области ИИ и аналитики к концу 2024 года будут синтетическими.
Доступность и лицензирование
Обе версии Aya Vision доступны через платформу Hugging Face под лицензией Creative Commons 4.0. Однако их использование в коммерческих целях запрещено. Модель предоставляется бесплатно через WhatsApp, что, по словам разработчиков, делает технические прорывы более доступными для исследователей.
Новые горизонты в оценке AI
Вместе с Aya Vision, компания выпустила набор бенчмарков AyaVisionBench, который тестирует способности моделей на задачах, сочетающих зрение и язык, например, определение различий между изображениями и преобразование снимков экрана в код.
«[T]he dataset serves as a robust benchmark for evaluating vision-language models in multilingual and real-world settings.» — отмечают исследователи Cohere. Они уверены, что AyaVisionBench предоставляет широкий и сложный каркас для оценки кросс-язычного и мультимодального понимания моделей.
Историческая перспектива и будущее развитие
По мере того как технологии в области ИИ продолжают развиваться, лидерство в таких аспектах, как производительность и доступность, играет ключевую роль в создании устойчивого будущего для дальнейших исследований.








