Cohere выпускает модель Aya Vision: лучший ИИ в своем классе

Новости

Введение в Aya Vision

Cohere, стартап в области искусственного интеллекта, представил новую модель Aya Vision, которая позиционируется как лучшая в своем классе. Эта мультимодальная модель способна выполнять такие задачи, как создание подписей к изображениям, ответы на вопросы о фотографиях, перевод текста и генерация резюме на 23 основных языках.

Технические особенности

Cohere предлагает Aya Vision в двух версиях: Aya Vision 32B и Aya Vision 8B. Более мощная из них, Aya Vision 32B, превосходит модели в два раза больше, включая Meta’s Llama-3.2 90B Vision. Aya Vision 8B также показывает лучшие результаты в сравнении с моделями, в десять раз превышающими его по размеру.

  • Версия Aya Vision 32B превосходит вдвое большую модель конкурентов.
  • Версия Aya Vision 8B превосходит модели, большие в десять раз.

Использование синтетических аннотаций

Модель Aya Vision тренируется на основе синтетических аннотаций, что снижает затраты ресурсов. Эта стратегия также применима к другим крупным игрокам, таким как OpenAI, и поддерживается аналитиками, которые прогнозируют, что 60% данных для проектов в области ИИ и аналитики к концу 2024 года будут синтетическими.

Доступность и лицензирование

Обе версии Aya Vision доступны через платформу Hugging Face под лицензией Creative Commons 4.0. Однако их использование в коммерческих целях запрещено. Модель предоставляется бесплатно через WhatsApp, что, по словам разработчиков, делает технические прорывы более доступными для исследователей.

Новые горизонты в оценке AI

Вместе с Aya Vision, компания выпустила набор бенчмарков AyaVisionBench, который тестирует способности моделей на задачах, сочетающих зрение и язык, например, определение различий между изображениями и преобразование снимков экрана в код.

«[T]he dataset serves as a robust benchmark for evaluating vision-language models in multilingual and real-world settings.» — отмечают исследователи Cohere. Они уверены, что AyaVisionBench предоставляет широкий и сложный каркас для оценки кросс-язычного и мультимодального понимания моделей.

Историческая перспектива и будущее развитие

По мере того как технологии в области ИИ продолжают развиваться, лидерство в таких аспектах, как производительность и доступность, играет ключевую роль в создании устойчивого будущего для дальнейших исследований.

admin
Оцените автора
CheatGPT
Добавить комментарий