Новая языковая модель от Contextual AI побеждает GPT-4o

Новости

Contextual AI представила свою новую языковую модель (GLM), заявляя, что она превосходит текущие AI системы от Google, Anthropic и OpenAI по ключевым показателям правдивости.

Фактическая точность: новое нужное явление

Стартап, основанный пионерами технологии генерации, дополненной извлечением данных (RAG), сообщает, что его GLM достигла 88% в фактичности, на что конкуренты от Google, Anthropic и OpenAI могут похвастаться всего лишь 84,6%, 79,4% и 78,8% соответственно.

  • Google’s Gemini 2.0 Flash — 84.6%
  • Anthropic’s Claude 3.5 Sonnet — 79.4%
  • OpenAI’s GPT-4o — 78.8%

Почему важна высокая точность?

Модели, с запутанной фактической достоверностью, часто называемые галлюцинациями, остаются критической задачей для внедрения в предприятия. Contextual AI стремится решить эту проблему и предлагает модель, оптимизированную специально для задач с высокой потребностью в точности.

Если вы решаете задачу RAG в строго регулируемой отрасли, никаких галлюцинаций не должно быть, — поясняет Доуве Киела, CEO и сооснователь Contextual AI.

GLM и концепция «заземленности»

Понятие «заземленности», или доведение ответов AI до строго соответствующих заданным данным, становится ключевым требованием для систем AI в таких отраслях, как финансы, здравоохранение и телекоммуникации. KIela добавляет:

Само умение сказать «Я не знаю» очень важно в корпоративных настройках.

Расширенные возможности RAG 2.0

Contextual AI развивает свою платформу с применением «RAG 2.0», которая идет дальше простого соединения готовых компонент. Компания использует смешанные методы извлечения и оптимизирует все элементы системы совместно.

От сложного текста до данных и диаграмм

Платформа Contextual AI теперь поддерживает многомодальное содержание, включая диаграммы и структурированные данные из различных популярных платформ. Основатель отмечает:

Большинство самых интересных проблем находятся на пересечении структурированных и неструктурированных данных.

Контекстуальному AI прокладывает дорогу в будущее

В ближайших планах компании развертывание специализированного компонента реранкинга и дальнейшее расширение возможностей понимания документов.

admin
Оцените автора
CheatGPT
Добавить комментарий