Эволюция искусственного интеллекта в Zoom: От базовых инструментов для проведения совещаний к агентской платформе продуктивности на базе LLM и SLM

Новости

Zoom стал известным брендом во времена пандемии, когда удаленная работа стала нормой практически мгновенно. Хотя компания была синонимом видеоконференций, за последние несколько лет она тихо строила сложную AI инфраструктуру с целью переопределить продуктивность на рабочем месте. Видеоконференции остаются важными и основой бизнеса Zoom, но благодаря AI, теперь есть намного больше.

Переход от встречи к достижению

Все знают, что Zoom — это технология для встреч. Но для чего назначается встреча? В деловом контексте, конечно, встреча может быть без конкретной цели, но это должны быть исключения. Встречи должны вести к чему-то, будь то задание или другая веха. «В эпоху агентивного AI технологии наконец-то достигают точки, где мы можем трансформировать встречи в достижения,» сказал главный технический директор Zoom Сьюдонг (X.D.) Хуанг в эксклюзивном интервью VentureBeat.

Сегодня Zoom объявляет агрессивную стратегию агентивного AI, включающую ряд новых услуг. Обновление вводит агентивные возможности, которые обещают трансформировать встречи из коммуникационных событий в ориентированные на действие рабочие процессы, наряду с новым AI Studio, позволяющим предприятиям создавать настраиваемых AI агентов.

Скрытая техническая эволюция агентивного AI Zoom

Перед тем как прийти в Zoom, Хуанг 30 лет работал в Microsoft над технологиями распознавания речи и сервисом Microsoft Azure OpenAI. Он перенес множество уроков, полученных в этом опыте, когда присоединился к Zoom в 2023 году. Под руководством Хуанга, Zoom тихо создавал AI архитектуру, предназначенную для обеспечения задач, а не просто для обобщения разговоров. Zoom публично объявил о партнерстве с Anthropic в мае 2023 года, но это не единственная большая языковая модель (LLM), используемая в Zoom.

В то время как Microsoft Teams в основном полагается на OpenAI через Microsoft OpenAI Azure, и Google Meet поддерживается Google Gemini, Zoom занял агностический подход к LLM. Хуанг объяснил, что когда Zoom запускал первую итерацию своего AI компаньона в 2023 году, она не основывалась ни на одной единственной LLM. Вместо этого компания начала с федеративного подхода, используя несколько LLM, включая специально разработанную маленькую языковую модель (SLM).

«Мы сотрудничаем с лучшими моделями на рынке, включая OpenAI и Anthropic, но также создали нашу собственную высоко настроенную модель с 2 миллиардами параметров,» сказал Хуанг.

AI компаньон Zoom использует федеративный подход, в котором используется меньшая модель Zoom в сочетании с более крупными, ведущими в отрасли языковыми моделями. Меньшая модель первоначально оценивает и обрабатывает входные данные, а частичные результаты затем передаются на более крупные модели для генерации окончательного ответа. Такой подход позволяет Zoom использовать как преимущества меньшей, настраиваемой модели, так и более крупных, мощных моделей, при этом снижая затраты и улучшая производительность.

Как маленькая языковая модель находится в центре агентивного AI Zoom

Возможно, самым технически интересным аспектом стратегии AI Zoom является его акцент на SLM. Вместо того чтобы следовать индустриальной тенденции по созданию меньших моделей из более крупных, Zoom создал свою модель с 2 миллиардами параметров с нуля. Техническое преимущество этого подхода проявляется, когда речь идет о настройке для конкретных доменов.

«Когда вы настраиваете, это требует больше усилий. Трудно управлять большим кораблем,» объяснил Хуанг. Оказывается, возможность настройки маленькой модели является критически важным компонентом для разработки конкретных агентивных AI процессов.

AI компаньон 2.0: Агентивный AI превращает встречи в достижения

В центре обновлений Zoom находится AI компаньон 2.0, который преобразует возможности AI Zoom от поддержки встреч к полноценным агентивным функциям. С версией 2.0 Zoom развивается от помощника к агентивному AI, который способен к рассуждениям, памяти и выполнению задач. Эволюционированный AI компаньон теперь может выполнять многоэтапные действия от имени пользователей, оркеструя задачи, такие как планирование встреч, создание видеоклипов и создание документов. Ключевые обновления включают:

  • Агентивные навыки: Управление календарем, генерация клипов, расширенная помощь в написании;
  • Управление задачами: Автоматическое обнаружение элементов действий из встреч и чатов;
  • Улучшенные встречи: Генерируемые AI повестки дня, живые заметки и голосовая запись;
  • Создание документов: Расширенные ссылки и автоматическая генерация таблиц данных в Zoom Docs;
  • Виртуальные агенты: Самообслуживание для клиентов с поддержкой как чата, так и голоса;
  • Индустриальные решения: Специализированные инструменты для первичных работников, медицинских специалистов и преподавателей;
  • Zoom Drive: Новый центральный репозиторий для активов встреч и документов продуктивности;
  • Пользовательские аватары: AI-генерированные видео аватары для создания презентационных клипов.

Большинство функций будут внедрены в период с марта по июль 2025 года. В то время как стандартный AI компаньон включен без дополнительной платы для платных пользователей, специализированные агенты и настраиваемые конфигурации потребуют дополнительных затрат.

«Самым важным аспектом для нас агентивного AI является реальное обеспечение ориентированного на действия информационного потока,» сказал Хуанг. «Это означает, что когда у вас есть встреча, задача будет перетекать в Docs или чат или в другие действия, которые вы должны предпринять.»

AI Studio: Создание пользовательских агентов для предприятий

Хотя Zoom предоставляет множество различных возможностей агентивного AI из коробки для пользователей, Хуанг признал, что предприятиям часто требуются более настраиваемые варианты. Здесь на помощь приходит AI Studio, позволяя компаниям создавать настроенные AI агенты, адаптированные к специфическим бизнес-потребностям. Они могут быть глубоко интегрированы с конкретными знаниями компании и рабочими процессами. В качестве примера, Хуанг рассказал о практическом применение для политики в области человеческих ресурсов.

Предприятия могут использовать AI Studio для загрузки всех внутренних документов по HR политике. AI компаньон будет затем обучаться на этой специфической политике компании, позволяя ему точно отвечать на вопросы сотрудников о HR правилах и процедурах. IT администраторы также могут использовать AI Studio для подключения компаньона к другим внутренним базам знаний, таким как документация по IT поддержке. Цель состоит в том, чтобы позволить компаниям создавать AI агентов, которые глубоко интегрированы с их собственными процессами, данными и рабочими потоками, превращая AI компаньон в настраиваемый и ценный инструмент продуктивности.

Импликации для принятия решений в сфере AI в предприятиях

Для технических лиц, принимающих решения, которые оценивают решения AI для продуктивности, подход Zoom предлагает несколько отличительных соображений по сравнению с альтернативами от Microsoft, Google и других поставщиков. Модель ориентированного на действия информационного потока может лучше подойти для организаций, где встречи являются основным средством сотрудничества, и где выполнение задач осложняется фрагментацией информации по различным инструментам.

Компании с высоким объемом встреч могут найти особую ценность в способности Zoom соединять разговоры с последующими действиями. Кроме того, федеративный подход AI, сочетающий SLM и LLM, представляет архитектуру, заслуживающую изучения, — потенциально предлагая лучшее экономическое решение при сохранении качества. По мере того, как затраты на AI становятся растущей проблемой для предприятий, расширяющих свои внедрения AI, этот сбалансированный подход может оказать значительное влияние.

Для предприятий, стремящихся лидировать в области внедрения AI, эволюция Zoom от инструмента для встреч до комплексной платформы продуктивности предлагает ценные уроки о том, как строить на существующих сильных сторонах, а не просто добавлять AI в существующие рабочие процессы. Используя свое доминирование на рынке встреч, Zoom переосмысливает весь опыт продуктивности, демонстрируя, как опыт в определенной области можно сочетать с возможностями AI для создания решений, которые решают конкретные бизнес-проблемы, а не универсальные AI помощники.


Подписывайтесь на наш telegram-канал

admin
Оцените автора
CheatGPT
Добавить комментарий