Google добавляет голосовую модель Chirp 3 в свою платформу Vertex AI
Большая часть внимания в области генеративного ИИ уделена текстовым интерфейсам, используемым для генерации текста, изображений и многого другого. Следующая волна, похоже, затрагивает голос, и она набирает обороты. В последнем развитии событий Google сегодня объявила, что начнет добавление своих моделей преобразования речи в текст и HD преобразования текста в речь — Chirp 3 — в свою платформу разработки Vertex AI уже на следующей неделе. На прошлой неделе Google тихо объявила, что Chirp 3 представит 8 новых голосов для 31 языка. Примеры использования платформы включают создание голосовых ассистентов, создание аудиокниг, разработку агентов поддержки и озвучивание для видео. Новость была объявлена на мероприятии в лондонском офисе Google DeepMind.
Ограничения на использование
Примечательно, что будет существовать ограничение на использование Chirp 3 для предотвращения злоупотреблений. «Мы просто решаем некоторые из этих вопросов с нашей командой по безопасности», — сказал Томас Курьян, генеральный директор Google Cloud, на пресс-мероприятии.
Другие усилия в области голосового ИИ
Одиннадцать Labs — среди крупных стартапов, которые привлекли сотни миллионов в финансировании для расширения своих работ в области голосовых услуг ИИ. Эта новость приведет Chirp 3 в одно семейство с более новыми версиями его флагманской LLM, Gemini, которые тестируются, а также с моделями генерации изображений Imagen и дорогостоящим инструментом генерации видео Veo 2. Еще предстоит подтвердить, будет ли Chirp 3 от Google столь же «реалистичным», как некоторые другие попытки ИИ создать «человеческие» голоса (в особенности выделяется работа Sesame). Но, как подчеркнул Демис Хассабис, генеральный директор DeepMind, это остается марафоном, а не спринтом.
Долгосрочные перспективы ИИ
«В ближайшем будущем… эта идея, что [ИИ] является серебряной пулей для всего в течение ближайших пары лет, этого я пока не вижу. Думаю, до чего-то вроде AGI (общего искусственного интеллекта) мы ещё далеко», — сказал он. «Это изменит многое… в течение следующего десятилетия, так что в средне- и долгосрочной перспективе. Это один из тех интересных моментов во времени».
Развитие Vertex AI
Google запустила Vertex AI еще в 2021 году как платформу для разработчиков для создания услуг машинного обучения в облаке. Это было, конечно, задолго до взрыва интереса к ИИ и, в частности, генеративному ИИ, который произошел с запуском услуг GPT от OpenAI. С тех пор компания активно развивает Vertex AI, отчасти чтобы догнать такие компании, как Microsoft и Amazon, которые также создают инструменты генеративного ИИ для разработчиков.
- Разработчики могут использовать Vertex AI для классификации данных, обучения моделей и настройки моделей для производства.
- Интересно, расширит ли компания свою огражденную комбинацию для моделей, помимо тех, которые создаются непосредственно Google.
Google уже несколько лет создает голосовые услуги «Chirp», начиная с использования этого названия в качестве кодового имени для своих ранних усилий по конкуренции с сервисом Alexa от Amazon.
Подписывайтесь на наш telegram-канал








