Новая эпоха для платформы Podcastle: запуск модели преобразования текста в речь
Подкастинг и редактирование медиа становятся ещё более инновационными благодаря новым технологиям. Платформа Podcastle, специализирующаяся на этих услугах, объявила о запуске собственного AI для преобразования текста в речь — Asyncflow v1.0, позволяющего использовать более 450 AI-голосов для озвучивания текста.
Отличительной особенностью нововведения является доступность API для разработчиков, что позволяет им интегрировать специализированную модель непосредственно в свои приложения. Это открывает широкие возможности в таких сферах, как маркетинг, реклама, создание контента, образование и корпоративное обучение.
Стоимость и качество: как Podcastle держит конкуренцию
Основатель компании Arto Yeritsyan поделился, что создание подобной модели всегда было в планах команды, но ранее они сталкивались с высокими затратами на обучение и необходимые ресурсы данных. Однако последнее развитие в области больших языковых моделей помогло компании разработать качественную модель голоса, требующую меньшего объема данных.
Интересно, что стоимость использования этой технологии составляет около $40 за 500 минут преобразования, тогда как ElevenLabs за тот же объем предлагает цену в $99. Разница значительна и делает продукт Podcastle привлекательным на фоне конкурентов.
Новые возможности синтеза голоса
Ранее процесс клонирования голоса требовал от пользователя чтения около 70 предложений. Но теперь достаточно пары секунд записи для создания клона вашего голоса благодаря улучшению технологии Magic Dust AI, представленной в прошлом году. Это значительное облегчение для пользователей, стремящихся к быстрому и качественному результату.
Хотя при тестировании звучание может показаться несколько роботизированным, компания стремится улучшить этот аспект, и пользователи могут использовать разные образцы своего голоса для достижения лучших результатов.
Преимущества интегрированной платформы
Подкасты, видео, аудио и AI-поддержка — всё это теперь доступно в одном обновлённом интерфейсе. Это предлагает пользователям комплексные инструменты для работы с медиа. Arto Yeritsyan подчёркивает, что хотя основная часть работы пользователей связана с аудио, видео активность также заметно растёт.
Таким образом, интеграция всех необходимых средств на единой платформе, вкупе с различными технологическими новинками, позволяет Podcastle занимать лидирующие позиции на рынке, обеспечивая себя большими шансами на успех в стремительно развивающейся индустрии.








