Octave: Новый уровень синтеза речи от Hume AI

Новости

AI для преобразования текста в речь: на пороге нового этапа

AI имеет потенциал заменить человеческих актеров озвучивания в таких областях, как аудиокниги, дубляж и реклама. Однако, голоса AI зачастую звучат неестественно и механически, так как не понимают содержание текста. Решить эту проблему решила компания Hume с новой AI-моделью.

Запуск Octave от Hume AI

Hume AI недавно запустила модель Octave, которая улучшает технологию преобразования текста в речь (TTS). Теперь синтетические голоса могут понимать не только контекст, но и эмоциональные оттенки в произносимом тексте.

Эмоциональный интеллект и понимание контекста

В отличие от традиционных TTS-систем с ограниченной возможностью интерпретации эмоций, Octave может корректировать тон, ритм и акценты в зависимости от эмоциональной тональности текста. Это делает синтетические голоса более человечными и адаптированными к конкретному содержанию.

Адаптация и создание персональности

Пользователи могут создавать голосовые профили, задавая конкретные тексты и инструкции для настройки эмоциональных выражений, делая голос более радостным, саркастичным или драматичным. Octave также позволяет генерировать совершенно новые голоса на основе описаний персонажей, что идеально подходит для креативных применений в аудиокнигах, фильмах и играх.

Подключение с помощью API

Hume AI предоставляет доступ к Octave через API, что упрощает интеграцию модели в сторонние проекты. Она поддерживает несколько языков, включая английский и испанский, с планами расширения языковой поддержки в будущем.

Планируемая языковая экспансия

В настоящее время Octave поддерживает как английский, так и испанский языки, планируя в будущем расширить языковую поддержку для контент-авторов в таких областях, как аудиокниги, подкасты и разработка игр. Кроме того, Hume AI запустила платформу оценки Expressive TTS Arena для сравнения технологий превращения текста в речь с помощью детализированных текстовых примеров.

Ценовая политика Octave

Octave предлагает бесплатный тариф с лимитом в 10 000 символов и шесть платных уровней, стоимость которых варьируется от 3 до 900 долларов в месяц, адаптированных под разные лимиты символов и потребности использования. В целом, Octave стремится установить новый стандарт в области выразительного синтеза речи с акцентом на практические улучшения как для разработчиков, так и для пользователей.

admin
Оцените автора
CheatGPT
Добавить комментарий