Hume предлагает революцию в области текстов в речь, запуская Octave TTS, инновационную модель, изменяющую подход к синтезу речи. Разработанная на основе передовой системы LLM, Octave TTS акцентирует внимание на эмоциональной выразительности и контексте, создавая настраиваемые ИИ-голоса, адаптирующиеся к любым сценариям. Ранее текстовые системы зачастую интерпретировали текст в монотонной манере без передачи эмоциональной окраски, что делало их менее привлекательными для пользователей и разработчиков. Прорыв Hume в открытии новых горизонтов в синтезе речи позволяет моделям адаптироваться под уникальные требования и настроения, создавая голоса, не только передающие слова, но и эмоциональное наполнение.
Технические характеристики
Octave функционирует на базе обширной языковой модели, обученной для речевого синтеза, обеспечивая не только точное произношение, но и соответствующую интонацию. Основной новинкой Octave является функция «Дизайн голоса». Пользователи могут задавать сценарии или описания, чтобы генерировать голоса, подходящие для различных ролей или персонажей. Это инструмент для создания уникальных голосов: от спокойного консультанта до решительного диктора, Octave легко подстраивается под любые требования.

Данные и сравнительные оценки
Развитие Octave TTS сопровождалось глубокой оценкой её возможностей в сравнении с конкурентами. В проведённом Hume исследовании, включающем 180 испытателей, показано, что Octave предпочли за качество звука в 71.6% случаев, по натуральности — в 51.7%, а в точном совпадении с заявленным описанием — в 57.7% испытаний. Это результаты, подтверждающие улучшение Octave в сравнениях с конкурентами.

Заключение
Octave от Hume предлагает значительные улучшения по сравнению с традиционными TTS системами, делая акцент на контексте и эмоциональной гибкости. Будучи построенной на продвинутой языковой модели, Octave стремится выйти за рамки преобладающих решений на рынке, предоставляя инструмент для более естественного и вовлеченного восприятия голоса. В сочетании с продолжающейся разработкой, включая возможность клонирования голоса, Octave от Hume остаётся на переднем крае технологий ИИ.








