Новые диффузионные модели: технологию из AI-белосинтеза для 10-кратного увеличения скорости
Диффузионные модели являются одним из видов генеративной AI-технологии, которая, в отличие от авторегрессивных моделей, не создает текст последовательно. Она начинает с создания грубого эскиза текста и постепенно его уточняет через несколько итераций. Данная методика состоит из двух основных этапов: сначала модель добавляет гауссовский шум к входным данным, а затем обучается восстанавливать данные, удаляя этот шум шаг за шагом.
Mercury и его преимущества
Inception Labs недавно представили новую AI-языковую модель Mercury, которая использует диффузионные модели для достижения значительных ускорений в генерации текста. Это открывает двери для нового поколения больших языковых моделей (LLM), которые кардинально отличаются от традиционных авторегресивных моделей.
- Mercury обрабатывает свыше 1000 токенов в секунду по сравнению с 200 токенами в секунду у устаревших моделей.
- Возможности Mercury превосходят другие коммерческие модели, такие как GPT-4o Mini, особенно в задачах генерации кода.
Широкие возможности применения
Mercury и лежащие в его основе диффузионные модели имеют потенциал для применения не только в генерации текста, но также в создании изображений, видео и аудио. Эти модели могут стать мощным инструментом для мультидальных AI-приложений.
С увеличением инвестиций в эту технологию со стороны компаний и исследователей, ожидается рост использования диффузионных моделей в AI-генерации. Это может стать переломным моментом в проектировании и реализации AI-приложений.
Проблемы и перспективы
Несмотря на обнадеживающие результаты, диффузионные модели пока не обрели широкого распространения в сравнении с авторегресивными моделями. Это связано с рядом вызовов, включая более высокие вычислительные затраты и сложности в управлении генерацией. Однако последние исследования указывают на возможный прорыв, который открывает новые возможности в областях, таких как генерация кода и обработка естественного языка.








