Axonn: Прорыв в обучении LLM с четырёхмерной гибридной параллельной обработкой

Новости

Введение в AxoNN

Deep Neural Network (DNN) обучение переживает небывалый рост благодаря крупным языковым моделям (LLM) и генеративному ИИ. Однако обучение нейронных сетей с миллиардными параметрами представляет собой значительные технические трудности. Чтобы справиться с нагрузкой, модель распределяется на несколько GPU и параллельно выполняет умножение матриц. Несколько факторов влияют на эффективность обучения, включая устойчивую вычислительную производительность и коллективные коммуникативные операции.

Проблемы и достижения в обучении LLM

Существуют стремления расширить использование кластеров на базе GPU для обучения LLM. Например, Meta обучила Llama 2, используя 2,000 NVIDIA A100 GPU, но эффективность остаётся задачей. Различные команды, используя разные подходы к параллелизму, демонстрируют различные показатели производительности.

Представляем AxoNN

Исследователи из Университета Мэриленда, Института Макса Планка и Университета Калифорнии предложили AxoNN, новую четырехмерную гибридную параллельную алгоритмическую систему. AxoNN, реализован в масштабируемой и открытой платформе, предлагает оптимальные конфигурации для повышения производительности матричных ядер и анализа данных. Система также решает критические вопросы конфиденциальности и авторского права, возникающие из-за меморизации данных в LLM.

Тестирование платформы AxoNN

AxoNN проходит тестирование на трёх крупных суперкомпьютерных платформах. Программа показывает впечатляющие результаты масштабирования на всех платформах. В частности, AxoNN демонстрирует почти идеальное слабое масштабирование на всех трёх суперкомпьютерах, достигая до 88.3% эффективности на 8192 GCD.

Заключение

В заключение, AxoNN предлагает новые горизонты в области машинного обучения, предоставляя доступ к параллелизму моделей. Это позволяет эффективно обучать и адаптировать большие модели в условиях обычных вычислительных ограничений. Благодаря AxoNN исследователи могут использовать модели беспрецедентного масштаба и сложности, что поднимает важность понимания и устранения рисков меморизации.

admin
Оцените автора
CheatGPT
Добавить комментарий