Как масштабирование на время вывода влияет на рынок компаний в сфере ИИ
Существует много шума вокруг текущих расходов на модели ИИ, предоставляемые бесплатно пользователям, в основном утверждают, что это неустойчиво и сужают пространство для тех, кто имеет историческую перспективу постоянно падающих расходов на технологии. Выпуск GPT-4.5 с «гигантской» моделью без явной ниши только усилил этих критиков. С учетом того, что вычисления на время вывода стали новым стандартом, можем ли мы по-прежнему иметь бесплатные продукты на основе ИИ? Или мы просто находимся в эпоху, когда ИИ субсидируется венчурными капиталами?
Для обычных запросов к ChatGPT реалистичное ожидание заключается в том, что стоимость обслуживания среднего запроса снизится до чрезвычайно низких значений, а доход от рекламной модели в будущем сделает сервис чрезвычайно прибыльным. Самая целостная структура для понимания крупных интернет-бизнесов, построенных на нулевых предельных издержках, — это Агрегационная теория Бена Томпсона. Эта теория предполагает, что в долгосрочной перспективе экстремальная ценность будет накапливаться у немногих поставщиков, которые контролируют доступ к информации и услугам, построенным на динамике нулевых предельных издержек. Эти компании агрегируют пользовательский спрос. Это режим современного доминирующего бизнеса, подобного Google и Meta, которые производят крайне прибыльные продукты.
Теория агрегации и её применимость к компаниям ИИ
Многие хотят изучить, как это будет применяться к новым AI-бизнесам, которые являются программно-насыщенными платформами, ориентированными на пользователей, из которых OpenAI является самой выдающейся благодаря размеру ChatGPT. Наличие большего числа пользователей и внимания позволяет агрегаторам лучше монетизировать взаимодействия и инвестировать в предоставление лучших впечатлений, что часто образует убыстряющийся цикл.
Агрегаторы часто сравниваются с платформами. В то время как первые зависят от своей роли посредника между пользователями и другими рыночными местами, платформы служат основой, на которой другие строят бизнес и создают ценность, как например, Apple с iPhone, AWS или Stripe. Бизнесы, такие как ChatGPT или Perplexity, будут зависеть от открытия прибыльной рекламной модели, которая будет работать хорошо с форматом диалога.
Будущее рекламной модели в компании ИИ
Включение предыдущих обсуждений в чат ChatGPT, как они начали делать в последние месяцы, вдохновляет в этом плане, так как они также могут иметь предпочтительные продукты или источники, которые они стремятся рекомендовать в первую очередь. В любом случае, это будет совершенно новый вид рекламы, отличный от ориентированных на пользователей рекламных объявлений Meta, поисковых объявлений Google или длительной истории общих брендовых реклам. Некоторые из этих прошедших вариантов рекламы могут работать, но менее эффективно в текущем формате.
Ещё более лёгкий аргумент заключается в том, чтобы рассмотреть текущих гиперскейлеров, использующих недорогие решения на время вывода на моделях ИИ, которые дополняют их существующий бизнес и подходят к компонентам Агрегационной теории, такие как Meta, предоставляющая чрезвычайно захватывающий ИИ контент и рекламу. Самая большая перспективная платформа здесь — это следовать через призму, через которую языковые модели являются новой вычислительной тканью для технологий. AWS моделей ИИ.
Влияние масштабирования на время вывода на бизнес-модели компаний ИИ
Все эти бизнес-модели, реклама, вывод и то, что между ними, стали очевидны вскоре после запуска ChatGPT. По мере созревания AI-индустрии появились более сложные вопросы: кто несет расходы на обучение передовых моделей, которыми могут пользоваться другие компании? Сколько кратных существующих парадигм вывода (0-100s токенов) мотивирует масштабирование на время вывода? Как это повлияет на бизнесы?
Этот пост рассматривает второй вопрос: как вычисления на время вывода меняют бизнес-модели компаний ИИ? Объявление о OpenAI’s o3 с расходами на вывод на ARC-AGI, превышающими $5 за задачу, и распространение новых моделей рассуждений подняли первое серьезное испытание, будет ли агрегационная теория применима к ИИ.
Вызовы и Будущее ИИ в свете новых моделей вывода
Связь между вычислениями на время вывода и разговором вокруг агрегаторов была запущена Fabricated Knowledge’s Outlook за 2025 год на AI и полупроводники, в котором утверждается: эпоха агрегационной теории позади, и ИИ снова делает технологию дорогой. Это отношение увеличенных затрат из-за увеличенного потребления противоречит интернет-эру мышления. Это правда, только если требуется увеличенное размышление по каждому запросу и если это не сопровождается пропорциональным увеличением предоставляемой ценности. Базовые операции AI-бизнесов будут существенно следовать в призме Агрегационной теории, и более работа потребуется для выработки бизнес-моделей для продуктов с высокой нагрузкой на вывод.








