В подкаст Дваркеша Патела пришел Дженсен Хуан и рассказал про возможности Nvidia, конкуренцию с TPU от Google и необходимость поставок чипов в Китай. Вот сокращенное изложение почти 2 часов подкаста.
По данным последних отчётов Nvidia, объём закупочных обязательств перед литейными производствами, производителями памяти и упаковщиками составляет около 100 млрд долларов, а по оценкам SemiAnalysis может достигнуть 250 млрд долларов. Любые узкие места в поставках — будь то CoWoS-упаковка или оборудование EUV — решаются за два-три года при наличии устойчивого спроса, а реальным ограничением Дженсен назвал энергетическую политику и нехватку квалифицированных рабочих, включая сантехников и электриков.
Говоря о конкуренции с TPU от Google и другими GPU, Хуан указал на принципиальные отличия архитектуры Nvidia: CUDA позволяет быстро внедрять новые алгоритмы, что обеспечило 50-кратный прирост энергоэффективности Blackwell по сравнению с Hopper — результат, недостижимый за счёт одного лишь закона Мура. Примерно 60 % выручки Nvidia приходится на пятёрку крупнейших гиперскейлеров, однако большая часть этих объёмов обслуживает внешних клиентов облаков. Anthropic является «уникальным случаем», переход компании на TPU и Trainium вызван тем, что на раннем этапе Nvidia не была в состоянии сделать многомиллиардные инвестиции, которые предложили Google и AWS. Маржинальность ASIC-чипов Хуан оценил примерно в 65 %, что лишь незначительно ниже маржи Nvidia в ~70 %.
Nvidia вложила до 30 млрд долларов в OpenAI и до 10 млрд долларов в Anthropic, а также поддержала облачных провайдеров нового типа — CoreWeave (гарантии до 6,3 млрд долларов и инвестиции в 2 млрд долларов), Nscale и Nebius. При этом Nvidia принципиально не становится облачным провайдером или гиперскейлером, придерживаясь философии «делать столько, сколько необходимо, и как можно меньше». Компания также не выбирает победителей среди стартапов, стараясь инвестировать во всех. В текущем году выходит Vera Rubin, далее — Vera Rubin Ultra, затем Feynman, а за ним ещё одна архитектура, название которой пока не объявлено.
Дженсен выступил против жёстких ограничений экспорта GPU в Китай, аргументируя это тем, что Китай располагает огромными энергетическими ресурсами, производит около 60 % мировых чипов массового сегмента, имеет порядка 50 % мировых исследователей в области ИИ, а Huawei показала рекордный годовой результат за всю историю компании. По его словам, при избытке энергии Китай способен компенсировать отставание в техпроцессе (7 нм без доступа к EUV) простым увеличением количества чипов. Политика полного ограничения экспорта будет «услугой Huawei», ускоряющей развитие китайской чип-индустрии, а потеря второго по величине технологического рынка мира нанесёт ущерб национальной безопасности США. Дженсен настаивает на необходимости диалога между американскими и китайскими исследователями AI и на сохранении открытых моделей и экосистем. Патель возражал, ссылаясь на модель Mythos Preview от Anthropic, обладающую кибернаступательными возможностями, и на то, что преимущество США в объёме вычислительных ресурсов позволяет американским лабораториям первыми достигать таких уровней и подготавливать защиту.
Nvidia не разрабатывает параллельно несколько радикально разных архитектур: по результатам внутреннего моделирования альтернативные подходы (вафельного масштаба, без CUDA и др.) показывают себя хуже. Исключением стало приобретение Groq, интегрируемого в экосистему CUDA, — этот шаг обусловлен формированием нового сегмента рынка с высокой стоимостью токенов, где скорость отклика важнее пропускной способности (я вот тут логику усмотрел другую — мы не разрабатываем, но отказаться от прибыльных секторов не можем).