Telegram-канал

OpenAI выпустила новую версию модели — GPT-5.1 в двух вариантах — Instant для повседневных задач и Thinking для сложных рассуждений. Как для меня, так самое интересное в том, насколько тихо этот запуск прошел. Хотя продуктово выглядит заметно.

Главное в обновлении не столько рост интеллекта, сколько изменение стиля общения. Модели стали “теплее”, более разговорными и лучше следуют инструкциям. Компания прямо пишет, что услышала от пользователей: хороший AI должен быть не только умным, но и приятным в общении.

GPT-5.1 Instant теперь может использовать адаптивное рассуждение, то есть “думать” перед ответом на сложные вопросы. Раньше это было эксклюзивной особенностью Thinking-модели. При этом thinking mini модель пропала.

Добавили шесть пресетов персонализации тона — от Professional до Quirky — и возможность тонкой настройки вплоть до частоты использования эмодзи. Legacy-модели останутся доступны еще три месяца через дропдаун в меню выбора моделей.

World Labs, стартап Фей-Фей Ли, запустил Marble — первую коммерческую модель для генерации 3D-окружений из текста, фото, видео или панорам. Компания год назад привлекла 230 млн долларов, и теперь опередила конкурентов вроде Decart и Odyssey, у которых пока только бесплатные демо. Google Genie все еще в исследовательском превью.

Модель создает постоянные загружаемые миры, а не генерирует их на лету, как конкуренты. Можно экспортировать как Gaussian splats, меши или видео. Есть гибридный 3D-редактор Chisel, где структура отделена от стиля. Четыре тарифа от бесплатного (4 генерации) до $95/месяц (75 генераций плюс коммерческие права).

Джастин Джонсон, сооснователь World Labs, видит применение в геймдеве, VFX и VR. Правда, индустрия игр настроена скептически — недавний опрос на Game Developers Conference показал, что треть респондентов считает генеративный AI негативным фактором, причем на 12% больше, чем год назад.

А буквально вчера были слухи, что Ян Лекун собирается покинуть Meta, чтобы развивать идею World AI. Это тесно связано — научить AI обрабатывать данные из реального мира и генерировать виртуальные. Олды, помнящие название Second Life, — можете испытывать дежа-вю. Сбой в Матрице, если кто предпочитает американский фильм 1999 года, а не советский 1989-го.

Anthropic объявила о планах инвестировать $50 млрд в AI-инфраструктуру в США — строительство дата-центров в Техасе и Нью-Йорке совместно с Fluidstack, облачной платформой, которая уже поставляет GPU-кластеры для Meta, Midjourney и Mistral. Первые объекты заработают в 2026 году, проект создаст 800 постоянных рабочих мест и более 2000 строительных позиций.

Вообще, новости про новые планы инвестиций в датацентры идут так плотно, что я, наверное, возьму паузу в их перечислений. Их реально по несколько штук в день — вчера было сообщение от Nebius, что они развернут мощностей для Meta на 3 млрд в течение нескольких лет, сегодня это уже четвертая новость на тему датацентров, и это не считая аналитики, которая тоже интересна, но сколько ж можно? Тем более, что речь идет о планах на несколько лет, а все комментируют эти заявления так, будто все уже потратили десятки млрд и обанкротились или вот-вот уже прогорят.

Microsoft и Google объявили об инвестициях более $16 млрд в AI-инфраструктуру в Европе. Microsoft вложит свыше $10 млрд в дата-центр в португальском Синише вместе с Nvidia, британским стартапом Nscale Global Holdings и застройщиком Start Campus. Планируется разместить около 12,600 GPU Nvidia GB300. Google инвестирует 5.5 млрд евро в расширение инфраструктуры и офисов в Германии до 2029 года, включая новый дата-центр в Дитценбахе.

Microsoft объявили об инвестиции со сцены WebSummit и, вполне возможно, что проект будет развиваться при поддержке правительства страны. В конце концов, должны же 11 млн в год, которые Португалия платит организаторам конференции, окупаться не только наплывом стартаперов раз в году, увеличивающим население Лиссабона на 20%, и не столько цифровыми кочевниками, регулярно там оседающими. Правда, вопрос, насколько к этому готова инфраструктура — я в последний раз в 2021-м году не заметил сверхбыстрого интернета, а он необходим для таких проектов.

Google, вслед за Apple, запускает Private AI Compute — облачную платформу для продвинутых AI-функций с обещанием полной приватности данных. Функция “практически идентична” Apple Private Cloud Compute, как прямо пишет The Verge. Данные будут доступны “только вам и никому больше, даже не Google”.

Практическое применение пока выглядит скромно — более умный Magic Cue на Pixel 10 и расширенная языковая поддержка транскрипций. Google говорит “это только начало”, но пока непонятно, насколько пользователи готовы доверить свои данные компании, которая на этих данных зарабатывает.

Впрочем, есть еще одна мысль — что эта функция не просто подсказана Apple, но и стала следствием возможного сотрудничества двух компаний — я имею в виду контракт на использование Gemini в качестве модели для Siri.

Пишут, что Ян Лекун, лауреат премии Тьюринга и глава исследовательской лаборатии FAIR в Meta с 2013 года, покидает компанию для создания собственного стартапа. По слухам, Лекун уже ведет ранние переговоры о привлечении финансирования. Новый стартап будет фокусироваться на его главной идее последних лет — world models, системах AI, которые понимают физический мир через видео и пространственные данные, а не только через тексты.

В общем, это часть перезагрузки AI направления Meta, где приоритетом становится быстрый выпуск продуктов, а не исследовательская работа. Тем более, что сам Лекун оценивает временные рамки своих идей в десятилетия, и это вряд ли находит понимание у Закерберга. Особенно на фоне, скажем так, неуспеха Llama 4.

Согласно документам, полученным Wall Street Journal, Anthropic планирует выйти на безубыточность в 2028 году, в то время как OpenAI прогнозирует операционные убытки в $74 млрд в том же году — примерно три четверти от выручки. До достижения прибыльности в 2030 году OpenAI сожжет в 14 раз больше денег, чем конкурент. Конечно, с учетом большинства планов по закупке мощностей.

Принципиальная разница в стратегии компаний в том, что Anthropic фокусируется на достаточно узком поле деятельности, в то время как OpenAI стремится масштабироваться сразу во все стороны. Разница есть и в продвижении — Anthropic занимается продажей своего Claude бизнесам, а OpenAI ставит на вирусное распространение среди массовой аудитории. В результате для этой аудитории AI означает ChatGPT, а название Claude известно лишь продвинутым пользователям. Что, конечно, не означает, что у OpenAI нет продаж корпорациям, мы на эту тему плодотворно спорили на прошлой неделе в комментариях.

Будет интересно сравнить результаты в итоге. Кстати, заодно проверим еще один фактор — помните, как рост Google в итоге обусловил его отрыв в лидерстве, поскольку, чем больше такой системой пользуются, тем больше у нее потенциала для улучшения своих продуктов? “Богатые богатеют”. Интересно, работает ли это наблюдение для разработки AI?

Как обычно, к началу новой недели Марк Гурман выдает порцию инсайдов про Apple. Впрочем, про спутниковую связь мне не очень интересно, про Gemini писалось про неделю, а вот перечисление продуктовых планов в линейке Mac мне понравилось.

Итак, в первой половине 2026 года Apple планирует выкатить MacBook Pro с процессорами M5 Pro и M5 Max, а так же MacBook Air с M5. Насколько я смотрю на прогнозы, апгрейд с M4 Pro/Max будет не очень заметным, а вот владельцам предыдущих моделей стоит задуматься. Тем более, что, например, в Украине начали активно появляться в широкой продаже не только начальные версии с минимальной конфигурацией по памяти, но вполне продвинутые — я в итоге понял, что это самый оптимальный способ подобрать нужную, не занимаясь дозаказом и ожиданием. Ну, а Air я даже посмотрю пристально — у жены M2, в котором плохо помещаются все ее вкладки в браузерах (8 Gb, что вы хотите), так что апгрейд назревает.

В середине года мы дождемся mac mini c M5 и M5 Pro и Mac Studio с M5 Max и M5 Ultra. Конечно, с моей стороны наглость планировать что-то аж на следующую осень, но я очень пристально хочу посмотреть на конфигурацию Studio — если до нас быстро доедут модели с 64/128 гигабайт, то я знаю, какую сумму денег готовить наперед.

И к концу года нас ждет анонс M6 и нового начального MacBook Pro с ним (кстати, возможно, и iPad Pro тоже).

Но вот что интересно — скорее всего, следующие MacBook Pro с M6 Pro/Max будут иметь OLED-экраны, тоньше корпус и это будут те самые модели с поддержкой touch-экранов. Они планируются на конец 2026 - начало 2027 года, хотя мне кажется избыточным два релиза одной линейки в год. Но, может, это будет некий MacBook Max?

Что скажете, что купите?

Европейская комиссия готовит пакет упрощений регуляторных норм, который затронет GDPR и AI Act. По данным Politico, планируется смягчить требования к обработке чувствительных данных, включая медицинскую информацию, этническую принадлежность и религиозные убеждения, для нужд AI-разработки. Предполагается годовой «льготный период» для компаний, нарушающих правила высокорискованных AI-приложений.

Ян Филипп Альбрехт, немецкий политик и один из разработчиков оригинального GDPR, называет потенциальные изменения драматическим подрывом европейских стандартов. В похожем тоне комментирует Макс Шремс, основатель правозащитной группы из Австрии, — кстати, именно он еще студентом начал кампании за соблюдение privacy и именно ему компания Meta (вместе с другими) обязана европейскими решениями, обязывающими компании хранить данные европейских пользователей в Европе или, по крайней мере, обеспечить им защиту на европейском уровне. Пять стран — Чехия, Эстония, Франция, Австрия и Словения — уже выступили против ослабления GDPR. Германия, напротив, поддерживает реформы, а Финляндия готова к изменениям ради AI-конкурентоспособности.

Как раз тот случай, когда одни уже поняли, что без риска достижений не будет, а другие хотят гарантий безопасной жизни.

Группа исследователей опубликовала в Nature Scientific Data датасет Itiner-e — детализированную карту дорог Римской империи с возможностью построения маршрутов. Данные собирались из археологических отчетов, древних путеводителей вроде Tabula Peutingeriana, спутниковых снимков от миссии Corona и топографических карт XIX века. Каждый сегмент имеет оценку достоверности от “Certain” до “Hypothetical”, библиографию источников и метаданные о периоде строительства.

Разработчики Itiner-e честно признают, что в одних регионах источников больше, в других — меньше, где-то физические следы дорог сохранились лучше. После построения карты выяснилось, что полная уверенность есть только относительно 3% дорог, относительная — про 7%.

Инструмент для построения маршрутов учитывает рельеф местности через функцию Тоблера, скорость движения разных видов транспорта (от пешехода на 4 км/ч до конного курьера на 6 км/ч) и навигацию по рекам с учетом направления течения.

В результате получились такие Google Maps для Древнего Рима — если вам нравится, как мне, из исторических романов доставать географические указания и прикладывать это к сюжету (и обнаруживать, что у Дюма герой две страницы бежит со всех сил и в итоге все же пробегает 30 метров), то походите по карте. Дабы узреть настоящую основу “римского мира”. Часть историков, например, считает, что развитие Европы в средние века во многом было предопределено не падением Римской империи, а тем, что вторжение гуннов и вандалов прервало сообщение по виа Игнасия между Римом и Константинополем.

Большой материал журнала Colossus, когда их сотрудница — директор по маркетингу, Бри Вулфсон, на пару месяцев присоединилась к Cursor в качестве маркетолога.

За год компания выросла с 20 до 250 человек, при этом 86% работают из офисов в Сан-Франциско или Нью-Йорке. Видимо, они не знают, что офис убивает креативность в сотрудниках.

Процесс найма в компании необычен. Cursor не открывает вакансии под роли, а находит выдающихся людей и создает для них позиции. Атомарная единица найма — человек, а не джоб-спека. В компании 50 человек, ранее основывавших своих проекты. Процесс рекрутинга выглядит как “сварм” — коллективная атака на кандидата, где участвует куча людей, а не только рекрутер. Некоторые кандидаты даже просят не рассказывать, что их видели в офисе.

Автор материала работала в Stripe и Figma в ранние дни, так что ее сравнения не случайны. Она отмечает схожее ощущение “магии в воздухе”, но с важной оговоркой: основатель Майкл Трует прямо говорит, что главный риск для Cursor — ранний коммерческий успех может отвлечь от по-настоящему больших ставок. И пока всё идет неплохо — в офисе Бри практически не слышала разговоров о том, чтобы разбогатеть, что было обычной темой на кофепойнтах в Stripe и Figma.

Много деталей, показывающих непосредственность атмосферы — посмотрите на фото, вряд ли там есть кто-то старше 30. При этом много бумажных книг (со следами использования) и даже старой мебели, тщательно подобранной. Умилил стенд с механическими клавиатурами. Не знаю, заметите ли сами, но сильное отличие от модных фотографий из офисов Big Tech заключается в том, на мой взгляд, что почему-то нигде нет игровых приставок. Видимо, этой молодежи интересно работать.

В общем, интересно посмотреть на суперсегодняшний вариант НИИЧАВО.

Microsoft AI формирует команду по суперинтеллекту под руководством своего вице-президента по AI Мустафы Сулеймана, со-основателя DeepMind. Но задачей подразделения будет не гонка за AGI. Вместо этого цель компании — “гуманистический суперинтеллект” (Humanist Superintelligence — HSI), набор узкоспециализированных систем с жесткими ограничениями автономности. “Мы отвергаем нарратив о гонке к AGI”, — пишет Сулейман.

Возможно, это попытка диверсифицироваться — ведь инвестиции в OpenAI тоже никто не отменял.

Сулейман прямо пишет о главной проблеме: никто не знает, как гарантировать безопасность постоянно улучшающегося суперинтеллекта. И предлагает обходной путь — доменно-специфичные системы. Как, например, уже имеющийся пример использования AI в медицине — помните пример с диагностикой, где AI ставил более точные диагнозы, чем люди?

Я долго не хотел вообще про это писать, ну да ладно. Новость недели — акционеры Tesla 75% голосов одобрили новый пакет компенсации для Илона Маска — потенциально до $1 трлн в акциях, разделенных на 12 траншей. Первый транш завестится при капитализации $2 трлн вместо нынешних $1.5 трлн плюс продажа 11.5 млн машин. Финальная цель — капитализация $8.5 трлн за десять лет. Для сравнения, скорректированная EBITDA должна вырасти с $16 млрд до $400 млрд, а компания должна продать миллион роботов.

Пакет преподносится как мотивационный инструмент для самого богатого человека планеты, который уже владеет 15% компании. Понимаете, больше никак не мотивируешь, только перспективой встретить пожилой возраст в статусе первого (вероятно) триллионера планеты. С другой стороны, в этом году он действительно как-то не выглядел мотивированным заниматься Tesla — то он уходил в правительство, потом занялся AI. Собственно, на том же собрании акционеры проголосовали за возможность совета директоров инвестировать в эту самую xAI.

Кстати, предыдущий пакет 2018 года, самый крупный до нынешнего, оспаривается в Верховном суде Делавэра. Судья первой инстанции отменил его в январе 2024-го, установив, что директора были под влиянием Маска, а процесс одобрения был непрозрачным. Судьба нынешнего тоже непрозрачна.

В продолжение дискуссии в комментариях о бизнес-модели OpenAI и вчерашней оговорке финдиректора компании — Сэм Альтман опубликовал развернутое объяснение планов OpenAI. Основной посыл: никаких гарантий для частных компаний не нужно, но правительство могло бы построить собственную инфраструктуру. OpenAI ожидает выручку в годовом исчислении (annualized run rate) выше $20 млрд в конце этого года и рост до сотен миллиардов к 2030-му. При этом обязательства компании составят $1.4 трлн за восемь лет.

Экономически такой прогноз выглядит амбициозно даже для OpenAI. $1.4 трлн за восемь лет — это примерно $175 млрд капитальных расходов ежегодно. Даже если к 2030 году выручка достигнет $200+ млрд, такие инвестиции требуют либо постоянного притока нового капитала, либо прибыльности, которой пока нет ни у кого в индустрии. Альтман упоминает планы продавать вычислительные мощности как “AI cloud” — фактически, OpenAI хочет конкурировать с AWS и Azure, используя их же инфраструктуру на первых этапах.

Но, опять же, возвращаясь к дискуссии — это не выглядит абсурдным. Пока что мы видим рост в разы — по итогам 2024 года выручка составила порядка 4 млрд, причем annualized run rate в конце прошлого года составлял порядка 5,5 млрд. В июне были сообщения о росте этого показателя до 10 млрд. Теперь, как видим, прогноз на 20+ млрд — то есть почти в 4 раза больше. Если учесть, что количество пользователей с августа 2024 года выросло с 200 до 400 млн в феврале и до 800 млн в октябре этого года, а конверсия бесплатных пользователей в подписчиков держится на уровне 5-6%, то снижения темпов роста явно не предвидится. А ведь еще есть международное развитие — датацентр в ОАЭ строится не только и не столько для улучшения жизни существующих пользователей, это очевидно.

Еврокомиссия предлагает отсрочить ввод в действие части AI Act под давлением Big Tech и администрации Трампа. По информации Financial Times, компаниям, нарушающим правила по наиболее рискованным AI-системам, дадут год “grace period”, а штрафы за нарушение требований прозрачности отложат до августа 2027 года. Предложение будет принято 19 ноября, но потребует одобрения большинства стран ЕС и Европарламента.

Брюссель позиционировал AI Act как самый строгий режим регулирования в мире. Закон вступил в силу в августе 2024, но основные положения для high-risk систем должны были заработать только в августе 2026. Meta и другие компании предупреждали, что подход ЕС рискует отрезать Европу от передовых AI-сервисов. Собственно, большое количество запусков последнего года либо происходили в Европе позже остальных стран, либо не случались вообще.

Это, правда, никак не повлечет за собой какое-то сильное изменение в позиции Евросоюза, то есть, они не начнут вдруг поощрять местные компании активнее развиваться, не снимут какие-то регуляторские требования. Нет, Европа просто не хочет ссориться с Трампом, поэтому согласна немного потерпеть и не регулировать.

Moonshot AI выпустила Kimi K2 Thinking — это их первая рассуждающая модель на основе уже известной Kimi K2, которую многие даже считали очень неплохой для задач программирования. У модели 1 трлн параметров, из которых 32 млрд постоянно активных благодаря MoE, окно контеста 256k токенов. Она может выполнить 200-300 вызовов инструментов без участия человека, выполняя таким образом самостоятельно решение, состоящее из большого количества промежуточных этапов.

По утверждениям разработчиков, модель превосходит и GPT-5, и Claude Sonnet 4.5 на тестах, связанных с рассуждениями и работой в качестве агента. На задачах программирования она им уступает, но выглядит достаточно достойно. Что дает возможность разработчикам говорить о лучшей open-source модели — модель доступна на Hugging Face. Правда, минимальное оборудование для запуска модели — это кластер из 8 H200, что обойдется желающим примерно в 400 тысяч долларов. Так что лучше использовать через API.

Сара Фриар, CFO OpenAI, выступила на мероприятии Wall Street Journal и упомянула, что компания не планирует IPO, но рассматривает возможность создания экосистемы финансирования с участием банков, частного капитала и федеральной “подстраховки” для инвестиций в инфраструктуру. Через несколько часов она опубликовала пост в LinkedIn, где уточнила, что слово “backstop” было неудачным выбором. Мол, речь шла просто, что государство и частный сектор должны играть свою роль в развитии технологического потенциала страны.

Разъяснение понадобилось из-за того, что пошли комментарии о сложностях OpenAI с финансированием своих обязательств по долгосрочным контрактам. Даже Дэвид Сакс, провозглашенный Трампом “криптоцарем”, выступающий как советник по всем вопросам, связанным с AI, в том числе, заявил, что никакой федеральной помощи AI-компаниям не будет, мол, их в стране уже пять и, даже если одна провалится (читай, обанкротится), другие займут её место.

Впрочем, скорее всего, это ложная тревога — текущие темпы роста ведущих AI компаний даже не намекают на будущее замедление роста, а поскольку все они построены на подписочной модели, то в ближайшее время кривые роста, скорее всего, будут только круче задираться, а не выполаживаться.

Деннис Кроули, основатель Foursquare, запустил BeeBot — приложение, которое через наушники или умные очки озвучивает контекстные обновления о месте, где вы находитесь. AI-диджей рассказывает о событиях поблизости, статусах друзей, локальных новостях из Substack и newsletters. Работает постоянно, пока наушники вставлены, и может прерывать музыку пару раз в день. Приложение позиционируется как “app for AirPods” и поддерживает Meta glasses.

Судя по всему, Кроули уже в третий раз пытается войти практически в одну и ту же реку — ведь Foursquare была вторым его проектом на тему so-lo-mo (social-location-mobile), — причем повторить именно игровую механику 4sq. Большой вопрос, насколько удастся, тем более, что про мэров и бейджи речь пока не идет. Забавно, что эта идея уже была в фантастике, причем совсем недавней — если вы читали “Анклавы” Панова, то легко узнаете аналогию.

Reuters опубликовал материал на основе внутренних документов Meta, и там много неприятных (или интересных, кому как) подробностей. По прогнозам конца прошлого года, компания ожидала заработать около $16 млрд в 2024-м — примерно 10% всей выручки — на рекламе скама и запрещенных товаров. В среднем платформы Meta показывают пользователям 15 миллиардов скам-объявлений в день.

Meta банит рекламодателей только если уверена минимум на 95%, что это мошенники. Если уверенность ниже, но подозрения остаются — компания просто берет с них больше денег через систему “penalty bids”. То есть подозрительные рекламодатели платят премию за показы. Из документов следует, что это основа стратегии борьбы с мошенничеством — сократить количество показов, но заработать больше на тех, что остаются.

Что отдельно удивительно — я регулярно занимаюсь рекламными кампаниями для нормального бизнеса и, как легко догадаться, далеко не все объявления проходят через эту систему. Видимо, надо на пирамиды и крипту переключаться.

Внутренний анализ показал, что рекламировать скам на платформах Meta проще, чем в Google. При этом 96% жалоб пользователей на скам в 2023 году компания игнорировала или отклоняла. А один из стратегических документов прямо говорит, что потенциальные штрафы до $1 млрд все равно меньше, чем $3.5 млрд дохода каждые полгода только от высокорискованной мошеннической рекламы.

Компания планирует снизить долю такой выручки с 10.1% до 5.8% к 2027 году. Но пока что это помогает зарабатывать больше. Датацентры строить надо, да и многомиллионные бонусы разработчикам AI денег требуют.

Apple планирует платить Google около $1 млрд в год за доступ к кастомной модели Gemini с 1.2 триллиона параметров, которая будет обрабатывать функции планирования и суммаризации в новой версии Siri. По данным Bloomberg, соглашение близко к подписанию после периода тестирования, когда Apple сравнивала Gemini с ChatGPT и Claude. Запуск обновленного голосового ассистента намечен на весну следующего года.

Переговоры об интеграции Gemini как чатбота в Siri проваливались дважды — в 2024 и начале этого года. Теперь речь о более глубокой интеграции, но максимально закулисной. Google будет невидимым поставщиком технологий, в отличие от сделки с Safari, где его роль поискового движка публична. Модель запустят на серверах Private Cloud Compute от Apple.

В целом, выбор Apple одобряю полностью. В отличие от первых попыток Google быстро ответить на успех OpenAI (кто-то помнит такое — Bard?), нынешнее поколение моделей более чем достойно выглядит. Даже более того — после нескольких случаев откровенной галлюцинации GPT-5 я всё чаще использую Gemini в качестве LLM для бытовых и информационных вопросов. Что же до оценок, мол, Apple их отставание в AI обойдется в такие деньги, то ничего особенного — догнать компании, много лет занимающиеся ML и AI, в лучшем случае непросто, если вообще возможно. Амбициозный проект Apple Maps доходчиво демонстрирует, сколько занимает вообще попытка правильно конкурировать с Google.