16 мая 2025

Meta задерживает запуск своей флагманской AI-модели “Behemoth” — это максимальная Llama 4 с 288 млрд активных параметров из общего количества в 2 триллиона.

Инженеры Meta испытывают трудности с улучшением возможностей модели, а сотрудники сомневаются, что прогресс по сравнению с предыдущими версиями достаточен для публичного релиза. Первоначально “Behemoth” планировали выпустить в апреле, затем перенесли на июнь, а теперь отложили до осени или позже.

Руководство компании разочаровано работой команды, создавшей Llama 4, и рассматривает возможность существенных изменений в управлении AI-подразделением. Хотя публично Meta хвалилась, что “Behemoth” превосходит технологии OpenAI, Google и Anthropic по некоторым тестам, внутри компании понимают, что модель страдает от проблем с обучением.

Тем временем сегодня OpenAI планирует стрим с неясным анонсом, а на будущей неделе Google I/O, где тоже что-то расскажут и покажут.

Зато свою модель (точнее, модели) представил Windsurf. Компания анонсировала три модели: флагманскую SWE-1, а также облегченные версии SWE-1-lite и SWE-1-mini. По заявлению разработчиков, основная модель SWE-1 конкурирует по производительности с Claude 3.5 Sonnet, GPT-4.1 и Gemini 2.5 Pro на внутренних тестах программирования, хотя и уступает самым продвинутым моделям вроде Claude 3.7 Sonnet.

Примечательно, что Windsurf отмечает принципиальное отличие своего подхода от конкурентов. “Сегодняшние передовые модели оптимизированы для кодирования, но кодирование — это не разработка программного обеспечения”, — заявил глава исследовательского отдела компании Николас Мой. SWE-1 обучена работать одновременно в разных средах — терминалах, IDE и интернете, что лучше соответствует реальному процессу разработки ПО.

Модели SWE-1-lite и SWE-1-mini будут доступны всем пользователям платформы, включая бесплатный тариф, в то время как SWE-1 предназначена только для платных подписчиков. Компания позиционирует свои разработки как “первое доказательство концепции”, что намекает на возможное появление новых моделей в будущем.

Что-то я совсем запутался, так их покупают или нет?

OpenAI решила всех запутать и запустила уже третий продукт под названием Codex – теперь это облачный агент для разработки программного обеспечения, способный работать над множеством задач параллельно. Codex помогает писать новый функционал, отвечать на вопросы о кодовой базе, исправлять ошибки и предлагать pull request’ы для проверки. Каждая задача выполняется в отдельной облачной среде с загруженным репозиторием.

Codex работает на основе модели codex-1, оптимизированной версии OpenAI o3 для разработки ПО. Модель была обучена с помощью обучения с подкреплением на реальных задачах кодирования, чтобы генерировать код, максимально похожий на человеческий стиль и соответствующий предпочтениям при PR-ревью. Инструмент буде доступен пользователям ChatGPT Pro, Enterprise и Team, а скоро выкатится и для Plus и Edu. Правда, я пока его не вижу.

Параллельно с этим OpenAI выпустила меньшую версию codex-1 для использования в Codex CLI – легковесном агенте для кодирования, который запускается в терминале. Эта модель оптимизирована для быстрых рабочих процессов с низкой задержкой и доступна как модель по умолчанию в Codex CLI и в API как codex-mini-latest.

В ближайшие недели пользователи смогут бесплатно и без ограничений исследовать возможности Codex, после чего OpenAI введет ограничения и гибкие варианты ценообразования. Для разработчиков, использующих codex-mini-latest, модель доступна по цене $1.50 за 1 млн входных токенов и $6 за 1 млн выходных токенов.

Я регулярно использую codex cli как второго агента — он неплохо справляется с code review и нахождением багов. Так что, как в доступе появится анонсированный агент, мне есть чем его загрузить.

Nvidia продолжает свой сложный путь между капелек — компания заявила, что не будет отправлять планы графических процессоров в Китай, несмотря на сообщения о том, что компания работает над исследовательским центром в Шанхае на фоне недавних экспортных ограничений США.

Источник CNBC сообщил, что компания арендует новые помещения для существующих сотрудников, но не отправляет туда какую-либо интеллектуальную собственность или дизайны GPU. По его словам, это продолжение давнего присутствия компании в Китае.

Epic с Apple продолжают бодаться — Epic Games сообщила, что Apple «заблокировала» новую заявку на размещение Fortnite, не позволяя выпустить игру ни в США, ни в Epic Games Store в Европейском Союзе. «К сожалению, Fortnite на iOS будет недоступен по всему миру, пока Apple не разблокирует его», — заявили представители Epic в X.

В свою очередь Apple отрицает обвинения: «Мы не предпринимали никаких действий для удаления работающей версии Fortnite из альтернативных магазинов приложений» в ЕС. Компания утверждает, что просто попросила европейское подразделение Epic Sweden «повторно подать обновление приложения без включения магазина App Store для США, чтобы не влиять на Fortnite в других регионах».

При этом немалое количество сервисов уже воспользовалось свежими изменениями в политике App Store — я уже упоминал Amazon с возможностью купить книги в Kindle, вчера Patreon сообщил, что 30% комиссии отменяются. Но вот Epic-у по-прежнему не можно. Черт его знает, на что теперь рассчитывает Apple.