24 апреля 2026

DeepSeek выложили preview V4 — две MoE-модели: Pro (1.6 трлн параметров, 49 млрд активных) и Flash (284 млрд, 13 млрд активных), обе с нативным миллионом токенов контекста. На таком контексте Pro тратит почти вчетверо меньше вычислений и в десять раз меньше памяти, чем V3.2 — длинный контекст для open-source впервые становится реально дешёвым.

Архитектурных новшеств три. Механизм внимания стал двухуровневым: контекст сжимается блоками по 4 и по 128 токенов, и модель работает с агрегатами, а не с каждым токеном — отсюда и экономия ресурсов. Обычные остаточные связи между слоями заменены на hyper-connections с математическим ограничением на норму матрицы. Заметно изменилась и процедура обучения после предтренинга: сначала для каждого домена (математика, код, агенты, следование инструкциям) отдельно тренируется модель-специалист, а затем более десяти таких учителей дистиллируются в одну общую модель. Подход пришёл от стартапа Миры Мурати Thinking Machines Lab; классический смешанный RL-этап на финальной стадии полностью убран.

На бенчмарках, правда, картина неоднозначная. Codeforces 3206, Putnam-2025 — 120/120, LiveCodeBench 93.5 — формально выше, чем у GPT-5.4 и Gemini-3.1-Pro. Но на 1M-контексте по MRCR впереди Opus-4.6 (92.9 против 83.5), на HLE и GPQA Diamond closed-модели тоже лидируют. Сами авторы в разделе ограничений честно пишут — по траектории развития отстают от frontier закрытых моделей на 3–6 месяцев. Но дешевле — так сказать, топ за свои деньги.

Amazon и Meta заключили многолетний контракт на несколько миллиардов долларов: Meta арендует сотни тысяч процессоров Graviton из дата-центров Amazon для задач, связанных с AI. Сделка дополняет уже имеющиеся у Meta соглашения с Nvidia, AMD, Google (TPU) и Broadcom, а также собственную линейку MTIA. Акции Amazon на премаркете выросли на 1,8%, бумаги Meta почти не отреагировали.

Речь идёт не о GPU и не об AI-ускорителях Trainium, а об универсальных Graviton на базе Arm. Как говорит вице-президент Amazon Нафеа Бшара, «GPU бесполезны без стоящих рядом CPU».

X выпустили наконец обещанное приложение XChat для iPhone и iPad. Приложение построено вокруг личных сообщений в твиттере: сквозное шифрование, отсутствие рекламы и трекинга, исчезающие сообщения, блокировка скриншотов, групповые чаты и видеозвонки. В отличие от основного клиента X, XChat уже использует дизайн и клавиатуру iOS 26. Запуск совпал с отключением функции Communities в X, которую заменили на Groupchat Links.

Вынос мессенджера в отдельный продукт выглядит совершенно противоположным решению самого Маска строить суперапп на базе X. Параллельное закрытие Communities и перевод групповых чатов в XChat, вероятно, упрощает внедрение сквозного шифрования, которое сложнее реализовать внутри ленты с рекламой и трекингом. А вот Grok отсутствует совершенно, несмотря на амбиции всей компании в AI.