4 июня 2026

Google представил Gemma 4 12B — мультимодальную модель, которая стала промежуточной между компактной E4B и более крупной 26B MoE, при этом по бенчмаркам приближается к 26B при менее чем половине её требований к памяти. Главная особенность — отказ от отдельных энкодеров для изображений и звука: вместо стандартного визуального энкодера используется лёгкий модуль из одного матричного умножения с позиционными эмбеддингами и нормализацией, а аудиоэнкодер убран полностью — сырой сигнал проецируется в то же пространство, что и текстовые токены. Это первая модель среднего размера в линейке с нативным вводом аудио.

Уже можно попробовать во всех популярных фреймворках. На моем MBP M4 Pro выдает 25-26 токенов в секунду. Правда, как и все остальные локальные модели, странно долго думает на вопрос “кто ты?”. Размышления модели в этот момент больше напоминают внутренний монолог Семена Семеновича Горбункова “Зачем я соврал? Зачем он спросил? Зубы заговаривает”.

Кроме того, Google выпустил три инструмента для MacOS: приложение AI Edge Gallery с чатом, голосовой редактор Eloquent с полностью офлайновой обработкой и функцией Voice Edit, и добавил serve в LiteRT-LM CLI, которая поднимает эндпоинт, совместимый с форматом OpenAI API.

Оба приложения — AI Edge Gallery и Eloquent, — практически портированы из iOS версий. В Gallery доступны Agent Skills, где модель может выполнять скрипты на python, режим аудиоввода, обработка картинок. Правда, в целом юзабилити приложения не на высоте, а скорость генерации слегка ниже LM Studio, но для нетехнического пользователя это вряд ли будет серьезной проблемой, а технические детали в LM Studio его скорее испугают.

Cloudflare покупает VoidZero, которая разрабатывает Vite, Vitest, Rolldown, Oxc и Vite+. Вся команда переходит в Cloudflare, при этом проекты остаются под лицензией MIT, vendor-agnostic и управляемыми сообществом, а их дорожную карту по-прежнему ведут Эван и команда VoidZero. В рамках сделки Cloudflare выделяет 1 млн долларов в фонд экосистемы Vite, которым распоряжается её core-команда. Это второе подобное поглощение за год — ранее к Cloudflare присоединилась команда Astro.

С Astro вроде пока ничего плохого не произошло. Так что и про Vite вряд ли нужно беспокоиться.

За ноутбуками и компьютерами на Computex потерялся анонс Nemotron 3 Ultra. Модель с 550 млрд параметров (из которых активны 55 млрд) стала крупнейшей в линейке Nemotron 3 и, по оценке Artificial Analysis, самой сильной американской моделью с открытыми весами — 48 баллов в Intelligence Index против 39 у Gemma 4 31B и 33 у gpt-oss-120b. При этом она уступает китайскому лидеру Kimi K2.6 (54 балла). На предрелизном эндпоинте DeepInfra модель выдавала свыше 300 токенов в секунду.

Модель сегодня уже доступна на HuggingFace, других инференс-провайдерах и даже есть бесплатный эндпойнт на Openrouter.