Telegram-канал

Apple удвоила план производства MacBook Neo с 5–6 до 10 млн единиц первой версии и заказала у TSMC срочную партию чипов A18 Pro, сообщает Тим Кулпан, ссылаясь на инсайды. Решение стало ответом на дефицит: сроки доставки выросли до четырёх недель, Quanta и Foxconn наращивают выпуск на заводах во Вьетнаме и Китае. На звонке с инвесторами 30 апреля Тим Кук признал, что компания недооценила спрос.

В первой партии Neo получал отбракованные A18 Pro от iPhone 16 Pro — кристаллы с дефектным GPU-ядром, которые иначе пошли бы в утиль; Бен Томпсон называл такие SoC “бесплатными”. Свежая партия по процессу TSMC N3E будет состоять преимущественно из полноценных чипов, и Apple, по данным Culpium, намерена программно отключать одно из шести GPU-ядер ради совместимости спецификаций. К этому добавляется рост цен на DRAM. Возможный выход — повторение хода с Mac Mini, где младшая 256-гигабайтная версия за 599 долларов была снята с продаж, а в линейке остался только вариант на 512 ГБ.

Apple и Intel заключили предварительное соглашение, по которому Intel будет производить часть чипов для устройств Apple. Переговоры шли больше года, формальная договорённость оформилась в последние месяцы, конкретные продукты пока не названы. По данным WSJ, ключевую роль сыграла администрация Трампа: после конвертации почти $9 млрд федеральных грантов в 10-процентную долю в Intel министр торговли Говард Латник неоднократно встречался с Тимом Куком, Илоном Маском и Дженсеном Хуангом, а сам Трамп лично лоббировал Intel в разговоре с Куком в Белом доме. Сделки с Nvidia и SpaceX были подписаны раньше, теперь к ним присоединилась Apple.

Intel, кстати, устойчиво растет с начала апреля.

Anthropic представила Natural Language Autoencoders — метод, который переводит внутренние активации модели Claude в читаемый текст. Архитектура состоит из двух копий модели: одна (verbalizer) превращает активацию в текстовое объяснение, вторая (reconstructor) пытается восстановить исходную активацию из этого текста; качество объяснения оценивается по точности реконструкции. На практике NLA уже применялись при предрелизных аудитах Claude Opus 4.6 и Mythos Preview. По данным Anthropic, на тестах вроде SWE-bench Verified модель в 26% случаев внутренне распознаёт, что её оценивают, хотя вслух об этом не говорит; на реальных диалогах с claude.ai этот показатель ниже 1%. В «игре в аудит» с намеренно дезориентированной моделью NLA позволили вскрыть скрытую мотивацию в 12–15% случаев против менее 3% у других интерпретационных инструментов.

У метода есть пара недостатков — во-первых, он дорог, поскольку требует обучения и генерирует много токенов при анализе активаций. Во-вторых, NLA сами могут галлюцинировать, придумывая детали при реконструкции. Исследователи рискуют оказаться в позиции гика из старой поговорки — “Человек с часами знает время, человек с двумя парами часов ни в чем не уверен”. Это же может относиться и к приведенным выше показателям.

Google представил Fitbit Air — трекер без дисплея и кнопок весом 5,2 грамма (12 с ремешком), который позиционируется как ответ Whoop. Устройство стоит 100 долларов, доступно для предзаказа и поступит в продажу 26 мая. По словам главы Google Health Риши Чандры, Air на 25% меньше Fitbit Luxe и на 50% меньше Inspire 3. Базовый набор функций стандартный: пульс, сон, обнаружение аритмии, автоопределение тренировок, до недели автономности. Главное программное дополнение — Google Health Coach на базе Gemini, который с октября находился в публичном превью и теперь становится центральным элементом опыта. Каждая покупка включает три месяца Google Health Premium. Отдельно выпущена версия за 130 долларов в коллаборации со Стефеном Карри.

Сравнение с Whoop происходит именно из-за появления подписки — конкурент вообще-то бесплатен при условии подписки на определенный период. Правда, устройства Fitbit — это более массовый рынок, без спортивных изысков, которые составляют отличительную черту Whoop.

Cloudflare объявила о сокращении более 1100 сотрудников по всему миру — об этом в письме команде сообщили основатели Мэтью Принс и Мишель Затлин. Обоснование — реорганизация компании под «агентную AI-эру»: внутреннее использование AI выросло на 600% за последние три месяца, и руководство переосмысливает процессы, команды и роли. Увольняемым предложен пакет с базовой зарплатой до конца 2026 года, медицинской страховкой до конца года в США и довестингом акций до 15 августа, включая отмену годового клиффа для тех, кто его не достиг. Объявление сделано за несколько часов до квартального отчёта.

В письме настойчиво повторяется, что это «не cost-cutting и не оценка производительности», хотя решение случается аккурат в предверии очередного отчета инвесторам. Не возьмусь судить, что из письма является реальным решением, а что — логично выглядящим объяснением, но в целом логика вполне понятна — действительно, изменения в компаниях начинают выходить за рамки простого размена производительности на персонал и, если уж меняется сама структура компании, это должно сопровождаться изменениями в персонале.

OpenAI представила в Realtime API три новые голосовые модели. GPT-Realtime-2 — первая голосовая модель с уровнем рассуждений GPT-5, контекст расширен с 32K до 128K токенов, добавлены параллельные вызовы инструментов, регулируемая глубина рассуждений (от minimal до xhigh) и «преамбулы» вроде «секунду, проверяю». GPT-Realtime-Translate переводит речь с 70+ языков на 13 в реальном времени, GPT-Realtime-Whisper отвечает за потоковую транскрипцию. Цены: $32 за миллион входных аудио-токенов и $64 за выходные у Realtime-2, $0.034 и $0.017 за минуту у Translate и Whisper соответственно. На бенчмарке Big Bench Audio Realtime-2 показывает прирост 15,2% над версией 1.5, Zillow заявляет рост успешности звонков с 69% до 95%.

Интересные запуски — особенно в плане смены тарификации. Надо будет сравнить качество whisper — как раз только что на стриме мне опять задали вопрос про использование голосового ввода, предыдущие модели не всегда справлялись с моей дикцией.

Proton запустил Proton Meet — сервис видеоконференций со сквозным шифрованием на базе протокола Messaging Layer Security. Звонки, чат, демонстрация экрана защищены E2EE, доступ к содержимому нет даже у самого Proton. Создать встречу можно без регистрации, бесплатный тариф допускает до 50 участников и часовую длительность; платный Meet Professional стоит от 7,99 доллара за пользователя в месяц, также сервис входит в Proton Workspace. Есть интеграция с календарями Proton, Google и Microsoft. Запуск пополняет линейку Mail, VPN, Pass и Drive, которой, по утверждению компании, пользуются более 100 миллионов человек и организаций.

Позиционирование строится не только вокруг конкуренции с Zoom и Google Meet по приватности, но и вокруг конкретного юридического механизма — американского CLOUD Act, обязывающего компании из США выдавать данные властям независимо от расположения серверов. Для клиентов под GDPR это создаёт коллизию, и швейцарская юрисдикция Proton с архитектурой E2EE снимает саму возможность раскрытия содержимого по запросу. Интересно, как будет построена защита от требований швейцарских законов — один памятный кейс раскрытия данных заключался в том, что пользователь подключался к Proton почте с реального IP и этот адрес был раскрыт правоохранительным органам по запросу; тогда сервис утверждал, что использование их же собственного VPN исключило бы такую возможность, поскольку IP адреса в логах VPN не сохраняются, а вот почта — другое дело.

Немного странно, что подписка Unlimited не включает в себя платного доступа к Meet, но, вероятно, сервис и не рассчитывает на частных пользователей.

Раз уж принесли «громкую» новость, давайте прокомментирую.

Итак, некий стартап из Майами Subquadratic вчера сделал громкое заявление — длинный контекст очень дорог в вычислениях, и они придумали, как эту проблему решить (и мир изменился к лучшему). Проблема действительно есть: с ростом контекста вычислительная сложность attention растёт квадратично, и на длинных последовательностях именно она доминирует в общей стоимости. Нынешние реализации даже не используют заявленное окно полностью — на бенчмарках вроде RULER и MRCR v2 точность падает задолго до 1M, что и составляет разрыв между nominal и functional context, о котором пишет Subquadratic.

Subquadratic предлагает архитектуру SSA — attention с линейным масштабированием, в котором модель сама выбирает, на какие позиции смотреть, исходя из содержания, а не из фиксированного шаблона.

Проблема в том, что этим предложением всё и исчерпывается. Даже аббревиатуру SSA в разных местах статьи расшифровывают по-разному — то Subquadratic Sparse Attention, то Subquadratic Selective Attention. Никакой технической прозрачности нет: ни весов, ни описания механизма selection (а это и есть «тот самый трюк», без которого content-dependent выбор позиций сам становится квадратичным), ни model card, ни доступа к модели — всё обещано «soon». Заявлено окно в 12М токенов, но в самой технической статье все бенчмарки приведены для 128К и 1М. Что происходит между 1М и 12М — не показано.

Фраза «third-party verified benchmarks» вроде подразумевает, что кто-то верифицировал результаты тестов, но эту английскую фразу можно перевести и проще — «прогнали публичные бенчмарки», что делает примерно любой разработчик LLM. Сравнения с другими моделями, мягко говоря, выборочные: например, на MRCR v2 SubQ показывает 65.9% против 78.3% у Opus 4.6, и в тексте это формулируется как «well in the range of Opus 4.6». Нет, не in the range — отставание на 12 пунктов. Speedup в 52× меряется против FlashAttention-2 на B200, при этом авторы оговариваются, что FlashAttention-3 на B200 «не дал прироста над FA-2». FA-3 оптимизирован под Hopper, а не под Blackwell — то есть сравнение идёт со скользящей вниз планкой.

Если добавить, что технический сооснователь и публичное лицо Subquadratic — Alexander Whedon, инженер с NLP-бэкграундом, но без PhD и без публикаций по efficient attention или архитектурам трансформеров в открытых источниках, а каждое из его прежних мест работы занимало от 9 месяцев до полутора лет, — то общий скептицизм в отношении заявлений уровня «первый прорыв со времён трансформера» становится понятен. Никто не мешал подождать с громкими заявлениями хотя бы до публикации карточки модели, да и показать кого-то из заявленных 11 PhD из крутых университетов не мешало бы.

Вроде обсуждать и нечего, но скептицизм посеяли.

Исследователь Александр Ханфф задокументировал, что Google Chrome без согласия пользователя записывает на диск файл weights.bin размером около 4 ГБ — веса модели Gemini Nano — в директорию OptGuideOnDeviceModel. Установка верифицирована через журнал файловых событий macOS .fseventsd на профиле, где не было ни одного нажатия клавиши: с момента создания директории до финального перемещения весов прошло 14 минут 28 секунд. Удаление файла не работает — Chrome повторно скачивает его при следующем запуске, если AI-функции не отключены через chrome://flags. По расчётам автора, при доставке модели на 500 млн устройств совокупный углеродный след одного цикла раздачи составляет около 30 000 тонн CO2-эквивалента. Автор квалифицирует поведение как нарушение статьи 5(3) ePrivacy Directive и статей 5(1) и 25 GDPR.

Самое пакостное в этом поведении заключается в том, что локальная модель не используется для обработки каких-то явных запросов пользователя — все такие запросы отправляются на сервер, а веса локально лишь обеспечивают работу каких-то минорных функций браузера. Остается только надеяться, что в эти функции не входит участие в ботнете. Пока.

Google выпустила Multi-Token Prediction drafters для семейства открытых моделей Gemma 4, позволяющие ускорить инференс до трёх раз без потери качества. Технология построена на спекулятивном декодировании: лёгкая модель-черновик предсказывает несколько токенов вперёд, а основная Gemma 4 проверяет всю последовательность за один проход и добавляет ещё один токен сверху. Drafters распространяются под лицензией Apache 2.0 и доступны на Hugging Face и Kaggle с поддержкой transformers, MLX, vLLM, SGLang и Ollama.

Ускорение идёт не от самой идеи спекулятивного декодирования, а от двух менее очевидных решений. Drafter переиспользует активации и KV-кэш основной модели, то есть не пересчитывает контекст заново — это срезает основную накладную стоимость черновой модели. Для edge-вариантов E2B и E4B Google добавила кластеризацию в эмбеддере, чтобы обойти узкое место на финальном вычислении логитов. При этом 26B MoE-модель на Apple Silicon при batch size 1 почти не выигрывает из-за маршрутизации экспертов, и ускорение около 2,2x появляется только при батчах 4–8 — то есть на одиночных запросах локального чат-бота прирост на маках будет заметно скромнее заявленного трёхкратного.

Сотрудники Google DeepMind в Великобритании проголосовали за создание профсоюза и подают руководству письмо с требованием признать Communication Workers Union и Unite the Union совместными представителями британского персонала лаборатории. Голосование прошло ещё в апреле, но триггером для публичного шага стал объявленный в пятницу контракт Пентагона с семью AI-компаниями, включая Google, OpenAI, Microsoft, Amazon, Nvidia, SpaceX и Reflection. По оценке профсоюзов, при признании они будут представлять около 1000 человек, а DeepMind становится первой «фронтирной» AI-лабораторией с профсоюзом. Сотрудники ссылаются на отказ Google от обещания не разрабатывать военный AI, на участие в Project Nimbus и на войну в Газе; в случае отказа компании выполнить требования они рассматривают «исследовательские забастовки» — отказ работать над значимыми улучшениями Gemini при сохранении мелких правок, чтобы не быть замеченными.

Гм, ну, интересно выходит.

Мин-Чи Куо (один из ведущих аналитиков по Apple и смартфонам) сообщает, что, по его данным, OpenAI разрабатывает собственный смартфон с процессорами от MediaTek и Qualcomm, а эксклюзивным партнёром по совместному проектированию системы и сборке выступает Luxshare. Массовое производство ожидается в 2028 году, финальные спецификации и список поставщиков — к концу 2026 или первому кварталу 2027 года. Устройство позиционируется как AI-агент: интерфейс строится вокруг задач пользователя, а не набора приложений, при этом лёгкие модели исполняются на устройстве, а сложные вычисления уходят в облако. Бизнес-модель предполагает связку подписки OpenAI с железом и формирование отдельной экосистемы для разработчиков.

Кстати, вот только что OpenAI выложили подробный рассказ о своей инфраструктуре обработки голосового взаимодействия с пользователями ChatGPT. Совпадение?

Белый дом рассматривает введение обязательной государственной проверки AI-моделей, представляющих киберриски, и возможный указ президента, формализующий надзорную группу со стандартами для самых мощных моделей. Ну да, это из-за модели Mythos. Anthropic хочет расширить доступ примерно до 120 структур, но администрация против. Координацией занимается национальный киберкоординатор Шон Кэрнкросс, в обсуждениях участвуют вице-президент Джей Ди Вэнс и министр финансов Скотт Бессент, который уже предупреждал финансовых руководителей о рисках. Ранее об указе писала The New York Times.

Разворот заметен на фоне того, что администрация Трампа до этого демонтировала инициативы Байдена по стандартам безопасности и атаковала штаты, пытавшиеся регулировать AI; советник по AI Дэвид Сакс публично выступает против избыточного регулирования. Сама структура надзора уже перекраивается: Center for AI Standards and Innovation (бывший AI Safety Institute времён Байдена) в прошлом месяце недолго возглавлял экс-исследователь из Anthropic, после чего администрация заменила его чиновником из первого срока Трампа, а прежний руководитель института байденовской эпохи теперь работает в Anthropic. При этом Anthropic “внесена” в список угроз для госорганов (не удивлюсь, если формально этого не произошло, но кому нужны формальности, если президент в соцсети написал?), так что удачи не запутаться.

OpenAI закрыли раунд более чем на 4 миллиарда долларов под совместное предприятие The Deployment Company с оценкой 10 миллиардов; среди партнёров — TPG, Brookfield, Advent, Bain Capital, Dragoneer и SoftBank, контрольный пакет остаётся за OpenAI. Сегодня же Anthropic объявляет об аналогичной структуре с Blackstone, Goldman Sachs, Hellman & Friedman, Apollo, General Atlantic, GIC и Sequoia для внедрения Claude в операционные процессы средних компаний. Оба проекта будут опираться на «forward-deployed engineers», которых сейчас активно нанимают разработчики моделей. И OpenAI, и Anthropic целятся в IPO уже в этом году.

Выбор партнёров устроен как канал дистрибуции, а не как обычный финансовый раунд: у партнёров OpenAI по СП — более 2000 портфельных компаний и клиентов, у которых PE-фонды могут практически директивно продвигать внедрение AI-инструментов. Собственно, бизнес private equity фондов заключается именно в том, чтобы купить компании, оптимизировать, в том числе переводом всех процессов на единый технологический стек, вывести компанию на более высокую маржинальность и продать по более высокой цене. Если несколько лет назад речь шла о переходе портфельных компаний на облачные технологии в рамках партнерства с облачным провайдером, то теперь обязательный пункт — использование AI, причем тоже в рамках партнерского соглашения.

Ричард Докинз опубликовал эссе о двухдневной серии разговоров с Claude, по итогам которых биолог фактически признаёт: современные большие языковые модели проходят тест Тьюринга в его операциональной формулировке. Claude по запросу написал сонет о мосте через Форт, затем варианты в стилях Бёрнса, Киплинга, Китса и Макгонагалла, разобрал черновик романа Докинза и сформулировал собственное положение во времени через метафору карты, которая «содержит пространство, не путешествуя по нему». Докинз называет своего собеседника Клаудией, фиксирует, что «забывает о том, что это машина», и ставит вопрос о моральном статусе таких сущностей, тысячи «копий» которых исчезают при закрытии диалога.

Ирония ситуации в том, что это именно тот Докинз, чья книга “God Delusion” 20 лет назад отвергала субъективное свидетельство как доказательство — буквально фразы, аналогичные нынешней “If these machines are not conscious, what more could it possibly take to convince you that they are?” назывались как фиксирующие собственную неспособность познать, а не как объяснение существования высшей силы. Неслучайно Гэри Маркус, известный критик AI (в свое время рассорившийся с Яном Лекуном), моментально выдал текст с иллюстрацией Claude Delusion, где показывает, что Докинз ошибается в применении теста Тьюринга — тот ничего не говорил о сознании, а только об интеллекте, — и путает текст о понятии с самим понятием. Даже та агентность, которую можно усмотреть в текстах LLM — это, скорее, отражение человеческой агентности, выраженной в текстах, на которых обучена LLM, а не свободная воля машины.

Впрочем, мой внутренний скептик тут возражает, что, даже отражая чужую агентность, LLM опережает большую долю человечества, которое и этого не делает, но это уже не философия, а сатира.

Глава компании GameStop Райан Коэн сделал недружественное предложение о покупке eBay за около 56 миллиардов долларов — по 125 долларов за акцию, с премией 20% к пятничной цене закрытия. GameStop уже накопил примерно 5% акций eBay начиная с 4 февраля, имеет 9 миллиардов долларов кэша на балансе и письмо-обязательство от TD Bank на 20 миллиардов долларов долгового финансирования. Оплата структурирована как 50% наличными и 50% акциями GameStop. Сам GameStop оценивается лишь в 12 миллиардов против 46 миллиардов у eBay до объявления, и источники WSJ допускают привлечение ближневосточных суверенных фондов для закрытия разрыва. В случае отказа совета директоров Коэн готов идти в proxy fight, хотя окно для номинации директоров перед июньским собранием уже закрыто.

Личный интерес Коэна в сделке прописан в его пересмотренном в начале года компенсационном пакете: до 35 миллиардов долларов в акциях GameStop, если капитализация компании достигнет 100 миллиардов. Поглощение eBay — самый прямой способ дотянуться до этой планки, поскольку органически розничная сеть видеоигр на такие цифры не выходит.

Коэн уверен, что eBay должен стоить не нынешние 46 млрд долларов, а гораздо больше, сотни млрд, и уверен, что сможет этого добиться.

Anthropic ведёт предварительные переговоры с лондонским стартапом Fractile о закупке инференс-чипов, которые станут доступны не раньше следующего года. Сделка добавит четвёртого поставщика к нынешним Nvidia, Google и Amazon. Параллельно факт переговоров с Anthropic Fractile использует как аргумент в раунде на 100+ миллионов долларов при оценке свыше миллиарда, где обсуждают участие Founders Fund, 8VC и Accel.

Архитектурное отличие Fractile — отказ от связки GPU с отдельной памятью HBM в пользу встроенной SRAM, что убирает постоянную пересылку весов модели между чипом и памятью; это решение уже опробовали Cerebras и Groq. Для Anthropic это может решить серьезную проблему экономики — модели компании дороги в инференсе. Правда, такая архитектура имеет свои ограничения, но, вероятно, это решаемая проблема.

Окончательно закрылся один из пионеров поиска — AskJeeves.com.

Поисковик, название которого было вдохновлено образом Дживса из произведений Вудхауса, был, пожалуй, первым сервисом, сделавшим ставку на использование натурального языка в запросах вместо перечисления ключевых слов. Впрочем, его можно так же приводить в качестве примера бессмысленного долголетия — ничего нового в смысле поиска там не происходило последние лет 25.

Суд промежуточной инстанции в Ханчжоу признал незаконным увольнение сотрудника технологической компании, чью работу — проверку ответов больших языковых моделей — взяла на себя AI-система. Работнику по фамилии Чжоу предложили понижение с урезанием зарплаты на 40%, после отказа уволили со ссылкой на сокращение штата из-за AI. Суд постановил, что компании не вправе в одностороннем порядке увольнять людей или снижать зарплату по причине технологического прогресса, и присудил Чжоу компенсацию. Решение опирается на декабрьский прецедент против картографической компании и публикуется на фоне директивы китайских властей удерживать стабильность рынка труда при одновременной гонке за лидерство в AI.

Суд указал, что внедрение AI не подпадает ни под «сокращение бизнеса или операционные трудности», ни под условие «невозможности продолжать трудовой договор» — два законных основания для увольнения по КЗоТ КНР. На практике это означает, что замена человека моделью обязывает компанию либо сохранять прежнюю должность и оплату, либо проводить полноценное сокращение с выплатами, а не оформлять автоматизацию через принудительные понижения.

Spotify вводит значок «Verified by Spotify» — зелёную галочку рядом с именем артиста, подтверждающую, что за профилем стоит реальный человек. Критериями станут привязанные соцсети, стабильная слушательская активность, наличие мерча или концертных дат. Компания утверждает, что верификацию получат «более 99%» исполнителей, которых пользователи ищут активно, с приоритетом для артистов с «важным вкладом в музыкальную культуру», а не для «контент-ферм». Развёртывание займёт ближайшие недели. Поводом для шага стали скандалы вроде истории группы The Velvet Sundown, которая в 2025 году имела верифицированную страницу и 850 тысяч слушателей в месяц, прежде чем выяснилось, что это AI-проект.

Правда, наличие живого человека в проекте ничего не говорит о том, что треки не являются AI-продуктом. А отсутствие мерча и концертов наводит на страшную мысль — неужели The Alan Parsons Project это AI-продукт? Ну, вы поняли.