Telegram-канал

Meta разрабатывает планы облачного бизнеса для продажи внешним клиентам избыточных AI-мощностей и доступа к моделям, то есть напрямую конкурировать с AWS, Microsoft Azure и Google Cloud. По данным Bloomberg, инициатива идёт в рамках внутреннего проекта Meta Compute и предполагает два направления: доступ к размещённым на инфраструктуре Meta моделям (включая собственные Muse Spark) по образцу AWS Bedrock и продажу «сырых» вычислительных мощностей в духе CoreWeave.

Я так понимаю, что Закерберг посмотрел на Маска и решил, что он тоже так хочет. В целом, пусть совершенно понятный — если не смог загрузить инфраструктуру собственными моделями, потому что не смог в модели, то остаётся продавать инфраструктуру.

С 1 июля Anthropic возвращает Claude Fable 5 в глобальный доступ после снятия экспортных ограничений, введённых правительством США 12 июня. Mythos 5 частично восстановлена для ряда организаций США после одобрения 26 июня. Anthropic также обучила новый классификатор, блокирующий описанную технику в более чем 99% случаев, и предлагает вместе с Amazon, Microsoft и Google единый отраслевой стандарт оценки серьёзности джейлбрейков.

C 1 июля Fable 5 будет доступен на всех тарифах в рамках 50% от еженедельных лимитов. После 7 июля использование модели будет оплачиваться через систему кредитов (usage credits).

Новый классификатор будет работать более строго и в большем количестве задач деградировать модель до Opus 4.8. Вместе с тем Anthropic обещает совершенствовать классификатор для исключения false positives.

Компания настаивает, что ничего страшного обнаружено не было — те же уязвимости находили Opus 4.8, GPT-5.5 и Kimi K2.7, а демонстрацию эксплойта воспроизвели вообще все проверенные модели, включая Haiku 4.5. Тем не менее длинный пост полон обтекаемых утверждений относительно налаживания сотрудничества с правительством, разработке общих мер и так далее.

Можно даже согласиться с рядом специалистов, высказывавшихся в том духе, что Anthropic подорвалась на собственной мине — они слишком долго предупреждали об опасности и в итоге их же модель и сочли опасной.

Anthropic выпустили Claude Sonnet 5 — модель, которую компания называет самой агентной в линейке Sonnet. По её данным, Sonnet 5 приближается по результатам к Opus 4.8 на задачах рассуждения, использования инструментов и кодинга, оставаясь дешевле. Правда, все же и хуже. Модель доступна сразу во всех тарифах и становится дефолтной для Free и Pro, а в API запускается с вводной ценой 2 и 10 долларов за миллион входных и выходных токенов до 31 августа 2026 года, после чего цена вырастет до 3 и 15 долларов.

Разница в тестах с Sonnet 4.6 заметная, так что можно переключать все субагентные решения на него. Anthropic поднимают лимиты для использования новой модели — правда, пока я вижу, что отдельный подсчет лимита для Sonnet пропал.

То есть, я так понимаю, что не исключено появление и Opus 5?

Meituan, китайский гигант доставки еды, выпустила и пообещала открыть исходный код модели LongCat-2.0, назвав её первой в мире системой на триллион (1,7Т, из которых 48B активных на токен) параметров, полностью обученной и работающей на кластере из 50 000 процессоров китайского производства. Модель ориентирована на агентное программирование, обрабатывает до 1 млн токенов и, по утверждению компании, на отдельных бенчмарках сравнялась или превзошла Google Gemini, GPT-5.5 от OpenAI и Claude Opus от Anthropic. Ну да, как же без этого.

В общем, ключевое в новости — что обучение проведено на неких AI-ASIC суперподах, а не на как-то довезенных в Китай контрабандных GPU западного производства. Впрочем, свои наработки, вроде развития DeepSeek Sparse Attention, тоже интересно посмотреть.

Британский регулятор CMA предложил разрешить разработчикам приложений направлять пользователей к альтернативным способам оплаты в обход магазинов Apple и Google. Любые комиссии за такой «стиринг» должны быть ниже текущих ставок App Store и Play Store. CMA предполагает, что такая экономия перейдет к потребителям или будет направлена в развитие продуктов. Параллельно CMA рассматривает требование к Apple открыть доступ к NFC, что позволило бы британским финтех-компаниям строить собственные платежные сервисы, включая переводы со счета на счет и цифровые валюты. Предложения вынесены на консультацию в рамках режима strategic market status, присвоенного обеим компаниям в прошлом году.

Google утверждает, что они что-то такое уже сделали и CMA обещает это учесть. Apple привычно сопротивляется. Наивность CMA с предположениями, что снижение комиссий приведет к снижению цен на подписки или продукты, в общем, тоже не особо удивляет.

Rocket Lab покупает оператора спутниковой связи Iridium за 8 миллиардов долларов — по 54 доллара за акцию деньгами и бумагами, что на 24% выше цены закрытия 26 июня. Сделку объявили 29 июня, закрытие ожидается в середине 2027 года при условии регуляторных одобрений. Iridium управляет группировкой из 66 спутников (плюс 14 резервных на орбите), работающих в L-диапазоне, и владеет авиационным сервисом Aireon. Для Rocket Lab, до сих пор занимавшейся запусками и производством спутников, это вход на рынок спутниковых услуг.

Питер Бек, глава Rocket Lab, более года намекал на собственную группировку, но компания не подавала заявок на спектр и не делала практических шагов — теперь он называет покупку Iridium «коротким путём» к редкому глобально согласованному спектру и готовой работающей сети.

Если встретите толкование — ну да, понятно, решили конкурировать со Starlink, — проходите мимо. Iridium глобально не конкурирует со Starlink, просто потому что Iridium есть глобально везде за счет более высокой орбиты и согласованного спектра частот, а Starlink оставляет пробелы в покрытии. Единственная точка пересечения — новомодная услуга Direct-To-Cell, где Starlink действительно попадает в нишу глобально доступной телефонной связи. Ну, и Iridium не конкурент в плане скорости, конечно — там передача данных и до мегабита не доходит.

Вот вам еще одно исследование, тоже вполне себе флеймовое.

Авторы использовали серьезный набор данных — более 100 000 разработчиков GitHub плюс внутренняя телеметрия Microsoft по использованию AI-инструментов. Метод — сопоставленный событийный анализ (каждого, кто внедрил инструмент, сравнивают с близнецом-разработчиком на год раньше, чтобы отделить эффект инструмента от общей волны внедрения AI). Задача исследования — выяснить, как растет отдача по мере внедрения AI-инструментов и доходит ли эффект до конечного продукта.

На уровне написания кода прирост огромный и растёт с каждым поколением. По числу коммитов накопленный эффект: ▪️ автодополнение — +40% ▪️ + синхронные (интерактивные) агенты — +140% ▪️ + асинхронные (автономные) агенты — +180%

Но дальше по цепочке выигрыш стремительно затухает. Те же 180% по коммитам превращаются в +50% по числу проектов и всего +30% по фактическим выпускам. У синхронных агентов разрыв ещё нагляднее: +741% строк кода, +65% пул-реквестов — и лишь +20% релизов.

Основная гипотеза, что происходит — в цепочке остаётся слабое звено, то есть человек. Громадный выигрыш в разработке и генерации кода дальше упирается в живого ревьюера — code review это же очень важная стадия, как можно доверять тупой машине? — и там и пропадает.

Кстати, аналогичную картину авторы видят в приложениях в App Store, Chrome и Google Play — количество новых приложений выросло значительно, но общее использование приложений по площадкам осталось прежним. Подавляющее большинство новых приложений не смогли набрать даже минимальную аудиторию. Собственно, это полностью согласовывается с общей идеей — узкое место просто переехало в маркетинг приложения.

Австрия предлагает Евросоюзу рассмотреть размещение американской компании Anthropic на своей территории — в ответ на ограничения, введённые администрацией Трампа в начале июня. Госсекретарь по цифровизации Александр Пёлль в письме исполнительному вице-президенту Еврокомиссии Хенне Вирккунен предложил обсудить «стратегическое учреждение и участие Anthropic в ЕС», обеспечив компании правовую определённость, доступ к рынку, капитал и подходящий набор ценностей. По словам Пёлля, присутствие такого игрока привлекло бы таланты и помогло бы устанавливать стандарты, не вытесняя европейские проекты.

Правда, непонятно, как именно американская компания Anthropic может переместиться в Европу хотя бы частью с учетом экстерриториальности большей части американского законодательства. И тем более, как она может взять с собой свои модели.

Понедельник обычно небогат на новости, так что давненько я не брал в руки исследований. Вот одно очень флеймообразующее.

В крупном турецком BPO-подразделении (клиентская поддержка телеком-оператора крупным аутсорсером) 248 полностью удалённых сотрудников случайным образом разделили на две группы: одни остались дома, другие выходили в офис один фиксированный день в месяц. Больше ничего не меняли — ни оплату, ни нагрузку, ни часы, ни технологию. Такая схема продолжалась девять месяцев плюс за командами наблюдали еще пять месяцев после окончания вмешательства.

Что получилось: ▪️ Производительность +7,8% (звонков в час) в постэкспериментальный период. Прирост — за счёт сокращения длительности звонка на ~17 секунд, без потери качества обслуживания. ▪️ Текучесть упала на треть: 21% → 13,7%. ▪️ Коммуникация выросла: +36 минут общения с коллегами за неделю после офисного дня; случайные «соседи по столу» потом на 11 п.п. чаще продолжали общаться. ▪️ Отношение выгод к издержкам ≈ 5:1 (с учётом транспорта и питания за счёт компании).

Интересная динами эффект не вспыхивает сразу, а накапливается со временем и сохраняется после того, как обязательные визиты прекратили. Это аргумент против объяснения через эффект Хоторна или временный подъём морали — личный контакт восстанавливает наставничество в реальном времени и обучение у коллег, и накопленный организационный капитал работает дальше.

Жду комментариев “Так это саппорт, а настоящим программистам даже подходить к офису противопоказано” или “А я много лет работаю удаленно и ничего”.

Anthropic подтверждает, что получили разрешение от правительства США предоставить доступ к модели Mythos 5 американским организациям, обеспечивающих критическую инфраструктуру. По утверждению правительства, в общее число включены и иностранные сотрудники самой Anthropic.

Переговоры относительно возобновления общего доступа к Fable 5 продолжаются.

Дональд Трамп пригрозил ввести 100-процентные пошлины на товары любой страны, которая обложит американские технологические компании налогом на цифровые услуги. В своей Truth Social он заявил, что эта пошлина «заместит» торговые соглашения с такими странами — независимо от того, подписаны они или нет, — и будет введена немедленно, если страны не откажутся от своих планов. Под удар Трамп поставил «многочисленные европейские страны», рассматривающие подобные налоги; всего такие сборы уже ввели более десятка государств.

Я так понимаю, одержав самую прекрасную победу на Ираном (на самом деле нет), дед на радостях опять забыл выпить таблетки, забыл, что делать дальше и пошел по второму кругу, начав с тарифов. Чего вдруг и именно сегодня случился этот выплеск известной жидкости в известный орган — вскрытие когда-нибудь покажет.

OpenAI выкатывает в ограниченный доступ модели линейки GPT‑5.6: флагманскую Sol, сбалансированную Terra и быструю Luna. Terra сопоставима по качеству с GPT‑5.5 при вдвое меньшей цене, Luna дает максимально дешевый доступ. Sol заявлен как сильнейшая модель компании с упором на агентные сценарии в кодинге, биологии и кибербезопасности, новыми режимами рассуждения max и ultra. Цены: Sol — 5/30 долларов за миллион токенов на входе/выходе, Terra — 2,5/15, Luna — 1/6. Широкий запуск в ChatGPT, Codex и API обещан в ближайшие недели, а Sol на Cerebras со скоростью до 750 токенов в секунду — в июле.

Как все уже посмотрели, выпуск моделей в широкий доступ согласовывается с правительством США. Насколько это будет совпадать с восстановлением доступа к моделям Anthropic — это хороший, конечно, вопрос.

С 1 июля 2026 года Binance прекращает обслуживать клиентов в ЕС: за неделю до этого Греция отклонила заявку биржи на общеевропейскую лицензию по регламенту MiCA, который вступает в силу с этой даты. Биржа уже рассылает пользователям в Польше, Италии, Испании и Франции инструкции по выводу средств и планирует подать новую заявку через Францию, хотя одобрение, если оно будет, придёт значительно позже дедлайна. До этого момента обслуживать клиентов в регионе компания не вправе.

Binance утверждает, что не получила формального решения и сама «приняла осмотрительное решение отозвать заявку», а сама заявка была «полной и соответствующей требованиям». Источники же, знакомые с процессом, говорят об отказе из-за претензий к контролю над отмыванием денег и сомнений, проходит ли основатель компании Чанпэн Чжао тест на «честность и добросовестность».

Ну-ка, расскажите мне про независимую от государств финансовую систему…

OpenAI проведёт поэтапный запуск GPT-5.6: сначала ограниченный доступ для узкого круга партнёров, причём, по словам Сэма Альтмана на встрече с сотрудниками, федеральное правительство будет одобрять доступ «клиент за клиентом» в течение превью-периода. Решение принято по прямой просьбе двух ведомств — Office of the National Cyber Director и Office of Science and Technology Policy. Несмотря на согласование планов, министр торговли Говард Латник позвонил Альтману и предостерёг от запуска без одобрений других агентств. Альтман назвал такой формат не предпочтительным и пообещал добиваться более устойчивого подхода. Аналогичным путём в апреле пошла Anthropic с моделью Mythos.

Причем, прямо скажем, Anthropic это не очень помогло. Посмотрим, как оно будет с OpenAI.

Anthropic обвинила Alibaba в масштабной попытке «незаконно» получить доступ к своей модели Claude через почти 25 тысяч поддельных аккаунтов: с апреля по июнь, по данным компании, прошло 28,8 млн обращений, нацеленных на самые ценные возможности Claude — программную инженерию и агентские рассуждения. Компания называет это крупнейшей пока попыткой китайского разработчика воспользоваться результатами ведущих американских лабораторий через так называемую состязательную дистилляцию.

В комментариях на HackerNews часть участников отмечают иронию — компания, обучающая модели на скачанных книгах (и суд это признал fair use), возмущена тем, что кто-то обучает свои модели на скачанных reasoning Claude. С другой стороны, как замечают некоторые, запрос к API — это транзакция, то есть покупка, поэтому что делает покупатель с купленным товаром, не может подпадать под уголовное преследование продавца.

Попутно в комментариях всплыли прекрасные ссылки, описывающие китайскую индустрию перепродажи доступа к Anthropic — прямой доступ там запрещен, да и расплатиться китайской картой не получится, поэтому в Китае полно реселлеров, которые при этом не закупают трафик через API — они используют миллионы аккаунтов с подписками Claude, часто через Сингапур. Даже это не оправдывает скидки до 97%, которые встречаются кое-где, — потому что для удешевления реселлеры часто подменяют модели в запросах и дополнительно монетизируют процесс продажей логов китайским лабораториям для дистилляции. Это, кстати, объясняет и предельно дешевый доступ к известным китайским моделям — они вынуждены конкурировать с ценами реселлеров в Китае.

Сегодня нашумело заявление сенатора-демократа Марка Уорнера о том, что при использовании Mythos в NSA модель взломала практически все существующие системы защиты, причем не за дни, а за часы. NSA уже поспешило объяснить, что речь не шла о взломе — модель просто очень эффективно находила уязвимости в существующих системах агентства.

Впрочем, больше не находит — после того, как Anthropic получил запрет на экспорт Mythos/Fable и выключил их всем, все и потеряли к ним доступ. Включая NSA и всех участников проекта Glasswing.

Гонка вооружений и диверсификации AI выходит на другой уровень — OpenAI и Broadcom представили Jalapeño. Это первый собственный инференс-чип OpenAI, спроектированный с нуля под LLM, а не адаптированный из универсальных AI-чипов. По заявлению компаний, путь от первого дизайна до tape-out занял девять месяцев, часть процесса оптимизации ускорили сами модели OpenAI. Инженерные образцы уже выполняют рабочие нагрузки в лаборатории, включая GPT-5.3-Codex-Spark. Развёртывание на гигаваттном масштабе с Microsoft и другими партнёрами обещают начать к концу 2026 года, чип — первый в серии.

OpenAI признаёт, что финальная производительность ещё измеряется, речь идёт об инженерных образцах в лаборатории, а детальный технический отчёт обещан лишь «в ближайшие месяцы». GPT-5.3-Codex-Spark уже запускался на чипах Cerebras и у OpenAI есть контракт на их использование — но это несколько урезанная модель по сравнению даже с 5.3 Codex, а сейчас носят уже GPT 5.5. Впрочем, в многоагентной среде получить модель, которая будет выполнять массовые рутинные операции с большой скоростью — а её пока не называют, — тоже очень хорошо.

Не знаю, почему это новость, но пусть будет — Марк Закерберг поручил сотрудникам Meta создать платформу для рынков предсказаний, что подтвердил CNBC источник, знакомый с планами компании; первой о разработке сообщила The New York Times. Приложение, с внутренним названием «Arena», будет отдельным от Instagram и Facebook, но будет использовать их аудиторию для привлечения трейдеров. В отличие от существующих рынков предсказаний, торговля пойдёт не на реальные деньги, а на игровые очки, хотя в будущем не исключено и подключение денег. На сообщение отреагировали падением акции DraftKings (минус 2%), Flutter Entertainment и Robinhood.

Впрочем, это еще что — вот когда вся дистрибуция Meta развернется на этот пузырь, мы наверняка увидим антимонопольные разбирательства — классическое же использование доминирующего положения на одном рынке на продвижение на другом. Останется только доказать ущемление конкуренции — но я почему-то не сомневаюсь, что реклама Arena будет только формально соответствовать законодательству (которое на данный момент очень неясно регулирует эту отрасль), а вот реклама Polymarket или Kalshi пропускаться будет реже, поскольку ничего не понятно и лучше считать это гемблингом.

Вчера на волне этих слухов встретил чей-то рассказ о том, как Закерберг пытался купить DeepMind за большие деньги, чем предлагал Google. Демис Хассабис на встрече завел разговор про VR, AR, 3D печать как перспективные технологии и Марк отреагировал с большим энтузиазмом на все эти темы. Как потом сказал Демис, это решило вопрос — он хотел иметь дело с людьми, которые понимают, что AI является чем-то гораздо большим, чем все остальные упомянутые темы, пусть и за меньшие деньги.

А мог бы сейчас заниматься прогнозными рынками.

Meta впервые выпускает умные очки под собственным брендом по сниженной цене: модели Adventurer и Fury стоят по 299 долларов — на 80 дешевле прошлогодних Ray-Ban Meta Wayfarer. Еще одна модель называется Starfire, она стоит 399 долларов и разработана в сотрудничестве с Кайли Дженнер. Дизайн разрабатывает сама Meta, производством займётся партнёр EssilorLuxottica (родительская компания Ray-Ban и Oakley), чей логотип появится на дужках и упаковке.

Обе модели Meta напоминают классический Wayfarer, только слегка попроще. Кроме того, руководство Meta намекает на возможность выхода еще одной модели очков — без камеры, только с аудиовозможностями взаимодействия с Meta AI.

Конечно, очевидная цель новинок — нарастить базу перед возможным выходом очков Apple, который по слухам ожидается в будущем году. Ну, не со свежим же ужасом от Snap им конкурировать.

У вас случалось такое, что вы читаете текст и думаете “Как будто мои мысли записаны”? У моделей/агентов это называется Prompt Injection as Role Confusion — когда часть информации, попадающей в контекст, выглядит настолько похоже на собственный reasoning модели, что агент принимает внешнюю информацию за свои мысли и выполняет инструкции, в них заложенные.

Большая работа на эту тему показывает, как именно это происходит. Правда, стоит учитывать, что эксперименты проводились на gpt-oss-20B, в том числе потому, что у этой модели, по мнению авторов, особенно хорошая линейная разделимость всех ролей. Не факт, что у других моделей эффект будет так же заметен или так же силен. Но действительно такой вектор атаки возможен и надежная защита модели от него отсутствует, поскольку собственный reasoning не проверяется. Передовые модели вроде бы могут не доверять собственным мыслям, но, как продолжают логику авторы, если модель сама себе не доверяет, можно ли доверять модели?

В общем, стоит взять на заметку и, может, добавить правило в настройки агента, чтобы ослабить подобные возможности. Что, конечно, не отменяет необходимости закрывать действительно опасные векторы физически за пределами возможностей LLM.