Telegram-канал

Anthropic выложила исследование того, как люди на практике работают с AI-агентами, основанное на анализе миллионов взаимодействий в Claude Code и публичном API компании. Длительность автономной работы агента в самых сложных сессиях удвоилась за три месяца — с 25 до 45 минут. При этом рост плавный, без резких скачков при выходе новых моделей, так что это не только заслуга моделей, но и развитие пользователей.

Опытные пользователи чаще включают автоматическое одобрение действий (40% сессий против 20% у новичков), но при этом чаще прерывают агента вручную. Сама модель при этом останавливается для уточнений чаще, чем пользователи её прерывают.

У меня пока сложные ощущения от всякой автономности — я как раз вчера соорудил для Claude Code среду, чтобы запустить его с разрешением делать всё (dangerously-skip-permissions), и в итоге чаще его прерывал, чем в предыдущей сессии отвлекался на подтверждения. Вероятно, это все же совпадение, но в режиме вседозволенности он выполнил месячную норму по галлюцинациям, выполнив задачу 0 “Подготовка среды и изучение состояния проекта”, он задачу 1 начинал с “Сначала я подготовлю всё и изучу проект” — в общем, был невыносим до крайности.

Впрочем, видимо, и сам проект оказался удивительно сложен — Codex тоже в итоге потребовал микроменеджмента.

Как показывает опрос Public First для Financial Times, около 60% сторонников Трампа обеспокоены темпами развития AI, а почти 80% считают, что отрасли нужно больше регулирования. Корреспондент FT даже сходил на собрание обеспокоенных избирателей в Миссури, где люди боятся, что AI отнимет у них работу, потребит всё электричество и выпьет всю воду, уводя в нереальный мир детей и внуков.

Белый дом при этом делает ровно обратное — ускоряет выдачу разрешений на строительство датацентров, пытается запретить штатам регулировать AI и угрожает лишить федерального финансирования тех, кто примет «обременительные» законы. В декабре Трамп провёл соответствующий указ через исполнительную власть после того, как Конгресс дважды заблокировал аналогичное законодательство — в том числе благодаря его же союзникам вроде Стива Бэннона.

Но указ фактически игнорируется. Губернатор Флориды Рон Десантис — вероятный кандидат от республиканцев в 2028-м — публично критикует попытки «связать руки штатам и позволить Big Tech писать правила». Десятки проектов датацентров заморожены по всей стране из-за местного сопротивления. Город Сент-Чарльз в Миссури первым в стране ввёл годовой мораторий на строительство датацентров.

Методы правления нынешней администрации и без AI вызывают сопротивление — это нам отсюда может казаться, что Америка выглядит однородно и только некоторые штаты вроде Калифорнии или Техаса считают себя самобытными, но на самом деле права штатов и общин — больной вопрос для большинства из них, особенно южных — там до сих пор считают, что в войне 1861-65 годов могли бы выиграть.

А осенью выборы, которые традиционно сложны для правящей партии, и подобные настроения эту сложность только увеличивают. Самое же ироничное в том, что как раз развитие AI и, как следствие, масштабное развитие энергетики, выглядит чуть ли не единственным, что администрация делает условно правильно — но предыдущие много лет Трамп играл как раз на консерватизме и страхах избирателей “Ржавого” пояса, обещая им, что всё будет great again, без иммигрантов и woke.

Вот вам интересное исследование — авторы взяли две выборки книг (333 тысячи, выпущенные на Amazon с 2020 до 2025 годы, и 479 тысяч по отдельным тематикам с 2008 года), собрали читательские оценки для них, нормализовали их (то есть убрали влияние временного фактора на оценки) и попробовали определить, как распространение LLM повлияло на количество и качество книг.

Выводы интересные: — За последние три года ежемесячное количество новых книг в среднем утроилось, а в некоторых категориях увеличилось почти в 10 раз. — В среднем, книги, вышедшие в последние три года имели более низкое качество. — Но если взять отдельно топ-1000 книг по категориям, то их качество выросло за это время. — Средняя оценка авторов, которые начали публиковаться в последние три года, ниже обычного. А вот работы авторов, которые начали публиковаться до появления LLM, выросли за последние три года.

То есть, если считать, что LLM оказали влияние на работу авторов книг, то картина разнонаправленная — состоявшиеся авторы стали работать лучше (впрочем, наверняка они бы и так показали прогресс, поэтому вопрос конкретного влияния открыт), а те, кто решил, что теперь могут писать книги, писателями от этого не стали.

Я думаю, что это можно и к другим категориям отнести.

Apple приглашает журналистов и блогеров на «special Apple Experience» 4 марта сразу в трёх городах — Нью-Йорке, Лондоне и Шанхае. Компания намеренно использует слово «experience», а не «event» — привычной большой презентации из Apple Park не будет.

Список ожидаемых продуктов длинный, но не особенно амбициозный: iPhone 17e, MacBook Pro на чипах M5 Pro и M5 Max, обновлённые iPad Air и базовый iPad, возможно — новый Studio Display, бюджетный MacBook на чипе A18, Apple TV и HomePod mini. Почему именно сейчас Apple решила дать всё пощупать — непонятно.

Meta заключила многолетний контракт с Nvidia на миллиарды долларов, включая чипы следующего поколения Vera Rubin. Но, кажется, главное здесь не объём закупки, а то, что Meta стала первой из крупных tech-компаний, которая будет покупать у Nvidia отдельные CPU для инференса AI-моделей.

До сих пор Nvidia продавала CPU только в связке с GPU. Решение Дженсена Хуанга предложить их отдельно — стратегический разворот, который связывают с тем, что после эпохи обучения наступает эпоха инференса. Если вы посмотрите на сделку Nvidia с Groq или крупный контракт OpenAI c Cerebras, то это как раз подтверждается.

При этом у Meta были планы по разработке собственного чипа, которые, по слухам, реализуются с трудом. А у Nvidia этот контракт примечателен, поскольку остальные Big Tech компании скорее пытаются снизить свою зависимость от лидера рынка.

Manus запустил интеграцию своего AI-агента с Telegram — пока как первый канал, с обещанием добавить другие мессенджеры позже. Подключение занимает минуту через QR-код, без командной строки и конфигурационных файлов.

Компания подчёркивает, что это не облегчённый чат-бот, а полноценный агент с многошаговым выполнением задач, генерацией документов, обработкой голосовых сообщений и изображений. По сути, тот же Manus, только доступный через привычный интерфейс переписки.

Что интересно — выбор Telegram в качестве первого канала. Можно рассуждать о продвинутых пользователях, конечно, и как это соображение пересилило корпоративные интересы (Manus куплен Meta), но мне кажется показательным в плане скорости разработки. Всё, конечно, теперь делается быстро, но двух месяцев после покупки крутой компанией со своими мессенджерами не хватила молодому быстрому стартапу, чтобы перенести готовящийся запуск на собственные платформы. Забавно.

Сэм Альтман объявил о найме Питера Штайнбергера, создателя OpenClaw. OpenClaw переходит под управление фонда как open source проект при поддержке OpenAI. Альтман назвал Штайнбергера гением и пообещал, что мультиагентное взаимодействие «быстро станет ядром продуктовой линейки».

Питер был на этой неделе в подкасте Лекса Фридмана и говорил, что у него есть два предложения о сотрудничестве, упоминая и OpenAI. Немного иронии, правда, заключается в том, что OpenClaw пока что официально рекомендует использовать в качестве основной модели агента Claude Opus, да и вся экосистема скиллов ориентируется скорее на Claude, впрочем, с выпуском Codex app OpenAI уже начала двигаться в этом же направлении.

Ну, посмотрим, куда нас это заведет.

Пентагон рассматривает возможность разрыва отношений с Anthropic из-за отказа компании снять ограничения на использование Claude в военных целях. Министерство обороны требует от четырёх ведущих AI-лабораторий доступ ко всем «законным применениям» — включая разработку вооружений, разведку и боевые операции. OpenAI, Google и xAI уже сняли пользовательские ограничения для работы с Пентагоном. Anthropic держится за две красные линии: массовая слежка за гражданами США и полностью автономное оружие.

По данным Axios, конфликт обострился после операции по захвату Николаса Мадуро в Венесуэле. Высокопоставленный чиновник утверждает, что представитель Anthropic связался с Palantir, чтобы выяснить, использовался ли Claude в ходе рейда, при котором был открыт огонь. Anthropic это категорически отрицает.

Вот тут представляется прекрасный повод разогреть конспирологические мышцы. Помнится, в комментариях всегда хватало людей, уверенных, что всякие миссии — это для лохов, а настоящие пацаны знают, что за бабки компании пойдут на всё. С одной стороны, вроде бы как и не на всё.

С другой — у Пентагона уже в работе контракт на 200 млн с Anthropic, система уже используется и отказаться от нее тоже быстро не получится. Да и сильные стороны Claude мы все знаем. Поэтому возможен компромисс — который эти самые конспирологи, конечно, истолкуют так, как хочется.

Дарио Амодеи сходил в подкаст к Дваркешу Пателю и заявил о приближении завершения «экспоненциальной фазы» развития искусственного интеллекта. Вот небольшой дайджест — на самом деле не так уж много громких заявлений получилось.

По его прогнозам, создание AI, сопоставимого по возможностям с «целой страной гениев в дата-центре», произойдет в течение ближайших 1–3 лет (к 2026–2027 годам). Амодеи оценивает вероятность достижения такого уровня технологий к 2035 году в 90%, отмечая, что текущие модели уже переходят от уровня способностей выпускников вузов к уровню профессионалов и докторов наук (PhD).

Дарио подтвердил актуальность гипотезы масштабирования (scaling hypothesis), выделив семь ключевых факторов успеха, включая объем вычислительных мощностей, количество и качество данных, а также функции вознаграждения в обучении с подкреплением (RL). Финансовые показатели Anthropic демонстрируют десятикратный ежегодный рост: выручка выросла со 100 млн долларов в 2023 году до 1 млрд в 2024 году, с прогнозом достижения 10 млрд долларов в 2025 году. Согласно оценкам Амодеи, энергопотребление в индустрии AI увеличивается втрое каждый год: с текущих 10–15 ГВт до потенциальных 100 ГВт к 2028 году. При стоимости одного гигаватта в 10–15 млрд долларов, общие затраты отрасли на вычислительные мощности могут составить триллионы долларов к 2029 году.

В вопросах корпоративной стратегии Амодеи сообщил, что Anthropic планирует выйти на прибыльность к 2028 году. Он упомянул высокую эффективность внутренних инструментов, таких как Claude Code, которые уже обеспечивают значительный прирост продуктивности программистов. Тем не менее Амодеи признает существование «экономической диффузии» — задержки между появлением технологии и ее внедрением в реальный сектор из-за юридических и бюрократических барьеров, особенно в крупных предприятиях.

Разумеется, поговорили о безопасности и государственному регулированию. Дарио еще раз рассказал о необходимости внедрения «конституционного AI» (Constitutional AI) и прозрачности для предотвращения рисков создания биологического оружия и автономных киберугроз. В геополитическом контексте он поддержал (опять, он последователен) ограничения на экспорт чипов в Китай, аргументируя это необходимостью сохранения лидерства демократических стран для формирования правил мирового порядка в эпоху “мощного” AI (он употреблял именно этот термин в январском эссе).

OpenAI направила в комитет Палаты представителей по Китаю меморандум, в котором обвиняет DeepSeek в систематической дистилляции результатов американских моделей для обучения R1. Компания утверждает, что обнаружила «новые, обфусцированные методы» обхода защит — доступ через сторонние роутеры, программатический сбор выходных данных, сети нелегальных реселлеров.

Меморандум адресован не суду и не регулятору, а именно комитету по Китаю, где председатель от республиканцев Джон Муленаар уже готов его поддержать с цитатой про «украсть, скопировать, убить как часть китайского сценария». Так что это политический лоббизм, а не защита своих интересов.

Тем более, что не очень понятно, является ли дистилляция как метод обучения чем-то нелегальным с юридической точки зрения. Особенно иронично будет, если провайдеры AI, обучив свои модели на публично и не очень доступных датасетах, начнут судиться с теми, кто как-то не так использует результаты работы моделей.

Anthropic объявляет о раунде в $30 млрд при оценке в $380 млрд. Раунд возглавили GIC и Coatue, в списке участников — BlackRock, Goldman Sachs, суверенные фонды Катара и Абу-Даби, также Microsoft и Nvidia.

Заодно компания поделилась некоторыми финансовыми показателями. Текущая выручка в годовом выражении — $14 млрд при десятикратном росте каждый год. Только Claude Code, который стал публично доступен в мае 2025-го, генерирует $2,5 млрд в годовом выражении, причём эта цифра удвоилась с начала 2026 года.

Число клиентов, тратящих более $1 млн в год, выросло с дюжины до 500 за два года. Восемь из десяти крупнейших компаний Fortune 10 — клиенты Claude.

Мультипликатор 27x, конечно, достаточно высок даже для стартапа (а с такими абсолютными числами их даже scale-up назвать сложно), но выглядит достаточно оправданным.

Google выпустил обновлённую версию Gemini 3 Deep Think — специализированного режима для научных и инженерных задач. Доступ открыт подписчикам AI Ultra в приложении Gemini, а через API — по заявке для исследователей и компаний.

Кроме его доступности, как обычно, подписчикам Ultra, теперь этот режим станет доступен в API отдельным организациям и разработчикам.

Режим действительно мощный, я часто задаю в него вопросы, которые требуют какого-то свободного поиска новой идеи.

Правда, выкатка новой версии заставила вспомнить про осень, когда функция сильно страдала от нехватки мощностей. Сейчас он мне опять выдал, что “сервисом пользуются много людей и мне нужно время на обработку их запросов”, но тут уж я поинтересовался, насколько больше эти люди заплатили, что он меня посылает. В ответ получил незабываемое “приношу личные извинения за сбой системы до этого”.

Вот они и прокололись, все же там дрессированные люди отвечают 😊.

Федеральная торговая комиссия США направила Apple письмо с предупреждением о недопустимости подавления консервативного контента в Apple News. Поводом стал отчёт Media Research Center — консервативной медиа-организации, — утверждающий, что ни одна из 620 главных публикаций в приложении за первый месяц 2026 года не принадлежала правым изданиям вроде Fox News или Breitbart. Трамп расшарил этот отчёт в Truth Social накануне.

Формулировка главы FTC заслуживает внимания. Он подчёркивает, что комиссия «не является полицией свободы слова», но тут же предупреждает, что алгоритмический подбор новостей может нарушать законы о защите потребителей от введения в заблуждение.

То есть практически это и есть цензура, не обманывайтесь. В свое время Google выиграл несколько судов по поводу ранжирования, когда судьи согласились, что редакционная политика и работа алгоритмов поиска является свободой слова компании и это подлежит защите Первой поправкой к Конституции США. Тот факт, что сейчас чиновник в правительстве позволяет себе писать такие письма коммерческой компании, лучше всего демонстрирует, куда всё зашло в некогда свободной стране.

OpenAI представила GPT-5.3-Codex-Spark — компактную модель для кодинга в реальном времени, работающую на чипах Cerebras Wafer Scale Engine 3 со скоростью свыше 1000 токенов в секунду. Это первый публичный результат партнёрства с Cerebras, о котором объявили в прошлом месяце.

Осталось научить Codex тому, что уже давно умеет Claude — использовать субагентов для делегирования более простых задач от основного процесса.

Должен, кстати, заметить, что нынешняя версия Codex работает прямо быстро — я говорю про новое приложение, CLI-версию я давно не запускал.

Новая модель пока доступна только подписчикам Pro-аккаунтов (которые за 200 долларов в месяц) и нескольким партнерам.

Илон Маск провёл общее собрание сотрудников xAI, на котором объявил о реструктуризации в четыре направления: чат-бот Grok, кодинг, видеогенерация и Macrohard — подразделение AI-агентов, ну, вы понимаете, на кого он намекает.

Набор направлений выглядит как попытка догнать сразу всех конкурентов одновременно. Голосовой продукт разрабатывали с нуля за полгода, вдохновившись успехами OpenAI. Видеогенерация, по словам Маска, станет основным потребителем вычислительных мощностей.

Маск также рассказал о планах запустить отдельное приложение X Chat и платёжный сервис X Money (опять?!). По его словам, X приносит $1 млрд подписочной выручки в год. Сколько приносит бизнес непосредственно AI, не говорится, но расширение датацентров обойдется в 20 млрд долларов.

Кроме дел земных, Маск рассказал, что компания построит фабрику на Луне, откуда массивной катапультой будут запускаться AI датацентры на орбиту вокруг Земли. На Марс мы, очевидно, пока не летим, концепция поменялась.

Китайская Zhipu AI выпустила GLM-5 — открытую модель на 744 млрд параметров (40 млрд активных). Модель распространяется под лицензией MIT, ее можно подключить к Claude Code и другим агентам.

По совокупности результатов GLM-5 оказывается где-то между лучшими открытыми моделями и закрытыми фронтирными — разрыв с GPT-5.2 и Claude Opus 4.5 сохраняется, но заметно сужается. Не сомневаюсь, что сейчас мы увидим волну контента на тему “Лучше, чем Claude, и бесплатно”, хотя это не так — не лучше, хотя заметно дешевле, это правда.,

На бенчмарке Vending Bench 2, где модель должна год управлять виртуальным вендинговым бизнесом, GLM-5 показывает результат $4432, уступая только Gemini 3.0 Pro и Claude Opus 4.5.

GLM-5, кстати, использует механизм внимания DeepSeek Sparse Attention. Китайская AI-экосистема всё активнее переопыляется.

OpenAI распустила команду mission alignment, созданную в 2024 году для продвижения заявленной миссии компании — обеспечить, чтобы AGI приносил пользу всему человечеству. Семь сотрудников переведены в другие подразделения. Руководитель команды Джошуа Ачиам получил новую должность — «главный футурист».

Это уже второй такой эпизод за полтора года. Весной 2024-го OpenAI распустила команду superalignment после ухода Ильи Суцкевера и Яна Лайке. Тогда компания заявляла, что mission alignment — это не замена superalignment. Теперь нет и её.

Пару недель назад были разговоры, что OpenAI задвинула некоторые теоретические исследования, чтобы сконцентрироваться на продуктовых запусках. Экзистенциальная философия — это хорошо, но инвестиции так не привлечешь.

Я по понятным причинам слежу за компанией Nebius — и люди знакомые, и бизнес хороший. И вот новость, что они покупают себе Tavily — популярный поиск для AI-агентов, — вызывает самые разные реакции. От “окружают” до “Что бы они не делали, получится поиск”.

С другой стороны, хороший поиск действительно критичен для AI, а сооснователь и Chief Business Officer Nebius — Рома Чернин, — больше десятка лет руководил всем поиском Яндекса, так что сделка более чем логична.

На россии, кажется, решили помочь Илону Маску в благородном деле разрушения военной связи и начали уже серьезно блокировать Telegram. Сильное замедление наблюдалось еще полгода назад и, кажется, звонки через него проходили с большим трудом, но теперь сложности начинаются даже с отправкой текстовых сообщений и медиафайлов.

И это отдельно забавно, поскольку от Telegram связь в российской армии зависит даже больше, чем от Starlink, и различные Z-каналы уже проходили стадии воя на эту тему. Теперь им придется поголовно, видимо, переходить на VPN (как это делают бесчисленные боты, пробирающиеся в западные сети, чтобы рассказать, как свободно в россии при Путине) — вот будет смеху, если в итоге они приземлятся в многочисленных эмигрантских VPN, которые под себя делает каждый первый YouTube канал, включая Сашу Плющева, Марка Фейгина и Майкла Наки 😊.

Alphabet собирается разместить 100-летние облигации в фунтах стерлингов — в дополнение к размещению долларовых бондов на $20 млрд (изначально планировалось $15 млрд, но спрос, по слухам подобрался уже к 100 млрд). Столетние облигации — инструмент крайне редкий. В tech-секторе последний раз такое делала IBM в 1996 году. В фунтах за всю историю их выпускали только Оксфордский университет, EDF и Wellcome Trust.

А хороший ответ всем, кто рассказывает про неминуемый скорый конец пузыря.

Правда, один из портфельных управляющих, ранее покупавший бумаги Alphabet, от участия в этом размещении отказался — доходность недостаточная, а риски, связанные с гигантскими капитальными расходами на AI-инфраструктуру, растут.

Вспомнился фрагмент из “Титана” Драйзера, второй книги трилогии, когда Фрэнк Каупервуд ведет переговоры в Европе о привлечении финансирования на развитие своего бизнеса городского транспорта в Чикаго и кто-то из по-настоящему больших финансистов в Европе сообщает, что предприятие перспективное, но короткий (20 лет) срок концессии ограничивает интерес. Мы, мол, в Европе подходим к вещам более обстоятельно, и хотели бы видеть концессию на 50, а то и 99 лет, объясняет ему собеседник.

Интересно всё перевернулось, причем несколько раз — за следующие после того разговора 50 лет Европа дважды воевала и разваливалась, а США взлетели на поставках воюющей Европе, и вот теперь компания, существующая менее 30 лет и оперирующая самыми новыми технологиями, предлагает перспективу на 100 лет.

Я понимаю, что сейчас в комментарии набежит народ, уверенный, что кредиты брать нельзя никогда, а то еще внуки не расплатятся.