Telegram-канал

Cloudflare объявила о приобретении британского стартапа Human Native. Сделка направлена на создание прозрачной экосистемы взаимодействия между разработчиками искусственного интеллекта и создателями контента. Cloudflare уже не впервые говорит на эту тему и известна своей позицией на защиту прав владельцев контента. С другой стороны, если ты обрабатываешь десятки процентов мирового трафика к сайтам и видишь, какую их долю составляют запросы AI-ботов, как-то понимаешь, что это всё должно быть не просто так. А за деньги.

Еще одна новость примерно про это же — Microsoft, Meta и Amazon официально пополнили список платных партнеров подразделения Wikimedia Enterprise. Программа, запущенная еще в 2021 году, предлагает крупному бизнесу и разработчикам AI доступ к очищенному и структурированному API Wikipedia. Wikimedia Foundation даже не скрывает, что устойчивость фонда (и проекта в целом) теперь напрямую связана с выживанием AI-компаний.

Правда, будущее выглядит лишь самую малость светлее, чем в “Матрице” — батарейки Матрицы не нужны (пока), а вот датасеты, составленные людьми, — очень даже.

Противнее президента страны, выпрашивающего себе золотые медальки со всего мира, может быть только миллиардер, использующий AI, чтобы троллить свою бывшую, мать своего ребенка. Новый биологический вид — Homo bullshit.

OpenAI, уже однажды став автором де-факто стандарта API для LLM с Completions API, теперь предлагают идти дальше — в рамках проекта OpenResponses в качестве основы нового стандарта предлагается Responses API, который больше года развивается OpenAI для доступа к своим моделям.

В принципе, идея совершенно логичная — зоопарк стандартов никому не нужен. Впрочем, понятно, что Google и Anthropic на это не пойдут, но многочисленные провайдеры инференса — от OpenRouter до LM Studio, — уже вписались. Собственно, опять же — логично переходя с нынешней OpenAI API compatible версии.

Иногда они возвращаются: Digg запускает публичную бету под руководством своего основателя Кевина Роуза и, что придает ситуации особую пикантность, сооснователя Reddit Алексиса Оганяна. Кевин выкупил проект обратно некоторое время назад — теперь можно оценить, зачем.

Новый Digg пытается решить главную проблему современного интернета — засилье ботов и токсичность, но без требования загружать скан паспорта (KYC). Роуз предлагает систему «сигналов доверия» на базе zero-knowledge proofs. Например, чтобы участвовать в дискуссии владельцев колец Oura, нужно криптографически подтвердить наличие устройства. Это превращает платформу из привычного агрегатора ссылок в набор верифицированных клубов по интересам. Правда, дальше можно додумать много чего — только совершенно непонятно, как с таким подходом подтвердить свое право обсуждать права меньшинств или религию. Совсем сложно будет доказать, что имеешь право писать Free Palestine, не предъявляя документов об обучении в Гарварде или Оксфорде.

В отличие от Reddit, логи модерации будут публичными. Я вижу в этом ровно одно гигантское преимущество — можно будет учить ботов модерации. А модераторам мои соболезнования и даже глубокая скорбь.

Мира Мурати объявила, что Thinking Machines Lab расстается с сооснователем и CTO Барреттом Зофом. Через 58 минут Фиджи Симо из OpenAI сообщила, что Зоф возвращается к ним — вместе с другим сооснователем Люком Метцем и Сэмом Шенхольцем. По данным Wired, расставание было далеко не мирным, что объясняет телеграфный стиль поста Мурати и подозрительную синхронность анонсов. Источники говорят о раскрытии информации — а Симо пишет о процессе в течение нескольких недель.

Новым CTO назначен Сумит Чинтала — один из создателей PyTorch и ветеран Meta AI.

Круговорот людей в природе. Начинаешь жалеть сисадминов и специалистов по безопасности — как уследить, кому доступ открыть, а кому закрыть?

OpenAI подписала контракт на $10+ млрд с Cerebras Systems — стартапом, производящим чипы для inference, которые, по заявлениям компании, работают быстрее решений Nvidia. За три года OpenAI получит до 750 мегаватт вычислительной мощности.

Cerebras тем временем готовится поднять $1 млрд при оценке $22 млрд — втрое больше, чем год назад, когда компания тихо отозвала заявку на IPO.

Мы знаем еще одну компанию, чьи чипы работаЛИ быстрее, чем Nvidia — это Groq. Не правда ли, занятно наблюдать эти события в реальном времени — только Nvidia по оригинальной схеме “купила” Groq с технологией быстрого инференса, как самый заметный конкурент получает солидный контракт от OpenAI. Кажется, что в полном соответствии с принципами Алисы, все бегут изо всех сил, чтобы хотя бы оставаться на месте.

Google разыгрывает свой главный козырь в гонке AI-ассистентов: компания выкатывает Personal Intelligence для Gemini. Это функция, которая подключает к Gemini все остальные персональные сервисы — Gmail, YouTube, Photos и так далее, позволяя пользователю оперировать этим всем, как контекстом.

В общем, как-то так мы и представляем себе крутого агента. Правда, хороший пример, когда у Gemini можно спросить, какие тебе колеса нужны для машины, а AI отыщет фото машины, определит тип шин и посоветует, что купить, в моем воображении перебивается другим — такой умный AI, если я его попрошу заказать мне стейк, найдет сканы моих анализов и я рискую получить вегетарианский салат.

Пока, впрочем, для нас это будущее — выкатка начинается с платных подписчиков в США. Так что подождем.

Британское правительство отказалось от планов обязательного digital ID для подтверждения права на работу. Правда, это уже третий случай отказа правительства от своих планов и сторонники правящей партии не в восторге от таких шараханий.

Лорд Бланкетт, сам когда-то продвигавший ID-карты, комментирует в том духе, что правительство не объяснило ни зачем это нужно, ни как будет работать.

При этом технически мало что меняется. Gov.uk One Login уже используют 12 миллионов человек. Цифровые проверки для британцев с биометрическими паспортами работают с 2022 года. Gov.uk Wallet готовится к запуску. Обязательные проверки права на работу никуда не денутся — просто будут называться иначе. То есть по сути, инфраструктура (кто сказал “ангсоц”?) и так развивается, просто её использование не всегда обязательно.

Будем надеяться, пока.

Интересные события развиваются вокруг поставок чипов H200 в Китай.

С одной стороны, США долго запрещали поставки мощных чипов. И до сих пор многие уверены, что так и надо продолжать и эти меры работают и тормозят развитие AI в Китае.

Но теперь власти официально одобрили экспорт чипов H200 в Китай. Однако разрешение сопровождается жесткими ограничениями: объем поставок китайским клиентам не должен превышать 50% от объема продаж в США, а каждая партия подлежит проверке третьей стороной для подтверждения технических характеристик.

С другой стороны, власти Китая не злопамятны, но память у них хорошая и фразу американского чиновника про то, что надо держать Китай на поводке, не давая им мощных технологий, они запомнили. Сначала китайским компаниям было настоятельно рекомендовано покупать китайские GPU, а от покупок у Nvidia отказаться. Это не очень просто сделать — я писал, что чипы Huawei недостаточно мощны для полноценного обучения LLM, хотя для инференса уже подходят. Власти допускают исключения для закупок — но только для университетских исследований и R&D-центров.

И вот по данным Reuters, китайские таможенные органы получили прямое указание блокировать ввоз чипов H200.

Nvidia в итоге оказывается в центре шторма, близкого к идеальному — китайский рынок огромен, запреты и ограничения уже привели к развитию национальных версий GPU, при этом контрабанда чипов начинает напоминать романы киберпанка. Компания теперь требует от китайских клиентов 100% предоплаты наличными без права на возврат средств или отмену заказа, даже если товар будет остановлен на границе.

Несмотря на это, спрос со стороны китайских компаний, включая Alibaba и ByteDance, превышает 2 миллиона чипов, что значительно больше текущих складских запасов Nvidia.

Мне почему-то вспомнилась заключительная (не совсем последняя, правда) фраза Джима Моррисона из фильма The Doors — Let’s get some tacos. Не знаете, почему?

Очень интересное исследование влияния прогресса LLM на профессиональную эффективность. В нем участвовали более 500 специалистов (консультанты, аналитики данных, менеджеры), которые выполняли профильные задачи с использованием одной из 13 моделей различной мощности.

Вот что, вкратце, обнаружилось.

Экономический эффект прямо зависит от технических параметров моделей. Каждый год развития фронтир-моделей сокращает время выполнения задач в среднем на 8%. Десятикратное увеличение объема вычислений (при изоляции влияния других факторов) при обучении приводит к сокращению времени выполнения задачи на 6.3%. При этом прогресс обеспечивается как увеличением мощностей (на 56%), так и качественным образом, изменением алгоритмов и данных.

В процессе эксперимента участники получали вознаграждение, которое увеличивалось в зависимости от оценки качества выполнения заданий. Оказалось, что использование любой модели повышает базовый заработок в минуту на 81.3%, а с учетом бонусов за качество — на 146%.

При этом задачи, не связанные с использованием агентов — то есть, условно, одноходовые задачи, — показали прирост заработка на $1.58/мин. Аналогичный показатель для agentic-задач заметно скромнее — лишь $0.34/мин.

Но самое удивительное, что людям лучше не вмешиваться. Качество ответов моделей линейно растет с увеличением вычислительной мощности. Топовые модели демонстрируют оценки выше 6.0 из 7 (сверхчеловеческий уровень). А участие человека в выполнении задачи, хотя и улучшает результаты слабых моделей, но мощные модели в среднем получают среднюю оценку (4.3 балла). В общем, AI от людей тупеет.

Авторы исследований намеренно рандомизируют модели (и даже их не упоминают), чтобы исключить влияние конкретных LLM и сделать общие выводы. Но они и так интересны.

Microsoft анонсировал инициативу «community first» — набор обязательств по полной оплате электроэнергии для AI-датацентров, отказу от местных налоговых льгот и восполнению воды. Трамп успел слить новость накануне через Truth Social, назвав Microsoft «первым» из tech-компаний, готовых взять обязательства перед американцами.

Брэд Смит, президент Microsoft, описывает, как за год изменились разговоры в его родном Висконсине. В 2024-м местные хотели обсуждать рабочие места. К октябрю — только тарифы и расход воды. В штатах с крупными кластерами датацентров — Вирджинии, Иллинойсе, Огайо — цены на электричество для жителей выросли на 12-16% за год. Впрочем, если кто слушал один из недавних выпусков Радио-Т, то в курсе, как в городе Напервиль местные выступают против строительства датацентра, хотя компания гарантирует модернизацию энергосети, прямо сейчас находящейся не в блестящем состоянии.

Любопытно, что Смит поддержал федеральную помощь с разрешениями и доступом к земле, но прямо отверг субсидии на электроэнергию. OpenAI, обсуждая Stargate, от льгот не отказывается.

Мне регулярно случается сталкиваться с объяснениями, что личное присутствие в офисе не нужно, всё можно заменить видеозвонками, да еще и камеру не включать. Если вам кажется так же, то вот научные факты.

Исследователи Корнельского университета изучили статистику и даже провели эксперименты. Выяснилось, что почти идеальная видеосвязь хуже, чем её отсутствие — небольшие глюки психологически переносятся на собеседника, снижая его оценку.

Самый удивительный факт следует из статистики слушаний по условному освобождению в судах с января по апрель 2021 года. Глюки обнаружились в 32.6% случаев. Там, где связь работала нормально, положительное решение получали 60% заключенных. Наличие глюков снижало процент положительных решений до 48%. Проверка на характеристики преступления и самих заключенных ничего не изменила.

Из других проявлений — кандидаты на собеседованиях, где связь барахлила, получали оценки ниже и реже нанимались на работу. Рекомендации врача в случае с телемедициной воспринимались с меньшим доверием.

Ученые назвали это эффектом “жутковатой долины” и признались, что не смогли выработать рекомендации по минимизации этого явления.

Правда, сами авторы встретились вживую только через четыре года после того, как в пандемию начали работу над исследованием. Как видим, им это не помешало.

В общем, мы про это и так знали, но теперь официально — Apple будет использовать Gemini и облачную инфраструктуру Google для своих базовых AI-моделей. Сумму в год мы тоже знали — примерно 1 млрд долларов в год.

Сотрудничество с OpenAI тоже не прекращается.

Акции Google продолжили расти — компания официально перевалила за 4 триллиона долларов капитализации. Рынок наконец признал, что Google справился с вызовами AI.

Meta сокращает около 10% сотрудников Reality Labs — это примерно 1500 человек из 15 тысяч. По данным New York Times, удар придётся на тех, кто строил метавселенную: VR-гарнитуры, виртуальные социальные сети. Деньги перенаправляются понятно куда — на AI-исследования и подразделение носимых устройств.

При этом увеличивается бюджет TBD Lab — внутреннего подразделения Meta, которое занимается созданием “суперинтеллекта”.

Подразделение дополненной реальности — очки, браслеты, голосовое управление — сокращения почти не затронут. Фактически Meta делает ставку на AR вместо VR, хотя публично от метавселенной не отказывается. Просто концепция поменялась, как объяснял герой не очень старого анекдота.

Anthropic выпустила Cowork — по сути, Claude Code для тех, кто не пишет код. Можно это даже назвать упаковкой для разнообразных функций, связанных с обработкой файлов и документов.

Главное отличие от обычного чата — агентность. Claude получает доступ к выбранной папке, сам планирует выполнение задачи, работает параллельно с несколькими запросами.

Пока только macOS и только для подписчиков Claude Max. Windows и кросс-платформенная синхронизация обещаны позже.

На самом деле, я довольно часто именно так и использую Claude Code, который встроен в десктопное приложение. Достаточно выбрать режим Local и указать папку, после чего приложение делает всё, что попросите — правда, несколько напрягает разрешать ему почти каждую первую операцию, а посмотреть, как это разрешить радикально, пока не догадался.

Впрочем, еще одну похожую задачу я выполняю прямо из терминального Claude Code — команда monthly-report проверяет все изменения в папке проекта, читает всю историю изменений, коммитов и сессий, сверяется с предыдущими отчетами и составляет очередной, с расчетом рабочего времени, реализованных функций. Всё вот думаю — справится ли с созданием акта выполненных работ, причем так, чтобы не напугать бухгалтерию страшными словами?

Если вы уже видели новости про то, что Andreessen Horowitz привлекла $15 млрд в новые фонды, то вот прекрасный обзор на эту тему.

Главный тезис: a16z — это не венчурный фонд в классическом понимании. Это “культ технологий”. Фонд привлёк $15 млрд за 3 месяца в худший для VC год, управляет $90+ млрд активов, среди которых 10 из 15 крупнейших частных компаний мира.

Три принципа, которые отличают a16z:

  1. Никогда не инвестировать во “второго” Лучше пропустить категорию, чем выбрать не того основателя. Если нашёл лидера — дай ему в 50 раз больше, чем он просил. Databricks просили $200K, получили $10M — Андреесен довольно алогично верил, что Spark имеет шансы наравне с Hadoop. При этом компании остаются частными дольше.

  2. Компании стоят дороже, чем все думают. В 2016 году WSJ писала, что a16z отстаёт от элиты. Видимо, теперь напишут, что обгоняют.

  3. Масштаб — это преимущество, а не проблема. Когда конкуренты говорили “слишком много денег”, Marc Andreessen показывал неприличный жест и отвечал: “Мы охотимся на слонов” — defense tech, ядерная энергетика, биотех, космос.

Обзор неслучайно назван Power Brokers — a16z строит инфраструктуру власти: рекрутинг топ-менеджеров, продажи в enterprise, Government Affairs, медиа-команда. Фактически фонд становятся полноценной корпорацией, важной услугой которой является лоббизм (Regulation as a Service). А если вы вспомните эссе Андреесена “Time to build”, то поймете, что это очень долгосрочная стратегия.

Google начинает показывать персонализированную рекламу в AI-режиме поиска. Рекламодатели — пока ограниченное число вроде Petco, e.l.f. Cosmetics, Samsonite — смогут предлагать скидки пользователям в момент, когда модель Gemini решит, что те готовы к покупке.

Традиционная поисковая реклама работает в привязке к ключевым словам. Контекстная реклама учитывает контекст, в котором показывается, а поведенческий таргетинг позволяет показать рекламу, релевантную профилю пользователя. В AI-режиме возможности таргетинга меняются — пользователь, с одной стороны, сам наполняет контекст, позволяющий построить профиль, правда, объем контекста может снижать фокусировку, по сравнению с поисковой рекламой.

Параллельно Google запустил “universal commerce protocol” совместно с Walmart, Target и Shopify — покупатель исследует товары, выбирает и платит, не покидая платформу. Сундар Пичаи называет это “expansionary moment”. Антимонопольщики, вероятно, назовут это как-то иначе. Впрочем, стандарт открытый, никто не мешает им воспользоваться для любого другого агента.

В Юте запустился AI-сервис Doctronic, который самостоятельно продлевает рецепты на лекарства. Пациент заходит на сайт, система проверяет его геолокацию, подтягивает историю назначений и проводит стандартный опрос — как это сделал бы врач. Если всё в порядке, рецепт уходит в аптеку. Стоимость — $4 за продление.

Важен не сам факт автоматизации рутинной медицинской процедуры, а то, что компания получила полис страхования от врачебных ошибок для AI-системы. Впервые алгоритм юридически приравнен к врачу в части ответственности. CEO компании заявляет, что система будет “бесконечно безопаснее человека-врача” — смелое утверждение, хотя пока речь идёт только о 190 препаратах, причём без обезболивающих, препаратов от СДВГ и инъекционных.

С точки зрения регуляций это выглядит как юридический эксперимент. Традиционно в США штаты регулируют медицинскую практику, а FDA — медицинские устройства. Формально AI, выписывающий рецепты, — это устройство, занимающееся медицинской практикой. Кто это будет регулировать — неизвестно.

Наконец-то все, утомленные сумасшествием и сюрреализмом окружающего мира, смогут отдохнуть психологически и эмоционально — Netflix готовит к выпуску восьмой сезон милого семейного сериала Black Mirror.

Нам этого давно не хватало, не правда ли?

Meta анонсировала масштабные соглашения с тремя ядерными компаниями — TerraPower, Oklo и Vistra. Суммарно речь о тысячах мегаватт мощности для AI-дата-центров. Акции Vistra и Oklo выросли на 15% сразу после открытия торгов.

Станции Vistra в Огайо и Пенсильвании ещё несколько лет назад должны были закрыться. Теперь благодаря контракту с Meta они получают возможность продлить лицензию.

У TerraPower Билла Гейтса это вообще первый реальный заказ. Отдельная история — Oklo, которая вышла на биржу через SPAC Сэма Альтмана. Интересно, а OpenAI достанется энергия от этой компании?

С одной стороны, это здорово, что технологические компании пробуждают к жизни энергетику, но с другой — вовлеченность онлайн-компаний в такие brick-and-mortar индустрии неизбежно роняют их маржинальность. Держите это в уме, если захотите заговорить о лопающемся AI-пузыре, наблюдая за котировками на NASDAQ.