6 июня 2025

Журналист Washington Post провел масштабное тестирование пяти популярных AI-чатботов (ChatGPT, Claude, Copilot, Meta AI и Gemini) на способность понимать и анализировать различные типы текстов — от художественной литературы до юридических документов и политических речей Трампа.

Результаты оказались неоднозначными. Победитель Claude набрал в среднем 67% правильных ответов, ChatGPT — 64%. Остальные значительно отстали. При этом Claude был единственным, кто не “галлюцинировал” — не выдумывал несуществующие факты.

Интересно, что успех в одной области не гарантировал успеха в другой. ChatGPT лучше всех справился с анализом литературы и политических речей, но провалился на юридических документах. Claude показал стабильность во всех категориях.

AI часто пропускает важную информацию, акцентирует позитивное и игнорирует негативное, может давать поверхностные ответы вместо глубокого анализа. Например, при анализе романа о Гражданской войне в США боты часто обходили стороной темы рабства.

Впрочем, я думаю, что у любого, кто активно использует AI, в запасе есть с десяток историй, как галлюцинирует кто угодно. Мне буквально пять минут назад Claude объяснял, что 8 утра в Киеве — это 11:00 UTC и он нашел баг.

X обновила свои правила для разработчиков, запретив использование контента платформы для обучения больших языковых моделей. В новой версии соглашения появился пункт, прямо запрещающий использовать X API или контент для дообучения или тренировки foundation или frontier моделей.

Интересно проследить эволюцию политики X: в 2023 году платформа изменила политику конфиденциальности, разрешив использовать публичные данные для обучения AI-моделей, а в октябре прошлого года даже позволила третьим сторонам тренировать свои модели. Собственно, ничего не изменилось — просто тогда xAI была “третьей стороной”, а сейчас это одна компания.

У которой, кстати, в настройках пользователя галочка “Разрешить использовать мои публичные данные для обучения и файн-тюнинга” взведена по умолчанию.

Anysphere, разработчики AI-помощника для программирования Cursor, подтвердили привлечение $900 млн при оценке $9.9 млрд postmoney. В дополнение уже ранее известным деталям компания утверждает, что достигла $500 млн годовой выручки. Это делает её одной из самых быстрорастущих софтверных компаний.

Напомню, что предыдущий раунд в $105 млн был привлечен в январе 2024 года при оценке в $2,5 млрд.

Кстати, история с покупкой их конкурента Windsurf OpenAI получила неожиданное продолжение. Хотя официального подтверждения сделки не было, Windsurf на этой неделе заявили, что получили от Anthropic уведомление о прекращении оказания услуг доступа ко всем моделям версий 3.5 и 3.7. Чуть позже сооснователь Anthropic Джаред Каплан подтвердил, что причиной такого отказа стали слухи о покупке Windsurf, добавив, что было бы смешно продавать свои услуги главному конкуренту. Пользователи Windsurf могут продолжать использовать модели Anthropic, указав собственный ключ API.

Британский финансовый регулятор FCA снимает запрет на продажу криптовалютных биржевых нот (cETN) розничным инвесторам.

Теперь индивидуальные потребители смогут покупать cETN наравне с профессиональными инвесторами, при условии торговли на одобренных FCA биржах.

Дэвид Гил из FCA подчеркнул намерение “пересбалансировать подход к рискам” и позволить людям самим решать, подходят ли им высокорискованные инвестиции. При этом запрет на розничный доступ к криптовалютным деривативам сохраняется, а существующие правила финансового продвижения будут применяться для информирования потребителей о рисках.