6 июня 2025

14:34 #5995

Журналист Washington Post провел масштабное тестирование пяти популярных AI-чатботов (ChatGPT, Claude, Copilot, Meta AI и Gemini) на способность понимать и анализировать различные типы текстов — от художественной литературы до юридических документов и политических речей Трампа.

Результаты оказались неоднозначными. Победитель Claude набрал в среднем 67% правильных ответов, ChatGPT — 64%. Остальные значительно отстали. При этом Claude был единственным, кто не “галлюцинировал” — не выдумывал несуществующие факты.

Интересно, что успех в одной области не гарантировал успеха в другой. ChatGPT лучше всех справился с анализом литературы и политических речей, но провалился на юридических документах. Claude показал стабильность во всех категориях.

AI часто пропускает важную информацию, акцентирует позитивное и игнорирует негативное, может давать поверхностные ответы вместо глубокого анализа. Например, при анализе романа о Гражданской войне в США боты часто обходили стороной темы рабства.

Впрочем, я думаю, что у любого, кто активно использует AI, в запасе есть с десяток историй, как галлюцинирует кто угодно. Мне буквально пять минут назад Claude объяснял, что 8 утра в Киеве — это 11:00 UTC и он нашел баг.

Источник

14:43 #5996

X обновила свои правила для разработчиков, запретив использование контента платформы для обучения больших языковых моделей. В новой версии соглашения появился пункт, прямо запрещающий использовать X API или контент для дообучения или тренировки foundation или frontier моделей.

Интересно проследить эволюцию политики X: в 2023 году платформа изменила политику конфиденциальности, разрешив использовать публичные данные для обучения AI-моделей, а в октябре прошлого года даже позволила третьим сторонам тренировать свои модели. Собственно, ничего не изменилось — просто тогда xAI была “третьей стороной”, а сейчас это одна компания.

У которой, кстати, в настройках пользователя галочка “Разрешить использовать мои публичные данные для обучения и файн-тюнинга” взведена по умолчанию.

Источник

16:13 #5997

Anysphere, разработчики AI-помощника для программирования Cursor, подтвердили привлечение $900 млн при оценке $9.9 млрд postmoney. В дополнение уже ранее известным деталям компания утверждает, что достигла $500 млн годовой выручки. Это делает её одной из самых быстрорастущих софтверных компаний.

Напомню, что предыдущий раунд в $105 млн был привлечен в январе 2024 года при оценке в $2,5 млрд.

Кстати, история с покупкой их конкурента Windsurf OpenAI получила неожиданное продолжение. Хотя официального подтверждения сделки не было, Windsurf на этой неделе заявили, что получили от Anthropic уведомление о прекращении оказания услуг доступа ко всем моделям версий 3.5 и 3.7. Чуть позже сооснователь Anthropic Джаред Каплан подтвердил, что причиной такого отказа стали слухи о покупке Windsurf, добавив, что было бы смешно продавать свои услуги главному конкуренту. Пользователи Windsurf могут продолжать использовать модели Anthropic, указав собственный ключ API.

Источник

17:06 #5998

Британский финансовый регулятор FCA снимает запрет на продажу криптовалютных биржевых нот (cETN) розничным инвесторам.

Теперь индивидуальные потребители смогут покупать cETN наравне с профессиональными инвесторами, при условии торговли на одобренных FCA биржах.

Дэвид Гил из FCA подчеркнул намерение “пересбалансировать подход к рискам” и позволить людям самим решать, подходят ли им высокорискованные инвестиции. При этом запрет на розничный доступ к криптовалютным деривативам сохраняется, а существующие правила финансового продвижения будут применяться для информирования потребителей о рисках.

Источник