16 июня 2025

Интересное исследование — из его результатов следует, что модель Meta Llama 3.1 70B способна воспроизводить до 42% текста первой книги о Гарри Поттере дословно, что значительно превышает аналогичные показатели других моделей. Для сравнения, более ранняя модель Llama 1 65B воспроизводила лишь 4,4% текста той же книги.

Исследователи из Стэнфорда, Корнелла и Университета Западной Вирджинии проанализировали пять открытых моделей на предмет запоминания текстов из коллекции Books3, используемой для обучения. Оказалось, что модели лучше всего запоминают популярные книги — “Гарри Поттер”, “Хоббит”, “1984” Оруэлла — и значительно хуже малоизвестные произведения.

Исследование подрывает заявления AI-компаний о том, что их модели лишь “изучают паттерны”, а не копируют контент. Результаты показывают, что для некоторых произведений запоминание — не редкое исключение, а системная особенность. Аргументы относительно fair use таким образом становятся несколько нерелевантными.

Парадокс ситуации в том, что открытые модели становятся более уязвимыми для судебных исков именно из-за своей прозрачности — исследователи могут точно измерить степень запоминания. Закрытые модели от OpenAI, Anthropic и Google могут иметь аналогичные проблемы, но доказать это сложнее.

Оказывается, смешное зрелище под названием “Военный парад по-трамповски” имело спонсоров, причем все упоминают Coinbase, а их было больше двух десятков, многие из которых относятся к Big Tech. Oracle, Amazon, Coinbase, Lockheed Martin и Palantir спонсируют фонд America250, отвечающий за подготовку к 250-летию США.

Meta была указана как спонсор высшего уровня, но после запроса журналистов её логотип исчез с сайта организации. Компания объяснила, что “активно изучает возможности партнерства”. Meta ранее обещала $10 млн фонду, но в 2022 году разорвала контракт из-за обвинений в коррупции и неэффективном управлении.

Парад официально посвящен 250-летию армии США, но дата совпала с 79-летием Трампа. Стоимость мероприятия с участием более 150 единиц военной техники, включая танки Abrams, оценивается в $25-45 млн.

Что получилось — все видели сами. Печальные группы военных в полевой форме, вразнобой идущие мимо концертной сцены, странный чувак, несущий легкий дрон (который вообще-то должен летать сам), скучающие министры и дремлющий президент. Любители Трампа пытаются вяло оправдываться в соцсетях, что, мол, американскую армию обучают реальную боевую работу делать, а не носочек на параде тянуть, но проблема в том, что реальную боевую работу мы тоже видим (например, утопить пару истребителей противоракетными маневрами авианосца), а уставы американской армии как раз рассматривают строевую подготовку как ключевой элемент дисциплины, обеспечения единообразия действий, чувства плеча и даже школы лидерства для младших командиров. Но, видимо, всех американцев, умеющих громко орать “Sir, yes, sir!”, глядя на подтянутого сержанта со свирепым взглядом, забрали в Голливуд, а в армии остались только носильщики дронов.

В США нашли новую монополию. Федеральный суд в Манхэттене разрешил продолжить групповой иск против Amazon, обвиняющий компанию в монополизации рынка аудиокниг через сервис Audible. Независимые авторы утверждают, что Amazon принуждает их к эксклюзивным соглашениям, предлагая 40% роялти за эксклюзивность на 90 дней против 25% за неэксклюзивное распространение.

По данным иска, Audible контролирует более 60% американского рынка аудиокниг, в то время как доля Apple составляет около 20%. Истцы требуют более $5 млн компенсации и статуса группового иска для тысяч авторов.

Amazon отрицает нарушения, утверждая, что рынок аудиокниг “здоровый и конкурентный”, и что компания имеет право тратить больше ресурсов на продвижение эксклюзивного контента. Однако суд пока отклонил ходатайство Amazon о прекращении дела.

Мне это кажется некоторой левизной в сочетании с незнанием математики — если уж вы не хотите получить 40% за эксклюзив от владельца 60% рынка, то оставайтесь на 25% и доберите на 40% рынка остальное. По идее, получится даже больше. Впрочем, коллега Умпутун много лет жалуется на неумение американцев вычислять проценты.

WhatsApp впервые за 11 лет существования начнет показывать рекламу в своем приложении. Объявления появятся только в разделе “Обновления”, которым пользуются 1,5 млрд человек ежедневно. Meta заверяет, что личная переписка останется зашифрованной и недоступной для рекламодателей.

Для таргетинга рекламы WhatsApp будет использовать только базовые данные — геолокацию и язык устройства, но не содержание сообщений. Пользователи смогут опционально связать аккаунты WhatsApp с Instagram и Facebook для более персонализированной рекламы.

В 2017 году основатели мессенджера Ян Кум и Брайан Эктон покинули компанию, в том числе и разойдясь с Марком Закербергом во взглядах на монетизацию сервиса. Впрочем, реклама есть во многих мессенджерах, включая популярные Viber и Telegram, так что назвать это беспрецедентным не получится.