16 марта 2023

При запуске GPT-4 многие обратили внимание, насколько общим было описание параметров новой версии модели — например, ничего не было сказано об обучающей выборке. Оказывается, это было сделано намерено — компания OpenAI впервые с момента запуска приняла решение не раскрывать собственно исследовательские материалы, лежащие в основе LLM. Об этом рассказал Chief Scientist Илья Суцкевер.

Илья заявил, что получившаяся модель очень мощная и потенциально опасная при использовании не по назначению, поэтому организация решила не открывать материалы исследований. Доступ к ним будет ограничен для академического использования и компания будет следить за его использованием. Как выразился Илья, «с течением нескольких лет мы все поймем, что открывать AI [то есть выкладывать в open source] просто не разумно».

Ну, ну а что, Android же есть, теперь и OpenAI будет.

Вдогонку про генеративный AI — мы уже привыкли к фантазиям ChatGPT, который придумывает факты, которых не знает. Но вот так выглядит пересказ содержания анонса нововведений Google в Workspace, о которых я писал вчера, от модели constitional AI от компании Anthropic под названием Claude+. Я даже не понимаю, куда он попал по ссылке, что пошел перечислять все эти пять пунктов, ни один из которых не упоминается в оригинальном тексте.

Администрация Байдена угрожает запретить популярное китайское видео-приложение TikTok, если его основатель ByteDance Ltd. не продаст большую часть своих акций в компании американскому покупателю.

Комитет по иностранным инвестициям в США (CFIUS) - федеральная рабочая группа из нескольких агентств, контролирующая национальную безопасность в сделках с иностранными инвестициями - недавно потребовал продажи, сообщают источники.

Руководители TikTok заявили, что 60% акций ByteDance принадлежат глобальным инвесторам, 20% - сотрудникам и 20% - основателям, хотя акции основателей имеют увеличенные права голоса, что обычно для технологических компаний. Компания была основана в Пекине в 2012 году Чжан Имином, генеральным директором ByteDance Лян Рубо и другими.

TikTok заявил в среду, что принудительная продажа не решит проблему предполагаемой угрозы безопасности. Компания пообещала потратить 1,5 миллиарда долларов на программу защиты данных и контента пользователей из США от доступа или влияния китайского правительства. Ранее TikTok уже потратил более 1 млрд долларов на перенос части своей инфраструктуры, обслуживающей американских пользователей, в облако Oracle — такая договоренность была достигнута, когда проблемой TikTok и его влияния на американскую молодежь озаботилась администрация Трампа.

Но вопрос даже не в доступности персональных данных американских пользователей китайским властям, на что указывают сейчас, а в том, что китайские власти могут иметь влияние на алгоритмы, используемые Bytedance. Многие журналисты и эксперты открыто говорят о том, что TikTok может являться оружием пропаганды.

Это, конечно, очень смешно и, вероятно, было обнаружено и ранее, но я это уяснил только сейчас — если дать генеративному AI ссылку, то он с большой вероятностью по ней не пойдет, а всё саммари построит по урлу. Вот исчерпывающий пример, где GPT-4 понял по урлу, что заметка на русском и она про Silicon Valley Bank. Остальное — полёт фантазии, невозможный для алгоритма, знакомого со статьей.

Microsoft, как и обещали, представили сегодня большой запуск в части AI — Microsoft 365 Copilot. Фактически это запуск функции, аналогичной Copilot на Github, во всех продуктах, входящих в Microsoft 365 — Word, Excel, Powerpoint, Outlook и Teams. Как легко догадаться, в Word вы сможете сформулировать задачу для AI в части создания текста, в Excel — определить операции, которые надо проделать над вашими данными в таблицах, в Outlook Copilot поможет работать с почтой и так далее.

На данный момент компания тестирует возможности Copilot в 20 компаниях — корпоративных пользователях Microsoft 365, и обещает открывать эти возможности для большего числа пользователей в ближайшие месяцы. Судя по быстрому открытию нового Bing и даже по довольно быстрому запуску Copilot на GIthub, очень долго ждать не придется.