6 ноября 2023

Команда Илона нашего Маска объявила о выпуске фирменной LLM под названием Grok. Как описывается в релизе, модель обучена с учетом 33 млрд параметров и, несмотря на это, приближается к LlaMA 2 (70B), у которой параметров, соответственно, 70 млрд. Обещается, что модель сможет проявлять чувство юмора и вообще натренирована в духе “Путеводителя по Галактике”. Означает ли это, что она будет отвечать “42” на философские вопросы, или что она будет ныть, как робот Марвин — неизвестно.

Само название Grok относится к другому популярному фантастическому роману “Stranger in the Strange Land” Роберта Хайнлайна, где grok обозначал марсианский способ познания мира — grok переводилось как “вникнуть”, что в одном месте отождествлялось с “выпить”, в общем, речь шла о таком познании, которое осуществлялось полным растворением с познаваемым предметом или понятием. Можно, конечно, увидеть намеки на будущий полет Маска на Марс, но мне кажется, что разработчики просто решили собрать покер из хайповых гиковских образов.

Что представляет собой новая LLM технически, неизвестно — доступ к ней предоставлен очень узкому кругу пользователей в США и это лишь прототип, который даже по собственным замерам разработчиков держится на уровне GPT-3.5. Я не удивлюсь, если она окажется fine-tuned Llama 2, например. Впрочем, разработчики обещают, что она будет иметь доступ в реальном времени к новостям о мире через X и отвечать на острые вопросы, на которые отказываются отвечать другие системы.

Ожидания — Маск построит космический корабль, чтобы основать колонию на Марсе. Реальность — Маск тренирует AI, который не откажется сообщить, кто выпил кровь христианских младенцев и воду из крана.

OpenAI проводит сегодня DevDay и открылся он презентацией Сэма Альтмана в лучших традициях Apple — правда, ему стоит говорить медленнее и научиться устроить драматургию.

Но это никак не обесценивает прекрасные запуски, которые он анонсировал сегодня.

OpenAI запускает GPT-4-Turbo — новую версию GPT, которая лучше и мощнее, чем GPT-4. Новая версия поддерживает контекст до 128к токенов, втрое дешевле предыдущей версии, обучена на данных вплоть до апреля 2023 года. Всё это уже доступно в ChatGPT и начинает быть доступно в API. В API будет также доступен мультимодальный режим, когда GPT одновременно работает как с текстом, так и с графикой через DALL-E 3. До третьей версии обновился также Whisper — speech-to-text и text-to-speech движок.

Кроме того, компания представила GPTs — теперь разработчики могут создать свою собственную версию GPT и предоставить доступ к ней пользователям.

Сэм Альтман анонсировал также программу Copyright Shield — она похожа на Pledge от Copilot и заключается в обязательстве OpenAI защитить своих пользователей от претензии в части копирайта.

DevDay продолжается и можно смотреть прямую трансляцию.