6 декабря 2023

Google объявил о выпуске своей новой модели AI — Gemini. Одной из основных качеств новой модели Google называет продвинутый reasoning — мне кажется, что если в лоб перевести эту черту поведения модели как “рассуждения”, запутаются даже специалисты. Google сообщает, что модель нативно мультимодальна — то есть способность работать с разными видами информации в нее заложена изначально при обучении, а не достигнута путем сращивания разных моделей, специализированных на тексте, графике и аудио.

По имеющимся тестам, Gemini обходит GPT-4, но это касается только версии Ultra, которая является самой большой и продвинутой. Она при этом не будет доступна до следующего года, пока проводится тщательный анализ её безопасности — видимо, это то, о чем писали на прошлой неделе, утверждая, что результаты на языках, отличных от английского, привели к переносу анонса.

Кроме того, версия Pro, которая по ощущениям близка к возможностям GPT-3.5, становится доступной в Bard с сегодняшнего дня, пока только на английском. Есть также версия Nano, которая будет применяться на устройствах — например, на Pixel 8 Pro, с которого планируется начать внедрение.

Meta тоже выпускает AI — только это отдельная модель text-to-image под названием Imagine. Доступна она только для пользователей из США и, по идее, должна работать так же, как DALL-E или Stable Diffusion.

Изображения, сгенерированные в сервисе, будут снабжены водяными знаками, правда, не сразу, а лишь через некоторое время. Пока на изображения ставятся видимые водяные знаки, но в дальнейшем компания заменит их невидимыми, которые смогут быть проверены соответствующей моделью.