AI

Vesuvius Challenge

Проект Vesuvius Challenge объявил о присуждении главного приза по результатам 2023 года. Но сначала о самом проекте.

Модель виллы

Ученые много десятилетий пытаются прочесть свитки из Геркуланума — при извержении Везувия в 79 г. н.э., погубившем Помпеи, была засыпана пеплом вилла, библиотека которой содержала тысячи свитков. Свитки при этом обуглились от высокой температуры, но пепел их сохранил. В 1750 году виллу нашли вместе со свитками и немалое количество их погубили попытками развернуть — обугленный папирус крошится при этом. Только в последние годы попытки пошли в другом направлении — теперь свитки пытаются развернуть виртуально.

Так выглядит обугленный свиток
Так выглядит обугленный свиток

В прошлом году группа филантропов во главе с основателем Github Нэтом Фридманом организовала международное соревнование — для этого свитки, хранящиеся во Франции, были просканированы на синхротроне в Оксфорде для создания очень детальных 3D-сканов, после чего результаты были переданы участникам. И вот по итогам 2023 года есть реальный прорыв — одна из команд смогла прочесть 15 колонок текста — более 2000 символов, — причем это ранее неизвестное произведение греческого философа Филодемуса, принадлежащего к школе эпикурейцев и учителя Вергилия.

Результат расшифровки одного из свитков
Результат расшифровки одного из свитков

Команда из трех уже отличившихся участников — они выиграли в течение года спецпризы за первые распознанные слова и разработку алгоритмов сегментации (разделения слоев папируса в сканах), — получит 850 тысяч долларов в качестве главного приза.

Теперь задача проекта на 2024 год — разработать масштабируемую технологию сканирования и распознавания свитков. Сейчас работа над 1 кв.см свитка обходится в 100 долларов, что делает стоимость расшифровки одного свитка от 1 до 5 млн долларов. Кроме того, доставка свитков в Оксфорд и сканирование их в синхротроне обходится в 40 тысяч долларов, при этом приходится ждать перерывов в исследованиях на установке. В общем, организаторы рассчитывают, что имеющиеся 800 свитков будут прочитаны в ближайшие 2-3 года — при этом раскопки виллы можно и нужно продолжить, ученые уверены, что миру откроются еще много свитков — тем более, что это практически единственная дошедшая до нас античная библиотека.

Как я с Bard-ом общался

Возможно, вы слышали, что Google не желает уступать разным там OpenAI в гонке LLMs (Large Language Models) и недавно запустил в виде эксперимента собственный AI под названием Bard. Доступ к нему открывается через инвайты и возможен только в США и Великобритании, но можно пройти через VPN — так я инвайт и получил. И даже немного пообщался.

Пасха и AI

Какое отношение может иметь Пасха к машинному обучению? Ну вот, например, такой новостью — ученые, изучающие свитки Мертвого моря, известные также, как Кумранские свитки, с помощью нейронной сети доказали, что самый большой из свитков — он состоит из 17 листов пергамента, имеет длину около 8 метров и содержит целиком Книгу Исайи, — переписывался не одним, как считали ранее, а двумя писцами, хотя второй пытался подражать первому. Процесс распознавания почерка у графологов обычно выглядит очень субъективным.