Twitter вместо исследования ущерба
Очень интересное исследование провели австралийские исследователи — во главе с Юрием Кривошеей, что уже намекает на интернациональность исследования, — над базой данных Твиттера. Они взяли около 10 миллионов твитов, опубликованных с 15 октября по 12 ноября 2012 года, когда на Восточное побережье Америки обрушился ураган «Сэнди», разметили их на карте и затем сверили данные с американскими спасателями, которые во время и после стихийного бедствия изучали последствия и координировали усилия по восстановлению.
Оказалось, что интенсивность твитов и их характеристики очень хорошо коррелируют с реальным ущербом, нанесенным стихийным бедствием. Более того, данные исследования оказались даже точнее традиционных способов, когда сложные расчеты по географическим и метеорологическим моделям корректируются облетом территории.
Правда, интересно было бы точно понимать, каким должен быть уровень проникновения сервиса, чтобы на такие выводы можно было полагаться. А потом результаты расчетов сравнить с официальной сметой. Вот тут-то и начнется настоящий data science.