Ученые рассказали, что они объединили статистические алгоритмы, которым требуется меньше данных для точных и эффективных прогнозов, с мощной нейросетью и обучили ее предсказывать сценарии, вероятности и иногда даже хронологии редких событий, например, землетрясения или пандемии.
По статистике, эти события настолько редки, что обычно просто не хватает данных о них, чтобы использовать прогностические модели для точного прогнозирования того, когда они произойдут в следующий раз. Но группа исследователей из Университета Брауна и Массачусетского технологического института утверждает, что так не должно быть.
Исследовательская группа обнаружила, что их новая структура позволяет обойти необходимость в огромных объемах данных.
“Вы должны понимать, что это стохастические события”, – сказал Джордж Карниадакис, один из авторов исследования. “Вспышка пандемии, подобной COVID-19, экологическая катастрофа в Мексиканском заливе, землетрясение, огромные лесные пожары в Калифорнии, 30-метровая волна, опрокидывающая корабль – это редкие события … У нас нет достаточного количества образцов из прошлого, чтобы предсказывать их в будущем”.
Исследователи нашли ответ в технике последовательной выборки, называемой активным обучением. Такие статистические алгоритмы не только способны анализировать вводимые в них данные, но, что более важно, они могут учиться на основе полученной информации выделять новые релевантные точки данных, которые одинаково или даже более важны для вычисляемого результата. Они позволяют делать больше при меньших затратах.
Исследователи обнаружили, что их новый метод с использованием нейросети превзошел более традиционные попытки моделирования, и считают, что он представляет собой основу, которая может эффективно обнаруживать и предсказывать все виды редких событий.