Когда в прошлом году молния зажгла лесные пожары по всей Северной Калифорнии, это побудило ученых, занимающихся данными, улучшить инструменты для прогнозирования пожаров.

Попытка была предпринята SpaceML, инициативой Frontier Development Lab, которая является исследовательской лабораторией искусственного интеллекта для НАСА в партнерстве с институтом SETI. Сообщество разработчиков SpaceML, посвященное исследованиям с открытым исходным кодом, создает модели распознавания изображений, чтобы помочь продвинуть изучение рисков стихийных бедствий, включая лесные пожары.

SpaceML использует ускоренные вычисления на петабайтах данных для изучения наук о Земле и космосе с целью продвижения проектов для исследователей НАСА. Он объединяет военных ученых, аналитиков данных и добровольных гражданских ученых по проектам, которые подключаются к данным системы наблюдения Земли НАСА и информационной сети. Спутниковая информация поступала с записанных снимков Земли — 197 миллионов квадратных миль — ежедневно в течение 20 лет, обеспечивая 40 петабайт немаркированных данных.

“Нам повезло, что мы живем в эпоху, когда доступно такое беспрецедентное количество данных. Это как золотая жила, и все, что нам нужно, — это смастерить лопаты, чтобы использовать весь ее потенциал”, — уверен Анируд Коул (Anirudh Koul), ведущий специалист по машинному обучению и наставник SpaceML.

Горит желанием что-то изменить

Коул, чья основная работа — специалист по обработке данных в Pinterest, рассказал, что прошлой осенью калифорнийские лесные пожары повредили районы рядом с его домом. Житель Сан-Хосе и заядлый турист сообщил, что они сожгли некоторые из его любимых мест для пеших прогулок на близлежащей горе Гамильтон. Его первым побуждением было стать добровольцем-пожарным, но затем он понял, что его самый большой вклад может заключаться в том, чтобы применить свои знания в области науки о данных.

Коул любит помогать другим. До волонтерства в SpaceML он руководил ИИ и исследованиями в стартапе Aira, который использует очки дополненной реальности с идентификацией изображения в паре с обработкой естественного языка, чтобы диктовать слепым, что перед ними.

Aira, участник программы NVIDIA Inception accelerator для стартапов в области ИИ и науки о данных, была приобретена в прошлом году.

Инклюзивные междисциплинарные исследования

Работа в SpaceML объединяет добровольцев без опыта работы в области искусственного интеллекта с профессионалами технической индустрии в качестве наставников по проектам. Их цель — построить классификаторы изображений на основе спутниковых снимков Земли для выявления признаков стихийных бедствий.

Группы берут на себя трехнедельные проекты, которые могут исследовать все — от лесных пожаров и ураганов до наводнений и разливов нефти. Они ежемесячно встречаются с учеными из НАСА, имеющими опыт работы в области естественных наук, для проведения оценок.

Участники SpaceML — от старшеклассников до аспирантов и заслуженных ученых. В работе приняли участие представители Нигерии, Мексики, Кореи, Германии и Сингапура.

В состав команды SpaceML для этого проекта входят Руди Венгусвами, Тарун Нараянан, Аджай Кришнан и Жанесса Паттерсон. Наставниками являются КоулМехер Касам и Сиддха Ганджу, специалист по обработке данных в NVIDIA.

Сборка инструментария SpaceML

SpaceML предоставляет набор инструментов машинного обучения. Группы используют его для работы над такими задачами, как самостоятельное обучение с использованием SimCLR, поиск изображений с несколькими разрешениями и маркировка данных. Простота использования становится ключом к набору инструментов.

Среди своих платформ построения моделей разработчики SpaceML полагаются на NVIDIA DALI для быстрой предварительной обработки данных. DALI помогает с неструктурированными данными, непригодными для подачи непосредственно в сверточные нейронные сети для разработки классификаторов.

“Используя DALI, мы смогли сделать это относительно быстро”, — сообщил г-н Венгусвами.

Результаты SpaceML были опубликованы в Комитете по космическим исследованиям (COSPAR), чтобы исследователи могли воспроизвести их формулу.

Классификаторы для больших данных

Группа разработала куратор для обучения классификаторов с помощью человека в начале цикла, требуя меньше помеченных примеров из-за его самостоятельного обучения. Интерфейс куратора похож на Tinder, объясняет Коул, так что новички могут провести пальцем влево по отклоненным примерам изображений для своих классификаторов или провести пальцем вправо по тем, которые будут использоваться в обучающем конвейере.

Этот процесс позволяет им быстро собрать небольшой набор помеченных изображений и использовать его как образец для набора спутниковых изображений GIBS Worldview, чтобы найти каждое изображение в мире, которое соответствует, создавая массивный набор данных для дальнейших научных исследований.

“Идея всего этого конвейера заключалась в том, что мы можем обучить самоконтролируемую обучающую модель всей земли”, — поделился г-н Венгусвами.

CNN запускаются на NVIDIA GPUs в облаке.

Источник: https://blogs.nvidia.com/blog/2021/04/01/spaceml-taps-satellite-images-to-help-model-wildfire-risks/

от AI_NEWS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *