DeepMind, лаборатория искусственного интеллекта, поддерживаемая материнской компанией Google Alphabet, сегодня объявила, что использует искусственный интеллект для успешного управления перегретой материей внутри ядерного термоядерного реактора. Представители лаборатории утверждают, что система, подробно описанная в статье, опубликованной в журнале Nature, может позволить ученым исследовать, как такая материя реагирует при различных условиях.

В то время как DeepMind продолжает заниматься престижными проектами, такими как системы, которые могут победить чемпионов StarCraft II и Go, в последние годы лаборатория обратила свое внимание на более практические области: к примеру, генерация кодаобработка языковпрогноз погоды, рекомендации приложений и сжатие видео. DeepMind лицензирует многие из своих инноваций другим компаниям, принадлежащим Alphabet, таким как компания по производству автономных автомобилей Waymo и YouTube, и недавно запустила дополнительный проект — Изометрические лаборатории, ориентированные на открытие лекарств.

“Пока еще предстоит проделать большую работу… но мы рады, что результаты указывают на способность ИИ ускорять исследования и помогать науке о термоядерном синтезе, расширяя знания человека в этой области и служа инструментом для открытия новых и творческих подходов к управлению термоядерным реактором и за его пределами, — сообщил Мартин Ридмиллер, научный сотрудник DeepMind, во время брифинга для прессы на этой неделе. — Наша работа также может иметь потенциал для более широкого внедрения глубокого обучения с подкреплением в физических системах для сложных научных и промышленных машин, от простого управления двигателем до сложных роботов”.

Ядерный синтез

Ядерный синтез — реакция, которая приводит в действие звезды, включая Солнце, — обещает чистую, безграничную энергию путем разрушения и слияния атомов водорода в гелий. В отличие от некоторых источников энергии, термоядерный синтез не производит парниковых газов и лишь небольшое количество радиоактивных отходов. Но при низких давлениях, возможных на Земле, температуры для достижения термоядерного синтеза должны быть очень высокими, обычно более 100 миллионов градусов Цельсия.

Одним из решений является токамак, вакуум в форме пончика, окруженный магнитными катушками, который может содержать плазму водорода, более горячую, чем ядро Солнца. Однако плазма в этих машинах нестабильна, что затрудняет поддержание процесса, необходимого для ядерного синтеза. Чтобы плазма никогда не касалась стенок токамака, что привело бы к потере тепла (и, возможно, повреждению), системе управления необходимо координировать катушки и регулировать напряжение на них тысячи раз в секунду.

В поисках решения DeepMind сотрудничал со Швейцарским центром плазмы в EPFL, чтобы разработать то, что, по словам лаборатории, является первой системой обучения с подкреплением, позволяющей автономно узнавать, как управлять катушками в токамаке. Он может быть использован для разработки новых видов токамаков и контроллеров, согласно DeepMind, а также других типов “промышленных и научных” механизмов управления.

“Физические симуляции по большей части довольно хорошо отражают реальность, поскольку ИИ понимает законы физики намного лучше, чем то, как работают люди, — передал Сэм Гин, астрофизик из Амстердамского университета, VentureBeat по электронной почте. — Это также очень практичный случай использования, когда результаты сбоя модели были бы совершенно очевидны — ваш термоядерный реактор сломался бы… Машинное обучение может быть довольно эффективным для физических задач, где существует четкая связь между вводом и выводом и где то, что происходит между ними, достаточно предсказуемо. Задача, для решения которой машинное обучение может очень пригодиться, — это взять огромный набор сложных входных данных, таких как элементы управления реактором, и очень быстро определить, каким будет результат”.

Обучение с подкреплением

Обучение с подкреплением дает системе искусственного интеллекта набор действий, которые она может применить к своей среде для получения вознаграждения или достижения определенной цели. Система, которая обычно начинается с того, что ничего не знает об окружающей среде и выбирает случайные действия, получает вознаграждение в зависимости от того, как ее действия приближают ее к цели, и в конечном итоге изучает последовательности действий, которые могут максимизировать вознаграждение.

Обучение с подкреплением широко используется в робототехнике и других видах промышленного применения, таких как автономное вождение, моделирование управления и рекомендации по техподдержке. Этот подход также помог исследователям освоить сложные игры, такие как Gran Turismo, StarCraft 2 и DOTA 2, которые не были решаемы на уровне экспертов-людей с помощью предыдущих методов искусственного интеллекта.

Система управления реактором DeepMind обучалась с использованием инструментов моделирования, созданных исследователями EPFL. В исследованиях термоядерного синтеза необходимы инструменты моделирования, поскольку действующие в настоящее время реакторы могут поддерживать плазму в одном эксперименте только в течение нескольких секунд, после чего им требуется время для сброса.

Система DeepMind научилась управлять токамаком — в частности, токамаком TCV в Швейцарском центре Plamsa — в ходе моделирования в течение многих часов, а затем перенесла эти навыки в реальный TCV. Это впечатляющий подвиг, учитывая, что существующие системы управления плазмой требуют отдельных контроллеров для каждой из 19 магнитных катушек TCV. В то время как традиционные контроллеры используют алгоритмы для оценки свойств плазмы в реальном времени и соответствующей регулировки напряжений магнитов, система DeepMind использует единый алгоритм для управления всеми катушками одновременно, автоматически определяя, какие напряжения лучше всего подходят для достижения “конфигурации плазмы” непосредственно с датчиков.

В качестве демонстрации DeepMind впервые показал, что система может управлять аспектами плазмы с помощью одного контроллера. Затем лаборатория использовала систему для создания ряда форм плазмы, которые изучаются физиками плазмы на предмет их полезности для выработки энергии. Например, ИИ сделал форму “снежинки” со множеством “ножек”, которые могли бы помочь снизить затраты на охлаждение за счет распределения энергии выхлопных газов в различные точки соприкосновения на стенках токамака. И DeepMind стабилизировал две плазмы внутри токамака одновременно — впервые для TCV.

“На сегодняшний день это одно из самых сложных применений обучения с подкреплением в реальной системе, — пояснил г-н Ридмиллер. — Но это не означает, что мы решили проблему слияния. Пока наш успех стал значительным шагом в понимании того, как мы могли бы разработать новые гибкие контроллеры токамака, которые теперь позволяют нам указывать ”что», а не разрабатывать «каким способом» — способ теперь изучает ИИ».

Предстоящие задачи

Достижение DeepMind, хотя и значительное, является лишь одним шагом на пути к жизнеспособному источнику термоядерной энергии. Как отмечает лаборатория, для моделирования токамака требуется много часов компьютерного времени в течение одной секунды реального времени. Состояние токамака может меняться изо дня в день, более того, требуется разработка алгоритмических улучшений как физически, так и в процессе моделирования.

“В статье DeepMind поднимается один вопрос, который я разрабатывал, а именно вопрос о ”нелинейной динамике», — поясняет г-н Джин. — Большая часть того, что мы изучаем в школе, является «линейной» — если вы немного измените входные данные, выходные данные также немного изменятся. Однако большая часть физики реального мира «нелинейна» — если вы немного измените входные данные, выходные данные со временем сильно изменятся. Это «эффект бабочки», и он возникает при проблемах с такими сферами исследования, как погода и климат, межзвездный газ и плазма в термоядерных реакторах, где могут происходить непредсказуемые вещи. Ученые делают ставку на то, что эффект бабочки не имеет большого значения, если они тщательно контролируют ситуацию — иногда свойства жидкостей предсказуемы, например, если вы включаете душ, вы знаете, что скорость вытекающей воды со временем останется примерно одинаковой, даже если вы не знаете, где окажется каждая капля».

Существует также неопределенность в отношении того, когда термоядерная энергия будет готова к коммерциализации. Оценки варьируются от 20 до 30 лет, что не включает в себя расширение — последующий процесс, потенциально длящийся десятилетия.

Тем не менее DeepMind утверждает, что ИИ может помочь ускорить выход термоядерной энергии на рынок.

“Немногие из сегодняшних серьезных проблем в науке можно свести к небольшому набору элегантных или компактных формул, которые могут быть решены одним человеком или одной небольшой командой, — напомнил Джонас Бухли из DeepMind во время брифинга. — Мы считаем, что ИИ является катализатором человеческой изобретательности, открывающим новые области исследований и позволяющим нам полностью раскрыть свой потенциал. Сегодня системы искусственного интеллекта становятся достаточно мощными, чтобы их можно было применять ко многим проблемам реального мира, включая само научное открытие”.

Источник: https://venturebeat.com/2022/02/16/deepmind-applies-ai-to-controlling-nuclear-fusion-reactors/

от AI_NEWS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *