Вышка вошла в суперкомпьютерный клуб
В НИУ ВШЭ начал работу вычислительный кластер, мощности которого позволят университету выйти на новый уровень исследований в области глубинного обучения и математического моделирования, а ИСИЭЗ — развернуть обновленную версию системы интеллектуального анализа больших данных iFORA. Вычислительный кластер Вышки занял 6-е место в апрельском рейтинге «Топ-50 суперкомпьютеров России».
Использовать суперкомпьютер в научной деятельности планируют такие подразделения университета, как Московский институт электроники и математики им. А.Н. Тихонова, факультет компьютерных наук, Институт статистических исследований и экономики знаний, а также Центр нейроэкономики и когнитивных исследований факультета социальных наук.
Так как одна часть задач требует большой оперативной памяти, а другая — графических ускорителей, встает вопрос о балансировке нагрузки. На данный момент идет поиск технических решений, которые позволят минимизировать побочные эффекты от запуска разных типов задач на одной машине. Вопрос освоения мощностей суперкомпьютера для выполнения научных проектов стал темой первого семинара по высокопроизводительным вычислениям, на котором обсуждались результаты тестов по производительности и экспериментов по моделированию. Семинар планируется проводить на регулярной основе каждый первый вторник месяца. С предложениями по работе семинара заинтересованные сотрудники НИУ ВШЭ могут обращаться к профессору Льву Щуру.
Игорь Агамирзян, вице-президент НИУ ВШЭ: «Когда мы проводили опрос всех научных подразделений НИУ ВШЭ о необходимом научном оборудовании, большинство участников отметили в качестве основной потребности именно вычислительные ресурсы. На этапе планирования архитектуры и стоимости закупки предполагалось, что вычислительный кластер попадет в десятку рейтинга, но 6-е место стало приятным сюрпризом».
Лев Щур, научный руководитель образовательной программы «Суперкомпьютерное моделирование в науке и инженерии»: «Технические особенности нашего кластера лучше всего видны в сравнении. У лидера рейтинга суперкомпьютера «Ломоносов-2» скорость 2.5 петафлопса и больше полутора тысяч узлов. У нас 24 узла дают скорость 0.5 петафлопс. Казалось бы — узлов в 50 раз меньше, а скорость всего лишь в 5 раз меньше. Это означает, что сами по себе узлы на порядок мощнее. Кроме того, можно смотреть на мощность по специфике задач. Если для задач моделирования наш кластер находится на 6-м месте, то по возможности глубокого машинного обучения это самое мощное устройство в России на данный момент. Новая технологическая линейка фирмы Intel обеспечивает очень большую мощность и скорость на малом количестве узлов. Это упрощает решение задач по моделированию любых процессов: гидродинамических или биологических. Например, можно рассчитать обтекание крыла самолета, а можно построить модель движения кластеров клеток в кровеносных сосудах, проливающую свет на процесс распространения метастазов раковых опухолей. Второй пример — одно из приложений моего проекта, поддержанного грантом РНФ, по моделированию течения многокомпонентной жидкости в сложной геометрии. Еще одно возможное практическое применение этого исследования — изучение возможности адресной доставки лекарственных аппаратов, упакованных в кластеры».
Павел Бахтин, заместитель заведующего отделом информационно-аналитических систем ИСИЭЗ НИУ ВШЭ: «Установленный в Высшей школе экономике суперкомпьютер успешно задействован для разворачивания системы интеллектуального анализа больших данных iFORA, разработанной Институтом статистических исследований и экономики знаний. Ее результаты были использованы, в частности, при построении Карты компетенций Высшей школы экономики, также применяются во всех форсайт-проектах и в большинстве исследований ИСИЭЗ в области научно-технической и инновационной политики. Предоставленные вычислительные возможности позволят обучить новые дистрибутивные семантические модели iFORA (на русском и английском языках), необходимые для работы со смыслом текстов, обработать свыше 350 млн текстовых источников информации и тем самым расширить охват системы, а также в десятки раз повысить ее производительность. Помимо этого, до конца года на основе вычислительного кластера будет внедрен модуль обработки китайского языка, который даст возможность вывести на новый уровень аналитику китайских документов в сфере науки, технологий и инноваций».
Андрей Устюжанин, заведующий научно-учебной лабораторий методов анализа больших данных ФКН: «Вычислительный кластер оснащен ресурсами, позволяющими решать как вычислительные оптимизационные задачи, так и задачи глубинного обучения. Мы надеемся, что с его помощью мы дадим студентам возможность гораздо ближе познакомиться с ресурсоемкими инструментами глубинного обучения, а исследовательским лабораториям ускорить получение научных результатов. Ближайшим примером таких проектов могут стать работы по гранту РНФ по исследованию возможностей генеративных моделей для развития технологий цифровых двойников, которым наша лаборатория занимается совместно с центром глубинного обучения и байесовских методов».
Антон Осокин, заместитель заведующего Центром глубинного обучения и байесовских методов: «Наш центр разрабатывает фундаментальную основу для тех, кто занимается обучением с подкреплением, а также приложениями, связанными с обработкой изображений и естественного языка. Речь идет о создании новых методов обучения и использования глубоких нейросетей — это основное направление исследований в области искусственного интеллекта прямо сейчас. Целый ряд недавних прорывов в области ИИ — победы компьютера над человеком в различных играх — основаны именно на совместном использовании нейросетей и обучения с подкреплением. Сначала это были шахматы, потом Го, теперь — киберспорт (Starcraft и DotA). Традиционно считается: люди превосходят компьютер в задачах, связанных с творческим мышлением, интуицией — где недостаточно просто просчитывать варианты или вариантов слишком много. Но недавно выяснилось, что это не совсем так. Мы не можем создать систему, которая обыграет человека в Starcraft или Го, — для этого нужно быть огромной технологической корпорацией с колоссальным объемом вычислительных и людских ресурсов. Но мы можем улучшить методы, которые лежат в основе таких систем. Работая над задачами, которые находятся на переднем краю науки и которые компании не умеют решать в совершенстве, мы как бы делаем следующие шаги в развитии технологий».
Источник: новость на портале НИУ ВШЭ