Как и чем наполнить метавселенные
Метавселенная дает возможность упростить и сделать более доступными многие продукты и услуги и предоставить такой сервис, который в принципе невозможен в реальной жизни. О том, какие технологии помогают строить метавселенные, какова роль ИИ и каких специалистов не хватает отрасли, рассказывает Дмитрий Горинов, руководитель проекта «НЕЙМАРК. Цифровая вселенная».
Материал пополнил серию глубинных интервью, которые проводятся в рамках мониторинга развития и распространения технологий искусственного интеллекта, наряду с опросом 2,3 тыс. организаций, использующих решения на базе ИИ. Другие результаты были представлены ранее.
— В чем вообще ценность метавселенной для человека? Это еще одно пространство для продаж или это берлога, куда можно сбежать?
— С точки зрения функциональной ценности это, конечно, эффект присутствия. Плюс неограниченность пространства.
Я люблю рассказывать такой кейс. Самый большой в истории человечества концерт, который проходил в физическом мире, — это выступление на одном из фестивалей группы Queen, когда они собрали более 900 тысяч человек. На огромном поле стояло много рядов звукового оборудования, масса народа и охраны. Сложная организация и очень большие риски давки, беспорядков. Больше никто не решался такое повторить. Так вот, в прошлом году Трэвис Скотт, есть такой американский исполнитель, совершенно спокойно подключился к метавселенной у себя в студии и собрал 27 миллионов пользователей. Люди, которые находились за 150 метров от сцены, когда слушали группу Queen, даже близко не видели музыкантов, они слышали только звук. Теперь каждый из 27 миллионов пользователей может стоять у сцены и видеть, как выглядит в цифровом мире их кумир, как он поет, как он двигается.
Ну и, конечно, доступность. Пример с тем же телефонным оператором. Если я надену VR-очки, то у меня будет иллюзия того, что я реально вошел в офис и разговариваю с менеджером. У меня будет ощущение, что я получаю услугу от человека. Мы же знаем, что с операторами по телефону поговорить — зачастую тот еще квест.
Что касается личных, гуманистических факторов, то метавселенные делают доступными процессы, невозможные в реальном мире, предоставляют любой футуристичный сервис. Так, свое тело трудно изменить. Скажем, я могу сделать татуировки, но потом сложно их сводить. В метавселенной этих ограничений нет. Ты можешь себя проявлять и самореализовываться, как пожелаешь, можешь, например, выглядеть кошкой. Хочешь себе огромную квартиру, не можешь позволить ее в реальной жизни — сделай такую, как захочешь. То есть метавселенная дает определенные возможности самореализации и самовыражения.
— Следующий шаг или барьер, который требуется преодолеть, чтобы полностью загрузиться в метавселенную, — это установить нейроинтерфейс?
— Я бы сказал, что он, к сожалению, не следующий, вот в чем проблема. Это действительно очень значимый шаг к тому, чтобы всем нам лучше познать и человеческую природу, и ее взаимодействие с технологиями. Такие интерфейсы уже существуют, они работают. Есть рыночные экземпляры, их можно купить, они не так дорого стоят, и они нормально считывают импульсы. Но в пользовательском, бытовом формате недостаточно информации для их расшифровки, то есть не до конца понятно, верна ли интерпретация считываемой информации. И вообще, в целом беда в том, что внедрение не успевает за наукой и развитием технологий. Огромное количество технологий устаревают, не успев развиться. И у нас получается, что фундамент, на котором мы пытаемся построить дальнейшее развитие, — шаткий. Мы не имеем четкого понимания, что и зачем мы делаем.
И что уж говорить про нейроинтерфейсы, когда не до конца изучено само человеческое тело, до сих пор в медицинской науке нет полного понимания физиологических процессов.
Правда, есть специальные костюмы, они не так дорого стоят по меркам технологии, порядка полумиллиона рублей. Они позволяют полностью считывать ваши движения, напряжение мышц, мозговую активность. Такие костюмы — это современные нейроинтерфейсы. Следующий этап — это обратная связь для пользователя. Сейчас выпускаются перчатки dvr, которые позволяют потрогать предмет. Костюмов с обратной связью пока нет.
Основная цель в настоящий момент — довести до продуктового состояния технологию распознавания и считывания.
— И сколько времени вы даете на реализацию всех этих планов?
— До следующего всплеска VR, в котором пойдут как раз нейроинтерфейсы, я думаю, нам осталось два-три года. До полноценного пользовательского внедрения — лет пять-шесть.
— Прорывы в каких технологиях помогут реализовать ваш прогноз?
— Как только появится необходимое оборудование, работа пойдет. Либо оборудование, которое позволяет сетями 5G передавать на вычислительные серверы и обратно гигантские массивы данных. Либо мы настолько сокращаем вычислительные алгоритмы, что сможем проводить вычисления на носимых устройствах. Еще вариант: мы создаем новую прорывную технологию, которая снижает нагрузку на существующие устройства вычислительной мощности.
— Насколько критично для этого разворачивание сетей 5G?
— Удивительно, но не так много технологий, для которых, откровенно говоря, нужен тот самый пресловутый 5G, за которым мы все гонимся. 4G пользовательские нужды обеспечивает полностью, 5G критически необходим для развития технологий метавселенных.
— Как встраивается технология искусственного интеллекта в концепцию построения метавселенных?
— Я разделю ответ на две части: на текущие дни и на то, куда мы идем. В принципе, этот процесс не выходит за рамки дорожных карт, планов по развитию в целом сквозных технологий, потому что и АR/VR (дополненная реальность / виртуальная реальность. — Ред.), и искусственный интеллект как самые яркие представители технологий, должны быть взаимосвязаны. И получается, что на сегодняшний день мы все это делаем просто интеграциями, все это либо API (программный интерфейс приложения. — Ред.), либо какие-то транспортные узлы. То есть мы не встраиваем непосредственно технологию в технологию, мы строим между ними мосты, и это основная задача разработчиков. Сегодня мы занимаемся в основном этим. Что касается будущего, к чему мы идем, — это бесшовная быстрая интеграция. То, что сейчас делается, на языке программирования называется «костыли». Мы идем к тому, чтобы технологии могли между собой спокойно коммуницировать, без «костылей». В этом, наверное, будущее.
— В чем ценность технологий искусственного интеллекта, машинного обучения для развития метавселенной?
— Метавселенная — это пространство. Представьте здание. Если оно пустое, то это коробка, у которой единственный функционал — защищать вас от дождя, солнца и ветра.
И, по сути, технология искусственного интеллекта, не только она, но она в том числе, — это то, что ее наполняет, то, что создает внутри контент, функциональные возможности. Все, кто их создает, сейчас заняты одним главным вопросом: чем наполнить метавселенную, что пользователи там должны делать? Все трендовые метавселенные — в основном это просто пространства, в которых можно организовывать мероприятия, на которых собираются пользователи, проводят какие-то виртуальные выставки, где работают виртуальные магазины, — по сути, ивент-менеджмент.
Кроме того, что мы даем пользователю пространство, мы способны принести практическую пользу. Мы, например, взяли цифрового аватара, наделили его способностью разговаривать, то есть дали ему войс, и теперь он выполняет предзаписанные задачи в автоматическом режиме. По факту мы внутри метавселенной повторяем процесс, который проходили люди и в обычной жизни. Сначала у нас были операторы на телефоне, которые выполняли какую-то функцию, потом их заменил голосовой помощник. Так же в метавселенной. Например, человек подходит, чтобы что-то уточнить, получить какую-то услугу, получить какую-то информацию. И он обращается не к другому пользователю, который там находится, а непосредственно к искусственному интеллекту в виде человека.
У нас реализованы, например, пилоты операторов сотовой связи. Метавселенная тоже требует таких помощников, и мы туда сейчас интегрируем помощника. Можно сказать, что это аналог «Алисы», только в виртуальном пространстве.
— Какие технологии ИИ наиболее востребованы или какие вы рассматриваете как наиболее востребованные для развития кейсов с метавселенной?
— Так случилось, что мы в разных сферах успели поработать, всплески эти застали — и искусственный интеллект, и АR/VR, и блокчейн. Именно для метавселенной наиболее актуальны технологии компрессии данных на основе искусственного интеллекта и скорости передачи. И исследования в этих областях уже ведутся.
Следующая технология — это GAN. Здесь большой ряд ограничений. Но уже существуют прекрасные алгоритмы, которые генерируют, например, бесконечный ландшафт пляжа, — это то, что нужно внедрять в метавселенные. Потому что чем больше пользователей, тем больше нужно пространства для комфорта, его нужно простраивать, его нужно продумывать. Регенеративные технологии должны быть 100%. И еще, конечно, войс.
— Мы говорим об NLP?
— Войс — это, наверное, такая связка. Потому что NLP — это распознавание, natural language processing. А войс — это связка между распознаванием того, что говорит человек, то есть распознавание ключевых слов, интонаций и всего остального, и синтез речи. Я в понятие войса вкладываю сумму технологий, которые позволяют полностью осуществить взаимодействие голосового помощника с пользователем. Потому что мы все люди, и наш мир для нас — это то, как мы его чувствуем. На сегодняшний день метавселенную мы видели, слышали звуки, которые туда вложил человек. Следующий этап — с ней взаимодействовать, разговаривать. Потом нам останется только решить проблему с передачей запахов и нейростимуляцией.
В войсе я бы выделил три ключевых элемента. Это генерация контента, потому что контента мало. Это сейчас самая большая проблема — ограниченность контента. Если решаем задачу с генерацией, то контент становится условно неограниченным.
Это компрессия данных, и это серверная мощность. Если контент неограниченный, его надо хранить в неограниченном количестве, и пользователи должны иметь к нему доступ. Сейчас наблюдается тенденция к тому, что формируется дефицит хранилищ данных, по крайней мере в России.
— Технология TinyML могла бы снять нагрузку на вычислительные мощности, которые вы используете?
— Да. И нагрузку на передачу сняла бы, и решила бы вопрос со связкой. Если бы устройства могли предобрабатывать большую или хотя бы половину информации, которую нужно передать или получить, это бы сильно упростило весь процесс.
Поскольку мы пользуемся не российскими технологиями, у нас закрыт доступ к соответствующим исследованиям. Я сейчас готовлюсь к тому, чтобы в следующем году подаваться на большой грант РФРИТ — Российского фонда развития интернет-технологий — для того, чтобы исследовать всю цепочку и понять, каким образом нам сдвинуть отрасль. Технологии, движки, на которых мы пишем, они хоть «оупенсорсные», но они не отечественные. Оборудование не отечественное, даже банальные провода и все компоненты не отечественные. Технологии, которые мы внедряем, серверы и все остальное — не отечественные. То есть все почти целиком пришло извне.
— Проблема только в деньгах или в отсутствии каких-то компетенций?
— У нас был недавно прецедент, приходили ребята, которые били себя в грудь и говорили: «Дайте нам 5 миллиардов долларов, мы построим у нас завод по производству процессоров». Мы попросили вдобавок заложить риски на 5–10 лет того, что вдруг это не получится, и у них цифра улетела куда-то в космос. Конечно, не только деньги. Если дать просто денег, ничего хорошего не получится. Еще одна яхта, дача, новый завод, но только не по теме.
— А каких компетенций все-таки не хватает?
— Я так думаю, что не хватает не то что компетенций, скорее не хватает опыта. Отдельные технологии работают: VR в России делать умеют, искусственный интеллект в России делать умеют. Но когда мы пытаемся все объединить, возникает «дисконнекшн». Есть какие-то не очень стандартные задачи. И к сожалению, поколение «программистов со Skillbox» не может с ними справиться. Реально толковых инженеров, которые могут это сделать, мало, они стоят больших денег. А для исследования нужно содержать специалистов разных стеков.
По большей части не хватает крепких рабочих рук — дата-сайентистов на уровне «мидл». «Джунов» полно, потому что ими становятся после не очень дорогих и не очень длительных курсов, их везде выпускают. Не хватает людей с опытом, поскольку теория без практики не работает. Конечно, не хватает архитекторов, хотя нужен один архитектор на отдел или систему, какой-нибудь «суперсеньор», который все это генерирует, раздает все задачи. Не очень хорошо обстоят дела на рынке разметки. Должна быть полнота команды, которая будет выполнять проект целиком.
Ну и конечно, огромная проблема в управляющем персонале — в основном в «продактах». Не хватает аналитиков, системных аналитиков. Особенно очень тяжело идет монетизация в искусственном интеллекте, потому что таких специалистов мало. Здесь мало того что нужны какие-то предпринимательские навыки, техническое понимание, здесь еще нужно саму продуктовую составляющую понимать.
— По каким технологиям ИИ ведется наиболее активная работа? Какие приоритеты вы для себя определяете на сейчас и на завтра?
— Сейчас мы занимаемся развитием интеграций войса. Кроме того, чтобы просто пользователя слушать и ему отвечать, учимся интегрировать определенные команды, ивенты, чтобы сам искусственный интеллект мог еще что-то делать внутри. Одно дело — он с тобой просто разговаривает, другое дело — в процессе разговора он заказывает курьера, включает, выключает свет, меняет тебе локацию и так далее. То есть мы интегрируем туда еще эти команды, надстраиваем.
Для этого нужна либо технология голосовой авторизации, либо что-то типа блокчейна. Когда ты подходишь к ассистенту, он проверяет твой токен. Если ты человек, у которого есть доступ к определенному функционалу, он тебе открывает доступ. То есть я бы сказал, что, наверное, технологии сами по себе уже нормально развиты. И сейчас, и в ближайшее время мы планируем — и я для себя основную задачу ставлю — именно их грамотное соединение и надстройку друг над другом. Даже в России есть два официальных понятия — это продуктовый патент и технологический патент. У нас большая часть патентов — технологические. Потому что их гораздо проще сделать, в рамках грантовых поддержек их обычно все регистрируют и на этом забывают. А продукты никто не делает, технологии не внедряются. Огромная пропасть у нас между наукой и бизнесом. Никто не может ее закрыть, все пытаются какие-то мосты строить.
— Что касается ИИ, есть мнение, что черный ящик сделать просто, а сделать объяснимый искусственный интеллект гораздо сложнее.
— У меня есть большие опасения, что будут делать «черные ящики», выдавая их за объяснимые решения. Доверенный искусственный интеллект — вещь все-таки тяжелая для исследования и разработки даже с точки зрения ответственности в принятии решений, с точки зрения того же гуманизма. Человечеству прежде всего нужно решить, кто будет отвечать за результаты действий искусственного интеллекта. А когда мы сможем разработать доверенный — трудно сказать. В MIT сделали нормальный, вроде как пробный экспонат. В России есть разработки.
— Имеется в виду интеграция памяти в вычисления?
— Не совсем. Я бы сказал, что это просто уход от классической архитектуры фон Неймана, которой мы пользуемся в компьютерах. У нас сейчас есть шины и отдельная память, обработка, электричество и все остальное, и все это энергозависимое. А развитие пойдет не по пути изменения отдельных параметров, а путем наращивания системы, это другой подход. Это и с точки зрения вычислительных мощностей прорыв.
— Двигаться будем в сторону проприетарных разработок или Open Source?
— В России стоит задача двигаться в Open Source. Одна из задач, конечно. И даже грантовые поддержки есть для тех, кто занимается развитием open-source-технологий. Но рынок, конечно, будет делать все проприетарным. Лично я за то, чтобы технологии были Open Source, а продукт — проприетарным.
Беседовал Сергей Сычев, ведущий эксперт ИСИЭЗ НИУ ВШЭ
Впервые интервью опубликовано порталом HSE Dailly (дата публикации: 27.09.2023)