Серия методологических вебинаров о системе iFORA «От больших данных к инсайтам»
Центр стратегической аналитики и больших данных ИСИЭЗ НИУ ВШЭ по традиции в конце года проводит серию вебинаров о новациях системы iFORA, в ходе которых его сотрудники делятся опытом применения новых методологических решений в области анализа больших данных и демонстрируют их эффективность на реальных кейсах. Вебинары пройдут 13, 15 и 18 ноября 2024 года.
К участию в них приглашаются молодые исследователи, студенты старших курсов бакалавриата и магистратуры НИУ ВШЭ и все интересующиеся технологиями семантического анализа текстов. Практические примеры будут сфокусированы на развитии человеческого капитала и актуальной повестке в сфере образования.
-
Семинар 1: «Как повысить качество анализа больших текстовых данных? И чем китайские тренды в сфере образования отличаются от общемировых?»
Дата и время: 13 ноября (среда), 16:30 — 17:30
Спикеры: эксперт Мария Анташева и ведущие программисты Юлия Исаева и Евгения Заковоротная
Новый подход к векторизации терминов, который применили исследователи ИСИЭЗ, продемонстрировал высокие метрики качества и привел к значительному улучшению результатов семантического анализа. Это продемонстрировано на примере выявления глобальных трендов цифровизации образования: релевантность результатов поисковому запросу повысилась, а сравнение глобальной и страновой повесток (в качестве кейса выбран Китай) показало существующие отличия. Так, например, в повестке Поднебесной проявилось влияние диджитализации образования на цифровую экономику страны в целом, также заметен особый акцент на подготовке талантов в области информационных технологий.
-
Семинар 2: «Что такое Named entity recognition и почему анализировать китайские имена — “задача со звездочкой”?»
Дата и время: 15 ноября (пятница), 16:30 — 17:30
Спикеры: эксперт Мария Анташева и ведущий программист Юлия Исаева
В 2024 году система iFORA была дополнена алгоритмом Named entity recognition для выявления названий и имен собственных в текстах на китайском языке. Определять т. н. «именованные сущности» в массиве больших данных в целом задача нетривиальная, а при работе с неструктурированными китаеязычными текстами — задача «со звездочкой».
Исследователи ИСИЭЗ протестировали работу алгоритма на китайских текстах по тематике науки и образования. В частности, система iFORA выявила не только названия научных и образовательных организаций, но и тематики образовательных программ, наименования созданных совместно с зарубежными партнерами научно-исследовательских центров. Эту и другую ценную информацию теперь можно узнать благодаря новой методологии.
-
Семинар 3: «iFORA 2.0: как повысить безопасность и эффективность инфраструктуры системы анализа больших данных?»
Дата и время: 18 ноября (понедельник), 16:30 — 17:30
Спикеры: программист Никита Саввин и эксперт Мария Анташева
От того, как организовано хранение данных, настроены алгоритмы их обработки и мониторинг нагрузки на инфраструктуру зависит эффективность всей системы анализа больших данных. В этом году разработчики системы iFORA усовершенствовали подходы к хранению данных в целях повышения безопасности доступа, управлению нагрузкой при постоянно увеличивающихся объемах данных и обновили ряд решений, которые оптимизировали работу и функцию мониторинга системы. На вебинаре они расскажут о том, с какими основными вызовами столкнулись при создании и внедрении новой инфраструктуры.
Организационные детали:
К участию в вебинарах приглашаются молодые исследователи, студенты старших курсов бакалавриата и магистратуры НИУ ВШЭ и все интересующиеся технологиями семантического анализа текстов, инструментами анализа больших данных и актуальной повесткой в сфере человеческого капитала.
Формат: онлайн (на платформе Zoom). Ссылка для подключения будет направлена зарегистрировавшимся участникам по адресу электронной почты, использованному для регистрации.
Контактное лицо: Мария Анташева (msantasheva@hse.ru)
Зарегистрироваться на серию вебинаров