Серия методологических вебинаров о системе iFORA «От больших данных к инсайтам»

Мероприятие завершено

Центр стратегической аналитики и больших данных ИСИЭЗ НИУ ВШЭ по традиции в конце года проводит серию вебинаров о новациях системы iFORA, в ходе которых его сотрудники делятся опытом применения новых методологических решений в области анализа больших данных и демонстрируют их эффективность на реальных кейсах. Вебинары пройдут 13, 15 и 18 ноября 2024 года.

К участию в них приглашаются молодые исследователи, студенты старших курсов бакалавриата и магистратуры НИУ ВШЭ и все интересующиеся технологиями семантического анализа текстов. Практические примеры будут сфокусированы на развитии человеческого капитала и актуальной повестке в сфере образования.

Семинар 1: «Как повысить качество анализа больших текстовых данных? И чем китайские тренды в сфере образования отличаются от общемировых?»

Дата и время: 13 ноября (среда), 16:30 — 17:30

Спикеры: эксперт Мария Анташева и ведущие программисты Юлия Исаева и Евгения Заковоротная

Новый подход к векторизации терминов, который применили исследователи ИСИЭЗ, продемонстрировал высокие метрики качества и привел к значительному улучшению результатов семантического анализа. Это продемонстрировано на примере выявления глобальных трендов цифровизации образования: релевантность результатов поисковому запросу повысилась, а сравнение глобальной и страновой повесток (в качестве кейса выбран Китай) показало существующие отличия. Так, например, в повестке Поднебесной проявилось влияние диджитализации образования на цифровую экономику страны в целом, также заметен особый акцент на подготовке талантов в области информационных технологий.
Семинар 2: «Что такое Named entity recognition и почему анализировать китайские имена — “задача со звездочкой”?»

Дата и время: 15 ноября (пятница), 16:30 — 17:30

Спикеры: эксперт Мария Анташева и ведущий программист Юлия Исаева

В 2024 году система iFORA была дополнена алгоритмом Named entity recognition для выявления названий и имен собственных в текстах на китайском языке. Определять т. н. «именованные сущности» в массиве больших данных в целом задача нетривиальная, а при работе с неструктурированными китаеязычными текстами — задача «со звездочкой».

Исследователи ИСИЭЗ протестировали работу алгоритма на китайских текстах по тематике науки и образования. В частности, система iFORA выявила не только названия научных и образовательных организаций, но и тематики образовательных программ, наименования созданных совместно с зарубежными партнерами научно-исследовательских центров. Эту и другую ценную информацию теперь можно узнать благодаря новой методологии.
Семинар 3: «iFORA 2.0: как повысить безопасность и эффективность инфраструктуры системы анализа больших данных?»

Дата и время: 18 ноября (понедельник), 16:30 — 17:30

Спикеры: программист Никита Саввин и эксперт Мария Анташева

От того, как организовано хранение данных, настроены алгоритмы их обработки и мониторинг нагрузки на инфраструктуру зависит эффективность всей системы анализа больших данных. В этом году разработчики системы iFORA усовершенствовали подходы к хранению данных в целях повышения безопасности доступа, управлению нагрузкой при постоянно увеличивающихся объемах данных и обновили ряд решений, которые оптимизировали работу и функцию мониторинга системы. На вебинаре они расскажут о том, с какими основными вызовами столкнулись при создании и внедрении новой инфраструктуры.

Организационные детали:

К участию в вебинарах приглашаются молодые исследователи, студенты старших курсов бакалавриата и магистратуры НИУ ВШЭ и все интересующиеся технологиями семантического анализа текстов, инструментами анализа больших данных и актуальной повесткой в сфере человеческого капитала.

Формат: онлайн (на платформе Zoom). Ссылка для подключения будет направлена зарегистрировавшимся участникам по адресу электронной почты, использованному для регистрации.

Контактное лицо: Мария Анташева (msantasheva@hse.ru)

Серии открытых лекций об использовании в исследовательской деятельности ИСИЭЗ инструментов анализа больших данных организует разработчик системы iFORA — Центр стратегической аналитики и больших данных — в рамках НЦМУ «Центр междисциплинарных исследований человеческого потенциала» на средства гранта, предоставленного Министерством науки и высшего образования Российской Федерации (№ соглашения о предоставлении гранта: 075-15-2022-325).

Дата

13 ноября 2024

Темы

iFORA искусственный интеллект семантический анализ

В статье упомянуты

Институт статистических исследований и экономики знаний, Научный центр мирового уровня «Центр междисциплинарных исследований человеческого потенциала», Центр стратегической аналитики и больших данных

Персоны