Как систему iFORA обучили семантическому поиску
22 ноября 2023 года состоится заключительный из серии вебинаров о новых возможностях системы интеллектуального анализа больших данных iFORA. Сотрудники Центра стратегической аналитики и больших данных ИСИЭЗ НИУ ВШЭ Михаил Захаров и Лев Морозов расскажут о новом функционале системы, который помогает находить смысловые связи в текстах на разных языках.
О чем вебинар?
Всем привычный поиск в интернете (с помощью ввода ключевых слов в окно поисковой системы) не является единственным способом поиска в сети нужной информации. Для обработки огромных массивов текстов, да еще на разных языках, специалисты в области Data Science используют иной подход — семантический поиск (по векторному пространству).
В самом примерном приближении он выглядит так: в специально разработанный интерфейс вводится термин, а на выходе пользователь получает перечень релевантных его запросу документов (новый функционал системы iFORA, поддерживающий семантический поиск, пока заточен на работу с массивами текстов на русском и английском языках, в перспективе к ним может добавиться китайский модуль, уже подключенный к общему функционалу системы). Между отобранными документами можно также проследить смысловые связи, которые обычно визуализируются в виде интерактивной семантической карты (но бывают и другие форматы отображения результатов).
Данный вид поиска представляет собой важный этап подготовки Low-code-решений для использования в аналитике: при таком подходе не только обогащается поле поиска (в том числе за счет подключения массивов данных на других языках), но и становится возможным зафиксировать ключевые тренды исследуемой темы без применения кода.
В ходе вебинара спикеры покажут работу с интерфейсом семантического поиска системы iFORA и подробно прокомментируют следующие вопросы:
- Как команда разработки настраивала новый формат поиска? На какие примеры ориентировалась?
- Какие преимущества для аналитиков дает применение семантического поиска?
К участию в вебинаре приглашаются молодые исследователи, применяющие в своей работе инструменты анализа больших данных, студенты старших курсов бакалавриата и магистратуры и все интересующиеся технологиями семантического анализа текстов.
Дата и время: 22 ноября 2023, 16:30 — 17:30
Формат: онлайн (платформа «Яндекс.Телемост»).
Ссылка на подключение будет направлена зарегистрированным участникам.
Остались вопросы? Пишите Марии Сварчевской (msvarchevskaya@hse.ru)