Вакансия «Стажер по разметке данных для ИИ-ассистентов»
Центр стратегической аналитики и больших данных ИСИЭЗ НИУ ВШЭ ищет стажера по разметке данных для ИИ-ассистентов на проектную работу.
Наша команда – это методологи, разработчики и аналитики, реализующие проекты в области Big Data Analytics. Наш основной продукт – система анализа больших данных iFORA (собственная разработка ИСИЭЗ НИУ ВШЭ).
Система позволяет анализировать более 850 млн документов из уникальной коллекции (научные статьи, патенты, медиа и др.) для помощи в принятии управленческих и стратегических решений. Развитием iFORA занимается коллектив, включающий в себя разработчиков и специалистов в области Big Data, ИТ-инфраструктуры и MLOps, дата-сайентистов, научных сотрудников и аналитиков.
Ознакомиться с примерами аналитических продуктов и подробнее узнать о деятельности Центра стратегической аналитики и больших данных Вы можете в официальном Telegram – канале ИСИЭЗ НИУ ВШЭ, а также в сериях экспресс-информаций:
Об ИСИЭЗ: https://issek.hse.ru/
Сайт iFORA: https://issek.hse.ru/ifora/
Telegram-канал ИСИЭЗ: https://t.me/iFORA_knows_how
Серия бюллетеней «iFORA-экспресс»: https://issek.hse.ru/ifora_express
Серия бюллетеней «Цифровая экономика»: https://issek.hse.ru/express_digiteconomy
Серия бюллетеней «Искусственный интеллект»: https://issek.hse.ru/ai
-
Задачи
ИСИЭЗ НИУ ВШЭ разрабатывает передовые продукты и сервисы с использованием искусственного интеллекта на базе Системы iFORA для поддержки принятия решений в задачах технологической, рыночной и тренд-аналитики. Одним из таких продуктов является ИИ-ассистент на базе больших языковых моделей (LLM) и метода генерации с дополненной выборкой (RAG). Продукт представляет собой диалогового помощника, доступного пользователям через интерактивный веб-интерфейс с возможностью гибкой настройки поиска. ИИ-ассистент позволяет мгновенно генерировать ответы на вопросы пользователя на естественном языке, используя коллекцию релевантных документов и приводя к каждому ответу ссылки на документы-источники.
Основные задачи стажировки – сбор и разметка документов для пополнения и обновления информационной базы ИИ-ассистента:
- Ежедневный поиск аналитических материалов в сфере трендов и технологий по заданным критериям: аналитических отчетов/докладов, маркетинговых отчетов/обзоров рынков, корпоративных стратегий и др. в открытых источниках, в т.ч. в разрезе разных тем и отраслей (формат аналитических материалов – документы pdf; ожидаемый объем – 30+ новых документов ежедневно)
-
примеры критериев для отбора документов: тема – «Цифровые технологии», период – с 2015 г., языки публикации – русский и английский и др.
- Регулярный поиск и пополнение перечня релевантных источников с аналитикой по трендам и технологиям (сайтов компаний, исследовательских центров, аналитических порталов, телеграм-каналов и др.)
- Разметка отобранных документов в соответствии с заданной многоуровневой тематической классификацией и заполнение других необходимых атрибутов
-
примеры топиков в многоуровневой тематической классификацией по теме «Цифровые технологии»: ИИ, Индустрия 4.0, Финтех и др.; примеры атрибутов для заполнения по каждому документу – название документа, организации-авторы, язык, дата публикации, ссылка на источник и др.
- Обеспечение полного, корректного, структурированного и единообразного заполнения атрибутивной информации по каждому документу совместно с командой стажеров, участвующих в сборе и разметке документов
- Участие в разработке дополнительных критериев отбора и разметки документов для дальнейшего повышения в т.ч. тематического охвата продукта и увеличения функциональных возможностей настройки поиска пользователем
- Взаимодействие с командами аналитиков и разработчиков для повышения качества и полноты данных
- Применение навыков программирования, DS и работы с ИИ-инструментами для автоматизации поиска и разметки данных, повышения их скорости и качества (при наличии)
-
примеры задач, для которых полезны вышеуказанные навыки: автоматический парсинг источников, предварительное назначение атрибутов документам и тематическая классификация, автоматический контроль качества разметки и др.
-
Требования
- Умение искать и систематизировать информацию по различным направлениям развития науки, технологий и инноваций в отраслевом разрезе (цифровые технологии, ИКТ, финансовые сектор, госуправление, сельское хозяйство, здравоохранение, образование, энергетика, промышленность и др.)
- Знание английского языка (Upper-intermediate и выше), умение работать с англоязычными источниками, наличие подтверждающих сертификатов (например, IELTS, TOEFL) и аналитических/научных работ на английском языке; просим кандидатов направить сертификаты и примеры работ на английском языке при отклике на вакансию
- Знание китайского языка как преимущество; при наличии подтверждающих сертификатов и примеров работ на китайском языке также просим направить при отклике на вакансию
- Продвинутое владение MS Excel/Google Таблицами (формулы, фильтрация), опыт работы с Google Диском (организация файлов, совместный доступ)
- Внимательность к деталям и аккуратность при работе с данными, в частности, при заполнении таблиц с атрибутами документов
- Приветствуется наличие опыта создания и настройки решений для автоматизации обработки текстовых данных, включая навыки программирования, написания парсеров, применения методов DS для повышения качества обработки данных и др.
-
Условия
- Гибкий part-time график, преимущественно удаленная работа (20 часов в неделю)
- Оплата по итогам собеседования
- Готовность выполнить тестовое задание
- Оформление в соответствии с ТК РФ
-
Возможности
- Доступ к образовательным, информационно-аналитическим и др. ресурсам НИУ ВШЭ
- Возможность совмещать работу с обучением в бакалавриате, магистратуре или MBA НИУ ВШЭ
- Участие в экспертных и научных мероприятиях, инициативах и проектах НИУ ВШЭ
- Возможность дальнейшего сотрудничества при успешном прохождении стажировки
Отклик на вакансию
1) До 5 сентября 2025 г. включительно – сбор откликов через регистрационную форму: Форма
2) Проведение собеседований
3) Выполнение тестового задания после успешного интервью
4) Прием на стажировку осуществляется на основании результатов тестового задания. Уведомление о принятом руководителем решении будет отправлено каждому кандидату, выполнившему тестовое задание.
Обратная связь
По всем дополнительным вопросам просьба обращаться к Анастасии Попковой, главному эксперту Центра стратегической аналитики и больших данных ИСИЭЗ НИУ ВШЭ, +7(495)531-00-00 доб. 12025, apopkova@hse.ru
________________________________________________________
Проект реализован НИУ «Высшая школа экономики» в рамках гранта, предоставленного Министерством науки и высшего образования Российской Федерации (№ соглашения о предоставлении гранта: 075-15-2022-325)