Fall into ML: постерная сессия
Евгения Сурикова продемонстрировала кейс сравнения Low-rank adaptation (LoRA) c Full Parameter Fine-tuning – методов эффективной настройки больших языковых моделей для таких задач как (классификация,SFQA, LFQA) – в домене экономики и цифровых технологий. Ее исследование показало, что полная настройка параметров (Full Parameter Fine-tuning) превосходит по метрикам качества методы LoRa в задачах классификации, SFQA и LFQA. Например, для задачи классификации F1-мера составляют 0,85 для полной точной настройки, 0,7 для LoRA и для базовой модели 0,52. Также LoRA существенно сокращает время обучения в 2-5 раз по сравнению с Full Parameter Fine-Tuning. Наконец, исследование Евгении Суриковой не подтвердило ранее выдвинутую учеными гипотезу о том, что интеграция различных типов задач в рамках того же домена может повысить качество генерации. Напротив, было продемонстрировано, что объединение данных для обучения из задач классификации и QA приводит к снижению производительности показателей.
![Евгения Сурикова, программист отдела разработки интеллектуальных систем Евгения Сурикова, программист отдела разработки интеллектуальных систем](/pubs/share/direct/986318481.jpg)
Саввин Никита представлял результаты исследования, проводимого в рамках его аспирантской диссертации. Основная тема выступления касалась прогнозирования временных рядов и заполнения пропусков в данных с учетом сезонности. Усовершенствованные методы заполнения пропусков позволили добиться точности 12-15%, что выше по сравнению со стандартными методами, где точность обычно колеблется в пределах 18-20%. В работе проводилось сравнение различных рекуррентных нейронных сетей, среди которых одной из наиболее эффективных оказалась BI-LSTM. Использование векторов эмбеддинга, основанных на 11 параметрах даты, позволило улучшить точность краткосрочного прогноза с 12% до 9% по сравнению со стандартными методами, что подтвердило высокий потенциал этого подхода. Исследования велись в сотрудничестве с Университетом Брешиа (Италия) и апробировались на данных по электропотреблению университетского городка. Никита также показал работу над интеграцией всех разработок в удобный пользовательский интерфейс, что делает возможным их использование широкой аудиторией специалистов и исследователей.
Мероприятие стало площадкой для обмена идеями и обсуждения перспективных направлений исследований. Всего на постерной сессии было представлено 70 постеров с публикациями на конференциях уровня А* — флагманских событиях в сфере ИИ.