Новый способ обновления рекомендательных алгоритмов, который помогает снизить вычислительные затраты на обновления моделей машинного обучения и сохранить совместимость с ранее обученными моделями представили исследователи AI VK Research и лаборатории мультиагентного моделирования и адаптивного интеллекта ИТМО.
Исследователями предложен новый метод обновления генеративных рекомендаций. Так, на первом этапе их обучения семантический, семантический внутренний идентификатор, который отражает смысловые и поведенческие характеристики объектов каталога (товары, единицы контента и т.д.), пересчитывается на свежих данных. Затем новые идентификаторы выравниваются с их старой версией.
Система, благодаря этому, может учитывать актуальные изменения интересов аудитории, не “ломая” совместимость с предыдущей версией. Кроме того, появилась возможность снижать вычислительные затраты на полное переобучение, а следовательно – уменьшать издержки и ускорять обновления рекомендаций.
«Метод может быть полезен крупным цифровым платформам, где интересы аудитории быстро меняются, - отметил ведущий исследователь в AI VK, инженер лаборатории компьютерных технологий ИТМО Владимир Байкалов. - А полное переобучение подобных моделей требует больших вычислительных затрат».
Семантические внутренние идентификаторы, которые построены с учетом коллаборативного сигнала, со временем “устаревают”, то есть существовала проблема индустриального применения генеративных рекомендаций. А интересы аудитории и модели потребления, как известно, меняются быстро. При этом простое дообучение на новых данных, как показала практика, не всегда решает задачу, а полный пересчет (без выравнивания) может привести к тому, что модели будет сложнее адаптироваться к ранее развернутой версии системы и ее компонентам.