Approches rapides de factorisation et complétion matricielle non-négative utilisant l’algorithme du gradient optimal de Nesterov

Matthieu PUIGT
Equipe SPeciFI, LISIC, ULCO

slides

Les approches de factorisation matricielle consistent à  écrire un matrice de données observées en combinaisons linéaires inconnues de variables latentes à  estimer. Ces problématiques de factorisation connaissent un grand intérêt de la part de la communauté scientifique grà¢ce à  leur versatilité et au grand nombre d’applications possibles. Dans nombre de ces dernières, la matrice observée (i) est à  valeurs non-négatives et (ii) n’est que partiellement connue (valeurs manquantes dans la matrice observée).

La première contrainte a été extrêmement étudiée, donnant naissance aux nombreuses approches de NMF (pour Nonnegative Matrix Factorization en anglais). La seconde contrainte est moins étudiée et les techniques proposées font généralement appel à  l’utilisation de poids ou à  l’estimation des données manquantes par Espérance-Maximisation (EM). Les approches existantes de NMF tenant compte de données manquantes font appel à  l’un de ces deux formalismes et ne sont adaptées qu’aux problèmes de taille réduite.

Dans le cadre de ce séminaire, je montrerai comment combiner une approche d’optimisation rapide, basée sur l’algorithme optimal de gradient de Nesterov, aux deux formalismes de NMF à  données manquantes ci-dessus. Je montrerai en particulier que l’approche utilisant l’EM combinée aux itérations de Nesterov est bien adaptée aux problèmes de grande dimension.

slides