Menu Fermer

Une calibration sur les données pour un test à noyau à deux échantillons et non-asymptotique

Orateur : Perrine Lacroix
Établissement : Université de Nantes (France)
Dates : 2025-03-13 – 2025-03-13
Heures : 14:00 – 14:00
Lieu : Salle 0-3

Résumé :
Soit deux populations de données multivariées décrites par $p$ variables, où $p$ est significativement plus grand que les tailles des populations. Nous souhaitons déterminer, via un test statistique à deux échantillons, si les distributions des deux populations sont égales (hypothèse nulle) ou sont différentes (hypothèse alternative). Pour tenir compte de la structure complexe des variables et pallier certains problèmes liés à la grande dimension, les données sont plongées dans un espace de Hilbert à noyau reproduisant (RKHS) bien choisi. Dans cet exposé, j’étudie une statistique de test inspirée de Harchaoui et al. (2008) généralisant le test de Student dans un RKHS, et je propose une méthode non asymptotique et implémentable pour calibrer le test. Tout d’abord, une analyse spectrale permet de proposer une limite supérieure théorique du quantile du test. Ensuite, un algorithme basé sur les données permet de garantir un contrôle de l’erreur de type I et inclue la calibration de l’hyperparamètre de régularisation inconnu.

Travail en collaboration avec Bertrand Michel (Nantes Université), Franck Picard (ENS de Lyon) et Vincent Rivoirard (Université Paris-Dauphine).

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *