Van Oirbeek, RobinBury, ThomasTabopda Wafo, Vaneck ClydeVaneck ClydeTabopda Wafo2025-05-142025-05-142025-05-142022https://hdl.handle.net/2078.2/26102Lorsqu' on souhaite tarifier un nouveau produit d’assurance, il est souvent important de choisir les variables les plus pertinentes de la fréquence ou de la sévérité des sinistres afin de construire un modèle plus robuste et fiable. Cette sélection peut se faire de plusieurs manière et il est question ici de présenter trois méthodes de sélection de variables pertinentes à savoir Leshy, BoostAGrota et GrootCV qui sont contenues dans le module Python ARFS et d'étudier ces méthodes afin de voir leur sensibilité face à certains problèmes dont souffre les méthodes de sélection des variables à savoir la multi colinéarité, La présence des variables avec des valeurs manquantes, la présence des variables sans variances, pouvant affecter à la fois les performances de prédiction mais aussi la stabilité des méthodes de sélection de variables. When it comes to pricing a new insurance product, it is often important to choose the most relevant variables for the frequency or severity of claims in order to build a more robust and reliable model. This selection can be done in several ways and it is a question here of presenting three methods of selection of relevant variables namely Leshy, BoostAGrota and GrootCV which are contained in the Python ARFS module and to study these methods in order to see their sensitivity to certain problems from which the variable selection methods suffers, namely multi-collinearity, The presence of variables with missing values, the presence of variables without variances, which can affect both the prediction performance and the stability of the selection methods variables.feature selectionvariable importancesélection des variablesmulti colinéaritéboostingall relevantmachine learningComparaison des méthodes de sélection des variables appliquées à la tarification des produits d’assurance non-vietext::thesis::master thesisthesis:33671