Radoux, JulienBogaert, PatrickKlimmek, AlexisAlexisKlimmek2025-06-302025-06-302025-06-0420252025-06-09https://hdl.handle.net/2078.2/43227L’objectif de ce mémoire est d’identifier la présence ainsi que les sources d’un biais d’échantillonnage géographique dans les données de biodiversité végétale relativement ubiquiste en Belgique, en mettant particulièrement l’accent sur les différences entre la Wallonie et la Flandre. Au-delà d’une certaine similarité des écotopes entre la Wallonie et la Flandre à proximité de la frontière régionale, les résultats montrent qu’il existe un biais d’échantillonnage interrégional. Ce biais provient de la concentration des données de l’éditeur INBO en Flandre, contrastant avec l’absence de données institutionnelles en Wallonie. À l’inverse, les plateformes de crowdsourcing comme iNaturalist et PlantNet fournissent un échantillonnage plus équilibré entre les deux régions, mais sont influencées par les préférences individuelles des contributeurs et par l’accessibilité des sites. Les analyses démontrent que ces différences dans les pratiques d’échantillonnage influencent significativement la modélisation de la distribution des espèces. Les modèles entraînés sur des données biaisées tendent à surévaluer ou sous-estimer la probabilité de présence des espèces selon la région, ce qui limite leur capacité à généraliser. En particulier, l’échantillonnage intensif mais régionalisé de l’INBO conduit à des prédictions moins fiables en Wallonie. Par ailleurs, un biais intrarégional a été observé, résultant de pratiques d’échantillonnage divergentes entre les différentes sources venant de la plateforme GBIF. Ces constats soulignent l’importance de mieux comprendre et de minimiser les biais d’échantillonnage afin de produire des modèles écologiques via MaxEnt plus fiables. Parmi les recommandations, il est proposé de compléter la collecte institutionnelle en Wallonie, en particulier via le DEMNA, afin de disposer d’un pendant équilibré aux données de l’INBO. La combinaison des données institutionnelles et des données issues du crowdsourcing est également envisagée, dans une logique de complémentarité, afin de couvrir les zones d’ombre et d'améliorer la représentativité spatiale dans les processus de modélisation. En somme, ce travail met en lumière la nécessité d’intégrer les considérations de représentativité spatiale et de provenance des données dans toute approche de modélisation en écologie.biais géographiqueidentificationvégétationubiquisteécotopeBelgiqueMaxEntGBIFLe biais géographique présent dans les données de biodiversité végétale en Belgiquetext::thesis::master thesis