Qui suis-je ?

Depuis septembre 2025, je suis enseignant-chercheur en statistiques appliquées.

Travaux de recherche actuels

Mots Clés: Graphes d’admixture, Invasion biologique, Génétique des populations.

Collaborateurs: Arnaud Estoup, Mathieu Gautier (INRAE, CBGP, Montpellier), Paul Bastide (CNRS, Univ. Paris Cité, Paris), Cécile Ané (Univ. of Wisconsin-Madison, USA), Jean-Michel Marin (IMAG, Univ. Montpellier, Montpellier)

J’étais en recherche post-doctoral de mars 2025 à septembre 2025 au Centre Biologique de Gestion des Populations de Montpellier en tant que chargé de recherche. Cette collaboration continue actuellement. Je travaille sur des développements méthodologiques pour inférer des graphes de mélange (ou d’admixture, abrégé en GM) en génétique des populations d’espèces envahissantes. Les GM représentent schématiquement l’histoire évolutive de populations via des fusions et des séparations de populations. Ils sont inférés à l’aide de méthodes statistiques appliquées aux corrélations des fréquences alléliques. Les objectifs de ce travail sont multiples. Il s’agit d’abord de comparer les méthodes d’inférence existantes sur des données simulées et réelles, en analysant notamment des approches bayésiennes et des méthodes basées sur la vraisemblance. De plus, la grande taille de l’espace des GM complique ces méthodologies et pose des défis d’identifiabilité, que nous souhaitons étudier en s’inspirant de la littérature déjà existante pour les arbres phylogénétiques. Un autre défi sera d’intégrer l’incertitude dans l’estimation de la covariance des fréquences alléliques des populations et d’adapter ces estimations à des données plus complexes, telles que les données Pool-Seq. Il est aussi envisagé de développer des méthodologies innovantes pour l’estimation des GM, en m’inspirant des modèles génératifs de graphes, notamment avec des Graphs Neural Networks. Les méthodologies développées seront appliquées à des jeux de données génomiques disponibles pour de nombreuses populations natives et envahissantes de deux espèces d’insectes envahissants, la coccinelle Harmonia axyridis et la drosophile Drosophila suzukii.

Études

2021 - 2024

🏢 MIA Paris-Saclay, Palaiseau

Encadrant: Pierre Barbillon (MIA Paris-Saclay), Colin Fontaine (MNHM), Elisa Thebault (iEES).

Thèse : Prise en compte des effets d’échantillonnage pour la détection de structure des réseaux écologiques

Thèse soutenue au campus Agro Paris-Saclay le 16 décembre 2024.

Lien vers la thèse

Mots-clés: Statistiques appliquées à l’écologie, Théorie des graphes, réseaux plantes-pollinisateurs, modèle à blocs stochastiques, algorithme EM, échantillonnage, réseaux de neurones convolutifs.


2020 - 2021

🏢 Sorbonne Université, Paris

Master 2 de Mathématiques et Application, parcours Statistiques.

Mots-clés: Modèles linéaires en grande dimension, apprentissage statistique, apprentissage automatique, optimisation stochastique, analyse statistique de graphe, acquisition compressée.


2019 - 2020

🏢 Sorbonne Université, Paris

Master 1 de Mathématiques et Application.

Mots-clés: Statistiques avancées, statistiques computationnelles, géométrie différentielle


2018 - 2019

🏢 Sorbonne Université, Paris

Licence 3 de Mathématiques

Mots-clés: Statistiques numériques, approximation numérique de fonction, théorie de la mesure.


2016 - 2018

🏢 Lycée Fénelon, Paris

Classe Préparatoire aux Grandes Écoles Math-Physique


Expériences

Depuis 2025

🏢 Centre Biologique de Gestion des Populations, Montpellier

Post-Doctorat : Développement de méthodes statistiques pour la reconstruction de routes d’invasion biologique, inférence de scénarios évolutionnaires complexes à partir de données génomiques en utilisant des graphes admixtures.

Mots-clés: Génétique des populations, Graphes admixtures

  • Exploration de l’espace des graphes admixtures et problèmes d’identifiabilités.
  • Utilisation de modèles génératifs de graphes.
  • Applications à des données génétiques d’espèces invasives.

Mai-Sep 2021

🏢 CEA, Saclay

Encadrants : Valerio Calvelli (CEA)

Stage de M2 : Participation à la conception du design magnétique d’une machine IRM à 14 T en utilisant différentes techniques d’intelligence artificielle.

Mots-clés: Opera-2d 2020, algorithme génétique, optimisation sous contrainte, magnétisme

  • Mettre en place un code Python capable d’interagir avec le logiciel Opera-2d 2020.
  • Trouver une configuration optimale respectant des contraintes à l’aide d’un algorithme génétique.

Mai-Sep 2021

🏢 Laboratoire de Probabilité, Statistiques et Modélisation, Paris

Encadrants : Anna Bonnet (LPSM), Sylvain Le Corff (LPSM), Harry Sokol (AP-HP)

Stage de M1 : Apprentissage statistique pour tester l’influence du microbiote intestinal sur la réponse au traitement de la maladie de Crohn.

Mots-clés: Machine learning, forêts aléatoires, sélection de variables en grande dimension, MCMC

  • Sélectionner des variables pertinentes à l’aide de forêts aléatoires et comparer les résultats avec d’autres études.
  • Implémenter un algorithme MCMC de sélection de variables dans un modèle de régression logistique.
  • Le stage a abouti à l’écriture d’un article publié : Impact of the Ileal Microbiota on Surgical Site Infections in Crohn’s Disease : A Nationwide Prospective Cohort, Journal of Crohn’s and Colitis, Volume 16, Issue 8, August 2022, Pages 1211–1221, https://doi.org/10.1093/ecco-jcc/jjac026