Lieu : Institut Daniel Hollard · Contrat : Stage · Rémunération : Gratification Minimum €
Le Groupe Hospitalier Mutualiste de Grenoble est un Établissement de Santé Privé d’Intérêt Collectif (ESPIC) à but non lucratif, participant au service public hospitalier depuis plus de 60 ans. Deuxième acteur de santé en Isère, il offre environ 436 lits et places, répartis dans les 6 instituts qui composent le groupement hospitalier : chirurgie, médecine, cardiovasculaire, soins non programmés, urgences, femme et nouveau-né.
Contexte et description générale :
Les filtres de Kalman ont été appliqués avec succès au suivi du débit de dose (TOP) des accélérateurs Varian Halcyon, permettant de modéliser la dérive de la chambre moniteur et de prédire les dépassements de seuils.
Une évolution de cette approche a consisté à constituer une banque de filtres de Kalman, couvrant une gamme de paramètres initialement plausibles d’un point de vue physique. Ces filtres fonctionnent en parallèle et leur combinaison permet de représenter un espace d’incertitude multidimensionnel sur le comportement attendu de la machine.
L’évolution temporelle des matrices de covariance issues de cette banque constitue un indicateur de cohérence entre le modèle et les mesures :
- une croissance de covariance signale une divergence modèle–réalité (dégradation de la machine, ou anomalie de mesure)
- une covariance stable traduit une concordance avec le comportement attendu.
En parallèle, les EventLogs des accélérateurs Halcyon ont été exploités, en particulier les événements de type BGM (Beam Generation Module) correspondant à des pannes ou interruptions de faisceau.
Les premières analyses ont montré une corrélation statistiquement significative entre les croissances de covariance et les occurrences de pannes, confirmant le potentiel prédictif du signal de covariance.
Objectifs du stage :
L’objectif du stage est de modéliser la relation entre les covariances Kalman et les événements de panne à l’aide d’un réseau bayésien probabiliste capable de prédire la survenue d’une anomalie avant qu’elle ne se produise.
Le travail s’articulera autour des étapes suivantes :
1- Extraction et caractérisation des covariances Kalman issues de la banque de filtres.
2- Analyse statistique exploratoire : étude des distributions, corrélations temporelles et métriques Precision/Rappel pour différentes classes de pannes.
3- Conception du réseau bayésien : choix de la structure (apprentissage supervisé ou semi-supervisé), définition des variables et des relations causales (covariance, dérive, fréquence de panne).
4- Apprentissage et validation du modèle sur des données réelles Halcyon (plusieurs centaines de jours de TOP et EventLogs).
5- Évaluation du pouvoir prédictif et comparaison avec des modèles aléatoires.
L’environnement Python, incluant les codes de traitement des TrajectoryLogs, TOP, Kalman et EventLogs, est déjà opérationnel. L’étudiant(e) se concentrera sur la conception et l’entraînement du modèle bayésien ainsi que sur l’interprétation des résultats.
Compétences développées au cours du stage :
• Filtrage et estimation dynamique (filtres de Kalman, banque de filtres).
• Probabilistic Graphical Models (PGM) et réseaux bayésiens appliqués à des données physiques.
• Apprentissage supervisé et inférence probabiliste sous Python (pgmpy, pomegranate, PyMC).
• Analyse temporelle de séries expérimentales et détection d’événements rares.
• Maintenance prédictive et interprétation physique des signaux de dérive.
Profil Ingénieur M2 Recherché
1. Modélisation Probabiliste et Statistique (Le Cœur du Projet)
Réseaux Bayésiens (PGM) : Compétence centrale. Le candidat doit avoir une connaissance théorique et pratique approfondie des modèles graphiques probabilistes (Probabilistic Graphical Models), de la conception de leur structure, et de l'inférence probabiliste.
Filtrage et Estimation Dynamique : Une solide compréhension des Filtres de Kalman et de la théorie de l'estimation est cruciale pour comprendre la nature de la donnée source (les covariances) et l'objectif de prédiction (détection des événements rares).
Statistiques Avancées : Maîtrise de l'analyse statistique exploratoire (distributions, corrélations) et des métriques de classification/prédiction (Precision/Rappel) appliquées à la détection d'anomalies.
2. Compétences Techniques (L'Implémentation)
Python et Librairies PGM : Être capable de prendre en main et d'utiliser efficacement les librairies Python dédiées à la modélisation probabiliste (comme pgmpy, pomegranate, ou PyMC).
Analyse de Séries Temporelles : Expérience dans le traitement, le nettoyage et l'analyse des séries expérimentales (TOP, EventLogs) pour en extraire des caractéristiques pertinentes pour le modèle bayésien.
3. Qualités Domaine (L'Application)
Maintenance Prédictive : Intérêt ou connaissance des applications industrielles de la modélisation (ici, la maintenance prédictive des accélérateurs) et capacité à l'interprétation physique des signaux.
Autonomie sur la Modélisation : Le candidat doit pouvoir prendre en charge la conception et l'entraînement du modèle bayésien de A à Z, en se concentrant sur le choix de la structure et l'évaluation de son pouvoir prédictif.
Le stagiaire idéal est donc un expert en IA/statistiques capable de résoudre des problèmes de prédiction causale en utilisant des modèles explicites (Bayésiens). Vous ne cochez pas toutes les cases? Postulez quand même, nous vous recevrons avec plaisir!
Envoyer un CV à dimitri.reynard@avec.fr avec un petit mail de présentation.