Stage - Optimisation de l'architecture de modèles génératifs pour des séries temporelles F/H
EDF
- Stage
- 08/01/2025
- Yvelines (78)
- EDF Lab Chatou
Description
Contexte général
Au sein d’EDF R&D, le département PRISME (Performance, Risque Industriel et Surveillance pour la Maintenance et l’Exploitation) a pour mission de proposer des solutions innovantes pour une exploitation plus performante et sûre des différents moyens de production d’électricité du groupe EDF. Le groupe P17, au sein duquel le stage sera effectué, développe des méthodes et outils de gestion d’actifs industriels afin d’aider aux décisions d’investissements vis-à-vis de la maintenance des actifs de production nucléaire, hydraulique ou renouvelable. Le stage s’inscrira sur des développements autour de modèles d’IA générative en support à ces outils.
Problématique industrielle
EDF, au travers de sa filiale EDF Renouvelables, développe et exploite des installations dans plus de 20 pays, un tiers de la puissance installée étant de l’éolien.. Pour répondre aux différents appels d’offres pour la construction de fermes d’éoliennes offshore, EDF doit pouvoir au mieux quantifier l’impact des choix logistiques pour la maintenance (nombre et tailles des bateaux, nombre d’équipes de maintenance…) sur la disponibilité globale de la ferme afin de pouvoir optimiser au mieux les coûts actualisés du kWh (Levelized cost of energy ou « LCOE »). Pour aider dans ces chiffrages, EDF R&D a développé une chaîne d’outils logiciels permettant de simuler le cycle de vie d’une ferme en prenant en compte la fiabilité des composants et les conditions d’accès au site, qui peut être contraint par des variables météorologiques.
Objectifs du stage
EDF R&D a développé le modèle SWANN, à base de réseaux de neurones, pour générer des séries temporelles de données Metocean (vitesse de vent, hauteur de vague…), est actuellement utilisé par l’ingénierie afin de dimensionner les moyens logistiques pour l’exploitation de ferme éolienne offshore. En l’état actuel, le modèle est limité pour générer des séries multimodales telles que la périodicité des vagues.
Une alternative au modèle NARMA (nonlinear autoregressive–moving-average) sous-jacents à SWANN serait d’utiliser des modèles génératifs tels que les Generative Adversarial Network (GAN) ou les Variational Auto-Encoder (VAE). Les premiers tests réalisés ont révélé la difficulté à optimiser l’architecture de ces modèles (nombre de couches, nombre de neurones…).
Habituellement réalisé de manière expérimentale à partir de règles empiriques, le calage des hyperparamètres d’un modèle fait de cette étape de modélisation un processus fastidieux pouvant manquer de robustesse.
Le stage à trois objectifs :
1.Réaliser une étude bibliographique sur l’utilisation de modèles génératifs pour la génération de séries temporelles
2. Définir et implémenter un indicateur de la qualité du générateur.
3. Coupler la maquette Matlab à l’outil d’optimisation NOMAD permettant d’automatiser le calage des hyperparamètres du modèle optimisant l’indicateur de qualité du générateur.
Profil souhaité
Profil
Étudiant.e de M2 (mathématiques appliquées / machine learning) ou d’écoles d’ingénieur.e.s (généralistes avec majeure en mathématiques appliquées / machine learning).
Compétences requises
- Solides compétences en machine learning et optimisation
- Goût pour la programmation et connaissance de Matlab
- Aisance dans la communication, orale et écrite, en français et/ou en anglais
Aptitudes personnelles souhaitées
- Goût pour la recherche : méthodologies, concepts mathématiques, applications industrielles
- Ouverture d'esprit, curiosité et capacité à être autonome
Durée envisagée
6 mois à compter de février, mars ou avril 2025
Lieu
EDF R&D – Lab Chatou
6 quai Watier, 78401 Chatou, France
Département PRISME, Groupe P17 GAIA (Gestion d’Actifs, Incertitudes et Apprentissage statistique)