(Encadrant : Yassine Abdelouadoud (MINES Centre PERSEE))
un enjeu majeur pour l’atteinte des objectifs de la SNBC. La transition vers des habitations plus performantes (enveloppe et systèmes) est essentielle pour réduire la consommation d'énergie, les émissions de gaz à effet de serre et les coûts énergétiques pour les propriétaires et les locataires. Le parc de logements présentant des performances énergétiques très hétérogènes, caractériser les déterminants de celle-ci est un préalable à l’élaboration de scénarios de transitions adéquats. C’est ce que vise ce projet en procédant à une analyse des données issues de la base DPE de l’ADEME à l’aide de Python et les librairies dédiées (pandas, seaborn, scikit-learn, etc.).
L'objectif principal de ce projet est d'analyser les données issues de la base DPE V2 (Diagnostic de Performance Énergétique) de l’ADEME en utilisant Python comme langage de programmation principal. Les sous-objectifs spécifiques comprennent :
Collecte de Données (FACULTATIF*) : Rassembler les données issues de sources complémentaires à la base DPE qui pourront servir à l’analyse de donnée
Prétraitement des Données avec Python (FACULTATIF*) : Utiliser Python pour nettoyer et préparer les données de la base DPE et des bases complémentaires en éliminant les valeurs aberrantes, en gérant les données manquantes et en normalisant les variables pertinentes.
Analyse Exploratoire des Données avec Python : Utiliser Python pour réaliser une analyse exploratoire des données, en utilisant des bibliothèques telles que Pandas, Matplotlib et Seaborn, pour visualiser les tendances et les corrélations entre la performance énergétique et des variables potentiellement explicatives
Modélisation Statistique avec Python : Appliquer des techniques d'analyse de données en utilisant Python, telles que la régression linéaire multiple ou des méthodes d'apprentissage automatique avec des bibliothèques comme Scikit-Learn, pour modéliser la relation entre la performance énergétique et les différents déterminants.
Interprétation des Résultats : Interpréter les résultats de l'analyse pour identifier les facteurs les plus influents sur la performance énergétique des logements en France
Livrables : Présenter les résultats sous forme d’un poster, incluant des graphiques et des visualisations générés avec Python.
des jeux de données prétraités pourront être fournis aux étudiants s’ils le souhaitent