ScoDoc/app/pe/pe_interclasstag.py

128 lines
4.8 KiB
Python
Raw Normal View History

from app.comp import moy_sem
2024-02-03 10:46:14 +01:00
from app.pe.pe_tabletags import TableTag, MoyenneTag
2024-01-24 15:37:50 +01:00
from app.pe.pe_etudiant import EtudiantsJuryPE
from app.pe.pe_rcs import RCS, RCSsJuryPE
from app.pe.pe_rcstag import RCSTag
2024-01-24 15:37:50 +01:00
import pandas as pd
import numpy as np
class RCSInterclasseTag(TableTag):
2024-01-24 15:37:50 +01:00
# -------------------------------------------------------------------------------------------------------------------
def __init__(
self,
nom_rcs: str,
2024-01-24 15:37:50 +01:00
etudiants: EtudiantsJuryPE,
rcss_jury_pe: RCSsJuryPE,
rcss_tags: dict[tuple, RCSTag],
2024-01-24 15:37:50 +01:00
):
"""
Interclasse l'ensemble des étudiants diplômés à une année
donnée (celle du jury), pour un RCS donné (par ex: 'S2', '3S')
en reportant :
* les moyennes obtenues sur la trajectoire qu'il ont suivi pour atteindre le numéro de semestre de fin de l'aggrégat (indépendamment de son
formsemestres)
* calculant le classement sur les étudiants diplômes
"""
TableTag.__init__(self)
self.nom_rcs = nom_rcs
"""Le nom du RCS interclassé"""
2024-02-03 10:46:14 +01:00
self.nom = self.get_repr()
2024-01-24 15:37:50 +01:00
"""Les étudiants diplômés et leurs rcss""" # TODO
2024-01-24 19:37:45 +01:00
self.diplomes_ids = etudiants.etudiants_diplomes
2024-01-24 15:37:50 +01:00
self.etudiants_diplomes = {etudid for etudid in self.diplomes_ids}
# pour les exports sous forme de dataFrame
2024-02-03 10:46:14 +01:00
self.etudiants = {
etudid: etudiants.identites[etudid].etat_civil
for etudid in self.diplomes_ids
}
2024-01-24 15:37:50 +01:00
# Les trajectoires (et leur version tagguées), en ne gardant que celles associées à l'aggrégat
self.rcss: dict[int, RCS] = {}
2024-02-03 10:46:14 +01:00
"""Ensemble des trajectoires associées à l'aggrégat"""
for trajectoire_id in rcss_jury_pe.rcss:
trajectoire = rcss_jury_pe.rcss[trajectoire_id]
if trajectoire_id[0] == nom_rcs:
self.rcss[trajectoire_id] = trajectoire
2024-01-24 15:37:50 +01:00
self.trajectoires_taggues: dict[int, RCS] = {}
2024-02-03 10:46:14 +01:00
"""Ensemble des trajectoires tagguées associées à l'aggrégat"""
for trajectoire_id in self.rcss:
self.trajectoires_taggues[trajectoire_id] = rcss_tags[
2024-01-24 15:37:50 +01:00
trajectoire_id
]
# Les trajectoires suivies par les étudiants du jury, en ne gardant que
# celles associées aux diplomés
self.suivi: dict[int, RCS] = {}
2024-02-03 10:46:14 +01:00
"""Association entre chaque étudiant et la trajectoire tagguée à prendre en
compte pour l'aggrégat"""
2024-01-24 15:37:50 +01:00
for etudid in self.diplomes_ids:
self.suivi[etudid] = rcss_jury_pe.suivi[etudid][nom_rcs]
2024-01-24 15:37:50 +01:00
self.tags_sorted = self.do_taglist()
"""Liste des tags (triés par ordre alphabétique)"""
2024-01-24 15:37:50 +01:00
# Construit la matrice de notes
2024-01-24 15:37:50 +01:00
self.notes = self.compute_notes_matrice()
2024-02-03 10:46:14 +01:00
"""Matrice des notes de l'aggrégat"""
2024-01-24 15:37:50 +01:00
# Synthétise les moyennes/classements par tag
2024-02-03 10:46:14 +01:00
self.moyennes_tags: dict[str, MoyenneTag] = {}
2024-01-24 15:37:50 +01:00
for tag in self.tags_sorted:
moy_gen_tag = self.notes[tag]
2024-02-03 10:46:14 +01:00
self.moyennes_tags[tag] = MoyenneTag(tag, moy_gen_tag)
2024-01-24 15:37:50 +01:00
# Est significatif ? (aka a-t-il des tags et des notes)
self.significatif = len(self.tags_sorted) > 0
2024-01-24 19:37:45 +01:00
def get_repr(self) -> str:
"""Une représentation textuelle"""
return f"Aggrégat {self.nom_rcs}"
2024-01-24 19:37:45 +01:00
2024-01-24 15:37:50 +01:00
def do_taglist(self):
"""Synthétise les tags à partir des trajectoires_tagguées
Returns:
Une liste de tags triés par ordre alphabétique
"""
tags = []
for trajectoire in self.trajectoires_taggues.values():
2024-01-24 15:37:50 +01:00
tags.extend(trajectoire.tags_sorted)
return sorted(set(tags))
def compute_notes_matrice(self):
"""Construit la matrice de notes (etudid x tags)
retraçant les moyennes obtenues par les étudiants dans les semestres associés à
l'aggrégat (une trajectoire ayant pour numéro de semestre final, celui de l'aggrégat).
"""
# nb_tags = len(self.tags_sorted) unused ?
# nb_etudiants = len(self.diplomes_ids)
2024-01-24 15:37:50 +01:00
# Index de la matrice (etudids -> dim 0, tags -> dim 1)
2024-01-24 19:37:45 +01:00
etudids = list(self.diplomes_ids)
2024-01-24 15:37:50 +01:00
tags = self.tags_sorted
# Partant d'un dataframe vierge
2024-01-24 15:37:50 +01:00
df = pd.DataFrame(np.nan, index=etudids, columns=tags)
for trajectoire in self.trajectoires_taggues.values():
# Charge les moyennes par tag de la trajectoire tagguée
notes = trajectoire.notes
# Etudiants/Tags communs entre la trajectoire_tagguée et les données interclassées
2024-01-24 15:37:50 +01:00
etudids_communs = df.index.intersection(notes.index)
tags_communs = df.columns.intersection(notes.columns)
# Injecte les notes par tag
2024-01-24 15:37:50 +01:00
df.loc[etudids_communs, tags_communs] = notes.loc[
etudids_communs, tags_communs
]
return df