Referentiels/python/ressource.py

import re
from officiel import *
from modeles import *
from officiel import supprime_accent_espace
import ruamel.yaml
from ruamel.yaml.scalarstring import FoldedScalarString as folded

__LOGGER = logging.getLogger(__name__)


class Ressource():
    """Classe modélisant les ressources"""
    def __init__(self, nom, brute):
        self.nom = nom
        self.brute = brute # les données brutes de la ressource

    def charge_informations(self, code, semestre, heures_encadrees, tp, sae, prerequis, description, mots):
        self.code = code
        self.semestre = semestre # <--
        self.heures_encadrees = heures_encadrees
        self.tp = tp
        self.sae = sae
        self.prerequis = prerequis
        self.description = description
        self.contexte = None
        self.contenu = None
        self.mots = mots

    def charge_ac(self, apprentissages):
        self.apprentissages = apprentissages

    def __str__(self):
        print(self.nom + " " + self.code)

    def str_heures_formations(self):
        return str(self.heures_encadrees) if self.heures_encadrees else "???"

    def str_heures_tp(self):
        return str(self.tp) if self.tp else "???"

    def str_semestre(self):
        return int(self.semestre[1])

    def to_yaml(self):

        dico = {"nom": self.nom,
                "code": self.code,
                "semestre" : self.str_semestre(),
                "heures_formation": self.str_heures_formations(),
                "heures_tp": self.str_heures_tp(),
                "acs": self.apprentissages,
                "sae": "",
                "prerequis": self.prerequis,
                "contexte": folded(self.contexte),
                "contenu": folded(self.contenu),
                "motscles": self.mots
                }
        # output = yaml.dump(dico, #Dumper=yaml.Dumper,
        #    sort_keys=False, allow_unicode=True)
        output = ruamel.yaml.dump(dico, Dumper=ruamel.yaml.RoundTripDumper,
                                  allow_unicode=True)
        return output

def nettoie_heure(r):
    """Nettoie le champ (horaire) (de la forme 46h ou 33...) pour en extraire la valeur numérique :
    le champ peut contenir 2 volumes (heures formation puis heures tp), auquel cas les 2 valeurs sont renvoyées
    dans un tuple"""
    def nettoie_champ_heure(champ):
        try: # champ contenant uniquement un nbre d'heure
            volumes = int(champ)
            return volumes
        except:
            volumes = re.findall("(\d{2}\D|\d{1}\D)", champ)
            if len(volumes) == 1:
                return int(volumes[0][:-1])
            elif len(volumes) == 2:
                volumes = sorted(volumes, reverse=True)
                return (int(volumes[0][:-1]), int(volumes[1][:-1]))

    if r.heures_encadrees: # si les heures encadrées sont renseignées
        volumes = nettoie_champ_heure(r.heures_encadrees)
    if r.tp:
        r.tp = nettoie_champ_heure(r.tp)
    if isinstance(volumes, int):
        r.heures_encadrees = volumes
    elif isinstance(volumes, tuple):
        r.heures_encadrees = volumes[0]
        if not r.tp:
            r.tp = volumes[1]
        elif r.tp != volumes[1]:
            __LOGGER.warning(r"nettoie_heure: ans {r.nom}, pb dans les heures tp/td")
    else:
        r.heures_encadrees = None
        #else:
            #__LOGGER.warning("Heures non détectées")

def nettoie_code(r):
    """Recherche les codes ressources de la forme RXXX dans champ"""
    champ = r.code
    if r.code:
        codes = re.findall(r"(R[0-9][0-9][0-9])", champ)
        # if len(codes) > 1:
        #    __LOGGER.warning("plusieurs codes trouvés :(")
        #elif len(codes) == 0:
        #    __LOGGER.warning("code manquant")
        if len(codes) == 1:
            r.code = codes[0]
        else:
            code_devine = get_code_from_nom(r)
            if code_devine:
                __LOGGER.warning(f"nettoie_code : \"{r.nom}\" => code {code_devine}")
                r.code = code_devine
            else:
                r.code = None
                __LOGGER.warning(f"nettoie_code : \"{r.nom}\" => code manquant")

def nettoie_semestre(r):
    """Nettoie les semestres : semestre 1 => "S1", semestre 2 => "S2" """
    if r.semestre:
        if "1" in r.semestre:
            r.semestre = "S1"
        elif "2" in r.semestre:
            r.semestre = "S2"
        else:
            __LOGGER.warning(f"nettoie_semestre : dans \"{r.nom}, PAS de semestre => rattaché au S2")
            r.semestre = "S2"
    else:
        __LOGGER.warning(f"nettoie_semestre : dans \"{r.nom}, PAS de semestre => rattaché au S2")
        r.semestre = "S2"

def nettoie_titre(r):
    """Nettoie le titre en utilisant les titres officiels"""
    def devine_nom_from_ressources(champ):
        champ_purge = supprime_accent_espace(champ)
        for sem in DATA_RESSOURCES:
            for code in DATA_RESSOURCES[sem]:
                nom_purge = supprime_accent_espace(DATA_RESSOURCES[sem][code])
                if champ_purge.startswith(nom_purge):
                    return DATA_RESSOURCES[sem][code] # le bon nom

    old = r.nom
    titre = devine_nom_from_ressources(r.nom)
    if titre and titre != old:
        __LOGGER.warning(f"nettoie_titre : {old} => titre \"{titre}\"")
        r.nom = titre

def nettoie_acs(r):
    """Nettoie les acs d'une ressource en les remplaçant par leur code pour les 3 compétences"""
    if len(r.apprentissages) != 3:
        __LOGGER.warning(f"nettoie_acs : Problème dans le nombre de compétences de {r.nom}")
    for comp in range(3):
        donnees = r.apprentissages[comp] # chaine de caractères listant les ACS
        # donnees = donnees.replace("\t", "").replace("-", "") # supprime les tabulations
        acs_avec_code = devine_acs_by_code(donnees)
        acs_avec_nom = devine_code_by_nom_from_dict(donnees, DATA_ACS)
        acs_finaux = acs_avec_code + acs_avec_nom
        acs_finaux = [ac.replace(" ", "") for ac in acs_finaux]
        acs_finaux = sorted(list(set(acs_finaux)))
        r.apprentissages[comp] = acs_finaux

def nettoie_sae(r):
    """Nettoie les sae en détectant les codes"""
    print(r.sae)


def nettoie_prerequis(r):
    """Nettoie les prérequis (ressource) en les remplaçant par leur code de ressource"""
    R_avec_code = devine_ressources_by_code(r.prerequis)
    R_avec_nom = devine_code_by_nom_from_dict(r.prerequis, DATA_RESSOURCES)
    liste = R_avec_code + R_avec_nom
    liste = [l.rstrip() for l in liste] # supprime les espaces
    R_finaux = sorted(list(set(liste)))
    if R_finaux:
        r.prerequis = R_finaux
    else:
        r.prerequis = "Aucun"


def get_code_from_nom(ressource):
    """Récupère le code d'une ressource d'après son nom en utilisant les noms officiels
    des ressources du yaml"""
    nom = supprime_accent_espace(ressource.nom)
    for sem in DATA_RESSOURCES:
        for code in DATA_RESSOURCES[sem]:
            nom_data = supprime_accent_espace(DATA_RESSOURCES[sem][code])
            if nom.startswith(nom_data):
                return code

def devine_acs_by_code(champ):
    """Recherche les codes ressources de la forme ACXXX ou AC0XXX dans champ ;
    ramène les codes AC0XXX à 3 chiffres.
    """
    codes3 = re.findall(r"(AC[0-9][0-9][0-9]\D)", champ) # de code à 3 chiffres
    codes4 = re.findall(r"(AC0[0-9][0-9][0-9])", champ)

    codes3 += [ "AC" + c[-3:] for c in codes4] # supprime le 0 des acs (codage AC0111)
    return sorted(list(set(codes3)))

def devine_ressources_by_code(champ):
    """Recherche les codes ressources de la forme RXXX dans champ ;
    """
    codes = re.findall(r"(R\d{3}\D)", champ) # de code à 3 chiffres
    return sorted(list(set(codes)))

def devine_ressources_by_nom(donnees):
    """Partant d'une chaine de caractères, détermine les ressources
    présentes dans la donnée, en utilisant les infos officielles de
    ressources.yml"""
    donnees_purge = supprime_accent_espace(donnees)
    codes = []
    for sem in DATA_RESSOURCES:
        for code in DATA_RESSOURCES[sem]:
            nom_purge = supprime_accent_espace(DATA_RESSOURCES[sem][code])
            if nom_purge in donnees_purge:
                codes += [code]
    return sorted(list(set(codes)))

def split_description(r):
    """Découpe le champ description en un contexte+un contenu ; si pas possible """
    champs = r.description.split("\n")
    champs = [c for c in champs if c] # supprime les lignes vides

    indicea = 0 # la ligne mentionnant le contexte
    if True in [ligne.startswith("Contexte et ") for ligne in champs]:  # la ligne commençant par Contenus
        indicea = [ligne.startswith("Contexte et ") for ligne in champs].index(True)

    indicec = 0
    contexte = ""
    if True in [ligne.startswith("Contenus") for ligne in champs]: # la ligne commençant par Contenus
        indicec = [ligne.startswith("Contenus") for ligne in champs].index(True)
    if indicea>=0:
        contexte = "\n".join(champs[indicea+1:indicec]) # double \n pour passage en latex
    else:
        contexte = "\n".join(champs[:indicec])
    contenu = "\n".join(champs[indicec+1:])

    # sauvegarde des champs
    r.contexte = contexte
    r.contenu = contenu

def remove_ligne_vide(contenus):
    """Supprime les lignes vides"""
    return [c for c in contenus if c]

def get_marqueur_numerique(contenu):
    """Revoie la liste des marqueurs numériques"""
    m = re.findall(r"(\d/|\d\s\))", contenu)
    return m

def get_marqueurs(contenus):
    """Renvoie la liste des marqueurs partant d'une liste de ligne"""
    marqueurs = []
    for ligne in contenus:
        m = re.search(r"(\t)*", ligne) # dès \t ?
        if m.group() != "":
            ajout = m.group()
        else:
            ajout = ""
        ligne = ligne.replace("\t","")[0].rstrip() # le marqueur en début de ligne (si 1 caractère)
        if ligne[0] not in string.ascii_letters and ligne[0] != "É":
            marqueurs += [ajout + ligne[0]] # tous les symboles

    marqueurs_finaux = [] # tri les marqueurs en supprimant les doublons et en gardant un ordre (pour détecter les sous listes)
    for m in marqueurs:
        if m not in marqueurs_finaux:
            marqueurs_finaux.append(m)
    return marqueurs_finaux

def nettoie_contenus(r):
    # suppression des \t
    if r.code == "R107":
        print("ici")

    contenu = r.contenu
    marqueurs_numeriques = get_marqueur_numerique(contenu)
    for m in marqueurs_numeriques: # remplace les marqueurs numériques
        contenu = contenu.replace(m, ">")

    contenus = [ligne.rstrip().replace("--", "-") for ligne in r.contenu.split("\n")] # les contenus
    contenus = remove_ligne_vide(contenus) # supprime les lignes vides

    marqueurs_finaux = get_marqueurs(contenus)

    contenus_fin = contenus[:] # copie des ligne

    def get_marqueur(ligne, marqueurs):
        for m in marqueurs:
            if ligne.startswith(m):
                return m

    for (i, ligne) in enumerate(contenus):
        m = get_marqueur(ligne, marqueurs_finaux)
        if m:
            pos = marqueurs_finaux.index(m)
            contenus_fin[i] = "\t" * pos + "* " + ligne.replace(m, "").replace("\t", "").rstrip()

    contenu = "\n".join(contenus_fin)

    r.contenu = contenu

def convert_ressource_yml_to_latex(fichieryaml, fichierlatex, modele):
    contenu = get_modele(modele) #"pn/modele_ressource.tex")

    with open(fichieryaml, "r", encoding="utf8") as fid:
        yaml = ruamel.yaml.YAML()
        ressource = yaml.load(fid.read())

    # Préparation des ac
    ajoutac = "\\ajoutac{%s}{%s}"
    compRT = []
    for (i, accomp) in enumerate(ressource["acs"]):
        comps = []
        for no_ac in range(len(accomp)): # les ac de la comp
            comps.append( ajoutac % (accomp[no_ac], DATA_ACS["RT"+str(i+1)][accomp[no_ac]]) )
        compRT.append("\n".join(comps))

        # ajoutsaes = "\\ajoutsae{%s}{%s}"
        # compRT = []
        # for i in range(len(self.apprentissages)):
        #     comps = []
        #     for ac in self.apprentissages[i]:
        #         code = self.apprentissages[i]
        #         comps.append(ajoutac % (code, DATA_ACS["RT" + str(i + 1)][code]))
        #     compRT.append("\n".join(comps))

    ajoutprerequis = "\\ajoutprerequis{%s}{%s}"
    prerequis = ""
    if ressource["prerequis"] == "Aucun":
        prerequis = ""
    else:
        liste = []
        for (no, mod) in enumerate(ressource["prerequis"]):
            liste.append(ajoutprerequis % (mod, get_officiel_ressource_name_by_code(mod)))
        prerequis = "\n".join(liste)

    chaine = ""
    chaine = TemplateLatex(contenu).substitute(code=ressource["code"],
                                                   nom=ressource["nom"],
                                                   heures_formation=ressource["heures_formation"],
                                                   heures_tp=ressource["heures_tp"],
                                                   compRT1=compRT[0],
                                                   compRT2=compRT[1],
                                                   compRT3=compRT[2],
                                                   saes="",
                                                   prerequis=prerequis,
                                                   contexte=ressource["contexte"],
                                                   contenu=ressource["contenu"],
                                                   motscles=ressource["motscles"]
                                                   )

    with open(fichierlatex, "w", encoding="utf8") as fid:
        fid.write(chaine)

    return chaine

if __name__=="__main__":
    # Eléments de test
    for sem in DATA_RESSOURCES:
        for code in DATA_RESSOURCES[sem]:
            nom_data = supprime_accent_espace(DATA_RESSOURCES[sem][code])
            print(nom_data)
Ajout du tableau de synthèse des ressources & heures de formation/TP 2021-03-29 13:50:16 +02:00			`import re`
Déporte les données officielles dans officiel.py 2021-03-30 07:59:21 +02:00			`from officiel import *`
amélioratios diverses 2021-03-30 07:56:41 +02:00			`from modeles import *`
déplace le calcul de la matrice acs/ressource dans une fonction 2021-03-30 08:11:38 +02:00			`from officiel import supprime_accent_espace`
Amélioration du dump yaml 2021-03-30 11:00:23 +02:00			`import ruamel.yaml`
			`from ruamel.yaml.scalarstring import FoldedScalarString as folded`
Ajout du tableau de synthèse des ressources & heures de formation/TP 2021-03-29 13:50:16 +02:00
Début du traitement des données => détection des heures 2021-03-29 11:20:05 +02:00			`__LOGGER = logging.getLogger(__name__)`

Ajout de yaml contenant les info "officielles" sur les ressources et les sae. Elément de nettoyage des données (code/nom/semestre) pour uniformisation 2021-03-29 16:22:51 +02:00
Début du traitement des données => détection des heures 2021-03-29 11:20:05 +02:00			`class Ressource():`
Matrice ACs vs ressources 2021-03-29 22:11:17 +02:00			`"""Classe modélisant les ressources"""`
Début du traitement des données => détection des heures 2021-03-29 11:20:05 +02:00			`def __init__(self, nom, brute):`
			`self.nom = nom`
			`self.brute = brute # les données brutes de la ressource`

			`def charge_informations(self, code, semestre, heures_encadrees, tp, sae, prerequis, description, mots):`
			`self.code = code`
			`self.semestre = semestre # <--`
			`self.heures_encadrees = heures_encadrees`
			`self.tp = tp`
			`self.sae = sae`
			`self.prerequis = prerequis`
			`self.description = description`
amélioratios diverses 2021-03-30 07:56:41 +02:00			`self.contexte = None`
			`self.contenu = None`
Début du traitement des données => détection des heures 2021-03-29 11:20:05 +02:00			`self.mots = mots`

			`def charge_ac(self, apprentissages):`
			`self.apprentissages = apprentissages`

			`def __str__(self):`
			`print(self.nom + " " + self.code)`

Export yaml (avec pb d'encodage) 2021-03-30 09:22:21 +02:00			`def str_heures_formations(self):`
			`return str(self.heures_encadrees) if self.heures_encadrees else "???"`

			`def str_heures_tp(self):`
			`return str(self.tp) if self.tp else "???"`

			`def str_semestre(self):`
			`return int(self.semestre[1])`

			`def to_yaml(self):`
Amélioration du dump yaml 2021-03-30 11:00:23 +02:00
Export yaml (avec pb d'encodage) 2021-03-30 09:22:21 +02:00			`dico = {"nom": self.nom,`
			`"code": self.code,`
			`"semestre" : self.str_semestre(),`
			`"heures_formation": self.str_heures_formations(),`
			`"heures_tp": self.str_heures_tp(),`
			`"acs": self.apprentissages,`
			`"sae": "",`
			`"prerequis": self.prerequis,`
Amélioration du dump yaml 2021-03-30 11:00:23 +02:00			`"contexte": folded(self.contexte),`
			`"contenu": folded(self.contenu),`
Export yaml (avec pb d'encodage) 2021-03-30 09:22:21 +02:00			`"motscles": self.mots`
			`}`
Amélioration du dump yaml 2021-03-30 11:00:23 +02:00			`# output = yaml.dump(dico, #Dumper=yaml.Dumper,`
			`# sort_keys=False, allow_unicode=True)`
			`output = ruamel.yaml.dump(dico, Dumper=ruamel.yaml.RoundTripDumper,`
			`allow_unicode=True)`
Export yaml (avec pb d'encodage) 2021-03-30 09:22:21 +02:00			`return output`

amélioratios diverses 2021-03-30 07:56:41 +02:00			`def nettoie_heure(r):`
Matrice ACs vs ressources 2021-03-29 22:11:17 +02:00			`"""Nettoie le champ (horaire) (de la forme 46h ou 33...) pour en extraire la valeur numérique :`
			`le champ peut contenir 2 volumes (heures formation puis heures tp), auquel cas les 2 valeurs sont renvoyées`
			`dans un tuple"""`
amélioratios diverses 2021-03-30 07:56:41 +02:00			`def nettoie_champ_heure(champ):`
			`try: # champ contenant uniquement un nbre d'heure`
			`volumes = int(champ)`
			`return volumes`
			`except:`
			`volumes = re.findall("(\d{2}\D\|\d{1}\D)", champ)`
			`if len(volumes) == 1:`
			`return int(volumes[0][:-1])`
			`elif len(volumes) == 2:`
			`volumes = sorted(volumes, reverse=True)`
			`return (int(volumes[0][:-1]), int(volumes[1][:-1]))`

			`if r.heures_encadrees: # si les heures encadrées sont renseignées`
			`volumes = nettoie_champ_heure(r.heures_encadrees)`
			`if r.tp:`
			`r.tp = nettoie_champ_heure(r.tp)`
			`if isinstance(volumes, int):`
			`r.heures_encadrees = volumes`
			`elif isinstance(volumes, tuple):`
			`r.heures_encadrees = volumes[0]`
			`if not r.tp:`
			`r.tp = volumes[1]`
			`elif r.tp != volumes[1]:`
			`__LOGGER.warning(r"nettoie_heure: ans {r.nom}, pb dans les heures tp/td")`
			`else:`
			`r.heures_encadrees = None`
Matrice ACs vs ressources 2021-03-29 22:11:17 +02:00			`#else:`
			`#__LOGGER.warning("Heures non détectées")`
Début du traitement des données => détection des heures 2021-03-29 11:20:05 +02:00
amélioratios diverses 2021-03-30 07:56:41 +02:00			`def nettoie_code(r):`
Ajout du tableau de synthèse des ressources & heures de formation/TP 2021-03-29 13:50:16 +02:00			`"""Recherche les codes ressources de la forme RXXX dans champ"""`
amélioratios diverses 2021-03-30 07:56:41 +02:00			`champ = r.code`
			`if r.code:`
			`codes = re.findall(r"(R[0-9][0-9][0-9])", champ)`
			`# if len(codes) > 1:`
			`# __LOGGER.warning("plusieurs codes trouvés :(")`
			`#elif len(codes) == 0:`
			`# __LOGGER.warning("code manquant")`
			`if len(codes) == 1:`
			`r.code = codes[0]`
			`else:`
			`code_devine = get_code_from_nom(r)`
			`if code_devine:`
			`__LOGGER.warning(f"nettoie_code : \"{r.nom}\" => code {code_devine}")`
			`r.code = code_devine`
			`else:`
			`r.code = None`
			`__LOGGER.warning(f"nettoie_code : \"{r.nom}\" => code manquant")`

			`def nettoie_semestre(r):`
			`"""Nettoie les semestres : semestre 1 => "S1", semestre 2 => "S2" """`
			`if r.semestre:`
			`if "1" in r.semestre:`
			`r.semestre = "S1"`
			`elif "2" in r.semestre:`
			`r.semestre = "S2"`
			`else:`
			`__LOGGER.warning(f"nettoie_semestre : dans \"{r.nom}, PAS de semestre => rattaché au S2")`
			`r.semestre = "S2"`
			`else:`
			`__LOGGER.warning(f"nettoie_semestre : dans \"{r.nom}, PAS de semestre => rattaché au S2")`
			`r.semestre = "S2"`
Début du traitement des données => détection des heures 2021-03-29 11:20:05 +02:00
amélioratios diverses 2021-03-30 07:56:41 +02:00			`def nettoie_titre(r):`
			`"""Nettoie le titre en utilisant les titres officiels"""`
			`def devine_nom_from_ressources(champ):`
			`champ_purge = supprime_accent_espace(champ)`
			`for sem in DATA_RESSOURCES:`
			`for code in DATA_RESSOURCES[sem]:`
			`nom_purge = supprime_accent_espace(DATA_RESSOURCES[sem][code])`
			`if champ_purge.startswith(nom_purge):`
			`return DATA_RESSOURCES[sem][code] # le bon nom`

			`old = r.nom`
			`titre = devine_nom_from_ressources(r.nom)`
			`if titre and titre != old:`
			`__LOGGER.warning(f"nettoie_titre : {old} => titre \"{titre}\"")`
			`r.nom = titre`

			`def nettoie_acs(r):`
			`"""Nettoie les acs d'une ressource en les remplaçant par leur code pour les 3 compétences"""`
			`if len(r.apprentissages) != 3:`
			`__LOGGER.warning(f"nettoie_acs : Problème dans le nombre de compétences de {r.nom}")`
			`for comp in range(3):`
			`donnees = r.apprentissages[comp] # chaine de caractères listant les ACS`
			`# donnees = donnees.replace("\t", "").replace("-", "") # supprime les tabulations`
			`acs_avec_code = devine_acs_by_code(donnees)`
Export yaml (avec pb d'encodage) 2021-03-30 09:22:21 +02:00			`acs_avec_nom = devine_code_by_nom_from_dict(donnees, DATA_ACS)`
amélioratios diverses 2021-03-30 07:56:41 +02:00			`acs_finaux = acs_avec_code + acs_avec_nom`
			`acs_finaux = [ac.replace(" ", "") for ac in acs_finaux]`
			`acs_finaux = sorted(list(set(acs_finaux)))`
			`r.apprentissages[comp] = acs_finaux`

Intègre l'affichage des pré-requis 2021-03-30 12:14:27 +02:00			`def nettoie_sae(r):`
			`"""Nettoie les sae en détectant les codes"""`
			`print(r.sae)`


amélioratios diverses 2021-03-30 07:56:41 +02:00			`def nettoie_prerequis(r):`
			`"""Nettoie les prérequis (ressource) en les remplaçant par leur code de ressource"""`
			`R_avec_code = devine_ressources_by_code(r.prerequis)`
Export yaml (avec pb d'encodage) 2021-03-30 09:22:21 +02:00			`R_avec_nom = devine_code_by_nom_from_dict(r.prerequis, DATA_RESSOURCES)`
Intègre l'affichage des pré-requis 2021-03-30 12:14:27 +02:00			`liste = R_avec_code + R_avec_nom`
			`liste = [l.rstrip() for l in liste] # supprime les espaces`
			`R_finaux = sorted(list(set(liste)))`
amélioratios diverses 2021-03-30 07:56:41 +02:00			`if R_finaux:`
			`r.prerequis = R_finaux`
			`else:`
			`r.prerequis = "Aucun"`
Ajout de yaml contenant les info "officielles" sur les ressources et les sae. Elément de nettoyage des données (code/nom/semestre) pour uniformisation 2021-03-29 16:22:51 +02:00

			`def get_code_from_nom(ressource):`
amélioratios diverses 2021-03-30 07:56:41 +02:00			`"""Récupère le code d'une ressource d'après son nom en utilisant les noms officiels`
			`des ressources du yaml"""`
Ajout de yaml contenant les info "officielles" sur les ressources et les sae. Elément de nettoyage des données (code/nom/semestre) pour uniformisation 2021-03-29 16:22:51 +02:00			`nom = supprime_accent_espace(ressource.nom)`
			`for sem in DATA_RESSOURCES:`
			`for code in DATA_RESSOURCES[sem]:`
			`nom_data = supprime_accent_espace(DATA_RESSOURCES[sem][code])`
			`if nom.startswith(nom_data):`
			`return code`

Ajoute l'extraction des apprentissages critiques en se basant sur les noms/codes officiels donnés dans acs.yml 2021-03-29 17:25:16 +02:00			`def devine_acs_by_code(champ):`
			`"""Recherche les codes ressources de la forme ACXXX ou AC0XXX dans champ ;`
			`ramène les codes AC0XXX à 3 chiffres.`
			`"""`
			`codes3 = re.findall(r"(AC[0-9][0-9][0-9]\D)", champ) # de code à 3 chiffres`
			`codes4 = re.findall(r"(AC0[0-9][0-9][0-9])", champ)`
Ajout de yaml contenant les info "officielles" sur les ressources et les sae. Elément de nettoyage des données (code/nom/semestre) pour uniformisation 2021-03-29 16:22:51 +02:00
Ajoute l'extraction des apprentissages critiques en se basant sur les noms/codes officiels donnés dans acs.yml 2021-03-29 17:25:16 +02:00			`codes3 += [ "AC" + c[-3:] for c in codes4] # supprime le 0 des acs (codage AC0111)`
			`return sorted(list(set(codes3)))`

amélioratios diverses 2021-03-30 07:56:41 +02:00			`def devine_ressources_by_code(champ):`
			`"""Recherche les codes ressources de la forme RXXX dans champ ;`
			`"""`
			`codes = re.findall(r"(R\d{3}\D)", champ) # de code à 3 chiffres`
			`return sorted(list(set(codes)))`

			`def devine_ressources_by_nom(donnees):`
			`"""Partant d'une chaine de caractères, détermine les ressources`
			`présentes dans la donnée, en utilisant les infos officielles de`
			`ressources.yml"""`
			`donnees_purge = supprime_accent_espace(donnees)`
			`codes = []`
			`for sem in DATA_RESSOURCES:`
			`for code in DATA_RESSOURCES[sem]:`
			`nom_purge = supprime_accent_espace(DATA_RESSOURCES[sem][code])`
			`if nom_purge in donnees_purge:`
			`codes += [code]`
			`return sorted(list(set(codes)))`

Amélioration du dump yaml 2021-03-30 11:00:23 +02:00			`def split_description(r):`
			`"""Découpe le champ description en un contexte+un contenu ; si pas possible """`
amélioratios diverses 2021-03-30 07:56:41 +02:00			`champs = r.description.split("\n")`
			`champs = [c for c in champs if c] # supprime les lignes vides`

			`indicea = 0 # la ligne mentionnant le contexte`
			`if True in [ligne.startswith("Contexte et ") for ligne in champs]: # la ligne commençant par Contenus`
			`indicea = [ligne.startswith("Contexte et ") for ligne in champs].index(True)`

			`indicec = 0`
Amélioration du dump yaml 2021-03-30 11:00:23 +02:00			`contexte = ""`
amélioratios diverses 2021-03-30 07:56:41 +02:00			`if True in [ligne.startswith("Contenus") for ligne in champs]: # la ligne commençant par Contenus`
			`indicec = [ligne.startswith("Contenus") for ligne in champs].index(True)`
Amélioration de la détection des marqueurs dans le contenu 2021-03-30 11:09:43 +02:00			`if indicea>=0:`
			`contexte = "\n".join(champs[indicea+1:indicec]) # double \n pour passage en latex`
amélioratios diverses 2021-03-30 07:56:41 +02:00			`else:`
Amélioration de la détection des marqueurs dans le contenu 2021-03-30 11:09:43 +02:00			`contexte = "\n".join(champs[:indicec])`
Amélioration du dump yaml 2021-03-30 11:00:23 +02:00			`contenu = "\n".join(champs[indicec+1:])`
amélioratios diverses 2021-03-30 07:56:41 +02:00
Amélioration du dump yaml 2021-03-30 11:00:23 +02:00			`# sauvegarde des champs`
Amélioration de la détection des marqueurs dans le contenu 2021-03-30 11:09:43 +02:00			`r.contexte = contexte`
Amélioration du dump yaml 2021-03-30 11:00:23 +02:00			`r.contenu = contenu`

			`def remove_ligne_vide(contenus):`
			`"""Supprime les lignes vides"""`
			`return [c for c in contenus if c]`

			`def get_marqueur_numerique(contenu):`
			`"""Revoie la liste des marqueurs numériques"""`
			`m = re.findall(r"(\d/\|\d\s\))", contenu)`
			`return m`

			`def get_marqueurs(contenus):`
			`"""Renvoie la liste des marqueurs partant d'une liste de ligne"""`
amélioratios diverses 2021-03-30 07:56:41 +02:00			`marqueurs = []`
			`for ligne in contenus:`
			`m = re.search(r"(\t)*", ligne) # dès \t ?`
			`if m.group() != "":`
			`ajout = m.group()`
			`else:`
			`ajout = ""`
Amélioration du dump yaml 2021-03-30 11:00:23 +02:00			`ligne = ligne.replace("\t","")[0].rstrip() # le marqueur en début de ligne (si 1 caractère)`
amélioratios diverses 2021-03-30 07:56:41 +02:00			`if ligne[0] not in string.ascii_letters and ligne[0] != "É":`
Amélioration du dump yaml 2021-03-30 11:00:23 +02:00			`marqueurs += [ajout + ligne[0]] # tous les symboles`
amélioratios diverses 2021-03-30 07:56:41 +02:00
Amélioration du dump yaml 2021-03-30 11:00:23 +02:00			`marqueurs_finaux = [] # tri les marqueurs en supprimant les doublons et en gardant un ordre (pour détecter les sous listes)`
amélioratios diverses 2021-03-30 07:56:41 +02:00			`for m in marqueurs:`
Amélioration du dump yaml 2021-03-30 11:00:23 +02:00			`if m not in marqueurs_finaux:`
amélioratios diverses 2021-03-30 07:56:41 +02:00			`marqueurs_finaux.append(m)`
Amélioration du dump yaml 2021-03-30 11:00:23 +02:00			`return marqueurs_finaux`

			`def nettoie_contenus(r):`
			`# suppression des \t`
Amélioration de la détection des marqueurs dans le contenu 2021-03-30 11:09:43 +02:00			`if r.code == "R107":`
			`print("ici")`

Amélioration du dump yaml 2021-03-30 11:00:23 +02:00			`contenu = r.contenu`
			`marqueurs_numeriques = get_marqueur_numerique(contenu)`
			`for m in marqueurs_numeriques: # remplace les marqueurs numériques`
			`contenu = contenu.replace(m, ">")`

			`contenus = [ligne.rstrip().replace("--", "-") for ligne in r.contenu.split("\n")] # les contenus`
			`contenus = remove_ligne_vide(contenus) # supprime les lignes vides`

			`marqueurs_finaux = get_marqueurs(contenus)`
amélioratios diverses 2021-03-30 07:56:41 +02:00
			`contenus_fin = contenus[:] # copie des ligne`
Amélioration de la détection des marqueurs dans le contenu 2021-03-30 11:09:43 +02:00
			`def get_marqueur(ligne, marqueurs):`
			`for m in marqueurs:`
			`if ligne.startswith(m):`
			`return m`
convert yaml => latex 2021-03-30 11:37:05 +02:00
amélioratios diverses 2021-03-30 07:56:41 +02:00			`for (i, ligne) in enumerate(contenus):`
Amélioration de la détection des marqueurs dans le contenu 2021-03-30 11:09:43 +02:00			`m = get_marqueur(ligne, marqueurs_finaux)`
			`if m:`
			`pos = marqueurs_finaux.index(m)`
			`contenus_fin[i] = "\t" * pos + "* " + ligne.replace(m, "").replace("\t", "").rstrip()`
amélioratios diverses 2021-03-30 07:56:41 +02:00
			`contenu = "\n".join(contenus_fin)`

			`r.contenu = contenu`
Amélioration du dump yaml 2021-03-30 11:00:23 +02:00
convert yaml => latex 2021-03-30 11:37:05 +02:00			`def convert_ressource_yml_to_latex(fichieryaml, fichierlatex, modele):`
			`contenu = get_modele(modele) #"pn/modele_ressource.tex")`

			`with open(fichieryaml, "r", encoding="utf8") as fid:`
			`yaml = ruamel.yaml.YAML()`
			`ressource = yaml.load(fid.read())`

			`# Préparation des ac`
			`ajoutac = "\\ajoutac{%s}{%s}"`
			`compRT = []`
			`for (i, accomp) in enumerate(ressource["acs"]):`
			`comps = []`
			`for no_ac in range(len(accomp)): # les ac de la comp`
Intègre l'affichage des pré-requis 2021-03-30 12:14:27 +02:00			`comps.append( ajoutac % (accomp[no_ac], DATA_ACS["RT"+str(i+1)][accomp[no_ac]]) )`
convert yaml => latex 2021-03-30 11:37:05 +02:00			`compRT.append("\n".join(comps))`

			`# ajoutsaes = "\\ajoutsae{%s}{%s}"`
			`# compRT = []`
			`# for i in range(len(self.apprentissages)):`
			`# comps = []`
			`# for ac in self.apprentissages[i]:`
			`# code = self.apprentissages[i]`
			`# comps.append(ajoutac % (code, DATA_ACS["RT" + str(i + 1)][code]))`
			`# compRT.append("\n".join(comps))`

			`ajoutprerequis = "\\ajoutprerequis{%s}{%s}"`
			`prerequis = ""`
Intègre l'affichage des pré-requis 2021-03-30 12:14:27 +02:00			`if ressource["prerequis"] == "Aucun":`
			`prerequis = ""`
			`else:`
			`liste = []`
			`for (no, mod) in enumerate(ressource["prerequis"]):`
			`liste.append(ajoutprerequis % (mod, get_officiel_ressource_name_by_code(mod)))`
			`prerequis = "\n".join(liste)`
convert yaml => latex 2021-03-30 11:37:05 +02:00
			`chaine = ""`
			`chaine = TemplateLatex(contenu).substitute(code=ressource["code"],`
			`nom=ressource["nom"],`
			`heures_formation=ressource["heures_formation"],`
			`heures_tp=ressource["heures_tp"],`
			`compRT1=compRT[0],`
			`compRT2=compRT[1],`
			`compRT3=compRT[2],`
			`saes="",`
			`prerequis=prerequis,`
			`contexte=ressource["contexte"],`
			`contenu=ressource["contenu"],`
			`motscles=ressource["motscles"]`
			`)`
Intègre l'affichage des pré-requis 2021-03-30 12:14:27 +02:00
			`with open(fichierlatex, "w", encoding="utf8") as fid:`
			`fid.write(chaine)`

convert yaml => latex 2021-03-30 11:37:05 +02:00			`return chaine`
amélioratios diverses 2021-03-30 07:56:41 +02:00
Ajoute l'extraction des apprentissages critiques en se basant sur les noms/codes officiels donnés dans acs.yml 2021-03-29 17:25:16 +02:00			`if __name__=="__main__":`
			`# Eléments de test`
			`for sem in DATA_RESSOURCES:`
			`for code in DATA_RESSOURCES[sem]:`
			`nom_data = supprime_accent_espace(DATA_RESSOURCES[sem][code])`
			`print(nom_data)`