Please enable JavaScript.
Coggle requires JavaScript to display documents.
Recodification - Coggle Diagram
Recodification
A faire
Reranker
Reprendre les votes de modèles
Inclure RAG + génération dans chaque batch
Utiliser les gros modèles de Thomas (+20M)
Clarifier le mapping_ok du CAG
Utiliser vllm online
3 déclinaisons de l'embedding NAF2025
complet
semi-light
light
Piste pour la suite : description des niveaux supérieurs
Joue bcp sur le temps de génération
Premiers résultats
Pas d'effet du top_k (entre 4 et 10)
Gros model gen ==> meilleurs résultats
Collection : effet différent selon Gen model
Plus d'info => meilleur resultat sur petit Genmodel
Avec gros Gen model : semi light = best
Ajout libelles cj et nature dans le descriptif d'activité (cote embedding et cote prompt) : pas clair
On est très bien sur le retriever : 91% de mapping_ok
Paramétrisation du nombre de documents à retriever
Si gros Gen model : pas d'effet
Si petit Gen model : ça joue
Generation time : plutôt à la hausse mais pas clair
Retrieval time : RAS
Batching requêtes à Qdrant
Retrieval time / 5
investigations :
Max concurrency / asynchrone
Retry/backoff
Conséquences sur code
Comprendre le code/technos
Doc
Schémas
Prise en compte des variables annexes
natures d'activité
conditions juridiques
Représentativité du testset
10% de liasses d'élevage d'animaux de compagnie
Analyse des erreurs de retriever
Le mapping est particulièrement mauvais sur : Les activités de nettoyage, la restauration (mobile), activités récréatives, la construction spécialisée