Please enable JavaScript.
Coggle requires JavaScript to display documents.
Mesures de similarité textuelle - Coggle Diagram
Mesures de similarité textuelle
1. Similarité lexicale
Basé sur les caractères
Jaro-winkler
Jaro
Levenshtein
Hamming distance
Basé sur les mots
Sorensen-Dice index
Jaccard
Overlap coefficient
Tversky index
2. Représentation textuelle et mesures de similarité
a. Représentation textuelle
Basé sur les statistiques ou fréquences
Sac de mots (bag-of words)
TF-IDF
BM25
Basé sur l'embedding
Mots
Word2Vec
FastText
GloVe
BERT
Phrases
SBERT
OpenIA (Embedding models)
T5
USE
Basé sur la sémantique
DSSM (Deep Structured Semantic Model
CDSSM (Convolutional Deep Semantic Model)
MatchPyramid
MV-LSTM (Multi-View Bi-LSTM)
Basé sur les graphes
Knowledge graph
Graph neural network (GNN)
b. Mesures de similarité (Distance)
Cosine distance
Euclidean distance
Word mover's distance
3. Méthodes hybrides
Fusionne les deux approches à gauche et à droite