Please enable JavaScript.
Coggle requires JavaScript to display documents.
Pattern Evaluation, non varrebbe più il principio a priori - Coggle…
Pattern
Evaluation
misure di interesse
_
soggettive
si basa su argomenti soggettivi
(meglio se rivela informazioni inaspettate
o utili e profittevoli)
oggettive
usa statistiche derivate dai dati
tabella di contingenza
dove ottenere informazioni
necessarie per calcolare la regola d'interesse
row sum rappresenta support di 1 variabile
column sum rappresenta support di un altra variabile
correlazione
p(S /\ B) = p(S) x p(B) stat ind
''>'' corr. pos
''<'' corr. neg.
lift measure
p(Y, X) / p(X) 1/p(Y)
1 ind
1 corr pos
<1 corr neg
Pattern sequenziali
transazioni associate
ad informazioni temporali
sequenze
liste ordinate di elementi
ogni elemento contiene
una collezione di eventi
ogni elemento è attribuito ad un
specifico tempo o spazio
sottosequenza
sequenza contenuta in un altra sequenza
gli intervalli tra un tempo e l'altro devono coincidere
sottosequenza frequenti!!
Time constraints
max gap : tra eventi
min gap: ''
max span: differenza massima
tra evento ultimo e primo
t(e_j+1)-t(e_j)<=maxgap
t(e_j+1)-t(e_j)>mingap
t(e_k)-t(e_1)<=maxspan
Mining
approccio 1:
mine pattern sequenziali senza timing constraints
postprocess i pattern scoperti
approccio 2:
modifica GSP per prunare direttamente
i candidati che violano i timing constraints
Manipolare
attributi categorici
se l'attributo ha troppi valori possibili?
aggreggare low support
attribute values
distribuzione sblianciata?
droppare gli item più frequenti
Sequential pattern
mining
Metodi A priori
GSP
step 1:
produrre tutte le
1-sequenze frequenti
step 2:
Candidate Generation
Candidate Pruning
Support Counting
Candidate Elimination
ripeti fino a che
non ci sono più nuovi
itemset frequenti
SPADE
Metodi Pattern Growth
FreeSpan
PrefixSpan
non varrebbe più il principio a priori
SOTTOSEQUENZE CONTIGUE
se
s è ottenuta da w cancellando un item
da ogni elemento che contiene due item
s è una sottosequenza contigua di s' è s' è una sottosequenza contigua di w
s è ottenuta da w cancellando item
sia da e1 che da ek
Modified A priori principle
to handle max gap contraints
se una k sequenza è frequente,
alora tutte le sue k-1 sottosequenze contigue sono frequenti
una k sequenza è prunata se almeno una sua k-1 sottosequenza contigua non è frequente