Please enable JavaScript.

Coggle requires JavaScript to display documents.

Metodi Avanzati – Sinonimia ed Espansione della Query, - Coggle Diagram

- - - - Consiste nell'arricchire la query con:
        
        varianti morfologiche
        
        termini correlati semanticamente
        
        termini co-occorrenti in contesti simili
        
        sinonimi
      - Lo scopo è:
        ✔ aumentare il recall (recuperare più documenti pertinenti)
        ✖ senza ridurre troppo la precisione (evitare rumore)
        Esistono tecniche automatiche e semiautomatiche (le seconde richiedono che l'utente selezioni i termini migliori).
- - - - sinonimi (synset)
      - iperonimi/iperonimi
      - meronimi
      - relazioni semantiche varie
  - - - documenti pertinenti noti
      - documenti recuperati nella prima ricerca
      - co-occorrenze in finestre locali (frase, paragrafo, testo vicino)
- - - - TF-IDF combinato tra termini
      - Punto di Mutual Information (PMI)
      - Chi-square
      - Jaccard
      - Dice coefficient
      - Modelli basati su embedding (moderno)
    - - Queste misure possono essere applicate:
        
        sull’intero documento
        
        su parti: frasi, paragrafi, finestre scorrevoli
- - - - n {{a}} = numero di documenti che contengono la parola a
      - n{{b}} = numero di documenti che contengono b
      - n{{ab}} = numero di documenti che contengono entrambi
    - - Se a e b appaiono quasi sempre negli stessi documenti, allora n{{ab}} ,n{{ab}} è alto e Dice è vicino a 1.
      - Se compaiono in documenti distinti, n{{ab}} ,n{{ab}} è basso e Dice è vicino a 0.
- - - - P(a) probabilità che la parola a compaia in una finestra di testo
      - P(b) probabilità che b compaia
      - P(a,b): probabilità che a e b compaiano insieme
    - - Se compaiono insieme più spesso del caso, MI > 0
      - Se compaiono insieme come ci si aspetta, MI = 0
      - Se compaiono insieme meno del previsto, MI < 0