Please enable JavaScript.
Coggle requires JavaScript to display documents.
Modely IR (information retrieval) systémů - Coggle Diagram
Modely IR (information retrieval) systémů
Index
Snaha vyjádřit dokument prostřednictvím 1 a 0 na základě jeho obsahu
jak indexovat web?
robotem (spider), který se nasadí na nějakou webovou stránku a on využívá hyptext.odkazy, analyzuje, prochází a vyplyvává
Grepping
lineární prohledávání
prohledává dokument řádek po řádku a hledá slova, která chceme
časově náročné
lepší varianta
indexování dokumentů předem
Základním cílem jakéhokoliv IR systému
vybrat z kolekce dokumentů ty relevantní podle přání jeho uživatele
Modely IR systémů
Booleovský
logické operátory AND, OR,..
založeno na výskytu výrazů z dotazu
Vektorový
míra podobnosti mezi reprezentací připraveného dokumentu a reprezentací dokumentů v kolekci
řazení podle relevance
statistický přístup
výpočet podobnosti dokumentů
Pravděpodobnostní
Založeny na statistických metodách zpracovávání jazyka
typy
Jazykový model
celkové rozložení slov v dokumentech
Model založený na frekvenci termů
Model založený na věrohodnosti
Google PageRank
stránky, na které odkazuje mnoho jiných relevantních stránek, jsou pravděpodobně důležitější a relevantnější než stránky, na které odkazuje jen málo nebo žádné jiné relevantní stránky.
Regionový
rozšíření boolovského modelu
CONTAINING
najde nám dokument, ve kterém postava Hamlet říká sbohem
používá se pro jasně strukturované dokumenty
Fuzzy logika
výsledkem našeho vyhledávání na základě dotazu nebyly jen úplně správné či špatné dokumenty
umožňuje reprezentovat informace jako množiny s nejasnými hranicemi a pracovat s nimi pomocí teorie množin, logiky a matematických funkcí.