Please enable JavaScript.
Coggle requires JavaScript to display documents.
info 7 - Coggle Diagram
info 7
MOTORI DI RICERCA
Il web si espande, miliardi di pagine nel web=sistemi per la ricerca e la catalogazione delle pagine Web. Due gli approcci:
- Motori di ricerca (Google, Yahoo!, Bing) io cerco direttamente;
- Cataloghi sistematici (Yahoo! directory) le pagine assegnate a delle categorie specifiche (meno utilizzato).
Il motore di ricerca ci restituisce una lista di risultati in ordine. apparentemente semplice, risponde in pochissimo tempo. Quando effettuiamo una ricerca, il motore di ricerca NON va a fare una ricerca nel web in quel momento (troppo tempo). ha già catalogato le informazioni nell’archivio del motore di ricerca (dati organizzati per rispondere velocemente). Per costruire questo archivio, il motore di ricerca due componenti: spider (esplorazione del web) e indicizzatore (analisi dei dati esplorati).
INDICIZZATORE
Le pagine indicizzate (in un indice): velocizza i tempi di ricerca, ma i dati non sono in tempo reale, sono “vecchi”, non aggiornati. Il motore accede ai propri archivi (copia cache)
Deve esserci un aggiornamento degli archivi, perché magari le pagine o il contenuto cambia
La creazione e l’aggiornamento degli archivi tramite: spider o crawler (esplorano il web e mandano informazioni all’indicizzatore).
SPIDER/CRAWLER
dovrebbero esplorano la porzione di web non ancora esplorata e inviare dati all’indicizzatore (non sempre a esplorare tutte le pagine – limite). Per costruzione dell’indice ci si basa sulle parole contenute.
GOOGLE SCHOLAR motore di ricerca Google specialistico
- ricerca su testi di lettura scientifica
- segnalazione delle citazioni di un'opera (collegamenti entranti)
Il motore di ricerca, fornire risultati veloci, restituire dati ordinati. Gli utenti controllano all’incirca solo i primi 3 risultati=essere i più importanti. L’ordine di presentazione dei risultati è fondamentale (ranking). Inizialmente determinato dall’analisi delle parole chiave (più volte appariva e prima appariva nella lista di risultati).
seconda metà anni 90 sviluppo di nuovi metodi di ordinamento, basati importanza delle pagine e non dall’analisi delle parole chiave.
Il motore di ricerca all’epoca Google. basa l’ordinamento su alcuni metodi, tra cui il PageRank: importanza delle pagine (analizza la struttura ipertestuale delle pagine).
Adesso in considerazione diversi aspetti oltre al PageRank (anche il tenere traccia dei risultati selezionati dagli utenti: se viene presa in considerazione molte volte una pagina in quarta posizione, sarà messa per prima).
WEB 2.0
2004 coniato il termine WEB 2.0. I cambiamenti tecnologici: si passa da pagine statiche a molte più pagine dinamiche (più interazione). Si possono condividere informazioni in vari modi. c’è una dimensione partecipativa dell’utente: facilità nel pubblicare contenuti
Tipica piattaforma del linguaggio 2.0: Socialnetwork
- piattaforme per il collegamento tra utenti
- diversi tipi di relazione
primi spazi di interazione fra utenti:
- forum ( bacheca elettronica)
-thread convezione (possibili diramazioni)
- presenza di moderatori
nascono i blog (diario personale di qualcuno:
- pubblicazione di contenuto
- piattaforme come Twitter
- microblogging: hashtag
si è affermata: Wiki (scrittura collaborativa)
- memorizza la cronologia delle modifiche
- presenza di molti link ipertestualli
CRITTOGRAFIA: tecnica per la protezione di informazioni(messaggi) limitare le lettura ai destinatari costruire messaggio non decifrabile per chi non ha la chiave di decifrazione criptoanalisi, tentativo di ricostruzione del messaggio non cifrato
Ci sono due metodi di crittografia:
- A chiave segreta (crittografia simmetrica)
- A chiave pubblica (crittografia asimmetrica)
a chiave simmetrica il messaggio viene cifrato/decifrato con una chiave in possesso del mittente e del ricevente. problema trasmissione della chiave
a chiave asimmetrica, utilizza due chiavi complementari con funzioni diverse chiave pubblica per cifrare i messaggi nota a tutti chiave privata per decifrare i messaggi nota solo al proprietario
SERVIZI SU INTERNET
Internet e il web due cose differenti. Internet infrastruttura di rete-> trasferire dati da parte di diverse applicazioni (posta elettronica). web uno dei servizi che usa la rete internet per comunicare.
Caratteristiche del Web:
- Ipertestuale: costituito da ipertesti: i documenti nel web hanno sia un testo che una struttura detta grafo. I link (collegamenti) ipertestuali= spostarci da un punto all’altro (nodi).
- Multimediale: presenza di molte forme di comunicazione in un unico contesto (testo, immagini, suono).
- Ipermediale: convergenza tra ipertestualità e multimedialità = ipermedialità
- Distribuito su rete (internet)
WORLD WIDE WEB
primo nucleo del web 20 anni dopo internet (fine anni ’80). progettato al CERN da Cailliau e Berners-Lee, facilitazione delle comunicazioni
Il web è costituito da pagine web (nodi) – distribuite su server differenti. Ci sono collegamenti unidirezionali. Le pagine web consultabili tramite il browser (Explorer, Edge, Crome ecc.) che ci guida la navigazione, e ci permette la visualizzazione delle pagine (legge il codice della pagina).
PAGINE WEB
- pagine statiche; descrizone completa sul server
- pagine dinamiche; generate da un programma prelevando info da archivi. generata-> richiesta dall'utente
Quando Berners-Lee crea il web, lo basa su tre standard:
- HTTP
- HTML
- URL
Poco dopo crea anche il W3C (World Wide Web Consortium): ente= scopo di sviluppare tecnologie su cui si basa il web.
HTML
Hyper Text Markup Language – linguaggio di marcatura per la scrittura di documenti ipertestuali.
I TAG comandi per definire le parti ipertestuali=incorporare oggetti multimediali, definire le caratteristiche strutturali (CSS) (parentesi angolari <>)
browser ha il compito di interpretare il codice della pagina (HTML, CSS) e visualizzare elementi multimediali (immagini, video, ecc.).
Browser diversi danno visualizzazioni/interpretazioni diverse (a volte)
URL Uniform resource locator – indirizzo univoco di una risorsa nel web
composto da protocollo://nome_elaboratore/percorso_file
protocollo: protocollo utilizzato (http,https, ftp)https (s=sicuro - crittografia)
nome elaboratore: identificatore di un nodo della rete (DNS)
percorso file: percorso nel file system del server per raggiungere un certo file
RETE INTERNET
nasce fine anni ’60 – progetto finanziato e portato aventi dall’agenzia di difesa ARPA (Advanced Research Projects Agency). Il primo nucleo della rete internet ARPANET – scopo-> interconnettere reti.
Internet rete di reti: reti di tipo differenti interconnesse tra loro.
protocolli (insieme di regole condivise)alcuni standard per architetture di rete:
due protocolli importanti: standard Iso/osi (organizzazione internazionale degli standard= funzione definire degli standard,-> di comunicazione della rete, tramite 7 livelli x 7 aspetti diversi della trasmissione della comunicazione) protocollo Internet numero inferiore di livelli 4, si parte da un livello astratto il 4° livello e si arriva al livello del collegamento concreto
- Livello applicativo: riferimento alle applicazioni che usa la rete internet, (il web, mail)
- Trasporto, intermedio, gestisce la possibilità di avere una trasmissione il più possibile affidabile, l’informazione arrivi in modo corretto
- Livello internetworking, colleghiamo in rete con un indirizzo, i dispositivi devono essere identificati per ricevere e trasmettere, indirizzi IP-> come identificare i dispositivi.
Indirizzi IP sequenze numeriche di 4 numeri ognuno costituito da un byte (ovvero 8 bit). Andando avanti gli indirizzi erano insufficienti-> utilizzate tecniche per risolvere questa limitazione, e passare alla versione 6.
quando ci colleghiamo a un dispositivo ci colleghiamo agli indirizzi simbolici. sono composti da testo – dominio (es. dinamico2.unibg.it). Il servizio fa da convertitore tra indirizzi numerici e stringhe è il DNS (Domain Name System): traduzione di indirizzi IP in indirizzi simbolici.
dominio di primo livello descrive le caratteristiche:
- nazionali: stato di appartenenza (it., fr., uk)
- sovrannazionali: caratteristica di appartenenza ( com., org.,)
dominio di secondo livello-> ente, società persona a cui è legato l'indirizzo
www. unibg.it
Ci si può fermare al secondo livello oppure continuare, suddividendo ulteriormente:
- domini dei livelli successivi identificano singolo computer all'interno della rete
- il comp può appartenere a sottodomini o essere del dominio principale
Le varie parti dell’indirizzo simbolico ruolo specifico posizione non è casuale (es. www…).
Sono stringhe di testo separate da punti (.) – ogni stinga è un dominio: classificazione degli elaboratori che appartengono a una rete. La stringa più a sinistra non è un dominio, ma il nome del dispositivo (es. www).
Nel definire le varie parti si parte dalla stringa più a destra:
- dominio più a destra primo livello
- spostandosi secondo livello
diversi domini una specie di suddivisione degli elaborati.