Please enable JavaScript.
Coggle requires JavaScript to display documents.
Big Data e le loro criticità - Coggle Diagram
Big Data e le loro criticità
🔷 1. Introduzione: cosa sono i Big Data
Definizione sintetica:
grandi quantità di dati eterogenei
generati e analizzati a velocità elevata.
Si descrivono attraverso le
5 “V” fondamentali
:
📦 2. Le 5 V dei Big Data
Volume
Unità di misura:
Petabyte, Zettabyte
Crescita esponenziale per:
Contenuti generati dagli utenti (es. social).
Dati generati da macchine: log, sensori, archivi.
Velocità
I dati vengono prodotti/elaborati
in tempo reale
.
Serve per ottenere
risposte rapide e immediate
.
Varietà
Dati
strutturati
(tabelle),
non strutturati
(video, immagini),
semi-strutturati
(testi).
Dati
multi-dimensionali
(es. geolocalizzazione, tempo, metadati…).
Veridicità (Veracity)
Affidabilità
e
qualità
dei dati. si analizzano per verficarli
Attenzione alle
API
: anche i dati ufficiali possono contenere errori.
Valore
I dati vengono raccolti per
generare conoscenza
:
Analisi descrittive (es. ISTAT).
Analisi predittive (es. marketing, pubblicità).
Dato =
potenziale informativo
.
🔗 3. Relazionalità principio chiave dei database
Nei
database relazionali
(es. SQL), le informazioni sono collegate da chiavi.
Permette:
Efficienza → niente dati duplicati.
Connessione tra entità → esempio: utente ↔ post.
⚠️ 4. I dati non sono oggettivi
I dati sono
costruiti
,
interpretati
e soggetti a errori:
Esempio: il
like
su Facebook è ambiguo → può voler dire tante cose.
Gli errori possono derivare da:
Piattaforma.
Trasmissione.
Elaborazione.
Le analisi statistiche prevedono
controlli sulle distribuzioni
.