Please enable JavaScript.
Coggle requires JavaScript to display documents.
DATA SCIENCE - Coggle Diagram
DATA SCIENCE
Il machine learning, o apprendimento automatico, è una branca dell’intelligenza artificiale che si occupa di algoritmi statistici basati su reti neurali che sviluppano un apprendimento da parte del computer senza la necessità di specifiche istruzioni, ma grazie a un addestramento effettuato con grandi quantità di dati.
L’apprendimento supervisionato comprende una serie di funzione che mappano un input in un output in base a una serie di coppie conosciute di valori di input e di output.
la regressione: è un modello con input continuo in cui si trovano relazioni tra una variabile dipendente e una o più variabili indipendenti.
La regressione lineare consiste nel trovare una retta che si adatti al meglio ai dati. Alcune estensioni di questo modello sono la regressione lineare multipla ( trova dei piani che approssimino al meglio i dati) e la regressione polinomiale ( trova una curva di migliore approssimazione);
-
-
L’apprendimento non supervisionato cerca di individuare strutture nei dati in assenza di informazioni.
L’apprendimento per rinforzo implementa un agente autonomo che interagendo con l'ambiente e migliora le proprie prestazioni sulla base di feedback di ricompense punizioni basati su misure di fitness,
Con big data si fa riferimento all’insieme di dati particolarmente complessi e di difficile elaborazione con i tradizionali programmi informatici. L’analisi e il trattamento di questi enormi volumi di dati consentono anche di affrontare nuovi problemi, sia in ambito personale sia in ambito aziendale.
-
La data science si riferisce a un’area di studio interdisciplinare che comprende statistica, matematica ed informatica con lo scopo di analizzare, trasformare, modellare, visualizzare ed estrarre informazioni e conoscenza dai dati e di presentare i risultati in modo tale che siano di supporto nei processi decisionali.
-
collezionata e sistemata una quantità di dati nel dataset, si passa all'analisi esplorativa dei dati, ossia la fase di indagine che consente di catturare la natura dei dati e delle relazioni che li legano.
Lo scopo dell’EDA è quello di esaminare i dati prima di formulare qualsiasi ipotesi, aiutando identificare errori e trovare relazioni e pattern interessanti tra le variabili.
La data visualization comprende le tecniche per rappresentare dati e informazioni attraverso grafici, diagrammi e mappe composti da elementi visivi quali punti, linee, barre ecc. per individuare in maniera semplice e immediata andamenti (trend), schemi (pattern), e valori anomali.
tra principali diagrammi troviamo a barre, istogrammi, a linea, a torta, a dispersione
La trasmissione, lo stoccaggio e l'analisi dei big data richiede quantità notevoli di energia elettrica e pone un problema di sostenibilità ambientale