Please enable JavaScript.
Coggle requires JavaScript to display documents.
Big Data - Coggle Diagram
Big Data
Introdução
Dados podem estar em
DataLake
Grande repositório capaz de armazenar dados estruturados, semi-estruturados e não-estruturados
E tbm tem um método para organizar grandes volumes de dados de diversos formatos e de diversas fontes diferentes
-
-
Definição
Tecnologias projetadas economicamente para extrair valor de volumes muito grandes e vastos de dados, permitindo alta velocidade de captura, descoberta e análise
-
Infraestrutura
Pode-se utilizar
Infraestrutura própria
Hardware, software e outras tecnologias proprias
-
SQL vs NoSQL
NoSQL
-
Armazenamento:
Variado (Graficos, tabelas, documentos)
-
-
Obs:
Pensando em solucionar diversos problemas relacionados à escalabilidade, performance e disponibilidade, projetistas de BD não-relacionais promoveram uma alternativa de alto armazenamento com alta velocidade e alta disponibilidade, procurando se livrar de certas regras e estruturas inflexíveis que norteiam o modelo relacional de armazenamento de dados.
Obs:
A proposta dos BD não-relacionais não é substituir os BD relacionais, mas serem utilizados nos casos em que é necessária uma maior flexibilidade na estrutura do BD
-
Premissas
5V's: VO VA VE VE VA
-
-
-
Valor
valor agregado de todo esse trabalho desenvolvido, coleta, armazenamento e análise de todos esses da/dos tem que compensar os custos financeiros envolvidos
-
-
-
Exercicios
Data science
Utiliza modelos estatísticos e de aprendizado de máquina para encontrar padrões e insights nos dados.