Please enable JavaScript.
Coggle requires JavaScript to display documents.
Ciência de Dados (Ciclo de Vida Projetos DS (Principais Atividades na…
Ciência de Dados
-
Armazenamento
DATA LAKE

Definição
Armazenamento - Data Lake X Data WareHouse
-
-
Coursera
Tipos de Questionamentos
Descritivo
- Descreve o dataset
- normalmente aplicado a dados de Censo
- 1º tipo de análise realizada
- Descrição e interpretação são dados diferentes
Exploratório
- Descobrem relacionamentos desconhecidos por você
- Bom para descobertas de nonas conexões
- Normalmente apenas apontam a direção, não são conclusivas
- Correlação não implica em casualidade
Inferencial
- Uso de uma pequena amosta do dataset para inferir sobre a totalidade do conjunto (todo dataset)
- objetivo da maioria dos modelos estatísticos
- Envolve estimar uma quantidade (certeza) ou a incerteza
Preditivo
- Usa dados de alguns objetos para predizer valores em outros objetos;
- Se X prediz Y, não significa que X causa Y
- Dados e modelos simples tendem a funcionar melhor
Causal
- Relacionamentos causais são difíceis de identificar
- O que acontece se vc mudar o valor de uma variável?
- Para análise Causal o padrão é o uso de estudos randomizados ou randomizados controlados
- Tipo de padrão mais utilizado pela datascience
Mecanicista
- A idéia é entender a exata mudança de variáveis que levam a exatas mudanças em outras variáveis
- Muito difícil e pouco utilizado (fofo em aplicações de engenharia)
Definição de Dado
- Dados são valores de variáveis qualitativas e quantitativas, pertencentes a conjunto de itens
Qualitativas: Sexo, nacionalidade, nome
Quantitativas:: Peso, idade, altura
-