Análise de Informações 1
.
.
.
.
.
ESTRUTURA do DADOS
- DADOS ESTRUTURADOS
- DADOS SEMI-ESTRUTURADOS
- DADOS NÃO -ESTRUTURADOS
A identificação semântica se refere aos nomes utilizados.
.
DADOS =
Fatos em forma PRIMÁRIA
dados armazenados GERAM informações que, por conseguinte, trarão conhecimentos que se concretizarão na inteligência. .(TEORIA)
INFORMAÇÃO =
CONJUNTO de DADOS armazenados
É o ARMAZENAMENTOS dos fatos (EM DADOS ORGANIZADOS) .(TEORIA)
CONHECIMENTO =
É a informação INTERPRETADA, AVALIADA e ADQUIRIDA.(TEORIA)
INTELIGÊNCIA =
É o conhecimento SINTETIZADO e APLICADO a uma determinada situação. (PRATICA)
DADOS ESTRUTURADOS
.
DADOS SEMI-ESTRUTURADOS
meio termo
são DADOS com:
- Estrutura IRREGULAR ou PARCIAL
- Estrutura IMPLÍCITA
e essa estrutura é definida DEPOIS do armazenamento (À POSTERIORI)
.
São DADOS:
- ORGANIZADOS e
- IDENTIFICADOS
- Estrutura IRREGULAR
Não existe um esquema padrão para os dados. ❌
.
- Estrutura IMPLÍCITA
A estrutura é extraída do próprio dado, implicitamente.
.
- Estrutura PARCIAL
Nem todo o conteúdo dos dados é estruturado.
.
- Estrutura À POSTERIORI
Definição DA ESTRUTURA após a sua existência.
.
CARACTERÍSTICAS
.
Estrutura REGULAR
(tudo padrão)
Estrutura REDUZIDA
(Pela organização)
FRACAMENTE evolutiva
(pois JÁ ESTÃO TOP'S)
Estrutura PRESCRITIVA
(1° PRESCREVE / ORGANIZA, depois armazena)
DISTINÇÃO entre estrutura e dados É CLARA
(Por causa organização)
Estrutura INdependente DOS DADOS
(a ESTRUTURA NÃO depende DOS DADOS para organizar-se)
Esquema PREDEFINIDO
Planeja ANTES de armazenar
.
CARACTERÍSTICAS
.
Esquema NEM SEMPRE PREDEFINIDO
Planeja DEPOIS de armazenar
Estrutura IRREGULAR
(BAGUNÇA)
Estrutura EXTENSA
(Abarca MAIS dados pela desorganização)
FORTEMENTE evolutiva
(VÃO SE ORGANIZANDO)
Estrutura DESCRITIVA
(organiza PELA DESCRIÇÃO DOS DADOS)
DISTINÇÃO entre estrutura e dados NÃO É CLARA
(Por FALTA de organização)
Estrutura DEPENDENTE DOS DADOS
(a ESTRUTURA DEPENDE DOS DADOS para organizar-se)
.
DADOS NÃO-ESTRUTURADOS
• Não possuem estrutura definida. ❌
• Não há descrição explícita nem implícita de sua estrutura. ❌
Exemplos comuns de dados não estruturados são:
- documentos de textos,
- imagens,
- áudios,
- vídeos
etc.
.
- COLETA DE DADOS
É o processo de obtenção dos dados.
.
.
Sistemas corporativos
.
Formulários web
envio de dados se dá por meio de formulários eletrônicos.
Ex: Compras na web
.
Planilhas eletrônicas
São bastante utilizadas para cálculos numéricos.
.
Web services
Um SISTEMA coleta dados DE OUTRO SISTEMA
Ex.: Detran usa dados da Fazenda Pública para ver atraso em pagamentos
.
.
Logs, registros e históricos
- logs são registros de eventos no sistema operacional, são feitos em arquivos de texto.
- Os cookies são uma forma de registro de histórico da web, por exemplo.
Sistema de Instituições para coleta e análise dos dados
Ex.: Da receita, do Detran
Aplicativos móveis
quando requerem dados
.
- TRATAMENTO DE DADOS
É o processo de IDENTIFICAÇÃO e ORGANIZAÇÃO significativa dos dados.
MESMO em ESTRUTURADOS, os DADOS DEVEM PASSAR PELO TRATAMENTO ⚠
Consiste em:
- Identificação
- Transcrição
- Padronização
- Limpeza
- Organização da base de dados
.
.
- Padronização
.
- Organização da base de dados
- Identificação
Trata-se de identificar se há dados não preenchidos corretamente.
- Transcrição
Identificação de erros de preenchimento quanto aos caracteres, por exemplo.
- Limpeza
É necessária tanto para dados estruturados quanto para dados semi-estruturados.
.
3.ARMAZENAMENTO DE DADOS
Consiste em guardar os dados de forma PERSISTENTE, permitindo a sua posterior recuperação.
Os dados podem ser armazenados em:
Logs: tanto ARMAZENA quanto se COLETA se DADOS NELES ✅
• LOGS: são registros feitos em arquivos de texto, dos quais também podem ser extraídos dados.
- REGISTROS de dados.
Arquivos XML: trata-se de uma estruturação de dados que permite realizar a EXPORTAÇÃO desses dados de maneira estruturada, por meio de tags com suas classes, atributos etc.
- BANCOS de dados.
.
- INTEGRAÇÃO DE DADOS
- É o processo de apresentação UNIFORME e CONSISTENTE de dados.
- Tratamento de REPETIÇÕES e INconsistências.
a ORGANIZAÇÃO de maneira SEMÂNTICA
Esse DADOS são ARMAZENADOS em SISTEMA GERENCIADORES de BANCOS de DADOS (SGBD )
Uma vez que esses dados foram coletados, tratados e armazenados, é possível haver a sua integração.
.
Exemplo de INTEGRAÇÃO de dados:
Dados de RH se relaciona com os de Depart. Pessoal na demissão ou contratação em uma empresa.
.
Integração de Dados –
Data Warehouse
É uma estruturação de dados feito em um SGBD.
O Data Warehouse permite que sejam coletados um grande número de dados de diversas bases para integrá-las em uma única base.
SISTEMA GERENCIADORES de BANCOS de DADOS (SGBD )
.
- RECUPERAÇÃO DE DADOS
- É o processo de OBTENÇÃO dos dados que JÁ foram ARMAZENADOS.
SEGUE A ORDEM do numeros para A CORRETA ANÁLISE da INFORMAÇÃO ⚠
.
.
contra FALHAS
para CONSULTA
- Recuperação para o USO COTIDIANO.
– Consulta à base de dados.
- Recuperação em caso de falhas.
– Backups