Please enable JavaScript.
Coggle requires JavaScript to display documents.
Banco de dados de apoio à tomada de decisão (Visualização (Visualização de…
Banco de dados de apoio à tomada de decisão
Data Marts
Características
Assuntos de informação organizados para as necessidades de análise específicas
Análise fincanceira
Marketing
Campanhas
Contém uma porção dos dados do DW
Podem apresentar entre si
Sobreposição de assuntos
Granularidades distintas ou sobrepostas
Temporalidade sobrepostas
DM X DW
Design
DM:Denormalizada
DW: Normalizada
Histórico
DM:Contém apenas o essencial para algumas análises
DW: Contém todo o histórico necessário para BI
Granularidade
DM: Incentivo ä criação de agregações e sumarizações
DW: Contém o maior nível de detalhe necessário para BI
Tipos de usuário
DM: Predominantemente "gerente"
DW: Predominantemente "explorador" e "minerador"
Abrangência
DM: Modela as necessidades sob uma visão específica (departamental)
DW: Consolida as necessidades de toda a empresa (corporativo)
Requisitos para a tecnologia
DM
Facilidade de análise
Suportar dados altamente indexados
DW: Suportar alto volume de dados
Fonte de dados
DM: Única fonte de dados (Data Warehouse)
DW: Várias fontes de dados (Sistemas Operacionais)
Dependentes X Independentes
Independentes
Como garanto a qualidade? Como eu garanto que TODOS utilizam o mesmo conceito de "Cliente"?
Vantagens
Tempo menor de desenvolvimento
Desvantangens
Alto risco de contradição
Duplicação de dados
Em que situação poderíamos utilizar um DM Independente de modo vantajoso em uma organização?
Online Analytical Processing (OLAP)
Características
Tecnologia que possibilita diferentes perspectivas sobre modelos multidimensionais
Consultas que fornecem dados a respeito de
medidas
de desempenho, decompostas por uma ou mais
dimensões
Cubo é a estrutura operacional para armazenar os dados
Computa todas ou parte os valores de todos os relacionamentos para todas as dimensões
As células do cubo contém valores mensuráveis e as bordas definem os possíveis tipos de visões
Podem existir mais que três dimensões no negócio (hipercubo)
Quase todos os tipos de dados podem ser representados como um cubo de dados
BD Multidimensional é a estrutura operacional para armazenar os dados
Computa todas ou parte os valores de todos os relacionamentos para todas as dimensões
PASSOS:
Gerar as agregações para
todos
os agrupamentos possíveis
Carregar cubo
Ler os dados do DM (provável origem)
Arquiteturas
ROLAP (Relational OLAP)
Próprio para grandes volumes de dados e necessidade de dados detalhados
Recomendado quando os usuários não sabem exatamente o que vão perguntar ao longo do tempo
Não consegue realizar operações complexas
Menor performance
Utiliza a estrutura de banco de dados relacional para armazenar "cubos" e agregações
Cubos gerados dinamicamente
Baseado em visões materializadas
HOLAP (Hybrid OLAP)
O acesso aos dados é mais rápido do que na tecnologia ROLAP
Contém dados pré-calculados, considerando todas as possíveis respostas para um dado conjunto de questões
Combina características do ROLAP e MOLAP
Os dados detalhados são armazenados em banco de dados relacional
As agregações são armazenados em banco de dados multidimensional
Algumas alterações levam à necessidade de reprocessar as agregações
MOLAP (Multidimensional OLAP)
As agregações são armazenadas dentro da estrutura multidimensional do banco de dados
Estrutura proprietária baseada em vetores multidimencionais
Algumas alterações levam à necessidade de reprocessar o cubo
Contém dados pré-calculados, considerando todas as possíveis respostas para um dado conjunto de questões
Excelente performance
Os cubos podem ficar muito grandes à medida que novas dimensões e dados detalhados são acrescentados
Alto consumo de espaço
DOLAP (Desktop OLAP)
Permite baixar um hipercubo para utilização off-line
Excelente performance
Acesso somente local
Indicado para mobile BI
Restrito em operações e com alto nível de agregações
Sem acesso a dados detalhados
Operações
DRILL-DOWN
Abertura dos dados em grânulos menores
SLICE
Recorte dos dados
Pode ocorrer por meio de uma ou mais dimensões
ROLL-UP
Agregação de dados
Pode envolver uma ou mais dimensões
PIVOT
Rotação de dados
DRILL-THROUGHT
Retorna aos dados contidos nas relações
DRILL-ACROSS
Acesso a outro cubo por meio da(s)
conformed dimensions
Dependentes
Vantagens
Reuso de dados
Dados com qualidade
Desvantagens
Tempo maior de desenvolvimento
Visualização
Como transformar a montanha de dados em algo útil para as pessoas?
Visão Humana
Um dos sentidos
+ importantes
, embora seja o
+ lento
Caracteríticas
Processamento paralelo e pré-atentivo
Inata capacidade de reconhecimento de padrões
Estende a capacidade cognitiva e memória
Pessoas tendem a pensar visualmente
Processo biológico químico-elétrico que mensura uma energia física que nos rodeia
Permite perceber formas de objetos e seu arranjo no mundo
Analisada em detalhes
Neurociência, mas nem sempre foi assim
Psicologia cognitiva
História
(450 A) Teoria de Intromissão
Demócrito sugeriu que pequenas partículas (átomos) emanavam dos objetos aos nossos olhos
Tais partículas retinham as características dos objetos
Teoria da Extramissão
Platão sugeriu que nossos olhos emanavam uma energia que capturava o mundo ao seu redor
(1038 DC)Teoria da Luz Intromissão
Discussão sobre percepção humana retomada pelo árabes
Abu Ali-Hasan discorda das teorias gregas e passa a
enfatizar a luz
como maior ingrediente da visão
Sugere...
Não olhamos passivamente o mundo ao nosso redor
Cena muda conforme movemos os olhos e inspecionamos certos objetos em detrimento de outros
Visualização de dados
Fornecer representações visuais
interativas
que favoreçam análise complexa de dados e amplifique a cognição
Combina o melhor de dois mundos
Recursos computacionais
Distinção semântica inata humana
Natureza multidisciplinar
Psicologia cognitiva, computação gráfica, HCI
Ciência da Computação, Matemática
Propósito
NÃO
é criar figuras ou gráficos
SIM
: Impulsionar o processo cognitivo
Proporcionar
insights
(Explicações, descoberta, ...)
Formar uma imagem sobre algo
Internalizar a compreensão sobre algo
DATA VISUALIZATION
Enfoca dados com estrutura implícita, como Imagem médica, Mapas, Grafos...
INFORMATION VISUALIZATION
Enfoca dados sem estrutura inerte, como clientes, notas Fiscais....
Algumas aplicações
Agricultura (agricultura de precisão)
Engenharia de software
Geografia e história
Banco de dados
Diagnósticos médicos
Administração de redes e cloud computing
Mercado financeiro
Educação
Desafios
Escalabilidade para grandes conjuntos de dados
Área de video é limitada
Ser humano possui um limite físico na interpretação visual
Diferentes tipos de dados
Cada qual requer técnicas distintas
Avaliação
Como provar que uma visualização é melhor?
Pessoas com diferentes características
Cognição Humana e seus sistemas
Cognição é o resultado de cooperação e influência mútua
Sistema percepção pessoal
Sistema analítico
Processamento Inicial de Visão
Estrutura eficiente e autônoma captura estímulos
Estímulos de acordo com primitivos visuais
Somos inconscientes a esse trabalho
Certas primitivas "saltam aos olhos"
Denominadas
Primitivas Pré-Atentivas
Mesmo quando estão em regiões periféricas aos olhos
Processamento Org. Elementos
Percebemos o mundo conectado no espaço e tempo
Capturamos as primitivas de modo segmentado
Sistema visual
Determina contornos, linhas, superfícies, cores, etc...
Utiliza nossa memória de trabalho
Organiza as primitivas nas estruturas correspondentes
Somos inconscientes a esse trabalho
GESTALT
Simmetry
Remete a ideia de proporcionalidade e arranjo simétrico entre elementos. Assimetria nos causa uma ideia negativa de "algo errado, desconexo, esquisito"
Figure/Ground
Tendemos a separar a figura do seu fundo dependendo do contraste, cor, tamanho, etc
Proximity
Objetos ou formas próximas uma das outras é percebido como um grupo
Good continuation
Tendência instintiva de seguir naturalmente trajetórias até o ponto final
Similarity
Objetos distintos saltam aos olhos
Objetos com similaridade de formas, cor, tamanho ou textura são percebidos juntos
Closure
Para um objeto familiar, nosso cérebro completa os detalhes ausente
Refere-se a maneira como seres humanos observam grupos de objetos
Vemos o todo antes de partes individuais
Teoria que delineia que certo arranjo visual de elementos é mais coerente e comunicará melhor
Válida para apresentação visual, fotos, Web Design, Visualizações, etc.
Desenvolvida na década de 20 (Alemanha, Áustria)
Fundadores Max Wertheimer, Wolfgang Kohler e Kurt Koffka
Charge Blindness
Fenômeno que ocorre quando uma pessoa não detecta mudanças visuais no ambiente
Olhar
para algo é diferente de
prestar atenção ativa
para algo
Ocorre devido a
Mudanças muito rápidas de cena (motor, cinema)
Mudanças muito lentas de cena
Observador presta atenção em certo aspecto e não em outros
Processamento atentivo
Atividade mental de direcionamento de recursos cognitivos
Recursos cognitivos são escassos
Capacidade analítica, memória de longo prazo
Atividade pode ser
ativada por controle exógenos
Direcionamento voluntário
Interferência do conhecimento
Busca por padrão ou relacionamento compatível com uma tarefa
Agente humano utiliza visualização com um propósito
Projeto de visualizações
Como preencher o espaço de dados? Qualquer visualização "bunitinha" serve?
Basta ficar atento às características do Sistema de percepção visual humano
Visualização exige um projeto
Abordagem top-down
Valide a(s) visualização(ões) com o usuário
Escolha os componentes mais adequados
Compreenda o problema a ser resolvido
Refina o projeto na camada (ou camadas) necessárias
Caracterização do problema
Entenda como as pessoas make sense sobre algo
Similaridade de valores? Correlação por linha? Comparação por categoria?
Make sense
Processo de
como construo o entendimento
sobre algo
Processo ativo de buscar e interpretar
É individual e subjetivo
Compreender as estruturas conceituais
Exemplos de Domínios e Estruturas
Direito
Eventos
Pessoas
Cronologia dos eventos
Diagnóstico médico
Paciente
Eventos
Cronologia dos eventos
Padrão das enfermidades
Avaliação da Qualidade de Dados
Padrão
Variantes dos defeitos
Cada domínio possui uma estrutura que influencia as conceituações geradas pelos indivíduos
Compreenda o perfil do seu grupo de usuários
Descreve suas características gerais
Cada usuário possui habilidades e expectativas distintas
Determine requisitos relativos a
Familiaridade com visualizações
Nível de Acuracidade dos dados codificados
Capturando requisitos
Existe sempre uma tensão natural de
Como um computador pode implementar
Como o indivíduo pensa
Saber ouvir é uma arte e organizar tudo que ouviu é outra
Designing for appropriation
Tecnologia deve prover suporte e não controle aos indivíduos
Nunca antecipar soluções tecnológicas
Permitir indivíduos expressar a representação do domínio do problema
Entrevistas
Encontros planejados com os usuários
Quem?
Quando?
Em que local?
Por quanto tempo?
Intuito?
Condução
Evite questões gerais e de alto nível
Prefira questões que revelem detalhes sobre aspectos concretos
O que acontece quando....
Fale-me sobre como faz para....
Nunca aplicar perguntas que sugerem certa resposta
Como registrar e o que gerar?
Áudio, vídeo (se permitido)
Esboços, resumos de pontos chave, etc.
Inquérito Contextual (Similar a Etnografia)
Levantamento ocorre no local de trabalho do usuário
Observação das atividades (O que? Por quê? Como?)
Questionamentos (Minorar interrupções)
Condução
Envolve uma equipe de inquérito
Novamente, utilize questões concretas e não generalidades
Desafio de manter o usuário trabalhando de modo natural
Como registrar e o que gerar?
Video é muito bem vindo!
Fluxo de evento, Influência do Ambiente, Responsabilidades, etc.
Design de operações/dados
Passo 1: Determinar as abstrações visuais alinhadas a caracterização
Caso1: Correlações da evolução de instâncias temporais (Times series)
Caso 2: Planejar uma viagem
Elementos críticos: Orientação, localização e distância
Caso 3: Análise de relacionamentos em redes sociais
Elementos críticos: relacionamentos N:N, complexos
Passo 2: Abstrair seus dados em tipos genéricos
Caso 1: Correlação da evolução de instâncias temporais de certo atributo categórico de grande domínio
Caso 2: Análise de muitos relacionamentos hierarquizados
Design das codificações/interações
Passo 1: Mapear atributos para primitivas visuais
Passo 2: Definir as técnicas de interação
Crie a visualização (algoritmo)
Passo 1: Identifique pacotes que atendam as suas necessidades
Avalie com cuidado requisitos funcionais (codificação, interações)
Avalie com mais cuidado requisitos não-funcionais (escalabilidade, maturidade do pacote, facilidade de instalação e disponibilização, etc)
Passo 2: Implemente suas visualização
Crie sua visualização do Zero
Faça uma extensão sobre pacotes existentes
Resumo
Visualizações devem alavancar a percepção dos dados
Qualquer visualização pode prejudicar a análise
Importante considerar aspectos da percepção visual humana
O design de uma visualização é muito distinto de um interface visual de um software padrão
Usabilidade é uma pequena porção
Participação e avaliação dos usuários é mandatória