Please enable JavaScript.
Coggle requires JavaScript to display documents.
Modulo 6 - Model Performance - Coggle Diagram
Modulo 6 - Model Performance
Data Model Performance
Pontos Importantes
aplicação do datatype correto
Remover linhas e colunas desnecessarias
Evitar valores repetidos
Alterar colunas numéricas para métricas
Reduzir cardinalidades
Sumarizar dados onde possível
Analisar o modelo de dados
Variaveis no DAX
uso de variável pode reduz o tempo de processamento, pois executará a formula apenas uma vez
Readability - Dá um nome auto explicativo para a formula executada
Simplifica o debugin
Reduz a complexidade da formula
Performance Analyzer
Analisa a performance durante a execução do rrelatório pelo usuário
Visual Cache: necessário criar uma página em branco fechar e abrir novamente o Powerr BI Desktop para limpar o cache
Data Engine Cache: reiniciar o Power Bi ou no DAX Studio em Data Model clicar em Clear Cache
Dax Studio: Outra ferramenta free que ajuda na analise de performance
Analysing Data
Column Quality: porcentagem de dados válidos, com erro ou vázios. Investigar se dados válidos não for 100%
Column Distribution: mostra a qtde de valores distintos e únicos. Ajuda a identificar a cardinalidade
Column Profile: mais detalahado, mostra a estatiscia da columa.
Por default, utiliza apenas 1000 registro para analisar os dados, mas pode mudar para usar todo o dataset
Os dados são comprimidos e armazenados em storage VertiPaq
As colunas de relacionamento devem ter o mesmo datatype, sendo que numerico é mais performatico que texto
Uma tecnica muito efetiva para redução de dataset é criar uma tabela sumarizada, mas perde-se os detalhes
Auto-Date feature
Habilitado por padrão
pode ser gargalo de performance
cria uma tabela de datetime escondida
usado para o time intelligence
se tiver uma dimensão de data, não precisa ser habilitada
pode ser desabilitada para todos os arquivos do Power BI ou apneas para um
DirectQuery Performance
DirectQuery
Conecta direto na origem
Cada usuário envia a query para ser executada na origem
A performance depende da origem
Latencia da rede influencia na performance
performance do servidor origem influencia no relatório
Benefícios do DirecQuery
Dados near real time
pode consumer grande volume de dados sem a necessidade de tabela agregada
A segurança dos dados é feita na origem
pode ser utilizada uma origem multidimensional
Comportamento
somente a estrutura é carregada, nenhum dado é carregado
os dados precisam ser "atualizados" para refletir a realidade devido ao cache
Ao publicar o relatório, será criado um dataset sem dados no Portal
Sempre que abrir o relatório no Portal, queries serão enviadas para a origem
ao criar uma visão no dashboard, os dados serão atualizados de acordo com o schedule, que irá disparar as queries na origem
Limitações:
Performance depende muito da performance da origem
A segurança fica por parte da origem, no Power BI todos poderão ver os dados
Algumas transformações não poderão ser aplicadas, muitas vezes deverão ser realizadas na origem, por exemplo no SAP
Algumas funcionalidades de modelagem não estarão disponíveis
Quick Insight e Q&A não são suportados no Portal
Query Redution Option
Reduce number of queries sent by
Slicers - By default, the Instantly apply slicer changes
Filters - By default, the Instantly apply basic filter changes
Aggregations
Introdução
melhor performance
fica em cache
usa pouco recursos
melhora a resposta do refresh
reduz e mantem o tamanho do modelo
Criação
Definir o grão
a agregação pode ser criada na query de extração de dados da origem
a agregação pode ser criada em uma view na origem