Please enable JavaScript.
Coggle requires JavaScript to display documents.
Desempenho Computacional - Coggle Diagram
Desempenho Computacional
Lei de Amdahl
Conclusões
Speedup limitado
Código precisa ser paralelizável
Benefícios
Servidores mantém conexões com vários processadores
Banco de dados divididos em tarefas paralelas
Condições ideais
Nem todos os códigos paralelizados escalam com o num de núcleos
Subtarefas de tamanhos diferentes (prog princ.)
Maior o impacto do gargalo no barramento (mais tarefas em paralelo)
+nucleos = +sobrecarga
Maior demanda sobre dispositivos de E/S
Aumento do Desempenho Computacional
Balanço do Desempenho
Componentes não evoluem igualmente (equilíbrio é a chave)
Gargalo do Barramento Principal
Melhoria da interface DRAM
Redução da frequência de acesso a memória
Barramento de dados mais largo
Aumento da largura de banda CPU-DRAM (+freq +num bits)
Gargalo dispositivos Entrada/Saída
Barramentos de interconexão de maior velocidade
Estruturas de barramento mais elaboradas
Buffering (armaz. temp.)
Configurações de processador múltiplo
Caching
Melhorias na organização e arquitetura do chip
Aumentar tamanho e velocidade das caches
Mudar organização e arquitetura do processador
Aumento de paralelismo
Mais Instructions per Clock
Aumentar velocidade de hardware do processador
Encolhimento de transistores/portas lógicas
+portas = +taxas de clock
Problemas
Atraso de Transmissão (aumento de RC)
Memória mais lenta
Dissipação de calor
Diminuição chegando aos limites físicos
Velocidade do microprocessador
Manter ocupado a maior parte do tempo
Pipelining (linha de montagem)
Execução superescalar(mais de uma instrução)
Previsão de desvio (antecipa o código)
Análise do fluxo de dados(lista otimizada de instruções)
Execução especulativa(previsão de desvio + anáise de fluxo)
Medidas básicas de desempenho do computador
Principais parâmetros
Desempenho
Consumo de energia
Custo
Confiabilidade
Tamanho
Segurança
Comparações de desempenho
Linguagem de programação escolhida
Conjunto de instruções
Habilidade da programação
Velocidade bruta do processador
Clock do Sistema
Controla operações
Decodifica
Busca
Load e store
Requer vários ciclos por instrução