Please enable JavaScript.
Coggle requires JavaScript to display documents.
Desempenho computacional (Clock do sistema (A velocidade de clock é…
Desempenho computacional
MULTICORE, MIC
s E GPGPU
s
GPGPU:
Usa a GPU para outros fins além da computação gráfica.
MIC:
muitos cores integrados
AVALIAÇÃO DE DESEMPENHO
Comparação de desempenho são difíceis
Conjunto de instruções;
Escolha da linguagem de programação;
Velocidade bruta do processador;
Habilidade da programação;
Comparação de desempenho são difíceis
Principais parâmetros:
custo
tamanho
Desempenho
segurança
confiabilidade
Projetando Visando ao desempenho
Balanço do desempenho:
Lugar crítico: interface processador-barramento-memória.
Técnicas:
Redução da frequência de acesso a memória usando caches.
Melhoria da interface da DRAM
Barramento de dados mais largo
Os componentes do computador não evoluíram nas mesmas taxas
Tem a necessidade de procurar o equilíbrio do desempenho.
é preciso cuidar do problema do fluxo de dados para dentro e fora do computador via dispositivo de E/S.
Algumas soluções:
Caching
Buffering
Barramentos de interconexão de maior velocidade
Estruturas de barramentos mais elaborados
Configurações de processador múltip
A palavra chave é: EQUILÏBRIO
Melhorias na organização e na arquitetura do chip:
Mudar organização e arquitetura do processador
Aumenta a velocidade efetiva da execução da instrução.
isso envolve o uso do paralelismo de uma forma ou de outra.
Aumentar tamanho e velocidade das caches
tempo de acesso à cache caem significamente.
Dedicando parte do chip do processador
Aumentar a velocidade de hardware do processador:
Mais partes, reunidas mais parto, aumentando a taxa de clock.
Redução no tempo de propagação dos sinais.
o fator dominante nos ganhos de desempenho tem sido em aumentos na velocidade do clock e densidade lógica.
à medida que a velocidade do clock e a densidade lógica aumentam, diversos obstáculos tornam-se mais significativos:
Atraso de RC:
À medida que os componentes no chip diminuem de tamanho,as interconexões de fios tornam-se mais finas, aumentando a resistência.
os fios estão mais próximos, aumentando a capacitância,
Latência e taxa de transferência da memória:
a velocidade de acesso à memória e a taxa de transferência limitam as velocidades do processador.
Potência:
medida que a densidade da lógica e a velocidade do chip em um clock aumentam, também aumenta a densidade de potência
velocidade do microprocessador:
as técnicas evoluíram mas as bases, não.
Técnicas:
Previsão de desvio:
tentar antecipar as próximas instruções.
Execução superescalar:
Mais de uma instrução por ciclo de clock. Pipelines paralelos
Pipelining:
conceito de “”Linha de montagem” no processamento das instruções
Execução especulativa:
baseado nas técnicas acima, executar antecipadamente instruções potencialmente necessárias
Análise do fluxo de dados:
reordenação de instruções visando a otimização.
Clock do sistema
A velocidade de clock é medida em Hz.
Pipelining gera execução simultânea de instruções.
O computador é uma máquina síncrona
Velocidade de clock não é tudo.
Lei de Amdahl
speedup é limitado
Dependente da tarefa
Bancos de dados podem ser divididos em tarefas paralelas.
Servidores ganham mantendo múltiplas conexões em múltiplos processadores.
Código precisa ser paralelizável