Please enable JavaScript.

Coggle requires JavaScript to display documents.

HASHING - Coggle Diagram

- - - - Exemplo: se U = {1, 2, 3, 4, 5, 6, 7, 8, 9}, então S = {2, 3, 5, 7} é representado pela string de bits 011010100.
      - Esta forma de representação de conjuntos permite implementar as operações de conjunto padrão muito rápido, mas à custa de potencialmente usar um grande quantidade de armazenamento.
- - - - Em geral, a eficiência da busca depende dos comprimentos das listas vinculadas, que, por sua vez, dependem do tamanho do dicionário e da tabela, bem como da qualidade da função hash. Se a função hash distribuir n chaves entre m células do
        tabela de hash aproximadamente uniformemente, cada lista terá cerca de n/m chaves de comprimento. A razão α = n/m,
        chamado de fator de carga da tabela de hash, desempenha um papel crucial na eficiência do hash.
        
        Em particular, o número médio de ponteiros (links de cadeia) inspecionados em pesquisas bem-sucedidas, S, e pesquisas mal sucedidas, U, é:
        
        S = 1 + a/2, sendo a = U
        
        Normalmente, queremos que o fator de carga não esteja longe de 1. Se for muito pequeno implicaria muitas listas vazias e, portanto, uso ineficiente do espaço. No entanto, se for muito
        grande significaria listas vinculadas mais longas e, portanto, tempos de pesquisa mais longos.
        
        Se tivermos o fator de carga em torno de 1, temos um esquema incrivelmente eficiente que possibilita a busca de uma determinada chave, em média, pelo preço de uma ou
        duas comparações.
        
        As inserções são normalmente feitas no final de uma lista.
        
        1 more item...
  - - - Isso implica que o tamanho da tabela m deve ser pelo menos tão
        grande quanto o número de chaves n.
        
        Diferentes estratégias podem ser empregadas para a
        resolução da colisão.
        
        O mais simples - chamado de sondagem linear - verifica a célula seguinte àquela em que ocorre a colisão. Se essa célula estiver vazia, a nova chave será instalada lá. Se a próxima célula já estiver ocupada, a disponibilidade do sucessor imediato dessa célula é verificado, e assim por diante.
        
        Se o final da hash table for atingido, a pesquisa é encapsulada no início da tabela; ou seja, é tratada como um array circular.
        
        Embora as operações de busca e inserção sejam diretas para closed hashing, a exclusão não é.
        
        Uma solução simples é usar a “exclusão preguiçosa”, ou seja, marcar locais anteriormente ocupados com um símbolo para distinguí-los de locais que não foram ocupados.
        
        1 more item...
        
        Uma das estratégias mais importantes é o double hashing.
        
        O double hashing é superior à sondagem linear. Mas seu desempenho também se deteriora quando a tabela fica perto de estar cheia.
        
        Uma solução natural em tal situação é refazer: o tabela atual é verificada e todas as suas chaves são realocadas em uma tabela maior.
- - - - Eles variam de um uso não sofisticado de arrays (classificados ou não) a técnicas muito mais sofisticadas, como hashing e árvores de pesquisa balanceada.