Please enable JavaScript.

Coggle requires JavaScript to display documents.

Arquivos de registro Primários - Coggle Diagram

- - - - condição de pesquisa precisa ser uma igualdade em um campo denominado campo de hash
      - comumente só precisa de um acesso único de bloco para recuperar o registtro
      - Oferece acesso mais o rápido possível para se recuperar um registro qualquer dado o valor de seu campo de hash
  - - - gera endereçõ do bloco de disco em que o registro será arqmazenado
  - - - h(k) = K mod M
        
        Objetivo de uma boa função de hashing é distribuir os registros de maneira uniforme pelo espaço de endereços de modo a dinamização as colisões enquanto não deixam muitos locais não usados (espaço desperdiçado)
        
        Estudos mostraram que é melhor manter uma tabela de hash entre 70 e 90 por cento cheia, com isso evitando desperdício e muitas colisões
        
        Quando a função hash com Mod é utilizada, comumente é melhor escolher um número primo de endereços possíveis, pois ocorre melhor distribuição dos endereços de hash.
        Obs: outras funções por exemplo podem exigir que M (locais) seja uma potencia de 2.
        
        onde:
        
        intervalo de índice do array vai de 0 a M-1 (M Slots)
        
        endereços correspondem aos índices de array
        
        função hash transforma o valor de campo de hash em um inteiro entre 0 e M-1
        
        função h(K) retorna o resto de um valor de capo de hash inteiro k após a divisão por M
        
        esse valor é usado para o endereço de registro
  - - - bloco de disco ou um cluster de blocos de disco contíguos
    - - Busca por um registro dado um valor de algum campo diferente do campo de hash é tao dispendiosa quanto num arquivo desordenado.
      - Exclusão
        
        processo
        
        remoção do registor do seu bucket
        
        caso possua cadeia overflow
        
        pode-se mover um dos registro de overflow par o bucket substituir o registro excluido (aproveitamento de espaço)
        
        se o registro excluido ja estiver em overflow o removemos da lista liga
      - modificação
        
        depende de
        
        condição de pesquisa
        
        comparação de igualdade no campo hash
        
        localizacao eficiente
        
        não igualdade
        
        busca linear
        
        campo hash
        
        não
        
        pode ser modificado e regravação pode ocorrer no mesmo bucket
        
        sim
        
        registro pode ser movido para outro bucket
        
        exclusão do registro antigo
        
        inserção do registro modificado
    - - Expansão com hashing extensĩvel
        
        valor de "d" pode ser aumentado ou diminuido de um a cada vez que ocorre "estouro" ou "redução"
        
        reduza pela metade o numero de entradas no array
        
        ocorre se d>d' para todos os buckets (apos ocorrencia de exclusões)
        
        aumenta 2 vezes (dobra)
        
        Estouro: caso um bucket cuja projundidade local d' seja igual a profundidade global d,
        
        divisão do bucker
        
        nova inserção causa overflow (novo bit de divisão é relacionado ao bucket)
        
        exexmplo: overflow no bucket com valores iniciando com 01
        
        com ocorrencia do estouro dois novos buckets serão criados
        
        2 more items...
        
        novos valores iniciados em 01 serão direcionados para um destes dois buckets
        
        profundidade de d' aumentou de 1 valor
        
        Operações
        
        busca
        
        maioria das recuperações exige dois acessos de bloco
        
        um para o diretorio
        
        outro para o bucket
        
        Principais vantagens
        
        1 - desempenho do arquivo não degrada enquanto arquivo cresce (ao contrario do hashing estático, onde as colisões aumentam e o encadeamento corresponde a um aumento médio de acesso por chave)
        
        2 - Nenhum espaçõ é alocado para crescimento futuro (ocorrendo de maneira dinâmica conforme necessidade)
        
        3 - tamanho máximo do diretório é de 2K (onde k é o número de bits no valor de hash)
        
        4 - divisão causa apenas uma pequena reorganização
        
        desvantagem
        
        diretório precisa ser pesquisado antes do acesso aos buckets resultando em 2 acessos
        
        penalidade considerada pequena
        
        Esquema é tido como bastante desejável para arquivos dinâmicos
        
        Hashing dinâmico foi utilizado de modo precusor ao extensĩvel
        
        ver figura 17.12
        
        Hashing Linear
        
        objetivo:
        
        permitir que um aquivo de hash explanda e encolha seu número de bucketes dinamicamente sem precisar de um diretório
        
        criação de buckets de forma linear
        
        novas colisões levam a registros de overflow dividindo buckets na órdem linear
        
        funções
        
        função(k) = K mod M
        
        função i+1(k) = K mod2M
        
        função i+2 (k) = K mod 4M e assim por diante
        
        Incluir - Figura 17,11
      - estático
        
        overflow
        
        quando um bucket está cheio até sua capacidade e um novo registro a ser inserido tem um hash para esse bucket
        
        um ponteiro é mantido em cada bucket para uma lista ligad de registros de overflow
        
        os ponteiros ligados na lista devem ser ponteiros de registro que incluem
        
        posição de registro relativa ao bloco
        
        endereco de bloco
- - - - o postgres utiliza esse formato como padrão?
  - - - 1 - ultimo bloco de disco do arquivo é copiado para buffer
      - 2 -novo registro é acrescentado
      - 3 - bloco é regravado no disco
  - - - quando na busca apenas um único registro satisfizer os critérios de pesquisa
        
        custo b/2 (metade dos blocos)
        
        resultará em média na busca de metade dos blocos de arquivo
      - quando vários registros satisfizerem a condição de pesquisa
        
        programa deve ler e pesquisar todos os blocos do arquivo
  - - - Exclusão do registro no bloco sem reaproveitamento de espaço (desperdício de espaço nos blocos)
        
        3 - regravar o blloco no disco
        
        Problema
        
        isso deixa espaço livre no bloco do disco
        
        exclusão de muitos registros = espaço desperdiçado
        
        1 - Encontrar o bloco e copiálo para o buffer
        
        2 - excluir registro do buffer
      - técnica do bit extra (marcador de exclusão)
        
        b) valor diferente no marcador indica registro válido
        
        a) macador de exclusão possui valor predefinido
        
        programas de pesquisa consideram apenas valores válidos
      - Usar espaço dos registros excluídos para inserir novos registros
        
        exige manutençao extra para controle/informações sobre os locais vazios
- - - - ex: B blocos numerados de 1 até b; os registros ordenados por valor crescente do campo chave
        
        estamos buscando pelo registro de campo chave = K
        
        supondo endereços de disco dos blocos disponíveis no cabecalhoh do arquivo
        
        pesquisa binária acesssa log2(b) blocos não importando se o registro foi localizado ou não
        
        melhoria em relação as pesquisas lineares
        
        media nas pesquisas lineares é de (b/2) quando registro é encontrado e b/1 quando registro não é encontrado (ou até mesmo para múltiplos registros a serem encontrados)
  - - - Otimizada /eficiente para campos ordenados /chave de ordenação
        
        blocos podem ser lidos consecutivamente
        
        pode usar buffering duplo
      - Indiferente (sem vantages) para outros campos não ordenados
      - processo (ver algoritmo)
    - - operação dispendiosa
        
        deve gerenciar ordenação
      - processo
        
        a) encontrar posição correta
        
        b) criar espaõ no aquivo para inserir registro na posição adequada
      - Em arquivos muito grandes pode ocasionar em grande processamento pois na média metade dos blocos podem ser movidos, ocasionando leitura de metade dos blocos e regravação destes
      - Processos alternativos
        
        Opção mais eficiente (porém paliativa)
        
        problema reaparece quando espaços vazios são preenchidos/utilizados
        
        Manter espaçõ não usado em cada bloco para novos registros
        
        criação de arquivo não ordenado temporário
        
        denominado arquivo de overflow ou transação (arquivo principal é denominado mestre)
        
        novos registros são inclusos no final do arquivo de overflow
        
        Em alguns momentos arquivo de overflow é classificado e mesclado ao arquivo mestre durante reorganização do arquivo
        
        Benefício: Inserção eficiente
        
        Problema: maior complexidade no algoritmo de pesquisa
        
        arquivo overflow precisa de pesquisa linear caso pesquisa binária não localize registro no arquivo principal
    - - operação dispendiosa
        
        deve gerenciar ordenação
      - processo
        
        processo menos grave quando utilizados os marcadores de exclusão e reorganização periódica.
    - - processo
        
        busca do registro
        
        caso envolva o campo-chave comumente busca binária
        
        caso não envolva campo-chave será busca linear
        
        mudança
        
        campo não ordenado
        
        alter registro e grava no mesmo local físico (Considerando registros de tamanho fixo)
        
        campo ordenado
        
        registro pode alterar posição no arquivo
        
        requer
        
        exclusão do registsro antigo
        
        inserção do registro modificado
  - - - melhora o tempo de acesso aleatório ao campo-chave de ordenação
      - se o atributo de ordenação não for uma chave o arquivo é denominado de arquivo agrupado.
- - - - varredura sequencial (pesquisa linear)
        
        b/2
    - - Varredura sequencial (pesquisa linear)
        
        b/2
      - pesquisa binária
        
        log2(b)