Please enable JavaScript.

Coggle requires JavaScript to display documents.

12 - Aprendizado de Máquina (Machine Learning) - Coggle Diagram

- - - - Além de diminuir a variância do modelo, essa regularização (Lasso (L1)) tem uma outra importante aplicação em aprendizado de máquina: quando há múltiplas variáveis altamente correlacionadas (ou seja, que se comportam da mesma maneira) essa regularização seleciona apenas uma dessas variáveis e zera os coeficientes das outras.
  - - - Também chamado de Aumento/Expansão de Dados, essa técnica envolve a geração artificial de dados de treinamento adicionais aplicando transformações aleatórias aos dados de treinamento existentes. Isso ajuda a melhorar a generalização e reduzir o risco de overfitting.
- - - - A seleção de variáveis tem como objetivo descobrir um subconjunto de variáveis relevantes para
        uma tarefa
      - Há também casos em que existe correlação, mas não existe causalidade, isto é, os dados indicam
        que apartamentos anunciados em quartas-feiras possuem um valor maior.
      - Método Filter
        
        Usa a estatística para avaliar a importância dos recursos e selecionar os recursos mais relevantes na construção do modelo preditivo.
      - Método Wrapper
      - Método Embedded
    - - Trata-se de uma técnica utilizada para fatorar a matriz original em outras menores a fim de encontrar o melhor subconjunto de dados com a menor dimensionalidade que seja capaz de representar a matriz original.
      - O ponto aqui foi apenas demonstrar duas coisas: (1) não só é possível como também é comum armazenar dados sobre variáveis de um modelo em formato de matrizes; (2) é possível encontrar dependências e relacionamentos entre linhas e colunas de uma matriz
      - A vantagem é que matrizes são estruturas que podem ser manipuladas por meio de técnicas de
        álgebra linear para terem sua dimensionalidade reduzida
      - A fatorização de matrizes busca fazer um procedimento semelhante, isto é, representar uma matriz de alta dimensionalidade como o produto entre matrizes de baixa dimensionalidade
      - Sistema de Recomendação
        
        Trata-se de um algoritmo que faz previsões sobre os interesses de um usuário. Usa-se dados históricos e dados de itens específicos para fazer recomendações. O objetivo é fornecer recomendações personalizdas e relevantes aos usuários.
        
        a fatoração de matrizes é a principal base para criação de sistemas de recomendação
        
        Existem três modelos de sistemas de recomendação: (1) baseado em filtragem colaborativa; (2) baseado em conteúdo; e (3) híbrido. No primeiro modelo, os algoritmos usam aprendizado de máquina para prever seus gostos com base em usuários que têm perfis similares. Por exemplo: suponha que João ouve com frequência em um serviço de streaming de músicas as bandas Pink Floyd, Metallica e Blind Guardian.
    - - A técnica de redução de dimensionalidade (PCA) permite transformar dados que inicialmente pertencem a um espaço de dimensão n em um espaço de dimensão m, em que m < n, sendo utilizada, por exemplo, para reduzir a dimensionalidade de certo conjunto de dados através do descarte de características não úteis e que ainda permita realizar o reconhecimento de padrões