Pode ser definido por um sistema que recebe uma certa quantidade de dados, e a partir destes, tenta, imitando o modelo humano de aprendizado, chegar á uma variável, utilizando da experiência, e assim se baseando numa padronização ao identificar certas situações, para resolver funções e atingir sua melhor performance.
Se divide, com destaque, em três categorias:
Aprendizado supervisionado: Modo em que o sistema já tem parcialmente a resposta da função proposta, mas pede que a máquina desenvolva a partir dos dados fornecidos inicialmente, uma padronização inspirada em tais variantes, levando a um resultado correto. Divide-se em:
Regressão- o sistema recebe informações necessárias para fornecer uma variante que não necessariamente estará em situação de ser classificada, mas sim, será um quantitativo de acordo com estatísticas, numa relação entre duas variantes.
-
-
Classificação- o sistema divide as informações em variáveis categóricas, de acordo com o padrão que os dados fornecem e com o que é requisitado como resposta correta.
Neste exemplo, o sistema classifica as variantes de acordo com o previsto (cada fruta em um grupamento)
Comparativo entre um sistema de classificação e de regressão. Enquanto o de regressão tem como objetivo apresentar números, o de classificação tenta alcançar uma identificação programada.
Não Supervisionado: Sistema no qual não há a tentativa de atingir uma tal variante, ao contrário do supervisionado. Ele procura atingir diferentes níveis de padronização e informação, de acordo com os dados fornecidos. Ou seja, não é fornecida a “resposta correta” a máquina, mas os dados para que hajam diversas possibilidades de classificação ou resultados.
Neste exemplo, enquanto no aprendizado supervisionado existem variantes a serem alcançadas ou classificadas de um modo, no não supervisionado classifica ou alcança divisões feitas sem que precise ser alcançada uma expectativa delimitada.
Neste exemplo, enquanto no aprendizado supervisionado existem variantes a serem alcançadas ou classificadas de um modo, no não supervisionado classifica ou alcança divisões feitas sem que precise ser alcançada uma expectativa delimitada.
Aprendizagem por reforço:
Este modelo se dá pela geração de estímulos a partir da causa e consequência de uma ação. Ao realizar um processo, caso recompensada, a máquina recolherá as informações, e caso receba um impulso negativo, computará como um caminho a não ser seguido novamente, deletando a ação.
A imagem apresenta uma ideia de jogo. O Player terá que explorar os diferentes caminhos até entender qual é o correto, através de recompensas (como mais uma vida ou outro prêmio), ou através de estímulos negativos.
No adestramento de um cão, ele aprende o que deve ou não ser feito, através de recompensas ou punições.