Please enable JavaScript.
Coggle requires JavaScript to display documents.
Learning: Identification Trees, Disorder - Coggle Diagram
- Learning: Identification Trees, Disorder
-
problema
-
- Algumas características não importam
- Algumas características importam, mas só em parte do tempo
- Cost, algumas tem um custo de memória muito grande, como é o caso da sobra
The objective is to build the smallest tree possible (to reduce costs and computation) and because the simplest explanation is always the best.
Identification tree
tree boa
custo baixo, a small tree
tree
-
-
deixar o data bem homogêneo para verificar o que está certo ou não, entretanto, com uma base muito grande é muito difícil homogenizar tudo
usamos porque é algo parece funcionar, todas as curvas parecem ser a mesma coisa, o que precisamos entender é que:
-
Isso mostra como a gente mensura a disordem dos conjuntos (sets) mas a gente quer mensurar a qualidade do teste geral
como mensuramos a qualidade da qualidade do teste?
não é pela matemática, mas sim pela intuição. Ou seja, qual o melhor teste que deixa tudo mais homogêneo
-
so if half of the samples go down a branch, and if that branch has a certain disorder, then we're going to multiply that disorder times 1/2
então, se metade das amostras descer por um galho, e se esse galho tiver uma certa desordem, então vamos multiplicar essa desordem vezes 1/2
-
-
Decision boundaries
-
-
para trabalhar com doutores, médicos etc, a gente convert a tree em set of rules
-
-
o que eu aprendi?
quando temos um problema, temos que entender se ele é numérico, se algumas características importam, se os dados não importam, se importam algumas características daquele dado. E o custo de memória do computador
A partir disso, usamos a identification tree para tentar resolver esse problema
-
-
Decision boundaries
Contrary to nearest neighbors, identification tests always separate the data space in two equal parts parallel to the space axis.
Uma forma de identificar e separar a data de uma maneira com um custo muito menor, do que por exemplo a partir de uma reta que custa muita memória. E uma forma de fazer isso é