GridSearchCV
поиск оптимальных параметров для дерева
Crossvalidation для каждого набора параметров в сетке.
params = {'max_depth': np.arrange(2,11), 'min_samples_leaf': np.arrange(2,11)} - сетка параметров;
best_tree = GridSearchCV(estimator=tree,param_grid=params, cv=skf, n_jobs=-1, verbose=1), где cv - описание crossvalidation.
skf = StratifiedKFold(n_splts=5, shuffle=True, random_state =17)
best_tree.best_params, best_tree.best_estimator, best_tree.best_core - найденные лучшие параметры, лучшее дерево и лучшая точность.
Далее проверяем точность на holdout