Buenos días.
Tengo una pregunta:
- Tengo un conjunto de datos (2600 ejemplos, 90 atributos) y varios
modelos de predicción.
- La label es una variable binominal
- Aplico los modelos al conjunto de datos originales y a una
réplica de éste que sólo contiene los últimos 30 ejemplos.
- Por supuesto, los valores de los atributos de los casos
comunes de ambos conjunto de datos (e original y su réplica de los últimos
casos) son idénticos
Pues bien, los valores de las “confidences” obtenidos son
diferentes.
Entiendo que esto pase con modelos tipo KNN, pero no con
modelos basados en reglas o en árboles.
¿Cuál es la explicación?