División train-test | ML Interactivo

Tamaño del dataset

Proporción de entrenamiento

70%

Ruido en datos

0.30

Visualización de la partición

Entrenamiento (70%)

Prueba (30%)

0% 50% 100%

Puntos de entrenamiento

Puntos de prueba

MSE entrenamiento

—

MSE prueba

—

Datos y modelo ajustado

Efecto del tamaño de entrenamiento

¿Por qué dividir los datos?

Dividir los datos en entrenamiento y prueba es fundamental para evaluar cómo generalizará el modelo a datos nuevos. Si evaluamos en los mismos datos de entrenamiento, obtendremos una estimación optimista del rendimiento real. La proporción típica es 70-80% para entrenamiento y 20-30% para prueba.