Invítame un café Inicio

División train-test

Visualiza cómo dividir los datos en conjuntos de entrenamiento y prueba. Observa el impacto de diferentes proporciones en las métricas del modelo.

50
70%
0.30

Visualización de la partición

Entrenamiento (70%)
Prueba (30%)
0% 50% 100%
Puntos de entrenamiento
35
Puntos de prueba
15
MSE entrenamiento
MSE prueba

Datos y modelo ajustado

Efecto del tamaño de entrenamiento

¿Por qué dividir los datos?

Dividir los datos en entrenamiento y prueba es fundamental para evaluar cómo generalizará el modelo a datos nuevos. Si evaluamos en los mismos datos de entrenamiento, obtendremos una estimación optimista del rendimiento real. La proporción típica es 70-80% para entrenamiento y 20-30% para prueba.