Find more posts tagged with
Sort by:
1 - 2 of
21
Hola @hildarg,
"weight" en castellano es "peso". Y la idea del peso es la misma que un balancÃn.
Supongamos que agrupaste a cinco personas según su diagnóstico. Tres de ellas, cada una de 50 kilos de peso, están en un lado del balancÃn y dos de ellas al otro lado. ¿Cómo están los datos? Desbalanceados, ¿verdad? Pues, si quieres que el balancÃn quede más o menos bien, tienes que agregarle peso a un lado para que quede parejo.
En ciencia de datos necesitas tener datos balanceados para que éstos signifiquen algo, porque si no tus predicciones no van a ser exactamente lindas, por lo que hay un análogo a esta operación. Con este ejercicio en mente, supongamos que tienes el siguiente set de datos:
id, sistole, diastole, pulso, diagnóstico<br> 1, 120, 70, 120, arritmia<br> 2, 150, 100, 90, hipertension<br> 3, 120, 70, 60, normal<br> 4, 120, 70, 65, normal<br> 5, 120, 80, 70, normal <br>
Tienes dos formas de darle importancia a la etiqueta de arritmia, para poder hacer que sea significativa. Una es usando "muestras hasta igualar hacia arriba", otra es "muestras hasta igualar hacia abajo", y otra es "uso de pesos especÃficos". El problema es que igualar hacia arriba o hacia abajo (en inglés, upsampling o downsampling) ensucia las muestras, porque estás creando datos artificialmente. En cambio, puedes generar pesos (Generate Weight) para multiplicar los valores por ese peso, cosa de no ensuciar las muestras.

En el caso que te describÃ, por ejemplo, arritmia tiene un peso de 25% sobre el resto que tiene 12.5%. ¿Te das cuenta de que la columna weight es rosada? Es porque esa columna tiene como "rol" un peso generado (o sea, un weight). Ahora, yo lo hice usando el operador que es para eso, pero ¿qué ocurre si por ejemplo, tienes otra forma de generar pesos, como una fórmula matemática diferente, un script en Python, etc.? Puedes por ti mismo ponerle ese rol en la columna, y usar alguno de los operadores que tienen soporte para pesos (hay un árbol de decisión que tiene eso).
Ahà hay una explicación un poco más didáctica.
@varunm1, your translation was good, thanks mate!!!
Powered by Google Translate. My buddy @rfuentealba can dig deep on this in Spanish