knn medidas de similaridad y distancia

roberto_rojas_r
New Altair Community Member
señores, una pregunta de principiante, estoy procesando unos datos en KNN y necesito saber como configurar el proceso para que me funcione. Quiero utilizarlo para medir distancia entre un usuario objetivo y los usuarios vecinos cercanos. Tengo el identificador del usuario, los ítems revisados y las calificaciones de cada ítem por usuario. entiendo que KNN sólo permite variables numéricas. Me pueden explicar como configurar un proceso que me ayude con esto?
Tagged:
0
Answers
-
Debe investigar "Data to Similarity" y "Cross Distances" (dos operadores, per lo siento, no tengo la version RapidMiner en castellano y no se los nobres apropriados en esta version) si quiere identificar todas las distancias entre las observaciones, o las distancias entre un grupo de observaciones referentes y todas las otras observaciones. Los dos operadores tienen ayuda y procesos con ejemplos.1
-
Hola @roberto_rojas_r,
¿Puedes compartir tu proceso, para entender bien qué estás haciendo? Para ello, haz click con el botón secundario en el directorio donde tienes tu proyecto, elige Open in File Browser, y envíanos el archivo .rmp para poder revisarlo.
En principio, lo que dice @Telcontar120 está bien: Data to Similarity y Cross Distances son los operadores que necesitas para poder medir distancia entre usuarios objetivos y vecinos cercanos. Lo que me preocupa más es lo anterior, saber cómo son tus datos.
No, k-NN no necesariamente funciona con variables numéricas, pero debes saber configurar el tipo de medida:
Con el tipo MixedMeasures (Unidades de medida mezcladas) y la medida MixedEuclideanDistance (Distancia euclídea para unidades de medida mezclada), k-NN funciona bien con datos de otros tipos. Si lo que necesitas es convertirlos a tipos numéricos, lo más sencillo que puedes hacer es usar Parse Numbers para los datos que tienen números pero que cargaste como nominales, seguido de Nominal to Numerical para los tipos de datos que son descriptivos y que necesitas convertir a números.
Espero que esto te ayude. Un abrazo desde Chile,
Rodrigo.0 -
similarity se traduce como similitud en Español2