¡Bienvenidos al foro de RapidMiner en Castellano!

¡Hola a todos los usuarios de la comunidad!
Este foro es para los usuarios hispanoparlantes de RapidMiner. Sean bienvenidos. Este es un foro para que los nuevos usuarios puedan leer y aprender sobre RapidMiner, y para que los usuarios experimentados puedan ayudar a quienes, como ustedes, comenzaron a usar a RapidMiner.
NOTA PARA LOS NUEVOS USUARIOS: Es altamente probable que otra persona haya hecho una pregunta similar a las que ustedes tuvieron, o algún problema al iniciarse. No es necesario buscar en el foro en inglés, pero sí buscar por algunas palabras claves en castellano podría ayudarnos bastante. Cuando escriban una pregunta, por favor consideren agregar lo siguiente a su artículo:
- Escribir una descripción clara y concisa de su problema.
- Adjuntar el proceso en RapidMiner en XML. Es posible pegarlo aquí con el botón </> en la barra de herramientas.
- Adjuntar los datos, si es que éstos pueden ser compartidos públicamente, por supuesto.
- Adjuntar capturas de pantalla o screenshots, los que sea necesario.
- Si es necesario hacer referencia a otros usuarios en este foro, es posible hacerlo usando la arroba @ como prefijo, seguida del nombre de usuario.
NOTA PARA LOS USUARIOS EXPERIMENTADOS: Gracias por escribir en este foro. Agradecemos enormemente su ayuda para iniciar a otras personas. Por favor, consideren que las personas que escriben aquí son usuarios nuevos en su mayoría y tienen preguntas que corresponden a usuarios nuevos. Por favor, mantengan esto presente, ya que ustedes también fueron novatos alguna vez.
Quien les escribe es @rfuentealba, que administrará este grupo de interés especial (SIG, por las siglas en inglés de Special Interest Group). Siéntanse libres de escribirme si necesitan apoyo. La comunidad de RapidMiner en Castellano la hacemos todos. :smileyhappy:
Un abrazo enorme,
Comments
-
Excelente iniciativa.. Alguno sabe cuántos somos?
jaime
2 -
Hola,
pues somos... ¿pocos pero selectos?
1 -
¡Hola!
Entre las personas que conozco y que sé que han leído el foro, y ustedes que han comentado, somos alrededor de 20 personas en (por orden alfabético): Argentina, Chile, Colombia, España, Estados Unidos, México, Panamá y Perú.
Haré una entrada para que podamos presentarnos, y poder tener una catástrofe un catastro para saber cuántos somos. ¿Les parece? Difundan entre sus amigos y disfruten.
Un abrazo desde Chile,
1 -
Que buena noticias! Felicitaciones. Buenos Aires, Argentina
Diego Stamato
2 -
Estupendo, buena iniciativa. Aunque me manejo con el inglés, siempre es bueno encontrar ayuda en tu idioma.1
-
Saludos desde Ecuador, estoy incursionando con esta herramienta y quisiera saber si es posible llevar a cabo una integración entre rapidminer y un lenguaje de desarrollo?1
-
@jonathan_tayupa por defecto, hay integraciones en Python y R, y es posible escribir tus propios scripts en Groovy además de ello. Puedes escribir esto como una pregunta nueva, y agregar como etiqueta "RapidMiner en Castellano", ¿te parece?
1 -
@jonathan_tayupa como complemento a la respuesta de Rodrigo te comento que una vez que has creado tu proceso es posible exponer el proceso vía WS a través del RM Server. Con el server puedes exponer el servicio para que sea consumido vía cURL y podrías crear cualquier solución que sea necesaria.
Saludos0 -
señores, una pregunta de principiante, estoy procesando unos datos en KNN y necesito saber como configurar el proceso para que me funcione. Quiero utilizarlo para medir distancia entre un usuario objetivo y los usuarios vecinos cercanos. Tengo el identificador del usuario, los ítems revisados y las calificaciones de cada ítem por usuario. entiendo que KNN sólo permite variables numéricas. Me pueden explicar como configurar un proceso que me ayude con esto?0
-
Hola @roberto_rojas_r, bienvenido a la comunidad!
¿Te molesta si te pido que escribas esta pregunta como una pregunta nueva? Para ello haz click aquí, y escribe tu pregunta en castellano, con el tag RapidMiner en Castellano.
Así podemos tener una conversación completa dedicada a tu problema y diferentes opiniones.
Saludos y bienvenido nuevamente,
Rodrigo.2 -
Hola! Gracias por hacer un foro en EspañolEstoy teniendo problemas para poner preguntas, alguien sabria solucionarmelo?Muchas gracias1
-
Buenas quiero crear un grafico de burbujas lineal para registrar mi actividad deportiva de tres deportes cada día, cada burbuja sería más grande según el tiempo dedicado. Se puede realizar en esta aplicación? Gracias, es urgente.0
-
Hola a todos, saludos desde Panamá.3
-
Hola!!! Saludos desde Bolivia!
3 -
Hola.. Soy médico y tecnólogo. Estoy aquí para aprender a utilizar RapidMiner. Saludos desde México.
3 -
@Xtint0 bienvenido al grupo. Con gusto te ayudo en lo que necesites. Yo también soy Mexicano3
-
Hola rfuntealba sabras de una casa de estudios en Peru que brinde certificacion de basico a avanzado sobre rapidminer me interesa mucho.
Sld Miguel P.1 -
Muchas gracias, poor su bienvanida soy nuevo les escribo desde ibague - tolima - Colombia1
-
Hola!
Tengo una consulta: Estoy trabajando en un proyecto en el cual necesito predecir el valor de una variable en función a otras que en conjunto forman parte de una base de datos, la cual, a su vez, estoy utilizando como input en el programa. Para ello, La herramienta o método que uso en Rapidminer es el de automodelación (Automodel). Todo bien al correr el modelo. El algoritmo que salió como el mejor fue Gradient Boosted Trees, así que me enfoqué en ese. Una vez ahí, en la pestaña Pesos (Weights) ciertas variables (supongamos "a", "b"y "c") me salieron como las más influyentes o de mayor importancia. Hasta ahí todo en orden; luego fui a la pestaña Simulador (Simulator) justamente para observar como es que estas variables afectaban al valor de mi variable meta (digamos que "y"). No obstante, el valor se mantuvo intacto. Intenté con las demás variables que eran menos influyentes para ver si alguna impactaba en "y". Mientras hacía esta prueba, me topé con dos variables ("m" y "n") que sí modificaban el valor de "y" pero lo que me pareció extraño fue que ninguna de las dos era tan influyente como "a", "b" o "c". Otra cosa que observé y me pareció curioso fue que en la pestaña "Production Model" la mayoría de los árboles presentaba como cabeceras a estas dos variables "m" y "n", mas no sé que puedo concluir a partir de ello. Por favor, quisiera que alguien me explique por qué ocurre esto o cuál es la verdadera lógica en cuanto al impacto de los pesos en la predicción y por qué ciertas variables que no son casi nada influyentes sí causan un impacto. Espero puedan ayudarme. Gracias de antemano.
Saludos,
Miguel Hinostroza
0 -
Hola @MiguelHH98 ya que no puedo ver imágenes de tu modelo y de los resultados (imagino que por temas de confidencialidad) te recomiendo utilizar el operador Local Interpretation este te permitirá ver caso por caso qué rama del árbol fue utilizada para clasificar cada registro y posiblemente con eso puedas ver qué atributos y valores de los mismos están influyendo en la clasificación.
Para poderte ayudar un poco más valdría la pena pegar algunas imágenes de lo que te sale en automodel. Si quieres mantener el anonimato de tus columnas utiliza el operador rename by generic name con eso ya no podremos conocer el nombre de tus columnas y así perderemos el contexto de las variables y nos podremos enfocar en lo que te arroja el sistema.
Saludos y espero haber ayudado un poco en tu pregunta.
Saludos.1 -
Hola, @MarcoBarradas
Muchas gracias por responder. Ya no llegué a leer tu mensaje, pero felizmente pude aclarar mis dudas. Cualquier otra consulta la estaré comentando por aquí. Gracias de nuevo.
Saludos.0 -
Estimados:
Junto con saludar a todos, me gustaría solicitar su ayuda con ejercicio.
@rfuentealba favor si pudieras ayudarme con algunas indicaciones te lo agradecería muchísimo.
Necesito predecir las ventas para mis clientes. Tengo un excel con cuatro campos:
FECHA -> formato DD-MM-YYYY
DIA_SEMANA -> indica si que día es la fecha de lunes a viernes
NOMBRE_CLIENTE -> Indica el nombre del cliente
UNIDADES_VENDIDAS -> cantidad de unidades que compro un cliente en una fecha especifica
Mi pregunta es como puedo generar una predicción de ventas para las fechas futuras que no están en el excel.
La idea es que la predicción que arroje devuelva los mismos cuatro campos que ingrese pero con fechas futuras
El ejemplo es este:FECHA DIA_SEMANA NOMBRE_CLIENTE UNIDADES_VENDIDAS 01-01-2020 3 1 18 02-01-2020 4 1 19 03-01-2020 5 1 17 04-01-2020 6 1 3 05-01-2020 7 1 4 06-01-2020 1 1 16 07-01-2020 2 1 19 08-01-2020 3 1 22 09-01-2020 4 1 19 10-01-2020 5 1 17 11-01-2020 6 1 Predicción 12-01-2020 7 1 Predicción 13-01-2020 1 1 Predicción 14-01-2020 2 1 Predicción 15-01-2020 3 1 Predicción
La idea es que ingresando ventas del 01 al 10 de enero pueda predecir hasta el 15 de enero.
PD: Soy nuevo en RapidMiner favor agradecería me indicaran que procesos debo concatenar desde eñ ReadExcel hasta el CriteCSV final con los valores de predicción.
Desde ya muchas gracias.
Saludos a todos!
0 -
Hola @guillermopozop estás buscando hacer un problema de serie de tiempo ya que buscas predecir más de un valor en el futuro.
De inicio valdría la penar tener más datos para poder predecir 5 días en el futuro. Al menos deberías de tener 15 días previos.
Deberías de hacer un proceso que arroje una serie de tiempo por cada cliente con eso sólo usarías 2 atributos la fecha y el valor de la venta y con eso podrías pronosticar el valor en los siguientes días.
Aquí está el acceso al tutorial de RM para series de tiempo.
https://academy.rapidminer.com/learn/course/time-series-analytics/time-series-analytics/data-preparation-and-analysis
El otro camino sería hacer una regresión basada en las columnas que tienes pero los valores futuros después del primer pronóstico dependerían de la certeza del dato que pronosticaste primero.
Saludos una vez que hayas visto el tutorial de serie de tiempo con gusto te puedo intentar ayudar a construir tu modelo.
0 -
Hola
Tenemos un problema y no sabemos cómo resolverlo. Adjunto la imagen. @rfuentealba
Estamos haciendo la estimación de la variable objetivo con respecto al modelo. Pero no entendemos qué es lo que está fallando.
Gracias!0 -
Buen día Mónica,
Tienes problemas con los títulos. Cuando entrenaste el algoritmo "ReloadScore..." (por lo que veo en tu pantalla), lo entrenaste con un atributo llamado "PROGRAMA = MUSICA".
Probablemente hayas tenido, dentro de tu entrenamiento, algo llamado "One Hot Encoding", que lo que hace es cambiar esto:ID, PROGRAMA, OTROCAMPO<br>1, MÚSICA, MUS123<br>2, MÚSICA, MUS234<br>3, MATEMÁTICA, MAT123<br>4, MATEMÁTICA, MAT234<br>5, CASTELLANO, CAS123
A esto:ID, PROGRAMA = MÚSICA, PROGRAMA = MATEMÁTICA, PROGRAMA = CASTELLANO, OTROCAMPO<br>1, 1, 0, 0, MUS123<br>2, 1, 0, 0, MUS234<br>3, 0, 1, 0, MAT123<br>4, 0, 1, 0, MAT234<br>5, 0, 0, 1, CAS123
Si es que es eso (no he visto el programa de entrenamiento de tu algoritmo), entonces antes de "Apply Model", deberías poner el operador Nominal to Numerical.
Eso hace exactamente lo mismo.
Como consejos:
1.- Cuando escribas preguntas acá, escríbelas en castellano, pero en su propio párrafo. Así tenemos formas de seguir un hilo.
2.- Cuando crees procesos en los que antes de entrenar se modifican los datos, lleva todas las modificaciones a un subproceso, porque el entrenamiento sólo se hace con los datos como están al final de este proceso y no se toman en cuenta las modificaciones que sufrieron durante el proceso.
Disculpa la demora, he estado un poco perdido de todo. Un abrazo!
Saludos,
Rodrigo.
0 -
hola, gracias soy nuevo en la comunidad. tengo una duda. El programa aun sigue siendo gratis con bases hasta 10000 registros o solo es prueba de 30 días gratis?0
-
¡Hola @David_Franco, bienvenido a la comunidad!
Te comento, RapidMiner Studio tiene una prueba de 30 días a capacidad full, luego de los 30 días puedes continuar con las limitaciones de 10.000 registros que mencionas, que corresponde a RapidMiner Studio Free.
No está demás recordar que si deseas adquirir las versiones Professional o Enterprise de RapidMiner Studio y eres de Sudamérica, pueden contactarme mediante un mensaje directo aquí mismo en la plataforma.
Saludos cordiales,
Rodrigo0 -
Hola, tengo una duda al usar RapidMinder, después de subir el fichero csv con la función read Csv, y luego utilizo la fórmula select attributes y en el área de parameters no me salen las opciones de seleccionar ninguna columna o atributo. ¿A qué se debe?0
-
Hola Antonio,
te recomiendo que utilices mejor la función Import Data, que encontraras en la parte superior izquierda. con esta función puedes importar y tratar los datos y desde luego tener mapeados los atributos.
Un saludo0 -
Hola,
¿Soy yo o la imagen no se ve? En cualquier caso:
Si el CSV tiene como cabecera el nombre de cada columna, debes configurar el lector de CSV para que lea esto. De otra forma, tendrás que configurarlo antes:
En la siguiente imagen salen marcadas 3 flechas:
1.- Revisa siempre eso, es la causa de mis peores pesadillas cuando he debido importar CSV's.
2.- Los cambios de configuraciones deberían dar origen a una tabla como esta.
3.- Si tiene header, seleccionas esto; si no, te dará la opción de darles nombres a las columnas.
Otro tip:
En la parte final, si no necesitas todo el CSV, no es necesario que importes todas las columnas. Hay un menú que te permite configurar exactamente qué traer. Así te ahorras un "Select Attributes" en el proceso.
Una vez hecho este proceso, no deberías tener problemas:
Saludos,
Rodrigo.0