¡Hola, Comunidad! ¿Cómo están? Espero que estén muy bien y tengan una muy buena semana.
Amigos míos, tengo una pregunta: en una de las consultorías en que estoy trabajando, estoy evaluando un proyecto de procesamiento de lenguaje natural, en idioma castellano. Hasta ahora, he hecho esa clase de cosas con Python, pero quiero saber si alguien de por aquí tiene experiencia en usar RapidMiner en esta clase de proyectos.
Particularmente, me gustaría saber si se puede usar etiquetado de partes del habla (POS tagging) en castellano, cómo lo han hecho, qué les ha resultado y qué no les ha resultado. Ya @Telcontar120 en su charla en RapidMiner Wisdom comentaba un poco de cómo creaba diccionarios para esto, pero si existiese una biblioteca más completa específicamente para nuestro idioma, tal vez podría evitarme el problema que significan las múltiples conjugaciones (que en inglés no existen)
Pongo en mención a @MarcoBarradas, @Montse, @israel_jimenez, @csecada, @oswaldo_vergara, @SGolbert, @jaguilerav, @amanda_valdes y @ghislaine_gueri que son los nombres que recuerdo de usuarios de RapidMiner de habla hispana.
Muchas, muchas, muchas gracias de antemano por todas sus respuestas. Les comentaré cómo me va.
Saludos,
Rodrigo Fuentealba Cartes
Data Scientist en The Pegasus Group S. A., Chile.