🎉Community Raffle - Win $25

An exclusive raffle opportunity for active members like you! Complete your profile, answer questions and get your first accepted badge to enter the raffle.
Join and Win

Minimal gain value

User: "MonikaBeee"
New Altair Community Member
Updated by Jocelyn
Hi guys,
Someone could please help me in my homework? 
I need to use a csv file to make a process based on a decision tree model. Then the question is: what is the largest minimal gain value where  the C4.5 tree has not got only one leaf?
Thanks in advance!
Monika

Find more posts tagged with

Sort by:
1 - 9 of 91
    User: "BalazsBaranyRM"
    New Altair Community Member
    Accepted Answer
    Hi @MonikaBeee,

    you could import your CSV file into the repository, or use Read CSV to read the data on the file in the process.
    You should mark the label attribute using Set Role.
    Then you let a Decision Tree build a model from your data.

    For determining the minimal gain you could manually iterate (e. g. start from 0.4 and go down, or from 0.001 and go up), first in larger, then in smaller steps and look at the resulting until you find the threshold you're searching for. However, other parameter settings could also influence the result. 

    A more elegant way is using a loop to automatically try different parameter values and determining the tree complexity. For example there is Decision Tree to ExampleSet in the Converters extension that you could use to find the number of rules in the tree and then filter the appropriate lines. 

    Regards,
    Balázs
    User: "MonikaBeee"
    New Altair Community Member
    OP
    Hi Balázs,
    Are you hungarian by any chance?
    Because I'm so it would be easier to communicate in hungarian if you don't mind
    Best regards,
    M

    User: "BalazsBaranyRM"
    New Altair Community Member
    Accepted Answer
    Igen ;-)
    User: "MonikaBeee"
    New Altair Community Member
    OP
    Szuper!
    Szóval a helyzet az, hogy üzleti intelligencia kurzuson van hetene egy feladatsor amit rapidminerbe kell megoldani. Számomra ez nagyon nehéz, amikor volt olyan kérdés ami excelbe is megoldható volt, arra tudtam csak pontot szerezni.
    Valójában semmit nem tudok a szoftver kezeléséről, most odáig jutottam el, hogy megnyitottam (beolvastam) a csv fájlt (processt?) a programba. Szóval nekem lépésről lépésre el kellene magyarázni, hogy pontosan mit kell csinálnom...  :s

    User: "MonikaBeee"
    New Altair Community Member
    OP

    Ez a feladat magyarul:

    Bankmarketing esettanulmányhoz tartozó diák a teljes bank-full.csv adathalmaz felhasználásával készültek, ami nem biztos hogy minden gépen le tud futni. Ezért a feladat megválaszolásához a kisebbik bank.csv állományt használva állítsuk elő a diasor 11. oldalán található döntési fa modellen alapuló processt. (Az indukció és dedukció idejét nem szükséges megmérni a Log dobozzal.) A döntési fa alapértelmezett beállításai mellett melyik az a legnagyobb minimal gain érték, amire a kapott C4.5 fa nemcsak egyetlen levélből áll?

    (A választ három tizedes jegy pontossággal kell megadni.)

    User: "BalazsBaranyRM"
    New Altair Community Member
    Accepted Answer
    Szia!

    Itt nem szoktunk házi feladatot megoldani, hanem olyan kérdésekre válaszolunk, amikben a dokumentáció és az elérhetô anyagok nem segítenek. Ajánlom az https://academy.rapidminer.com fölkeresését, ott megnézel néhány videót, és utána érteni fogod, amit írtam.

    Ha utána még kérdésed van, szóljál. Nem csak én vagyok magyarul tudó rapidmineres, a fejlesztô csapat egy része magyar.

    Üdv,
    Balázs
    User: "MonikaBeee"
    New Altair Community Member
    OP
    Ok, köszönöm! Remélem, hogy úgy lesz, ahogy mondod. :)
    Amúgy te akkor a cégnek dolgozol?
    User: "BalazsBaranyRM"
    New Altair Community Member
    Accepted Answer
    Igen, de külsôs vagyok, és Bécsben élek.
    User: "MonikaBeee"
    New Altair Community Member
    OP
    Wow, gratulálok a karrieredhez!