Minimal gain value
MonikaBeee
New Altair Community Member
Hi guys,
Someone could please help me in my homework?
I need to use a csv file to make a process based on a decision tree model. Then the question is: what is the largest minimal gain value where the C4.5 tree has not got only one leaf?
Thanks in advance!
Monika
Someone could please help me in my homework?
I need to use a csv file to make a process based on a decision tree model. Then the question is: what is the largest minimal gain value where the C4.5 tree has not got only one leaf?
Thanks in advance!
Monika
Tagged:
0
Best Answers
-
Hi @MonikaBeee,
you could import your CSV file into the repository, or use Read CSV to read the data on the file in the process.
You should mark the label attribute using Set Role.
Then you let a Decision Tree build a model from your data.
For determining the minimal gain you could manually iterate (e. g. start from 0.4 and go down, or from 0.001 and go up), first in larger, then in smaller steps and look at the resulting until you find the threshold you're searching for. However, other parameter settings could also influence the result.
A more elegant way is using a loop to automatically try different parameter values and determining the tree complexity. For example there is Decision Tree to ExampleSet in the Converters extension that you could use to find the number of rules in the tree and then filter the appropriate lines.
Regards,
Balázs5 -
Igen ;-)5
-
Szia!
Itt nem szoktunk házi feladatot megoldani, hanem olyan kérdésekre válaszolunk, amikben a dokumentáció és az elérhetô anyagok nem segítenek. Ajánlom az https://academy.rapidminer.com fölkeresését, ott megnézel néhány videót, és utána érteni fogod, amit írtam.
Ha utána még kérdésed van, szóljál. Nem csak én vagyok magyarul tudó rapidmineres, a fejlesztô csapat egy része magyar.
Üdv,
Balázs5 -
Igen, de külsôs vagyok, és Bécsben élek.5
Answers
-
Hi @MonikaBeee,
you could import your CSV file into the repository, or use Read CSV to read the data on the file in the process.
You should mark the label attribute using Set Role.
Then you let a Decision Tree build a model from your data.
For determining the minimal gain you could manually iterate (e. g. start from 0.4 and go down, or from 0.001 and go up), first in larger, then in smaller steps and look at the resulting until you find the threshold you're searching for. However, other parameter settings could also influence the result.
A more elegant way is using a loop to automatically try different parameter values and determining the tree complexity. For example there is Decision Tree to ExampleSet in the Converters extension that you could use to find the number of rules in the tree and then filter the appropriate lines.
Regards,
Balázs5 -
Hi Balázs,
Are you hungarian by any chance?
Because I'm so it would be easier to communicate in hungarian if you don't mind
Best regards,
M
0 -
Igen ;-)5
-
Szuper!
Szóval a helyzet az, hogy üzleti intelligencia kurzuson van hetene egy feladatsor amit rapidminerbe kell megoldani. Számomra ez nagyon nehéz, amikor volt olyan kérdés ami excelbe is megoldható volt, arra tudtam csak pontot szerezni.
Valójában semmit nem tudok a szoftver kezeléséről, most odáig jutottam el, hogy megnyitottam (beolvastam) a csv fájlt (processt?) a programba. Szóval nekem lépésről lépésre el kellene magyarázni, hogy pontosan mit kell csinálnom...
0 -
Ez a feladat magyarul:
A Bankmarketing esettanulmányhoz tartozó diák a teljes bank-full.csv adathalmaz felhasználásával készültek, ami nem biztos hogy minden gépen le tud futni. Ezért a feladat megválaszolásához a kisebbik bank.csv állományt használva állítsuk elő a diasor 11. oldalán található döntési fa modellen alapuló processt. (Az indukció és dedukció idejét nem szükséges megmérni a Log dobozzal.) A döntési fa alapértelmezett beállításai mellett melyik az a legnagyobb minimal gain érték, amire a kapott C4.5 fa nemcsak egyetlen levélből áll?
(A választ három tizedes jegy pontossággal kell megadni.)
0 -
Szia!
Itt nem szoktunk házi feladatot megoldani, hanem olyan kérdésekre válaszolunk, amikben a dokumentáció és az elérhetô anyagok nem segítenek. Ajánlom az https://academy.rapidminer.com fölkeresését, ott megnézel néhány videót, és utána érteni fogod, amit írtam.
Ha utána még kérdésed van, szóljál. Nem csak én vagyok magyarul tudó rapidmineres, a fejlesztô csapat egy része magyar.
Üdv,
Balázs5 -
Ok, köszönöm! Remélem, hogy úgy lesz, ahogy mondod.
Amúgy te akkor a cégnek dolgozol?0 -
Igen, de külsôs vagyok, és Bécsben élek.5
-
Wow, gratulálok a karrieredhez!0