< back

Binární rozhodovací strom – genetický algoritmus


A) Zadání

Zkonstruujte binární rozhodovací strom pro stejnou vstupní funkci jako v jednom z předchozích cvičení binárního klasifikátoru s tím rozdílem, že pro určení množiny dělicích atributů v jednotlivých uzlech stromu použijete namísto výpočtu informačního zisku genetický algoritmus (GA).
 

  1. Binární strom tedy musí modelovat funkční závislost y=f(x) danou tabulkou pod textem:

  1. Konstrukci stromu proveďte pomocí genetického křížení, tj. určením suboptimální množiny J atributů {x1, x2, x3, x4}, přičemž |J|=7 a parametry genetického algoritmu jsou:



  1. Prezentujte následující výsledky:
    • Rozhodovací strom s doplněnými dělicími atributy a uvedenými počty klasifikovaných vzorků v jednotlivých listech stromu pro nejlepší nalezené suboptimální řešení.
    • Uveďte, jaký je počet všech přípustných jedinců (tj. kombinací s opakováním) a jaké procento jedinců z toho bylo v úloze použito GA.
    • Uveďte v řadě neseřazené hodnoty účelové funkce nejlepších jedinců z každé generace, tj. 10 hodnot. V které generaci se nachází suboptimální jedinec, proč nutně ne v poslední a kdy by tomu tak bylo?
    • Uveďte, zda nejlepší řešení GA je méně, stejně nebo více suboptimální, než řešení metodou informačního zisku a výsledek zdůvodněte.

B) Info

Tabulka funkční závislosti y=f(x):

x1 x2 x3 x4 y(x)
0 0 0 0 MSB(ID_16)
0 0 0 1
0 0 1 0
0 0 1 1
0 1 0 0
0 1 0 1
0 1 1 0
0 1 1 1
1 0 0 0
1 0 0 1
1 0 1 0
1 0 1 1
1 1 0 0
1 1 0 1
1 1 1 0
1 1 1 1 LSB(ID_16)