Eksploracja danych. Analiza dużych zbiorów danych
Przykładowe drzewo decyzyjne a analiza danych
Na rys. 2 przedstawiono przykładowy zbiór elementów, dla którego tworzony będzie klasyfikator w postaci drzewa decyzyjnego. Wszystkie obiekty opisano wartościami trzech cech: kolor, kółko (czy obiekt ma narysowane kółko wewnątrz), ramka (jaki jest styl ramki), oraz cechą decyzyjną – kształt. Tak opisane elementy, jako zbiór przykładów uczących przygotowanych do analizy, pokazano w tab. 1. Na rys. 3 pokazano zaś uzyskane drzewo decyzyjne wygenerowane na podstawie tego zbioru danych. W węźle pierwszym (korzeniu) dokonuje się testu dotyczącego koloru danego elementu. W przypadku gdy kolor jest żółty, można jednoznacznie przypisać elementom etykietę „kwadrat”, W pozostałych przypadkach konieczne jest przeprowadzenie kolejnych testów, dotyczących występowania kółka wewnątrz elementu lub rodzaju ramki otaczającej dany element. Ostatecznie na podstawie powyższych danych możliwe jest przypisanie odpowiedniej etykiety każdemu elementowi.
