Analiza dużych zbiorów danych
Regresja pozwala na opisywanie związków pomiędzy wieloma cechami (zmiennymi) poprzez dopasowanie do nich pewnej funkcji, przy czym jedna ze zmiennych jest tzw. zmienną zależną (objaśnianą). Rozróżnia się regresję liniową i nieliniową (rys. 3). Wynik takiej analizy to równanie regresji opisujące zidentyfikowane związki.
Klasyfikacja jest metodą, której celem jest określenie przynależności danego elementu do jednej z wcześniej zdefiniowanych klas elementów. Polega ona na automatycznym tworzeniu modeli w postaci tzw. klasyfikatorów, w oparciu o zgromadzone dane, które wcześniej poprawnie sklasyfikowano (tzw. uczenie z nauczycielem). Opracowany klasyfikator pozwala następnie na przypisanie nowych elementów do jednej z klas (por. rys. 4a).
Grupowanie, w odróżnieniu od klasyfikacji, wykorzystuje dane, które nie zostały wcześniej sklasyfikowane. Poszukiwane jest „naturalne” grupowanie elementów w oparciu o wartości ich cech. Odpowiednie algorytmy działają w taki sposób, aby maksymalizować podobieństwo elementów wewnątrz danej grupy, jednocześnie minimalizując ich podobieństwo pomiędzy grupami. W wyniku otrzymujemy grupy elementów mających podobne cechy (rys. 4b).
Odkrywanie asocjacji (w literaturze określane [...]
Porównaj produkty