Analiza dużych zbiorów danych

Autor: dr inż. Krzysztof Ciupke
Data publikacji: 09.07.2021 r. Numer wydania: Utrzymanie ruchu 1/2020

analiza danych dr inż. Krzysztof Ciupke integracja danych klasyfikacja przetwarzanie selekcja

Regresja pozwala na opisywanie związków pomiędzy wieloma cechami (zmiennymi) poprzez dopasowanie do nich pewnej funkcji, przy czym jedna ze zmiennych jest tzw. zmienną zależną (objaśnianą). Rozróżnia się regresję liniową i nieliniową (rys. 3). Wynik takiej analizy to równanie regresji opisujące zidentyfikowane związki.

Klasyfikacja jest metodą, której celem jest określenie przynależności danego elementu do jednej z wcześniej zdefiniowanych klas elementów. Polega ona na automatycznym tworzeniu modeli w postaci tzw. klasyfikatorów, w oparciu o zgromadzone dane, które wcześniej poprawnie sklasyfikowano (tzw. uczenie z nauczycielem). Opracowany klasyfikator pozwala następnie na przypisanie nowych elementów do jednej z klas (por. rys. 4a).

Grupowanie, w odróżnieniu od klasyfikacji, wykorzystuje dane, które nie zostały wcześniej sklasyfikowane. Poszukiwane jest „naturalne” grupowanie elementów w oparciu o wartości ich cech. Odpowiednie algorytmy działają w taki sposób, aby maksymalizować podobieństwo elementów wewnątrz danej grupy, jednocześnie minimalizując ich podobieństwo pomiędzy grupami. W wyniku otrzymujemy grupy elementów mających podobne cechy (rys. 4b).

Odkrywanie asocjacji (w literaturze określane [...]

Ten materiał dostępny jest dla zalogowanych użytkowników.

Załóż konto i dołącz do grona użytkowników naszego portalu!

Zaloguj się Zarejestruj się