Analiza dużych zbiorów danych - Strona 3 z 4 - dlaProdukcji.pl

Wyszukaj w serwisie

Analiza dużych zbiorów danych

Regresja pozwala na opisywanie związków pomiędzy wieloma cechami (zmiennymi) poprzez dopasowanie do nich pewnej funkcji, przy czym jedna ze zmiennych jest tzw. zmienną zależną (objaśnianą). Rozróżnia się regresję liniową i nieliniową (rys. 3). Wynik takiej analizy to równanie regresji opisujące zidentyfikowane związki.

Klasyfikacja jest metodą, której celem jest określenie przynależności danego elementu do jednej z wcześniej zdefiniowanych klas elementów. Polega ona na automatycznym tworzeniu modeli w postaci tzw. klasyfikatorów, w oparciu o zgromadzone dane, które wcześniej poprawnie sklasyfikowano (tzw. uczenie z nauczycielem). Opracowany klasyfikator pozwala następnie na przypisanie nowych elementów do jednej z klas (por. rys. 4a).

Grupowanie, w odróżnieniu od klasyfikacji, wykorzystuje dane, które nie zostały wcześniej sklasyfikowane. Poszukiwane jest „naturalne” grupowanie elementów w oparciu o wartości ich cech. Odpowiednie algorytmy działają w taki sposób, aby maksymalizować podobieństwo elementów wewnątrz danej grupy, jednocześnie minimalizując ich podobieństwo pomiędzy grupami. W wyniku otrzymujemy grupy elementów mających podobne cechy (rys. 4b).

Odkrywanie asocjacji (w literaturze określane [...]

Ten materiał dostępny jest dla zalogowanych użytkowników.
Załóż konto i dołącz do grona użytkowników naszego portalu!

Porównaj produkty

Poznaj nasze serwisy

Nasze strony wykorzystują pliki cookies. Korzystanie z naszych stron internetowych bez zmiany ustawień przeglądarki dotyczących plików cookies oznacza, że zgadzacie się Państwo na umieszczenie ich w Państwa urządzeniu końcowym. Więcej szczegółów w Polityce prywatności.