Eksploracja danych. Analiza dużych zbiorów danych
Analiza danych jest ciągle rozwijającym się procesem, składającym się z wielu etapów. W artykule przedstawiono główny etap – eksplorowanie danych. Jak wybrać odpowiednią metodę eksploracji danych?
Analiza danych jest procesem składającym się z kilku etapów takich jak: zrozumienie danych, ich integracja, selekcja i wstępne przetwarzanie, eksploracja oraz interpretacja wyników (por. Analiza dużych zbiorów danych, „UR”, nr 1/2020). Etap tzw. wstępnego przetwarzania danych, obejmujący: selekcję danych, czyszczenie danych, redukcję liczby cech, transformację i dyskretyzację wartości omówiono w numerze 4/2020 „UR”, w artykule pt. Wstępne przetwarzanie danych. Niniejszy artykuł stanowi opis kolejnego etapu, jakim jest eksploracja danych.
Główny etap procesu analizy danych
Eksploracja stanowi główny etap procesu analizy danych. W ramach tego etapu ze zgromadzonych danych wydobywa się wiedzę, najczęściej w postaci zależności matematycznych pomiędzy zmiennymi (cechami), informacji dotyczących podobieństw, np. pomiędzy poszczególnymi obiektami, pojawiających się trendów zmian wartości lub reguł określających zależności pomiędzy wartościami zmiennych. Jako że wachlarz możliwości jest tu ogromy, w [...]