Eksploracja danych. Analiza dużych zbiorów danych
Kryteria jakościowe
Model, aby mógł zostać uznany za poprawny, musi spełniać określone kryteria jakościowe. Są nimi zazwyczaj: wysoki stopień dopasowania modelu do danych, uzyskanie istotnych statystycznie wartości współczynników regresji oraz losowy charakter reszt (m.in. reszty powinny mieć rozkład normalny).
Istnieje wiele miar określających stopień dopasowania modelu. Jedną z nich jest współczynnik determinacji R2. Informuje on o tym, jaka część zmienności zmiennej zależnej jest wyjaśniana przez model. Współczynnik ten przyjmuje wartości z przedziału [0, 1]. Im wartość współczynnika jest większa, tym model jest lepiej dopasowany do danych. Przyjmuje się, że model, dla którego wartość R2 jest większa od 0,9, można uważać za bardzo dobrze dopasowany do danych, natomiast powyżej 0,8 – za dobrze dopasowany. Ostatecznie, dysponując kilkoma modelami, należy wybrać model najlepiej dopasowany do danych.
Regresja
Jak wspomniano, regresja pozwala na określenie związku pomiędzy badanymi zmiennymi, jednakże nie musi świadczyć o ich zależności przyczynowo-skutkowej. Poprawnie zbudowany model [...]