Da rezimiramo, općenito ako je distribucija podataka nagnuta ulijevo, srednja vrijednost je manja od medijana, što je često manje od načina. Ako je distribucija podataka nagnuta udesno, mod je često manji od medijane, što je manje od srednje vrijednosti.
Zašto na medijan manje utječu iskrivljeni podaci?
Zašto na medijan manje utječu iskrivljeni podaci od prosjeka? Međutim, kako podaci postaju iskrivljeni, srednja vrijednost gubi sposobnost pružanja najbolje središnje lokacije za podatke jer ih iskrivljeni podaci odvlače od tipične vrijednosti.
Zašto je medijan bolji za iskrivljene podatke?
Za distribucije koje imaju izvanredne vrijednosti ili su iskrivljene, medijan je često poželjna mjera središnje tendencije jer je medijan otporniji na odstupanja od srednje vrijednosti… Imajte na umu da se srednja vrijednost povlači u smjeru zakrivljenosti (tj. smjeru repa).
Kada je nagnuto udesno, srednja je vrijednost?
Za desnu iskrivljenu distribuciju, srednja vrijednost je obično veća od medijane Također primijetite da je rep distribucije na desnoj (pozitivnoj) strani duži nego na lijeva strana. Iz dijagrama okvira i brkova također možemo vidjeti da je medijan bliži prvom kvartilu nego trećem kvartilu.
Kako zakrivljenost utječe na podatke?
Efekti iskrivljenosti
Ako ima previše iskrivljenosti u podacima, onda mnogi statistički modeli ne rade, ali zašto. Dakle, u iskrivljenim podacima, područje repa može djelovati kao izvanredna vrijednost za statistički model i znamo da odstupnici negativno utječu na izvedbu modela, posebno na modele temeljene na regresiji.