logo

Десно нагнута дистрибуција: шта то значи?

феатуре_ригхт_скевед_хистограм

Студирање статистике? Онда сте вероватно чули фразу „нормална дистрибуција“ када описујете податке. Али шта је са фразом 'искривљено у праву'? Како изгледа десно закривљен хистограм? И шта га узрокује?

низ садржи

У овом чланку дајемо вам примере хистограма искривљених удесно и објашњавамо како се они разликују од графика нормалне дистрибуције.

Карактеристична слика: Моника Плаце /Викимедиа Цоммонс

Шта је нормална дистрибуција?

Пре него што објаснимо шта значи када су подаци искривљени у праву, погледајмо дефиницију нормалне дистрибуције.

Са нормалном дистрибуцијом, две или више променљивих деле директну везу да би а симетричан скуп података , на којој лева половина огледа десну половину. Ови графови се зову звонасте криве због њиховог јасно дефинисаног, звонастог облика:

боди_нормал_дистрибутион-300к215

На графикону нормалне дистрибуције, средња вредност (просек), медијана и мод су једнаки . Све ове тачке представљају центар података или врх графикона.

Шта значи искривљено у праву?

Док је нормална дистрибуција један од најчешћих облика дистрибуције, сви скупови података не прате ову основну криву. Другим речима, неки хистограми су искривљени удесно или улево .

Са дистрибуцијом удесно искривљеном (такође познатом као 'позитивно искривљена' дистрибуција), већина података пада на десну или позитивну страну врха графикона. Тако, хистограм се искривљује на такав начин да је његова десна страна (или 'реп') дужа од леве стране.

боди_ригхт_скевед_хистограм

Пример хистограма удесно искошеног.

На хистограму закривљеном удесно, средња вредност, медијана и мод су различити. У овом случају, мод је највиша тачка хистограма, док медијана и средња вредност падају десно од њега (или, визуелно, десно од врха). Напоменути да зла воља увек бити десно од медијане .

боди_скевед_ригхт_лефт

Графикон А је искошен удесно, док је Графикон Б искошен улево. Код графика закривљених удесно, средња вредност увек долази десно од мода (тј. врха). ( Аситгоес /Викимедиа Цоммонс) )

Ове карактеристике на крају то чине тешко доделити типичну вредност пошто не постоји јасна централна тачка на графу са десно косом. Насупрот томе, са нормалном дистрибуцијом, пошто су средња вредност, медијана и мод сви једнаки и налазе се у центру скупа података, ову вредност можете лако користити да прецизније генерализујете податке.

Шта узрокује десно закривљен хистограм?

Подаци искривљени удесно су обично резултат доње границе у скупу података (док су подаци искривљени улево резултат више границе). Дакле, ако су доње границе скупа података изузетно ниске у односу на остале податке, то ће узроковати искривљење података удесно.

Други узрок искривљености је старт-уп ефекти . На пример, ако процедура у почетку има много успеха током дугог периода покретања, то би могло да створи позитивну искривљеност података. (С друге стране, период покретања са неколико почетних кварова може негативно да искриви податке.)