Средна математичка статистика. Структурни карактеристики на сериите на дистрибуција на варијации

Медијана јастие ја нарекуваат вредноста на атрибутот што паѓа во средината на рангираната серија и ја делат на два дела еднакви по број на единици. Така, во рангираниот ред на дистрибуцијата, едната половина од редот има вредности на атрибути што ја надминуваат медијаната, другата половина е помала од средната вредност.

Медијаната се користи наместо аритметичката средина кога екстремните опции од рангираните серии (најмалата и најголемата) во споредба со останатите се покажуваат како претерано големи или претерано мали.

ВО дискретниво варијациска серија која содржи непарен број единици, медијаната е еднаква на варијантата на карактеристиката што го има бројот:
,
каде N е бројот на единици на население.
Во дискретна серија која се состои од парен број единици на население, медијаната се дефинира како просек од опциите кои имаат броеви и:
.
Во распределбата на работниците по стаж, медијаната е еднаква на просекот на опциите со броеви 10 во рангираната серија: 2 = 5 и 10: 2 + 1 = 6. Опциите за петтата и шестата карактеристика се еднакви до 4 години, значи
на годината
При пресметување на медијаната во интервалред прво најдете среден интервал, (т.е. содржи медијана), за кои се користат акумулирани фреквенции или фреквенции. Медијаната е интервал чија акумулирана фреквенција е еднаква или поголема од половина од вкупниот волумен на популацијата. Просечната вредност потоа се пресметува со формулата:
,
каде е долната граница на средниот интервал;
– ширина на средниот интервал;
– акумулирана фреквенција на интервалот што претходи на медијаната;
– фреквенција на медијалниот интервал.
Да ја пресметаме медијаната на распределбата на работниците по плата (види предавање „Резиме и групирање на статистички податоци“).
Медијаната е опсегот на плата од 800-900 UAH, бидејќи нејзината кумулативна фреквенција е 17, што надминува половина од збирот на сите фреквенции (). Потоа
Јас=800+100 UAH.
Добиената вредност покажува дека половина од работниците имаат плата под 875 UAH, но тоа е над просекот.
За да ја одредите медијаната, можете да користите кумулативни фреквенции наместо кумулативни фреквенции.
Медијаната, како и режимот, не зависи од екстремните вредности на варијантата, затоа се користи и за карактеризирање на центарот во сериите на дистрибуција со неизвесни граници.
Средна сопственост : збирот на апсолутните вредности на отстапувањата од медијаната е помал од која било друга вредност (вклучувајќи ја и аритметичката средина):

Ова својство на медијаната се користи во транспортот при дизајнирање на локацијата на постојките на трамвај и тролејбус, бензински пумпи, собирни места итн.
Пример.По должината на автопатот долг 100 километри има 10 гаражи. За да се дизајнира изградбата на бензинска пумпа, беа собрани податоци за бројот на очекувани патувања до бензинската пумпа за секоја гаража.
Табела 2 - Податоци за бројот на патувања до бензинска пумпа за секоја гаража.

Потребно е да се постави бензинска пумпа за вкупната километража на возилата за полнење гориво да биде минимална.
Опција 1.Ако бензинска пумпа е поставена на средината на автопатот, односно на 50-тиот километар (центарот на опсегот на промени во атрибутот), тогаш километражата, земајќи го предвид бројот на патувања, ќе биде:
а) во една насока:
;
б) спротивно:
;
в) вкупна километража во двата правци: .

Опција 2.Ако е поставена бензинска пумпа на средниот дел од автопатот, утврдена со аритметичката просечна формула, земајќи го предвид бројот на патувања:

Медијаната може да се одреди графички, со користење на кумулатот (види предавање „Резиме и групирање на статистички податоци“). За ова, последната ординација, еднаков на износотсите фреквенции или фреквенции се поделени на половина. Од добиената точка, нормалната се обновува додека не се вкрсти со кумулацијата. Апсцисата на пресечната точка ја дава средната вредност.

ТЕСТ

На тема: „Режим. медијана. Методи за нивно пресметување“


Вовед

Просечните вредности и придружните индикатори за варијација играат многу важна улога во статистиката, што се должи на предметот на неговото проучување. Затоа оваа темае еден од централните во курсот.

Просекот е многу вообичаена сумарна мерка во статистиката. Ова се објаснува со фактот дека само со помош на просекот може една популација да се карактеризира со квантитативно променлива карактеристика. Просечна големинаво статистиката се нарекува генерализирачка карактеристика на збир на слични појави според некоја квантитативно различна карактеристика. Просекот го покажува нивото на оваа карактеристика по единица население.

Кога ги проучуваат општествените појави и се обидуваат да ги идентификуваат нивните карактеристични, типични карактеристики во специфични услови на место и време, статистичарите широко користат просечни вредности. Користејќи просеци, можете да споредувате различни популации едни со други според различни карактеристики.

Просеците што се користат во статистиката припаѓаат на класата на просеци на моќност. Од просеците на моќноста, најчесто се користи аритметичката средина, поретко хармониската средина; Хармоничната средина се користи само кога се пресметуваат просечните стапки на динамика, а средниот квадрат се користи само кога се пресметуваат индексите на варијација.

Аритметичката средина е количник на делење на збирот на варијантите со нивниот број. Се користи во случаи кога обемот на различна карактеристика за целото население се формира како збир на карактеристичните вредности на нејзините поединечни единици. Аритметичката средина е најчестиот тип на просек, бидејќи одговара на природата на општествените појави, каде што обемот на различни карактеристики во агрегат најчесто се формира токму како збир на карактеристичните вредности на поединечните единици на населението. .

Според неговото дефинирачко својство, хармоничната средина треба да се користи кога вкупниот волумен на атрибутот се формира како збир на инверзните вредности на варијантата. Се користи кога, во зависност од материјалот, тежините не треба да се множат, туку да се поделат на опции или, што е исто, да се помножат со нивната реципрочна вредност. Хармоничната средина во овие случаи е реципрочна на аритметичката средина на реципрочните вредности на карактеристиката.

Треба да се прибегне кон хармоничната средина во случаи кога не се користат единиците на населението - носителите на карактеристиката - како тежини, туку производите на овие единици според вредноста на карактеристиката.


1. Дефиниција на режим и медијана во статистиката

Аритметичките и хармониците се генерализирачки карактеристики на населението според една или друга различна карактеристика. Помошни описни карактеристики на распределбата на различна карактеристика се модот и медијаната.

Во статистиката, режим е вредноста на карактеристиката (варијанта) која најчесто се наоѓа во дадена популација. Во серијата варијации, ова ќе биде опцијата со најголема фреквенција.

Во статистиката, медијаната е опцијата што е во средината варијација серија. Медијаната ја дели серијата на половина; од двете страни од неа (горе и долу) има ист број единици на население.

Режимот и медијаната, за разлика од средствата за моќност, се специфични карактеристики; нивното значење е доделено на која било специфична опција во серијата на варијации.

Режимот се користи во случаи кога е неопходно да се карактеризира најчесто појавуваната вредност на карактеристиката. Доколку е потребно, на пример, да се дознае најчестата стапка на плата во претпријатието, цената на пазарот по која се продавале најголем број стоки, големината на чевлите што е најбарана кај потрошувачите итн., овие случаи прибегнуваат кон модата.

Медијаната е интересна по тоа што ја покажува квантитативната граница на вредноста на различна карактеристика, која половина од членовите на популацијата ја достигнале. Просечната плата на вработените во банката нека биде 650.000 рубли. месечно. Оваа карактеристика може да се надополни ако кажеме дека половина од работниците земале плата од 700.000 рубли. и повисоко, т.е. Да ја дадеме медијаната. Мод и медијана се типични карактеристики во случаи кога популациите се хомогени и големи по број.


2. Наоѓање на режимот и медијаната во дискретна серија на варијации

Наоѓањето на режимот и медијаната во серија на варијации, каде што вредностите на карактеристиката се дадени со одредени бројки, не е многу тешко. Да ја погледнеме Табела 1 со распределбата на семејствата по број на деца.

Табела 1. Распределба на семејства по број на деца

Очигледно, во овој пример, модата ќе биде семејство со две деца, бидејќи оваа вредност одговара најголем бројсемејства. Може да има дистрибуции каде што сите опции се појавуваат подеднакво често, во тој случај нема режим, или, со други зборови, можеме да кажеме дека сите опции се подеднакво модални. Во други случаи, не една, туку две опции може да бидат со најголема фреквенција. Потоа ќе има два режима, дистрибуцијата ќе биде бимодална. Бимодалните распределби може да укажат на квалитативна хетерогеност на популацијата според карактеристиката што се проучува.

За да ја пронајдете средната вредност во серија на дискретни варијации, треба да го поделите збирот на фреквенции на половина и да додадете ½ на резултатот. Значи, во распределбата на 185 семејства по бројот на деца, медијаната ќе биде: 185/2 + ½ = 93, т.е. 93-та опција, која го дели нарачаниот ред на половина. Кое е значењето на опцијата 93? За да дознаете, треба да акумулирате фреквенции, почнувајќи од најмалите опции. Збирот на фреквенциите на првата и втората опција е 40. Јасно е дека тука нема 93 опции. Ако ја додадеме фреквенцијата на третата опција на 40, добиваме збир еднаков на 40 + 75 = 115. Затоа, 93-та опција одговара на третата вредност на различната карактеристика, а средната вредност ќе биде семејство со две деца.

Режимот и медијаната во овој пример се совпаднаа. Ако имавме парен збир на фреквенции (на пример, 184), тогаш, користејќи ја горната формула, ќе го добиеме бројот на средната опција, 184/2 + ½ =92,5. Бидејќи нема фракциони опции, резултатот покажува дека средната вредност е на средина помеѓу 92 и 93 опции.

3. Пресметка на режимот и медијаната во сериите на интервални варијации

Описната природа на режимот и медијаната се должи на фактот што тие не ги компензираат поединечните отстапувања. Тие секогаш одговараат на одредена опција. Затоа, режимот и медијаната не бараат пресметки за да се открие дали се познати сите вредности на атрибутот. Меѓутоа, во серија на варијации на интервал, пресметките се користат за да се најде приближната вредност на режимот и медијаната во одреден интервал.

За да пресметате одредена вредност на модалната вредност на карактеристиката содржана во интервал, користете ја формулата:

M o = X Mo + i Mo *(f Mo – f Mo-1)/((f Mo – f Mo-1) + (f Mo – f Mo+1)),

Каде што XMo е минималната граница на модалниот интервал;

i Mo – вредноста на модалниот интервал;

f Mo – фреквенција на модалниот интервал;

f Mo-1 – фреквенција на интервалот што му претходи на модалниот;

f Mo+1 – фреквенција на интервалот по модалниот.

Дозволете ни да ја прикажеме пресметката на режимот користејќи го примерот даден во Табела 2.


Табела 2. Распределба на работници во претпријатијата по исполнување на стандардите за производство

За да го пронајдеме режимот, прво го одредуваме модалниот интервал на оваа серија. Примерот покажува дека највисоката фреквенција одговара на интервалот каде што варијантите лежат во опсег од 100 до 105. Ова е модалниот интервал. Вредноста на модалниот интервал е 5.

Заменувајќи ги нумеричките вредности од Табела 2 во горната формула, добиваме:

M o = 100 + 5 * (104 -12) / ((104 - 12) + (104 - 98)) = 108,8

Значењето на оваа формула е следново: вредноста на оној дел од модалниот интервал што треба да се додаде на неговата минимална граница се одредува во зависност од големината на фреквенциите на претходните и следните интервали. ВО во овој случајна 100 додаваме 8,8, т.е. повеќе од половина од интервалот бидејќи фреквенцијата на претходниот интервал е помала од фреквенцијата на последователниот интервал.

Ајде сега да ја пресметаме медијаната. За да ја пронајдеме медијаната во серија на варијации на интервал, прво го одредуваме интервалот во кој се наоѓа (среден интервал). Таков интервал ќе биде оној чија кумулативна фреквенција е еднаква или поголема од половина од збирот на фреквенциите. Кумулативните фреквенции се формираат со постепено собирање на фреквенциите, почнувајќи од интервалот со најниската вредност на атрибутот. Половина од збирот на фреквенции е 250 (500:2). Затоа, според Табела 3, просечниот интервал ќе биде интервал со вредност на плата од 350.000 рубли. до 400.000 рубли.

Табела 3. Пресметка на медијаната во серијата на варијации на интервалот

Пред овој интервал, збирот на акумулираните фреквенции беше 160. Затоа, за да се добие средната вредност, потребно е да се додадат уште 90 единици (250 – 160).

Режим и медијана– посебен вид на просеци кои се користат за проучување на структурата на сериите на варијации. Тие понекогаш се нарекуваат структурни просеци, за разлика од претходно дискутираните просеци на моќност.

Мода– тоа е вредноста на карактеристика (варијанта) која најчесто се среќава кај дадена популација, т.е. има најголема фреквенција.

Модата има одлична практична примена и во некои случаи само модата може да ги карактеризира општествените феномени.

Медијана- ова е варијанта што е во средината на нарачана серија на варијации.

Медијаната ја покажува квантитативната граница на вредноста на различна карактеристика, која ја достигнале половина од единиците во популацијата. Препорачливо е да се користи медијаната заедно со просекот или наместо него, доколку има отворени интервали во сериите на варијации, бидејќи за да се пресмета медијаната, не е потребно условно утврдување на границите на отворените интервали, и затоа недостатокот на информации за нив не влијае на точноста на пресметката на медијаната.

Медијаната се користи и кога индикаторите што треба да се користат како тежини се непознати. Медијаната се користи наместо аритметичката средина во статистичките методи за контрола на квалитетот на производот. Збирот на апсолутните отстапувања на опциите од медијаната е помал од кој било друг број.

Да ја разгледаме пресметката на режимот и медијаната во дискретна серија на варијации :

Определете го режимот и медијаната.

Мода Мо = 4 години, бидејќи оваа вредност одговара на највисоката фреквенција f = 5.

Оние. најголем број работници имаат 4 години стаж.

За да ја пресметаме медијаната, прво наоѓаме половина од збирот на фреквенциите. Ако збирот на фреквенции е непарен број, тогаш прво додаваме една на оваа сума и потоа делиме на половина:

Медијаната ќе биде осмата опција.

За да најдеме која опција ќе биде осма по број, ќе акумулираме фреквенции додека не добиеме збир на фреквенции еднаков или поголем од половина од збирот на сите фреквенции. Соодветната опција ќе биде медијаната.

Мех = 4 години.

Оние. половина од работниците имаат помалку од четири години стаж, половина повеќе.

Ако збирот на акумулираните фреквенции во однос на една опција е еднаков на половина од збирот на фреквенциите, тогаш медијаната се дефинира како аритметичка средина на оваа опција и на следната.

Пресметка на режимот и медијаната во сериите на интервални варијации

Режимот во серијата на варијации на интервалот се пресметува со формулата

Каде X М0- почетна граница на модалниот интервал,

чм 0 – вредноста на модалниот интервал,

ѓм 0 , ѓм 0-1 , ѓм 0+1 – фреквенција на модалниот интервал кој претходи и следи по модалниот интервал, соодветно.

МодаленСе нарекува интервалот на кој одговара највисоката фреквенција.

Пример 1

Групи по искуство

Број на работници, луѓе

Акумулирани фреквенции

Определете го режимот и медијаната.

Модален интервал, бидејќи одговара на највисоката фреквенција f = 35. Тогаш:

Хм 0 =6, fm 0 =35

Функцијата MEDIAN во Excel се користи за анализа на опсег нумерички вредностии враќа број кој е средината на множеството што се испитува (медијана). Односно, оваа функција условно дели збир на броеви на две подмножества, од кои првото содржи броеви помали од средната вредност, а втората - повеќе. Медијаната е еден од неколкуте методи за одредување на централната тенденција на опсег на интерес.

Примери за користење на функцијата MEDIAN во Excel

При проучување на возрасни групи студенти, користени се податоци од случајно избрана група студенти на универзитет. Задачата е да се одреди просечната возраст на учениците.

Првични податоци:

Формула за пресметка:


Опис на аргументот:

  • Б3: Б15 – опсег на проучувани возрасти.

Резултат:

Односно, во групата има ученици чија возраст е помала од 21 година и повеќе од оваа вредност.



Споредување на функциите MEDIAN и AVERAGE за пресметување на просечната вредност

Во текот на вечерните кругови во болницата, се мереше телесната температура на секој пациент. Покажете ја корисноста од користењето на медијалниот параметар наместо средната вредност за да се испита опсегот на добиените вредности.

Првични податоци:

Формула за пронаоѓање на просекот:

Формула за наоѓање на медијаната:

Како што може да се види од просечната вредност, во просек температурата на пациентите е повисока од нормалната, но тоа не е точно. Медијаната покажува дека најмалку половина од пациентите имаат нормална телесна температура, која не надминува 36,6.

Внимание! Друг метод за одредување на централната тенденција е режимот (најчестата вредност во опсегот што се проучува). За да ја одредите централната тенденција во Excel, треба да ја користите функцијата MODE. Забележете дека во овој пример вредностите на медијаната и режимот се исти:

Односно, средната вредност што дели едно множество на подмножества на помали и поголеми вредности е исто така најчесто појавуваната вредност во множеството. Како што можете да видите, повеќето пациенти имаат температура од 36,6.

Пример за пресметување на медијаната во статистичка анализа во Excel

Пример 3. Во продавница работат 3 продавачи. Врз основа на резултатите од последните 10 дена, потребно е да се утврди работникот на кој ќе му се додели бонусот. При изборот на најдобриот вработен, се зема предвид степенот на ефикасност на неговата работа, а не бројот на продадени стоки.

Оригинална табела со податоци:


За да ја карактеризираме ефикасноста, ќе користиме три индикатори одеднаш: средна вредност, средна вредност и режим. Ајде да ги одредиме за секој вработен користејќи ги формулите AVERAGE, MEDIAN и MODE, соодветно:


За да го одредиме степенот на расејување на податоците, користиме вредност што е вкупната вредност на модулот на разликата помеѓу средната вредност и режимот, средната вредност и средната вредност, соодветно. Односно, коефициентот x=|av-med|+|av-mod|, каде што:

  • av – просечна вредност;
  • med – медијана;
  • мод - мода.

Ајде да ја пресметаме вредноста на коефициентот x за првиот продавач:

Слично ќе извршиме пресметки за другите продавачи. Резултати:


Ајде да го одредиме продавачот на кого ќе му биде доделен бонусот:

Забелешка: Функцијата SMALL ја враќа првата минимална вредност од разгледуваниот опсег на вредности на коефициентот x.


Коефициентот x е одредена квантитативна карактеристика на стабилноста на работата на продавачите, која ја воведе економистот на продавницата. Со негова помош, беше можно да се одреди опсегот со најмали отстапувања во вредностите. Овој метод покажува како три методи за одредување на централната тенденција може да се користат одеднаш за да се добијат најсигурни резултати.

Карактеристики на користење на функцијата MEDIAN во Excel

Функцијата ја има следнава синтакса:

МЕДИЈАН (број 1; [број 2];...)

Опис на аргументите:

  • број1 е потребен аргумент кој ја карактеризира првата нумеричка вредност содржана во опсегот што се проучува;
  • [број 2] - опционална секунда (и последователни аргументи, вкупно до 255 аргументи), што ги карактеризира втората и последователните вредности на опсегот што се проучува.

Забелешки 1:

  1. Кога правите пресметки, попогодно е да се пренесе целиот опсег на вредности што се проучуваат одеднаш наместо последователно да се внесуваат аргументи.
  2. Прифатените аргументи се нумерички податоци, имиња кои содржат броеви, податоци за референтен тип и низи (на пример, =MEDIAN((1,2,3,5,7,10))).
  3. При пресметување на медијаната, се земаат предвид ќелиите што содржат празни вредности или логичките ТОЧНО, НЕТОЧНО, кои ќе се толкуваат како нумерички вредности 1 и 0, соодветно. На пример, резултатот од извршување на функција со логички вредности во аргументите (TRUE; FALSE) е еквивалентен на резултатот од извршувањето со аргументи (1;0) и е еднаков на 0,5.
  4. Ако еден или повеќе функционални аргументи прифаќаат текстуални вредности што не можат да се претворат во нумерички вредности или содржат кодови за грешка, функцијата ќе го врати кодот за грешка #VALUE!.
  5. Други функции на Excel може да се користат за одредување на медијаната на примерокот: PERCENTILE.IN, QUARTILE.IN, MAX Примери за употреба:
  • =PERCENTILE.IN(A1:A10,0.5), бидејќи по дефиниција медијаната е 50-тиот перцентил.
  • =QUARTILE.ON(A1:A10;2), бидејќи медијаната е 2. квартил.
  • =HIGH(A1:A9,COUNT(A1:A9)/2), но само ако бројот на броеви во опсегот е непарен број.

Забелешки 2:

  1. Ако во опсегот што се проучува сите броеви се распределени симетрично околу средната вредност, аритметичката средина и медијаната за овој опсег ќе бидат еквивалентни.
  2. Со големи отстапувања на податоците во опсегот („растура“ на вредности), средната вредност подобро го одразува трендот во распределбата на вредностите отколку аритметичката средина. Одличен пример е употребата на медијаната за одредување на вистинското ниво на платите кај населението во држава во која функционерите заработуваат по ред повеќе од обичните граѓани.
  3. Опсегот на вредности што се испитуваат може да содржи:
  • Непарен број на броеви. Во овој случај, медијаната ќе биде еднина, делејќи го опсегот на две подмножества од поголеми и помали вредности, соодветно;
  • Парен број на броеви. Потоа, медијаната се пресметува како аритметичка средина на две нумерички вредности кои го делат множеството на двете подмножества наведени погоре.

За да се пресмета медијаната во MS EXCEL, постои посебна функција MEDIAN(). Во оваа статија ќе ја дефинираме медијаната и ќе научиме како да ја пресметаме за примерок и за даден закон за распределба случајна променлива.

Да почнеме со медијаниЗа примероци(т.е. за фиксен сет на вредности).

Примерок медијана

Медијана(медијана) е број што е средина на множество броеви: половина од броевите во множеството се поголеми од медијана, а половина од бројките се помали од медијана.

Да се ​​пресмета медијанипотребно прво (вредности во пример). На пример, медијаназа примерок (2; 3; 3; 4 ; 5; 7; 10) ќе биде 4. Бидејќи само внатре пример 7 вредности, три од нив се помали од 4 (т.е. 2; 3; 3), а три вредности се поголеми (т.е. 5; 7; 10).

Ако множеството содржи парен број на броеви, тогаш се пресметува за двата броја во средината на множеството. На пример, медијаназа примерок (2; 3; 3 ; 6 ; 7; 10) ќе биде 4,5, бидејќи (3+6)/2=4,5.

За одредување медијаниво MS EXCEL постои функција со истото име MEDIAN(), англиска верзијаМЕДИАН().

Медијанане мора да се совпаѓа со . Поклопување се јавува само ако вредностите во примерокот се распределени симетрично во однос на просек. На пример, за примероци (1; 2; 3 ; 4 ; 5; 6) медијанаИ просекеднакво на 3,5.

Доколку се знае Дистрибутивна функција F(x) или функција на густина на веројатност стр(X), Тоа медијанаможе да се најде од равенката:

На пример, откако ја решивме оваа равенка аналитички за логномалната дистрибуција lnN(μ; σ 2), добиваме дека медијанапресметано со формулата =EXP(μ). Кога μ=0, медијаната е 1.

Обрнете внимание на поентата Функции на дистрибуција, за што Ф(x)=0,5(види слика погоре) . Апсцисата на оваа точка е еднаква на 1. Ова е вредноста на медијаната, која природно се совпаѓа со претходно пресметаната вредност користејќи ја формулата em.

Во MS EXCEL медијанаЗа логнонормална дистрибуција LnN(0;1) може да се пресмета со помош на формулата =LOGNORM.REV(0,5,0,1).

Забелешка: Потсетиме дека интегралот на во текот на целиот домен на одредување на случајната променлива е еднаква на една.

Затоа, средната линија (x=Медијана) ја дели областа под графиконот функции на густина на веројатностна два еднакви дела.

Споделете со пријателите или заштедете за себе:

Се вчитува...