Студенти и ученици - помош во студирањето. Концептот на варијација серија. Видови варијации на серии Дадени серии на варијации

Методот на групирање ви овозможува и мерење варијација(променливост, флуктуација) на знаците. Кога бројот на единици во популацијата е релативно мал, варијацијата се мери врз основа на рангираниот број на единици што ја сочинуваат популацијата. Серијата се вика рангирана,ако единиците се подредени по растечки (опаѓачки) редослед на карактеристиката.

Сепак, рангираните серии се доста индикативни кога е потребна компаративна карактеристика на варијација. Дополнително, во многу случаи треба да се занимаваме со статистички популации кои се состојат од голем број единици, кои практично тешко се прикажуваат во форма на одредена серија. Во таа насока, за почетно општо запознавање со статистичките податоци и особено за олеснување на проучувањето на варијациите во карактеристиките, феномените и процесите што се испитуваат обично се комбинираат во групи, а резултатите од групирањето се претставени во форма на групни табели.

Ако групната табела има само две колони - групи според избраната карактеристика (опции) и бројот на групи (фреквенција или фреквенција), таа се нарекува во близина на дистрибуција.

Опсег на дистрибуција -наједноставниот тип на структурно групирање врз основа на една карактеристика, прикажан во групна табела со две колони кои содржат варијанти и фреквенции на карактеристиката. Во многу случаи, со такво структурно групирање, т.е. Со составувањето на дистрибутивните серии започнува изучувањето на почетниот статистички материјал.

Структурната групација во форма на дистрибутивна серија може да се претвори во вистинска структурна групација ако избраните групи се карактеризираат не само со фреквенции, туку и со други статистички показатели. Главната цел на дистрибутивните серии е да ја проучува варијацијата на карактеристиките. Теоријата на дистрибутивни серии е детално развиена со математичка статистика.

Сериите на дистрибуција се поделени на атрибутивен(групирање според атрибутивни карактеристики, на пример, поделба на населението по пол, националност, брачен статус итн.) и варијациски(групирање по квантитативни карактеристики).

Серија на варијациие групна табела која содржи две колони: групирање на единици според една квантитативна карактеристика и број на единици во секоја група. Интервалите во серијата на варијации обично се формираат еднакви и затворени. Серијата на варијации е следнава групација на руското население по просечен монетарен приход по глава на жител (Табела 3.10).

Табела 3.10

Распределба на населението на Русија по просечен приход по глава на жител во 2004-2009 година.

Групи на население по просечен готовински приход по глава на жител, руб./месец

Население во групата, % од вкупниот број

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Над 25.000,0

Цело население

Сериите на варијации, пак, се поделени на дискретни и интервални. Дискретнисериите на варијации комбинираат варијанти на дискретни карактеристики кои варираат во тесни граници. Пример за дискретна серија на варијации е распределбата на руските семејства според бројот на деца што ги имаат.

Интервалсериите на варијации комбинираат варијанти на континуирани карактеристики или дискретни карактеристики кои варираат во широк опсег. Интервал е серија на варијации на распределбата на руското население по просечен монетарен приход по глава на жител.

Дискретните серии на варијации не се користат многу често во пракса. Во меѓувреме, нивното составување не е тешко, бидејќи составот на групите се одредува според специфичните варијанти што всушност ги имаат проучуваните карактеристики на групирањето.

Пораспространети се сериите на интервални варијации. При нивното составување се поставува тешко прашање за бројот на групите, како и за големината на интервалите што треба да се утврдат.

Принципите за решавање на ова прашање се поставени во поглавјето за методологијата за конструирање статистички групирања (види став 3.3).

Сериите на варијации се средство за рушење или компресирање на различни информации во компактна форма; од нив може да се донесе прилично јасен суд за природата на варијацијата и да се проучат разликите во карактеристиките на феномените вклучени во множеството што се проучува. Но, најважното значење на варијационите серии е тоа што врз нивна основа се пресметуваат посебните генерализирачки карактеристики на варијацијата (види Поглавје 7).

Групирање- ова е поделба на населението на групи кои се хомогени според некоја карактеристика.

Цел на услугата. Користејќи го онлајн калкулаторот можете:

  • изгради серија на варијации, изгради хистограм и многуаголник;
  • најдете индикатори за варијација (просек, режим (вклучувајќи графички), медијана, опсег на варијација, квартили, децили, коефициент на диференцијација на квартили, коефициент на варијација и други индикатори);

Инструкции. За да групирате серија, мора да го изберете типот на добиената серија на варијации (дискретна или интервал) и да ја наведете количината на податоци (број на редови). Добиеното решение се зачувува во датотека Word (види пример за групирање статистички податоци).

Доколку групирањето е веќе извршено и на серии на дискретни варијацииили интервални серии, тогаш треба да го користите онлајн калкулаторот Variation Indices. Тестирање на хипотезата за типот на дистрибуцијасе врши со користење на услугата Проучување на формуларот за дистрибуција.

Видови статистички групирања

Серија на варијации. Во случај на набљудување на дискретна случајна променлива, истата вредност може да се сретне неколку пати. Ваквите вредности x i на случајна променлива се запишуваат што укажува на n i колку пати се појавува во n набљудувања, ова е фреквенцијата на оваа вредност.
Во случај на континуирана случајна променлива, групирањето се користи во пракса.
  1. Типолошка групација- ова е поделба на квалитативно хетерогеното население што се проучува на класи, социо-економски типови, хомогени групи единици. За да ја изградите оваа групација, користете го параметарот серија на дискретни варијации.
  2. Групирањето се нарекува структурно, во која хомогена популација е поделена на групи кои ја карактеризираат нејзината структура според некои различни карактеристики. За да ја изградите оваа групација, користете го параметарот серија интервал.
  3. Се нарекува групирање што ги открива односите помеѓу појавите што се проучуваат и нивните карактеристики аналитичка група(види аналитичко групирање на серии).

Пример бр. 1. Врз основа на податоците во Табела 2, конструирајте серии за дистрибуција за 40 комерцијални банки во Руската Федерација. Користејќи ја добиената дистрибутивна серија, определи: просечен профит по деловна банка, кредитни инвестиции во просек по деловна банка, модална и средна вредност на добивката; квартили, децили, опсег на варијација, средно линеарно отстапување, стандардна девијација, коефициент на варијација.

Решение:
Во поглавјето „Тип на статистичка серија“изберете Дискретна серија. Кликнете Вметни од Excel. Број на групи: според формулата на Sturgess

Принципи за конструирање статистички групирања

Се нарекува серија на набљудувања подредени во растечки редослед варијација серија . Функција за групирањее карактеристика со која населението се дели на посебни групи. Се нарекува основа на групата. Групирањето може да се заснова и на квантитативни и на квалитативни карактеристики.
По утврдувањето на основата на групирањето, треба да се реши прашањето за бројот на групи на кои треба да се подели популацијата што се проучува.

Кога се користат персонални компјутери за обработка на статистички податоци, групирањето на објектните единици се врши со користење на стандардни процедури.
Една таква постапка се заснова на употребата на формулата Sturgess за да се одреди оптималниот број на групи:

k = 1+3,322*log(N)

Каде што k е бројот на групи, N е бројот на единици на населението.

Должината на парцијалните интервали се пресметува како h=(x max -x min)/k

Потоа се бројат броевите на набљудувања кои спаѓаат во овие интервали, кои се земаат како фреквенции n i. Неколку фреквенции, чии вредности се помали од 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Средните вредности на интервалите x i =(c i-1 +c i)/2 се земаат како нови вредности.

Пример бр. 3. Како резултат на 5% случаен примерок, добиена е следната распределба на производите по содржина на влага. Пресметајте: 1) просечен процент на влажност; 2) индикатори кои ги карактеризираат варијациите на влажноста.
Решението е добиено со помош на калкулатор: Пример бр.1

Конструирај серија на варијации. Врз основа на пронајдената серија, конструирајте дистрибутивен полигон, хистограм и кумулирајте. Определете го режимот и медијаната.
Преземете решение

Пример. Според резултатите од набљудувањето на примерокот (примерок А, Додаток):
а) направи варијација серија;
б) пресметува релативни фреквенции и акумулирани релативни фреквенции;
в) изгради многуаголник;
г) да се создаде функција за емпириска дистрибуција;
д) нацртајте ја функцијата за емпириска дистрибуција;
ѓ) пресметај нумерички карактеристики: аритметичка средина, дисперзија, стандардна девијација. Решение

Врз основа на податоците дадени во Табела 4 (Додаток 1) и што одговараат на вашата опција, направете:

  1. Врз основа на структурното групирање, конструирајте серии на варијациска фреквенција и кумулативна дистрибуција користејќи еднакви затворени интервали, земајќи го бројот на групи еднаков на 6. Претставете ги резултатите во форма на табела и прикажете графички.
  2. Анализирајте ги сериите на варијации на распределбата со пресметување:
    • аритметичка средна вредност на карактеристиката;
    • режим, медијана, 1-ви квартал, 1-ви и 9-ти децил;
    • Стандардна девијација;
    • коефициентот на варијација.
  3. Извлечете заклучоци.

Потребно: рангирање на серијата, конструирање интервална дистрибутивна серија, пресметување на просечната вредност, варијабилност на просечната вредност, режим и медијана за рангираната и интервалната серија.

Врз основа на првичните податоци, конструирајте дискретна серија на варијации; да го претстави во форма на статистичка табела и статистички графикони. 2). Врз основа на првичните податоци, конструирајте серија на варијации на интервали со еднакви интервали. Сами изберете го бројот на интервали и објаснете го овој избор. Претставете ја добиената серија на варијации во форма на статистичка табела и статистички графикони. Наведете ги типовите на табели и графикони што се користат.

Со цел да се одреди просечното времетраење на услугите на клиентите во пензиски фонд, чиј број клиенти е многу голем, спроведена е анкета на 100 клиенти со примена на шема на случаен не-повторувачки примерок. Резултатите од истражувањето се прикажани во табелата. Најдете:
а) границите во кои, со веројатност 0,9946, е содржано просечното време на услуга за сите клиенти на пензискиот фонд;
б) веројатноста дека учеството на сите клиенти на фондовите со времетраење на услугата помало од 6 минути се разликува од учеството на таквите клиенти во примерокот за не повеќе од 10% (во апсолутна вредност);
в) обемот на повторено земање примероци, во кој со веројатност од 0,9907 може да се наведе дека учеството на сите клиенти на фондовите со времетраење на услугата помало од 6 минути се разликува од учеството на таквите клиенти во примерокот за не повеќе од 10 % (во апсолутна вредност).
2. Според задача 1, со помош на Пирсоновиот X2 тест, на ниво на значајност α = 0,05, тестирајте ја хипотезата дека случајна вредност X – времето за услуги на клиентите – се распределува според нормален закон. Конструирај хистограм на емпириската дистрибуција и соодветната нормална крива во еден цртеж.
Преземете решение

Даден е примерок од 100 елементи. Неопходно:

  1. Конструирај рангирана серија на варијации;
  2. Најдете ги максималните и минималните услови на серијата;
  3. Најдете го опсегот на варијации и бројот на оптимални интервали за конструирање интервална серија. Најдете ја должината на интервалот на интервалната серија;
  4. Конструирај интервална серија. Најдете ги фреквенциите на елементите на примерокот што спаѓаат во составените интервали. Најдете ги средните точки на секој интервал;
  5. Конструирај хистограм и многуаголник на фреквенција. Спореди со нормална дистрибуција(аналитички и графички);
  6. Исцртај ја функцијата за емпириска дистрибуција;
  7. Пресметајте ги нумеричките карактеристики на примерокот: средната вредност на примерокот и моментот на централниот примерок;
  8. Пресметајте приближни вредности на стандардна девијација, искривување и куртоза (со помош на пакетот за анализа на MS Excel). Споредете ги приближните пресметани вредности со точните (пресметани со помош на формули MS Excel);
  9. Споредете ги избраните графички карактеристики со соодветните теоретски.
Преземете решение

Следниве податоци за примерокот се достапни (10% примерок, механички) за излезот на производот и износот на профитот, милиони рубли. Според првичните податоци:
Задача 13.1.
13.1.1. Конструирајте статистичка серија на распределба на претпријатијата по износот на добивката, формирајќи пет групи со еднакви интервали. Конструирај графикони од сериите на дистрибуција.
13.1.2. Пресметајте ги нумеричките карактеристики на дистрибутивната серија на претпријатија по износот на добивката: аритметичка средина, стандардна девијација, дисперзија, коефициент на варијација V. Извлечете заклучоци.
Задача 13.2.
13.2.1. Определете ги границите во кои, со веројатност 0,997, лежи износот на добивката на едно претпријатие во општата популација.
13.2.2. Користејќи го Пирсоновиот x2 тест, на ниво на значајност α, тестирајте ја хипотезата дека случајната променлива X - износот на добивката - е распределена според нормален закон.
Задача 13.3.
13.3.1. Определете ги коефициентите на примерокот за регресивна равенка.
13.3.2. Утврдете го присуството и природата на корелацијата помеѓу трошоците за произведените производи (X) и износот на профитот по претпријатие (Y). Конструирај сптерплот и регресивна линија.
13.3.3. Пресметај го коефициентот на линеарна корелација. Користејќи го Студентскиот т-тест, тестирајте ја значајноста на коефициентот на корелација. Извлечете заклучок за блиската врска помеѓу факторите X и Y користејќи ја скалата на Чадок.
Насоки . Задачата 13.3 се изведува со користење на оваа услуга.
Преземете решение

Задача. Следниве податоци го претставуваат времето поминато на клиентите на склучување договори. Конструирај интервална серија на варијации на презентираните податоци, хистограм, најде непристрасна проценка математичко очекување, пристрасен и непристрасен проценувач на варијанса.

Пример. Според Табела 2:
1) Изградете дистрибутивна серија за 40 комерцијални банки на Руската Федерација:
А) во смисла на профит;
Б) по износот на кредитните инвестиции.
2) Користејќи ја добиената дистрибутивна серија, определи:
А) просечна добивка по деловна банка;
Б) кредитни инвестиции во просек по деловна банка;
В) модална и средна вредност на добивката; квартили, децили;
Г) модална и средна вредност на кредитните инвестиции.
3) Користејќи ги редовите за дистрибуција добиени во чекор 1, пресметајте:
а) опсег на варијации;
б) просечно линеарно отстапување;
в) стандардна девијација;
г) коефициент на варијација.
Пополнете ги потребните пресметки во табеларна форма. Анализирајте ги резултатите. Извлечете заклучоци.
Зацртај графикони на добиената дистрибутивна серија. Графички одредете го режимот и медијаната.

Решение:
За да изградиме групација со еднакви интервали, ќе ја користиме услугата Групирање статистички податоци.

Слика 1 – Внесување параметри

Опис на параметрите
Број на линии: број на влезни податоци. Ако големината на редот е мала, наведете ја нејзината количина. Ако изборот е доволно голем, тогаш кликнете на копчето Вметни од Excel.
Број на групи: 0 – бројот на групи ќе се определи со формулата Sturgess.
Ако е наведен одреден број на групи, наведете го (на пример, 5).
Тип на серија: Дискретна серија.
Ниво на значајност: на пример 0,954 . Овој параметар е поставен за да го одреди интервалот на доверливост на средната вредност.
Пример: На пример, извршено е 10% механичко земање мостри. Го наведуваме бројот 10. За нашите податоци наведуваме 100.

Збир на предмети или појави обединети со некоја заедничка карактеристика или својство од квалитативна или квантитативна природа се нарекува објект на набљудување .

Секој предмет на статистичко набљудување се состои од поединечни елементи - единици за набљудување .

Резултатите од статистичкото набљудување претставуваат нумерички информации - податоци . Статистички податоци - ова е информација за тоа кои вредности ги земала карактеристиката од интерес за истражувачот во статистичката популација.

Ако вредностите на некоја карактеристика се изразени во бројки, тогаш се нарекува карактеристиката квантитативни .

Ако знакот карактеризира некое својство или состојба на елементите на популацијата, тогаш знакот се нарекува висок квалитет .

Ако сите елементи на една популација се предмет на проучување (континуирано набљудување), тогаш статистичката популација се нарекува општо

Ако дел од елементите на општата популација е предмет на истражување, тогаш се нарекува статистичката популација селективно (земање мостри) . Примерок од популација се извлекува по случаен избор, така што секој од n-те елементи во примерокот има еднакви шанси да биде избран.

Вредностите на карактеристична промена (варираат) кога се движат од еден елемент на населението во друг, затоа во статистиката се нарекуваат и различни вредности на карактеристиката опции . Опциите обично се означуваат со мали латински букви x, y, z.

Се повикува серискиот број на опцијата (карактеристична вредност). ранг . x 1 - 1-ва опција (1-ва вредност на атрибутот), x 2 - 2-ра опција (втора вредност на атрибутот), x i - i-та опција (i-та вредностзнак).

Серија вредности на атрибути (опции) подредени во растечки или опаѓачки редослед со нивните соодветни тежини се нарекуваат варијација серија (дистрибуција серија).

Како вага се појавуваат фреквенции или фреквенции.

Фреквенција(m i) покажува колку пати оваа или онаа опција (вредност на атрибутот) се појавува во статистичката популација.

Фреквенција или релативна фреквенција(w i) покажува кој дел од единиците на население има една или друга опција. Фреквенцијата се пресметува како однос на фреквенцијата на одредена опција до збирот на сите фреквенции од серијата.

. (6.1)

Збирот на сите фреквенции е 1.

. (6.2)

Сериите на варијации се дискретни и интервални.

Дискретна варијација серијаТие обично се конструираат ако вредностите на карактеристиката што се проучува може да се разликуваат една од друга за не помалку од одредена конечна количина.

Во сериите на дискретни варијации, се специфицирани точките вредности на карактеристиката.

Општиот приказ на сериите на дискретни варијации е прикажан во Табела 6.1.

Табела 6.1

каде што i = 1, 2, ..., л.

Во сериите за варијација на интервалот, во секој интервал се разликуваат горните и долните граници на интервалот.

Разликата помеѓу горните и долните граници на интервалот се нарекува интервална разлика или должина (вредност) на интервалот .

Вредноста на првиот интервал k 1 се одредува со формулата:

k 1 = a 2 - a 1;

второ: k 2 = a 3 - a 2; ...

последно: k l = а л - а л -1 .

Генерално интервална разлика k i се пресметува со формулата:

k i = x i (max) - x i (min) . (6.3)

Ако интервалот ги има двете граници, тогаш тој се нарекува затворена .

Првиот и последниот интервал може да биде отворени , т.е. имаат само една граница.

На пример, првиот интервал може да се постави како „до 100“, вториот - „100-110“, ..., вториот до последен - „190-200“, последниот - „200 и повеќе“. Очигледно, првиот интервал нема долна граница, а последниот нема горна граница; и двата се отворени.

Честопати отворените интервали мора да бидат условно затворени. За да го направите ова, обично вредноста на првиот интервал се зема еднаква на вредноста на вториот, а вредноста на последниот - на вредноста на претпоследниот. Во нашиот пример, вредноста на вториот интервал е 110-100=10, според тоа, долната граница на првиот интервал условно ќе биде 100-10=90; вредноста на претпоследниот интервал е 200-190=10, според тоа, горната граница на последниот интервал условно ќе биде 200+10=210.

Покрај тоа, во серија на варијации на интервал може да има интервали со различни должини. Ако интервалите во серијата на варијации имаат иста должина (интервална разлика), тие се нарекуваат еднакви по големина инаку - нееднаков по големина.

Кога се конструира серија на варијации на интервали, често се јавува проблемот со изборот на големината на интервалите (интервална разлика).

За да се одреди оптималната големина на интервали (во случај да се конструира серија со еднакви интервали), користете Формула за Sturges:

, (6.4)

каде n е бројот на единици во популацијата,

x (max) и x (min) - најголемите и најмалите вредности на сериските опции.

За да се карактеризираат сериите на варијации, заедно со фреквенциите и фреквенциите, се користат акумулирани фреквенции и фреквенции.

Акумулирани фреквенции (фреквенции)покажете колку единици од населението (кој дел од нив) не надминуваат дадена вредност (варијанта) x.

Акумулирани фреквенции ( v i) врз основа на податоци од дискретни серии може да се пресметаат со користење следнава формула:

. (6.5)

За серија на варијации на интервали, ова е збирот на фреквенциите (фреквенциите) на сите интервали што не го надминуваат овој.

Дискретна серија на варијации може да се претстави графички со користење дистрибуција на фреквенција полигон или фреквенции.

Кога се конструира дистрибутивен полигон, вредностите на карактеристиката (варијанти) се исцртуваат по оската на апсцисата, а фреквенциите или фреквенциите се нацртани по должината на оската на ординатите. На пресекот на вредностите на атрибутот и соодветните фреквенции (фреквенции), се поставуваат точки, кои, пак, се поврзани со сегменти. Добиената скршена линија се нарекува полигон на дистрибуција на фреквенција (фреквенција).

x k
x 2
x 1 x i


Ориз. 6.1.

Сериите на варијации на интервал може да се претстават графички со користење хистограми, т.е. столбест дијаграм.

При конструирање на хистограм, вредностите на карактеристиката што се проучува (границите на интервалот) се нацртани долж оската на апсцисата.

Во случај интервалите да се со иста големина, фреквенциите или фреквенциите може да се нацртаат по должината на оската на ординатите.

Ако интервалите имаат различни големини, вредностите на апсолутната или релативната густина на дистрибуција мора да се нацртаат по должината на оската на ординатите.

Апсолутна густина- однос на интервалната фреквенција до големината на интервалот:

; (6.6)

каде што: f(a) i - апсолутна густина на i-тиот интервал;

m i - фреквенција на i-тиот интервал;

k i - вредноста на i-тиот интервал (интервална разлика).

Апсолутната густина покажува колку единици на население има по единица интервал.

Релативна густина- однос на интервалната фреквенција до големината на интервалот:

; (6.7)

каде што: f(о) i - релативна густина на i-тиот интервал;

w i - фреквенција на i-тиот интервал.

Релативната густина покажува колкав дел од единиците на населението паѓа на единица од интервалот.

а л
а 1 x i
а 2

И дискретните и интервалните серии на варијација може да се претстават графички во форма на кумулати и огиви.

При градење се кумулираспоред податоците на дискретна серија, вредностите на карактеристиката (варијантите) се нацртани по должината на оската x, а акумулираните фреквенции или фреквенции се нацртани по должината на оската на ординатите. На пресекот на вредностите на атрибутот (варијанти) и соодветните акумулирани фреквенции (фреквенции), се конструираат точки, кои, пак, се поврзани со сегменти или крива. Добиената скршена линија (крива) се нарекува кумулативна (кумулативна крива).

Кога се конструираат кумулати врз основа на податоци од интервална серија, границите на интервалите се исцртуваат долж оската на апсцисата. Абсцисите на точките се горните граници на интервалите. Ординатите ги формираат акумулираните фреквенции (фреквенции) на соодветните интервали. Честопати се додава уште една точка, чија апсциса е долната граница на првиот интервал, а ординатата е нула. Со поврзување на точките со отсечки или крива, добиваме кумулација.

Огивае конструиран слично на кумулатот со единствената разлика што точките што одговараат на акумулираните фреквенции (фреквенции) се нацртани на оската на апсцисата, а вредностите на карактеристиката (варијантите) се нацртани на оската на ординатите.

  • Воведна лекција бесплатно;
  • Голем бројискусни наставници (мајчин и руски јазик);
  • Курсевите НЕ се за одреден период (месец, шест месеци, година), туку за одреден број на часови (5, 10, 20, 50);
  • Повеќе од 10.000 задоволни клиенти.
  • Цената на една лекција со наставник што зборува руски е од 600 рубли, со мајчин јазик - од 1500 рубли

Концептот на варијација серија.Првиот чекор во систематизирањето на материјалите за статистичко набљудување е да се брои бројот на единици кои имаат одредена карактеристика. Со подредување на единиците по растечки или опаѓачки редослед на нивната квантитативна карактеристика и броење на бројот на единици со одредена вредност на карактеристиката, добиваме серија на варијации. Серијата на варијации ја карактеризира распределбата на единиците на одредена статистичка популација според некоја квантитативна карактеристика.

Серијата на варијации се состои од две колони, левата колона ги содржи вредностите на различната карактеристика, наречена варијанти и означена (x), а десната колона содржи апсолутни броеви кои покажуваат колку пати се појавува секоја варијанта. Индикаторите во оваа колона се нарекуваат фреквенции и се означени (f).

Серијата на варијации може шематски да се претстави во форма на Табела 5.1:

Табела 5.1

Вид на варијација серија

Опции (x)

Фреквенции (ѓ)

Во десната колона, може да се користат и релативни индикатори, кои го карактеризираат уделот на фреквенцијата на поединечни опции во вкупниот збир на фреквенции. Овие релативни индикатори се нарекуваат фреквенции и конвенционално се означени со , т.е. . Збирот на сите фреквенции е еднаков на една. Фреквенциите може да се изразат и како проценти, а потоа нивниот збир ќе биде еднаков на 100%.

Различни знаци може да бидат од различна природа. Варијантите на некои карактеристики се изразуваат во цели броеви, на пример, бројот на соби во станот, бројот на објавени книги итн. Овие знаци се нарекуваат дисконтинуирани или дискретни. Варијантите на други карактеристики можат да преземат какви било вредности во одредени граници, како што се исполнување на планираните задачи, платите итн. Овие карактеристики се нарекуваат континуирани.

Дискретна варијација серија.Ако варијантите на варијациските серии се изразат во форма дискретни количини, тогаш таквата серија на варијации се нарекува дискретна, нејзиниот изглед е претставен во табела. 5.2:

Табела 5.2

Распределба на учениците според оценките од испитот

Оценки (x)

Број на студенти (ѓ)

Во % од вкупното ()

Природата на распределбата во дискретни серии е прикажана графички во форма на дистрибутивен полигон, Сл. 5.1.

Ориз. 5.1. Распределба на студенти според оценките добиени на испитот.

Серии на варијации на интервал.За континуирани карактеристики, варијационите серии се конструирани како интервални, т.е. вредностите на карактеристиката во нив се изразуваат во форма на интервали „од и до“. Во овој случај, минималната вредност на карактеристиката во таков интервал се нарекува долна граница на интервалот, а максималната се нарекува горна граница на интервалот.

Сериите на интервални варијации се конструирани и за дисконтинуирани карактеристики (дискретни) и за оние кои варираат во голем опсег. Интервалните редови можат да бидат со еднакви или нееднакви интервали. Во економската практика се користат повеќето нееднакви интервали, кои прогресивно се зголемуваат или намалуваат. Оваа потреба се јавува особено во случаи кога флуктуацијата на некоја карактеристика се јавува нерамномерно и во големи граници.

Да го разгледаме типот на серии на интервали со еднакви интервали, табела. 5.3:

Табела 5.3

Распределба на работници по производство

Излез, т.р. (X)

Број на работници (ѓ)

Кумулативна фреквенција (f´)

Серијата на распределба на интервалот е графички прикажана во форма на хистограм, Сл. 5.2.

Сл.5.2. Распределба на работници по производство

Акумулирана (кумулативна) фреквенција.Во пракса, постои потреба да се трансформираат дистрибутивните серии во кумулативна серија,изградени според акумулираните фреквенции. Со нивна помош, можете да одредите структурни просеци кои ја олеснуваат анализата на податоците од сериите на дистрибуција.

Кумулативните фреквенции се одредуваат со последователно додавање на фреквенциите (или фреквенциите) од првата група овие индикатори на следните групи од серијата на дистрибуција. Кумулатите и огивите се користат за илустрација на сериите на дистрибуција. За да се конструираат, вредностите на дискретната карактеристика (или краевите на интервалите) се означени на оската на апсцисата, а кумулативните збирови на фреквенции (кумулати) се означени на оската на ординатите, Сл. 5.3.

Ориз. 5.3. Кумулативна распределба на работниците по производство

Ако скалите на фреквенции и опции се обратни, т.е. оската на апсцисата ги рефлектира акумулираните фреквенции, а оската на ординатите ги прикажува вредностите на варијантите, тогаш кривата што ја карактеризира промената на фреквенциите од група до група ќе се нарече дистрибуција, Сл. 5.4.

Ориз. 5.4. Огива на распределба на работниците по производство

Сериите на варијации со еднакви интервали обезбедуваат едно од најважните барања за сериите за статистичка дистрибуција, обезбедувајќи нивна споредливост во време и простор.

Густина на дистрибуција.Сепак, фреквенциите на поединечни нееднакви интервали во именуваната серија не се директно споредливи. Во такви случаи, за да се обезбеди потребната споредливост, се пресметува густината на дистрибуцијата, т.е. определи колку единици во секоја група има по единица интервална вредност.

Кога се конструира график на распределба на серија на варијации со нееднакви интервали, висината на правоаголниците се одредува пропорционално не на фреквенциите, туку на индикаторите за густина на распределбата на вредностите на карактеристиката што се проучува во соодветните интервали.

Изготвувањето на варијациска серија и нејзиното графичко претставување е првиот чекор во обработката на почетните податоци и првата фаза во анализата на популацијата што се проучува. Следниот чекор во анализата на варијационите серии е да се утврдат главните општи индикатори, наречени карактеристики на серијата. Овие карактеристики треба да дадат идеја за просечната вредност на карактеристиката меѓу единиците на населението.

средна вредност. Просечната вредност е генерализирана карактеристика на карактеристиката што се проучува кај популацијата што се проучува, што го одразува нејзиното типично ниво по единица на населението под специфични услови на место и време.

Просечната вредност секогаш се именува и има иста димензија како карактеристиката на поединечните единици на населението.

Пред да се пресметаат просечните вредности, неопходно е да се групираат единиците на населението што се проучува, идентификувајќи квалитативно хомогени групи.

Просекот пресметан за населението како целина се нарекува вкупен просек, а за секоја група - групни просеци.

Постојат два вида просеци: моќност (аритметичка средина, хармонична средина, геометриска средина, квадратна средина); структурни (режим, медијана, квартили, децили).

Изборот на просекот за пресметка зависи од целта.

Видови просеци на моќност и методи за нивна пресметка.Во практиката на статистичка обработка на собраниот материјал се јавуваат разни проблеми за чие решавање се потребни различни просеци.

Математичката статистика изведува различни просеци од формулите за просечни вредности на моќност:

каде е просечната вредност; x – индивидуални опции (вредности на карактеристики); z – експонент (со z = 1 – аритметичка средина, z = 0 геометриска средина, z = - 1 – хармонична средина, z = 2 – квадратна средина).

Меѓутоа, прашањето каков тип на просек треба да се примени во секој поединечен случај е решено со специфична анализанаселението што се проучува.

Најчестиот тип на просек во статистиката е аритметичко значење. Се пресметува во случаи кога обемот на просечната карактеристика се формира како збир на неговите вредности за поединечни единици од статистичката популација што се проучува.

Во зависност од природата на изворните податоци, аритметичката средина се одредува на различни начини:

Ако податоците се негрупирани, тогаш пресметката се врши со помош на едноставната просечна формула

Пресметка на аритметичката средина во дискретна серијасе јавува според формулата 3.4.

Пресметување на аритметичката средина во интервална серија.Во серија на варијации на интервал, каде што вредноста на карактеристиката во секоја група конвенционално се зема како средина на интервалот, аритметичката средина може да се разликува од средната вредност пресметана од негрупирани податоци. Притоа, колку е поголем интервалот во групите, толку се поголеми можните отстапувања на просекот пресметан од групирани податоци од просекот пресметан од негрупирани податоци.

При пресметување на просекот во серија на варијации на интервали, за да се извршат потребните пресметки, се преминува од интервалите до нивните средни точки. И тогаш просекот се пресметува со помош на формулата за пондериран аритметички просек.

Својства на аритметичката средина.Аритметичката средина има некои својства што овозможуваат поедноставување на пресметките; ајде да ги разгледаме.

1. Аритметичката средина на константните броеви е еднаква на овој константен број.

Ако x = a. Потоа .

2. Ако тежините на сите опции се менуваат пропорционално, т.е. се зголемува или намалува за ист број пати, тогаш аритметичката средина на новата серија нема да се промени.

Ако сите тежини f се намалат за k пати, тогаш .

3. Збирот на позитивни и негативни отстапувања на поединечни опции од просекот, помножен со тежините, е еднаков на нула, т.е.

Ако тогаш. Од тука.

Ако сите опции се намалат или зголемат за кој било број, тогаш аритметичката средина на новата серија ќе се намали или зголеми за истиот износ.

Да ги намалиме сите опции xна а, т.е. x´ = xа.

Потоа

Аритметичката средина на оригиналната серија може да се добие со додавање на намалената средина на бројот претходно одземен од опциите а, т.е. .

5. Ако сите опции се намалени или зголемени во кпати, тогаш аритметичката средина на новата серија ќе се намали или зголеми за иста количина, т.е. В кеднаш.

Нека биде тогаш .

Оттука, т.е. за да се добие просекот на оригиналната серија, аритметичкиот просек на новата серија (со намалени опции) мора да се зголеми за кеднаш.

Хармонична средина.Хармоничната средина е реципрочна на аритметичката средина. Се користи кога статистички информациине содржи фреквенции за поединечни варијанти на популацијата, туку е претставен како нивен производ (M = xf). Хармоничната средина ќе се пресмета со формулата 3.5

Практичната примена на хармоничната средина е да се пресметаат некои индекси, особено индексот на цените.

Геометриска средина.При користење на геометриска средина, поединечните вредности на карактеристиката се, по правило, релативни вредности на динамиката, конструирани во форма на вредности на синџир, како сооднос со претходното ниво на секое ниво во серија динамики. Просекот на тој начин ја карактеризира просечната стапка на раст.

Геометриската средна вредност се користи и за одредување на еднакво растојание од максималните и минималните вредности на карактеристиката. На пример, Друштво за осигурувањесклучува договори за давање на услуги за автоосигурување. Во зависност од конкретниот осигурен настан, исплатата на осигурувањето може да се движи од 10.000 до 100.000 долари годишно. Просечниот износ на плаќањата за осигурување ќе биде американски долари.

Геометриската средина е количество кое се користи како просек на соодноси или во дистрибутивни серии претставени во форма на геометриска прогресија кога z = 0. Оваа средина е погодна за употреба кога се внимава не на апсолутните разлики, туку на соодносите од два броеви.

Формулите за пресметка се како што следува

каде се просечните варијанти на карактеристиката; – производ на опции; ѓ– фреквенција на опции.

Геометриската средина се користи во пресметките на просечните годишни стапки на раст.

Среден квадрат.Формулата за средна квадратура се користи за мерење на степенот на флуктуација на поединечните вредности на една карактеристика околу аритметичката средина во серијата на дистрибуција. Така, при пресметување на индикаторите за варијација, просекот се пресметува од квадратните отстапувања на поединечните вредности на карактеристиката од аритметичката средина.

Коренската средна квадратна вредност се пресметува со формулата

ВО економски истражувањасредниот квадрат во изменета форма е широко користен во пресметувањето на индикаторите за варијација на некоја карактеристика, како што се дисперзија, стандардна девијација.

Владеење на мнозинството.Постои следнава врска помеѓу просеците на моќноста - колку е поголем експонентот, толку е поголема вредноста на просекот, Табела 5.4:

Табела 5.4

Однос меѓу просеците

z вредност

Однос меѓу просеците

Овој однос се нарекува правило на мајоризација.

Структурни просеци.За да се карактеризира структурата на населението, се користат посебни индикатори, кои може да се наречат структурни просеци. Овие индикатори вклучуваат режим, медијана, квартили и децили.

Мода.Режимот (Mo) е најчестата вредност на карактеристиката меѓу единиците на населението. Модот е вредноста на атрибутот што одговара на максималната точка на кривата на теоретската дистрибуција.

Модата е широко користена во комерцијалната практика при проучување на побарувачката на потрошувачите (при одредување на големини на облека и чевли што се барани) и евидентирање на цените. Може да има неколку модови вкупно.

Пресметка на режим во дискретна серија.Во дискретна серија, режимот е варијанта со најголема фреквенција. Ајде да размислиме да најдеме режим во дискретна серија.

Пресметка на режим во интервална серија.Во серија на варијации на интервал, режимот приближно се смета за централна варијанта на модалниот интервал, т.е. интервалот што има најголема фреквенција (фреквенција). Во интервалот, треба да ја пронајдете вредноста на атрибутот што е режим. За интервална серија, режимот ќе се определи со формулата

каде е долната граница на модалниот интервал; – вредноста на модалниот интервал; – фреквенција што одговара на модалниот интервал; – фреквенција што му претходи на модалниот интервал; – фреквенција на интервалот по модалниот.

Медијана.Медијана () е вредноста на атрибутот на средната единица на рангираната серија. Рангирана серија е серија во која вредностите на атрибутите се запишани во растечки или опаѓачки редослед. Или медијаната е вредност што го дели бројот на нарачана варијациска серија на два еднакви дела: едниот дел има вредност на различната карактеристика што е помала од просечната опција, а другиот има вредност што е поголема.

За да ја пронајдете медијаната, прво определете го неговиот реден број. За да го направите ова, ако бројот на единици е непарен, една се додава на збирот на сите фреквенции и сè се дели со две. Со парен број единици, медијаната се наоѓа како вредност на атрибутот на единицата, чиј сериски број се одредува со вкупниот збир на фреквенции поделен со два. Знаејќи го серискиот број на медијаната, лесно е да се најде неговата вредност користејќи ги акумулираните фреквенции.

Пресметка на медијаната во дискретна серија.Според примерокот анкета, добиени се податоци за распоредот на семејствата по број на деца, табела. 5.5. За да ја одредиме медијаната, прво го одредуваме нејзиниот реден број

=

Потоа ќе конструираме серија на акумулирани фреквенции (, користејќи го серискиот број и акумулираната фреквенција ќе ја најдеме медијаната. Акумулираната фреквенција од 33 покажува дека во 33 семејства бројот на деца не надминува 1 дете, но бидејќи бројот на медијаната е 50, просечната ќе биде во опсег од 34 до 55 семејства.

Табела 5.5

Распределба на бројот на семејства врз основа на бројот на деца

Број на деца во семејството

Број на семејства, – вредноста на медијалниот интервал;

Сите разгледувани форми на просеци на моќност имаат важна особина (за разлика од структурните просеци) - формулата за одредување на просекот ги вклучува сите вредности на серијата, т.е. големината на просекот е под влијание на вредноста на секоја опција.

Од една страна, ова е многу позитивно својство бидејќи во овој случај, се зема предвид ефектот од сите причини кои ги засегаат сите единици на населението што се испитува. Од друга страна, дури и една опсервација вклучена во изворните податоци случајно може значително да ја наруши идејата за степенот на развој на особината што се проучува кај популацијата што се разгледува (особено во кратки серии).

Квартили и децили.По аналогија со наоѓање на медијаната во сериите на варијација, можете да ја најдете вредноста на карактеристиката за која било единица од рангираната серија. Значи, особено, можете да ја најдете вредноста на атрибутот за единици кои делат серија на 4 еднакви делови, на 10, итн.

Квартили.Опциите што ја делат рангираната серија на четири еднакви делови се нарекуваат квартили.

Во овој случај, тие разликуваат: долниот (или првиот) квартал (Q1) - вредноста на атрибутот за единица од рангираната серија, делејќи ја популацијата во сооднос од ¼ до ¾ и горниот (или третиот) квартал ( Q3) - вредноста на атрибутот за единицата на рангираната серија, делејќи ја популацијата во однос ¾ до ¼.

Вториот квартил е медијаната Q2 = Me. Долниот и горниот квартал во интервалната серија се пресметуваат со формула слична на медијаната.

каде е долната граница на интервалот што ги содржи долните и горните квартили, соодветно;

– акумулирана фреквенција на интервалот што му претходи на интервалот што го содржи долниот или горниот квартил;

- фреквенции на квартилни интервали (долни и горни)

Интервалите што содржат Q1 и Q3 се одредуваат според акумулираните фреквенции (или фреквенции).

Децили.Покрај квартилите, се пресметуваат и децили - опции кои ја делат рангираната серија на 10 еднакви делови.

Тие се означени со D, првата децила D1 ја дели серијата во однос 1/10 и 9/10, втората D2 - 2/10 и 8/10 итн. Тие се пресметуваат според истата шема како медијаната и квартилите.

И медијаната, квартилите и децилите припаѓаат на таканаречената редовна статистика, што се подразбира како опција која зазема одредено редно место во рангираната серија.

РУСКА АКАДЕМИЈА ЗА НАЦИОНАЛНА ЕКОНОМИЈА И ЈАВНА СЛУЖБА под ПРЕТСЕДАТЕЛОТ НА РУСКАТА ФЕДЕРАЦИЈА

ГРАНКА ОРИОЛ

Катедрата за математика и математички методиво управувањето

Самостојна работа

Математика

на тема „Серија на варијации и нејзините карактеристики“

за студенти оддел со полно работно времеФакултет за економија и менаџмент

области на обука „Управување со човечки ресурси“


Цел на работата:Совладување концепти математичка статистикаи методи на примарна обработка на податоци.

Пример за решавање на типични проблеми.

Задача 1.

Следниве податоци се добиени преку анкетата ():

1 2 3 2 2 4 3 3 5 1 0 2 4 3 2 2 3 3 1 3 2 4 2 4 3 3 3 2 0 6

3 3 1 1 2 3 1 4 3 1 7 4 3 4 2 3 2 3 3 1 4 3 1 4 5 3 4 2 4 5

3 6 4 1 3 2 4 1 3 1 0 0 4 6 4 7 4 1 3 5

Неопходно:

1) Составете серија на варијации ( статистичка дистрибуцијапримероци), откако претходно запишаа рангирана дискретна серија на опции.

2) Конструирај фреквентен многуаголник и кумулирај.

3) Состави серија распределби на релативни фреквенции (фреквенции).

4) Најдете ги главните нумерички карактеристики на сериите на варијации (користете поедноставени формули за да ги најдете): а) аритметичка средина, б) медијана Мехи модата Мо, в) дисперзија и 2, г) стандардна девијација с, д) коефициент на варијација В.

5) Објаснете го значењето на добиените резултати.

Решение.

1) Да се ​​состави рангирана дискретна серија на опции Да ги подредиме податоците од анкетата по големина и да ги подредиме во растечки редослед

0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2

3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

5 5 5 5 6 6 6 7 7.

Ајде да составиме серија на варијации со запишување на набљудуваните вредности (варијанти) во првиот ред од табелата, а соодветните фреквенции во вториот (Табела 1)

Табела 1.

2) Фреквентен полигон е прекината линија што ги поврзува точките ( x i; n i), јас=1, 2,…, м, Каде м X.

Дозволете ни да го прикажеме многуаголникот на фреквенции од серијата на варијации (сл. 1).

Сл.1. Фреквентен полигон

Кумулативната крива (кумулира) за дискретна серија на варијации претставува скршена линија што ги поврзува точките ( x i; н и нак), јас=1, 2,…, м.

Ајде да ги најдеме акумулираните фреквенции н и нак(акумулираната фреквенција покажува колку варијанти се забележани со карактеристична вредност помала X). Пронајдените вредности ги внесуваме во третиот ред од Табела 1.



Ајде да изградиме кумулација (сл. 2).

Сл.2. Кумулира

3) Ајде да ги најдеме релативните фреквенции (фреквенции), каде , каде м– број на различни карактеристични вредности X, што ќе го пресметаме со еднаква точност.

Дозволете ни да ја запишеме дистрибутивната серија на релативни фреквенции (фреквенции) во форма на Табела 2

табела 2

4) Ајде да ги најдеме главните нумерички карактеристики на сериите на варијации:

а) Најдете ја аритметичката средина користејќи поедноставена формула:

,

каде се условните опции

Да ставиме Со= 3 (една од просечните набљудувани вредности), к= 1 (разликата помеѓу две соседни опции) и изготви пресметковна табела (Табела 3).

Табела 3.

x i nјас у јас у и н и u i 2 n i
-3 -12
-2 -26
-1 -14
Збир -11

Потоа аритметичката средина

б) Медијана Мехсерија на варијации е вредноста на карактеристиката што паѓа во средината на рангираната серија на набљудувања. Оваа дискретна серија на варијации содржи парен број на поими ( n=80), што значи дека медијаната е еднаква на половина од збирот на двете средни опции.

Мода Моваријација серија се нарекува опција која одговара на највисоката фреквенција. За дадена варијација серија, најголема фреквенција n max = 24 одговара на опцијата X= 3, значи мода Мо=3.

в) Варијанса и 2, што е мерка за дисперзија на можните вредности на индикаторот Xоколу неговата просечна вредност, ја наоѓаме со помош на поедноставена формула:

, Каде у јас– условни опции

Ќе вклучиме и средни пресметки во Табела 3.

Потоа варијансата

г) Стандардна девијација сго наоѓаме користејќи ја формулата:

.

д) Коефициент на варијација В: (),

Коефициентот на варијација е немерлива количина, затоа е погоден за споредба на дисперзијата на варијационите серии, чии варијанти имаат различни димензии.

Коефициентот на варијација

.

5) Значењето на добиените резултати е дека вредноста ја карактеризира просечната вредност на карактеристиката Xво рамките на разгледуваниот примерок, односно просечната вредност беше 2,86. Стандардна девијација сго опишува апсолутното ширење на вредностите на индикаторот Xи во во овој случајизнесува до с≈ 1,55. Коефициентот на варијација Вја карактеризира релативната варијабилност на индикаторот X, односно релативното распространување околу неговата просечна вредност, а во овој случај е .

Одговор: ; ; ; .

Задача 2.

Следниве податоци се достапни за акционерскиот капитал на 40-те најголеми банки во Централна Русија:

12,0 49,4 22,4 39,3 90,5 15,2 75,0 73,0 62,3 25,2
70,4 50,3 72,0 71,6 43,7 68,3 28,3 44,9 86,6 61,0
41,0 70,9 27,3 22,9 88,6 42,5 41,9 55,0 56,9 68,1
120,8 52,4 42,0 119,3 49,6 110,6 54,5 99,3 111,5 26,1

Неопходно:

1) Конструирај серија на варијации на интервал.

2) Пресметајте ја средната вредност на примерокот и варијансата на примерокот

3) Најдете го стандардното отстапување и коефициентот на варијација.

4) Конструирај хистограм на распределби на фреквенции.

Решение.

1) Ајде да избереме произволен број интервали, на пример, 8. Тогаш ширината на интервалот е:

.

Ајде да создадеме пресметковна табела:

Опција за интервал, x k –x k +1 Фреквенција, n i Средината на интервалот x i Условна опција, и јас и јас н и и јас 2 n i (и јас+ 1) 2 n i
10 – 25 17,5 – 3 – 12
25 – 40 32,5 – 2 – 10
40 – 55 47,5 – 1 – 11
55 – 70 62,5
70 – 85 77,5
85 – 100 92,5
100 – 115 107,5
115 – 130 122,5
Збир – 5

Вредноста избрана како лажна нула е c= 62,5 (оваа опција се наоѓа приближно во средината на серијата на варијации) .

Условните опции се одредуваат со формулата

Споделете со пријателите или заштедете за себе:

Се вчитува...