Распределбата се смета за нормална ако. Нормална дистрибуција на случајна променлива и правилото три сигма. Функција за распределба на нормална веројатност

Теоријата на веројатност разгледува прилично голем број на различни закони за дистрибуција. За да се решат проблемите поврзани со изградбата на контролни графикони, само неколку од нив се од интерес. Најважниот од нив е закон за нормална распределба, кој се користи за конструирање контролни графикони што се користат во квантитативна контрола, т.е. кога имаме работа со континуирана случајна променлива. Законот за нормална распределба зазема посебна позиција меѓу другите закони за распределба. Тоа се објаснува со тоа што, прво, најчесто се среќава во практиката, а второ, тој е ограничувачки закон, кон кој при многу вообичаени типични услови пристапуваат другите закони на дистрибуција. Што се однесува до втората околност, во теоријата на веројатност е докажано дека сумата е доволна голем бројнезависни (или слабо зависни) случајни променливи, кои подлежат на какви било закони за дистрибуција (предмет на некои многу лабави ограничувања), приближно го почитуваат нормалниот закон, и тоа е точно колку попрецизно, толку е поголем бројот на случајни променливи сумирани. Повеќето од случајните променливи што се среќаваат во практиката, како што се, на пример, мерните грешки, може да се претстават како збир на многу голем број релативно мали поими - елементарни грешки, од кои секоја е предизвикана од посебна причина, независна од други. Нормалниот закон се појавува во случаи кога случајна променлива Xе резултат на голем број различни фактори. Секој фактор посебно вреди Xблаго влијае, а не може да се посочи кој влијае повеќе од другите.

Нормална дистрибуција(Лапласова-гаусова дистрибуција) – распределба на веројатност на континуирано случајна променлива Xтака што густината на распределбата на веројатноста за - ¥<х< + ¥ принимает действительное значение:

Exp (3)

Односно, нормалната распределба се карактеризира со два параметри m и s, каде што m е математичкото очекување; s е стандардна девијација на нормалната дистрибуција.

Вредност s 2 е варијансата на нормалната распределба.

Математичкото очекување m ја карактеризира положбата на дистрибутивниот центар, а стандардното отстапување s (SD) е карактеристика на дисперзија (сл. 3).

f(x) f(x)


Слика 3 – Функции на нормална густина на дистрибуција со:

а) различни математички очекувања m; б) различни стандардни отстапувања s.

Така, вредноста μ определена со положбата на кривата на дистрибуција на оската на апсцисата. Димензија μ - исто како и димензијата на случајната променлива X. Со раст математичко очекувањедвете функции се поместени паралелно надесно. Со намалена варијанса с 2 густината станува сè поконцентрирана околу m, додека функцијата на дистрибуција станува сè повеќе стрмна.

Вредноста на σ ја одредува формата на кривата на дистрибуција. Бидејќи површината под кривата на распределба мора секогаш да остане еднаква на единството, како што σ се зголемува, кривата на дистрибуција станува порамна. На сл. Слика 3.1 прикажува три кривини за различни σ: σ1 = 0,5; σ2 = 1,0; σ3 = 2,0.

Слика 3.1 – Функции на густина на нормална дистрибуција соразлични стандардни отстапувања s.

Функцијата за дистрибуција (интегрална функција) има форма (сл. 4):

(4)

Слика 4 – Интегрални (а) и диференцијални (б) функции на нормална дистрибуција

Особено важна е линеарната трансформација на нормално распределена случајна променлива X, по што се добива случајна променлива Зсо математичко очекување 0 и варијанса 1. Оваа трансформација се нарекува нормализација:

Може да се изврши за секоја случајна променлива. Нормализацијата овозможува сите можни варијанти на нормалната дистрибуција да се сведат на еден случај: m = 0, s = 1.

Се вика нормалната распределба со m = 0, s = 1 нормализирана нормална дистрибуција (стандардизирана).

Стандардна нормална дистрибуција(стандардна Лапласова-Гаусова распределба или нормализирана нормална дистрибуција) е распределба на веројатност на стандардизирана нормална случајна променлива З, чија густина на дистрибуција е еднаква на:

на - ¥<z< + ¥

Функционални вредности Ф(z)определено со формулата:

(7)

Функционални вредности Ф(z)и густина f(z)нормализирана нормална дистрибуција се пресметуваат и табелирани. Табелата е составена само за позитивни вредности zЗатоа:

F (z) = 1Ф(z) (8)

Користејќи ги овие табели, можете да ги одредите не само вредностите на функцијата и густината на нормализираната нормална дистрибуција за дадена z, но и вредностите на општата нормална функција на дистрибуција, бидејќи:

; (9)

. 10)

Во многу проблеми кои вклучуваат нормално распределени случајни променливи, неопходно е да се одреди веројатноста за појава на случајна променлива X, предмет на нормалниот закон со параметри m и s, за одредена област. Таков дел може да биде, на пример, полето за толеранција за параметар од горната вредност Удо дното Л.

Веројатност да падне во интервалот од X 1 до X 2 може да се одреди со формулата:

Така, веројатноста да се погоди случајна променлива (вредност на параметарот) Xво полето за толеранција се одредува со формулата

Можете да ја најдете веројатноста дека случајна променлива Xќе биде во рамките на μ кс . Добиените вредности за к=1,2 и 3 се следните (исто така, видете на слика 5):

Така, ако некоја вредност се појави надвор од трисигма регионот, која содржи 99,73% од сите можни вредности, а веројатноста за појава на таков настан е многу мала (1:270), треба да се смета дека вредноста за која станува збор била премногу мал или премногу голем не поради случајна варијација, туку поради значително нарушување во самиот процес, што може да предизвика промени во природата на дистрибуцијата.

Се нарекува и областа што лежи во границите на три сигма област на статистичка толеранцијарелевантна машина или процес.

во споредба со другите видови дистрибуции. Главната карактеристика на оваа распределба е што сите други закони за дистрибуција се стремат кон овој закон со бесконечно повторување на бројот на тестови. Како доаѓа до оваа дистрибуција?

Да замислиме дека, земајќи рачен динамометар, се наоѓате на најпреполното место во вашиот град. И на секој што ќе помине им нудите да си ја измери силата со стискање на динамометарот со десната или левата рака. Внимателно ги запишувате отчитувањата на динамометарот. По некое време, со доволно голем број тестови, ги исцртавте отчитувањата на динамометарот на оската на апсцисата и бројот на луѓе кои го „исцедија“ ова читање на оската на ординатите. Добиените точки беа поврзани со мазна линија. Резултатот е кривата прикажана на сл. 9.8. Изгледот на оваа крива нема да се промени многу како што се зголемува времето на експериментот. Покрај тоа, од одреден момент, новите вредности само ќе ја усовршат кривата без да ја менуваат нејзината форма.


Ориз. 9.8.

Сега да го преместиме нашиот динамометар во атлетската сала и да го повториме експериментот. Сега максимумот на кривата ќе се помести надесно, левиот крај ќе биде малку затегнат, додека десниот крај ќе биде поостри (сл. 9.9).


Ориз. 9.9.

Забележете дека максималната фреквенција за втората дистрибуција (точка Б) ќе биде помала од максималната фреквенција за првата дистрибуција (точка А). Ова може да се објасни со фактот дека вкупниот број на луѓе кои ја посетуваат атлетската сала ќе биде помал од бројот на луѓе кои поминале во близина на експериментаторот во првиот случај (во центарот на градот на прилично преполно место). Максимумот се префрли надесно, бидејќи во атлетските теретани посетуваат физички посилни луѓе во споредба со општата позадина.

И конечно, ќе посетиме училишта, градинки и старечки домови со иста цел: да ја откриеме силата на рацете на посетителите на овие места. И повторно кривата на дистрибуција ќе има слична форма, но сега, очигледно, нејзиниот лев крај ќе биде поостри, а десниот крај ќе биде поизвлечен. И како и во вториот случај, максимумот (точка C) ќе биде под точката А (сл. 9.10).


Ориз. 9.10.

Ова извонредно својство на нормалната дистрибуција - одржување на обликот на кривата на густината на веројатноста (сл. 8 - 10) беше забележано и опишано во 1733 година од Моивр, а потоа и проучено од Гаус.

Во научното истражување, во технологијата, во масовните феномени или експерименти, кога зборуваме за постојано повторување на случајни променливи во постојани експериментални услови, тие велат дека резултатите од тестот се подложени на случајно расејување, почитувајќи го законот за кривата на нормална дистрибуција.

(21)

Каде е најчест настан. Како по правило, во формулата (21) наместо параметарот, . Покрај тоа, колку е подолга експерименталната серија, толку помалку параметарот ќе се разликува од математичкото очекување. Површината под кривата (сл. 9.11) се претпоставува дека е еднаква на една. Областа што одговара на кој било интервал од оската x е нумерички еднаква на веројатноста случаен резултат да падне во овој интервал.


Ориз. 9.11.

Функцијата за нормална дистрибуција има форма


(22)

Забележете дека нормалната крива (сл. 9.11) е симетрична во однос на правата линија и асимптотички се приближува до оската OX на .

Да го пресметаме математичкото очекување за нормалниот закон


(23)

Својства на нормална дистрибуција

Да ги разгледаме основните својства на оваа важна дистрибуција.

Имотот 1. Функцијата за густина на нормална распределба (21) е дефинирана на целата оска x.

Имотот 2. Функцијата за густина на нормалната дистрибуција (21) е поголема од нула за кој било од доменот на дефиниција ().

Имотот 3. Со бесконечно зголемување (намалување), функцијата на дистрибуција (21) се стреми кон нула .

Имотот 4. Кога функцијата за распределба дадена со (21) има најголема вредност еднаква на

(24)

Имотот 5. Графикот на функцијата (сл. 9.11) е симетричен во однос на правата линија.

Имотот 6. Графикот на функцијата (сл. 9.11) има две точки на флексија симетрични во однос на правата линија:

(25)

Имотот 7. Сите чудни централни моменти се нула. Забележете дека со користење на својството 7, асиметријата на функцијата се одредува со формулата. Ако, тогаш тие заклучат дека распределбата што се проучува е симетрична во однос на правата линија. Ако , тогаш велат дека серијата е поместена надесно (десната гранка на графикот е порамна или затегната). Ако , тогаш се смета дека серијата е поместена налево (порамната лева гранка на графикот на сл. 9.12).


Ориз. 9.12.

Имотот 8. Куртозата на распределбата е еднаква на 3. Во пракса, таа често се пресметува и степенот на „компресија“ или „заматување“ на графикот се одредува според близината на оваа вредност до нула (сл. 9.13). И бидејќи е поврзано со , на крајот го карактеризира степенот на фреквентна дисперзија на податоците. И бидејќи одредува

Во многу проблеми поврзани со нормално распределени случајни променливи, неопходно е да се одреди веројатноста случајната променлива , предмет на нормален закон со параметри, да падне на сегментот од до . За да ја пресметаме оваа веројатност ја користиме општата формула

каде е дистрибутивната функција на количината .

Да ја најдеме функцијата на распределба на случајна променлива распределена според нормален закон со параметри. Густината на распределбата на вредноста е еднаква на:

Од тука ја наоѓаме функцијата на дистрибуција

. (6.3.3)

Да направиме промена на променливата во интегралот (6.3.3)

и да го ставиме во оваа форма:

(6.3.4)

Интегралот (6.3.4) не се изразува преку елементарни функции, туку може да се пресмета преку посебна функција која изразува одреден интеграл од изразот или (т.н. интеграл на веројатност), за која се составени табели. Постојат многу варијанти на такви функции, на пример:

;

итн. Која од овие функции да се користи е прашање на вкус. Ние ќе избереме како таква функција

. (6.3.5)

Лесно е да се види дека оваа функција не е ништо повеќе од функција на дистрибуција за нормално распределена случајна променлива со параметри.

Да се ​​согласиме да ја наречеме функцијата функција на нормална дистрибуција. Додатокот (Табела 1) содржи табели со вредности на функции.

Да ја изразиме функцијата на распределба (6.3.3) на големината со параметри и преку функцијата нормална распределба. Очигледно,

Сега да ја најдеме веројатноста случајната променлива да падне на делот од до . Според формулата (6.3.1)

Така, ја изразивме веројатноста за случајна променлива, распределена според нормалниот закон со какви било параметри, навлегувајќи во областа преку функцијата за стандардна дистрибуција што одговара на наједноставниот нормален закон со параметри 0.1. Забележете дека аргументите на функцијата во формулата (6.3.7) имаат многу едноставно значење: постои растојание од десниот крај на делот до центарот на расејување, изразено во стандардни отстапувања; - исто растојание за левиот крај на делот, а ова растојание се смета за позитивно ако крајот се наоѓа десно од центарот на дисперзија, а негативно ако е лево.

Како и секоја дистрибутивна функција, функцијата ги има следните својства:

3. - неопаѓачка функција.

Покрај тоа, од симетријата на нормалната распределба со параметри во однос на потеклото, произлегува дека

Користејќи го ова својство, строго кажано, би било можно да се ограничат табелите на функции само на позитивни вредности на аргументи, но за да се избегне непотребна операција (одземање од еден), Додатокот Табела 1 дава вредности и за позитивни и за негативни аргументи.

Во пракса, често се среќаваме со проблемот на пресметување на веројатноста за нормално распределена случајна променлива да падне во област која е симетрична во однос на центарот на расејување. Да разгледаме таков дел од должината (сл. 6.3.1). Ајде да ја пресметаме веројатноста да ја погодиме оваа област користејќи ја формулата (6.3.7):

Земајќи го предвид својството (6.3.8) на функцијата и давајќи на левата страна од формулата (6.3.9) покомпактна форма, добиваме формула за веројатноста случајната променлива распределена според нормалниот закон да падне во област симетрична во однос на центарот на расејување:

. (6.3.10)

Да го решиме следниот проблем. Дозволете ни да нацртаме последователни сегменти на должина од центарот на дисперзија (сл. 6.3.2) и да ја пресметаме веројатноста случајната променлива да падне во секоја од нив. Бидејќи нормалната крива е симетрична, доволно е таквите сегменти да се исцртаат само во една насока.

Користејќи ја формулата (6.3.7) наоѓаме:

(6.3.11)

Како што може да се види од овие податоци, веројатноста да се погоди секој од следните сегменти (петти, шести итн.) со точност од 0,001 се еднакви на нула.

Заокружувајќи ги веројатностите за влегување во сегменти на 0,01 (на 1%), добиваме три броеви кои лесно се паметат:

0,34; 0,14; 0,02.

Збирот на овие три вредности е 0,5. Ова значи дека за нормално распределена случајна променлива, целата дисперзија (со точност од фракции од проценти) се вклопува во областа .

Ова овозможува, знаејќи го стандардното отстапување и математичкото очекување на случајната променлива, грубо да се означи опсегот на нејзините практично можни вредности. Овој метод за проценка на опсегот на можни вредности на случајна променлива е познат во математичката статистика како „правило три сигма“. Правилото три сигма подразбира и приближен метод за одредување на стандардното отстапување на случајна променлива: земете го максималното практично можно отстапување од средната вредност и поделете го со три. Се разбира, оваа груба техника може да се препорача само ако не постојат други, попрецизни методи за одредување.

Пример 1. Случајна променлива распределена според нормален закон претставува грешка при мерење на одредено растојание. При мерењето, дозволена е систематска грешка во насока на преценување за 1,2 (m); Стандардната девијација на грешката во мерењето е 0,8 (m). Најдете ја веројатноста дека отстапувањето на измерената вредност од вистинската вредност нема да надмине 1,6 (m) во апсолутна вредност.

Решение. Грешката во мерењето е случајна променлива која подлежи на нормалниот закон со параметри и . Треба да ја најдеме веројатноста оваа количина да падне на делот од до . Според формулата (6.3.7) имаме:

Користејќи ги табелите со функции (Додаток, Табела 1), наоѓаме:

; ,

Пример 2. Најдете ја истата веројатност како во претходниот пример, но под услов да нема систематска грешка.

Решение. Користејќи ја формулата (6.3.10), под претпоставка, наоѓаме:

Пример 3. Цел што личи на лента (автопат), чија широчина е 20 m, се гаѓа во правец нормален на автопатот. Целта се изведува по централната линија на автопатот. Стандардното отстапување во насоката на гаѓање е еднакво на m. Постои систематска грешка во насоката на гаѓање: понизок удар е 3 m. Најдете ја веројатноста да удрите во автопат со еден истрел.

Во пракса, повеќето случајни променливи кои се под влијание на голем број случајни фактори го почитуваат нормалниот закон за распределба на веројатноста. Затоа, во различни примени на теоријата на веројатност, овој закон е од особено значење.

Случајната променлива $X$ го почитува законот за нормална дистрибуција на веројатност ако нејзината густина на распределба на веројатност ја има следната форма

$$f\left(x\десно)=((1)\over (\sigma \sqrt(2\pi )))e^(-(((\left(x-a\десно))^2)\over ( 2(\сигма)^2)))$$

Графикот на функцијата $f\left(x\right)$ е шематски прикажан на сликата и се нарекува „Гаусова крива“. Десно од овој графикон е германската банкнота од 10 марки, која се користела пред воведувањето на еврото. Ако погледнете внимателно, на оваа банкнота можете да ја видите Гаусовата крива и нејзиниот откривач, најголемиот математичар Карл Фридрих Гаус.

Да се ​​вратиме на нашата функција за густина $f\left(x\right)$ и да дадеме неколку објаснувања во врска со параметрите на дистрибуција $a,\ (\sigma )^2$. Параметарот $a$ го карактеризира центарот на дисперзија на вредностите на случајна променлива, односно има значење на математичко очекување. Кога параметарот $a$ се менува и параметарот $(\sigma )^2$ останува непроменет, можеме да забележиме поместување на графикот на функцијата $f\left(x\десно)$ по должината на апсцисата, додека графикот на густина сама по себе не ја менува својата форма.

Параметарот $(\sigma )^2$ е варијанса и го карактеризира обликот на кривата на графиконот на густина $f\left(x\десно)$. Кога го менуваме параметарот $(\sigma )^2$ со параметарот $a$ непроменет, можеме да набљудуваме како графикот за густина ја менува својата форма, компресирајќи или растегнувајќи, без да се движи по оската на апсцисата.

Веројатност за нормално распределена случајна променлива да падне во даден интервал

Како што е познато, веројатноста случајната променлива $X$ да падне во интервалот $\left(\alpha ;\ \beta \right)$ може да се пресмета $P\left(\alpha< X < \beta \right)=\int^{\beta }_{\alpha }{f\left(x\right)dx}$. Для нормального распределения случайной величины $X$ с параметрами $a,\ \sigma $ справедлива следующая формула:

$$P\лево(\алфа< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right)$$

Овде функцијата $\Phi \left(x\right)=((1)\over (\sqrt(2\pi )))\int^x_0(e^(-t^2/2)dt)$ е Лапласова функција. Вредностите на оваа функција се земени од. Може да се забележат следните својства на функцијата $\Phi \left(x\right)$.

1 . $\Phi \left(-x\right)=-\Phi \left(x\right)$, односно функцијата $\Phi \left(x\right)$ е непарна.

2 . $\Phi \left(x\right)$ е монотоно растечка функција.

3 . $(\mathop(lim)_(x\to +\infty) \Phi \left(x\десно)\ )=0,5$, $(\mathop(lim)_(x\to -\infty) \ Phi \ лево(x\десно)\ )=-0,5$.

За да ги пресметате вредностите на функцијата $\Phi \left(x\right)$, можете да ја користите и функцијата $f_x$ волшебник во Excel: $\Phi \left(x\right)=NORMDIST\left(x ;0;1;1\десно )-0,5$. На пример, да ги пресметаме вредностите на функцијата $\Phi \left(x\десно)$ за $x=2$.

Веројатноста нормално распределената случајна променлива $X\in N\left(a;\ (\sigma )^2\десно)$ да падне во интервал симетричен во однос на математичкото очекување $a$ може да се пресмета со формулата

$$P\лево(\лево|X-a\десно|< \delta \right)=2\Phi \left({{\delta }\over {\sigma }}\right).$$

Правило три сигма. Речиси е сигурно дека нормално распределената случајна променлива $X$ ќе падне во интервалот $\left(a-3\sigma ;a+3\sigma \right)$.

Пример 1 . Случајната променлива $X$ подлежи на нормалниот закон за распределба на веројатност со параметри $a=2,\ \sigma =3$. Најдете ја веројатноста $X$ да падне во интервалот $\left(0.5;1\десно)$ и веројатноста за задоволување на неравенката $\left|X-a\right|< 0,2$.

Користење на формула

$$P\лево(\алфа< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right),$$

наоѓаме $P\left(0,5;1\десно)=\Phi \left(((1-2)\over (3))\right)-\Phi \left(((0,5-2)\ over (3 ))\десно)=\Phi \лево(-0,33\десно)-\Phi \лево(-0,5\десно)=\Phi \лево(0,5\десно)-\Phi \лево(0,33\десно)=0,191- 0,129 = 0,062 долари.

$$P\лево(\лево|X-a\десно|< 0,2\right)=2\Phi \left({{\delta }\over {\sigma }}\right)=2\Phi \left({{0,2}\over {3}}\right)=2\Phi \left(0,07\right)=2\cdot 0,028=0,056.$$

Пример 2 . Да претпоставиме дека во текот на годината цената на акциите на одредена компанија е случајна променлива распределена според нормалниот закон со математичко очекување еднакво на 50 конвенционални парични единици и стандардно отстапување еднакво на 10. Која е веројатноста дека на случајно избрана ден од периодот што се дискутира цената за промоцијата ќе биде:

а) повеќе од 70 конвенционални монетарни единици?

б) под 50 по акција?

в) помеѓу 45 и 58 конвенционални монетарни единици по акција?

Нека случајната променлива $X$ е цената на акциите на некоја компанија. По услов, $X$ подлежи на нормална распределба со параметри $a=50$ - математичко очекување, $\sigma =10$ - стандардна девијација. Веројатност $P\лево(\алфа< X < \beta \right)$ попадания $X$ в интервал $\left(\alpha ,\ \beta \right)$ будем находить по формуле:

$$P\лево(\алфа< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right).$$

$$а)\ P\left(X>70\десно)=\Phi \left(((\infty -50)\over (10))\десно)-\Phi \left(((70-50)\ над (10))\десно)=0,5-\Phi \лево(2\десно)=0,5-0,4772=0,0228.$$

$$b)\P\лево(X< 50\right)=\Phi \left({{50-50}\over {10}}\right)-\Phi \left({{-\infty -50}\over {10}}\right)=\Phi \left(0\right)+0,5=0+0,5=0,5.$$

$$in)\ P\лево(45< X < 58\right)=\Phi \left({{58-50}\over {10}}\right)-\Phi \left({{45-50}\over {10}}\right)=\Phi \left(0,8\right)-\Phi \left(-0,5\right)=\Phi \left(0,8\right)+\Phi \left(0,5\right)=$$

Законот за нормална дистрибуција, таканаречениот Гаусовиот закон, е еден од најчестите закони. Ова е фундаментален закон во теоријата на веројатност и нејзината примена. Нормалната распределба најчесто се среќава во проучувањето на природните и социо-економските појави. Со други зборови, повеќето статистички агрегати во природата и општеството го почитуваат законот за нормална дистрибуција. Според тоа, можеме да кажеме дека популациите на голем број големи примероци го почитуваат законот за нормална дистрибуција. Оние популации кои отстапуваат од нормалната дистрибуција како резултат на посебни трансформации може да се доближат до нормалата. Во овој поглед, треба да се запомни дека основната карактеристика на овој закон во однос на другите закони за распределба е тоа што тој е закон на границата до која се приближуваат другите закони на распределба во одредени (стандардни) услови.

Треба да се напомене дека терминот „нормална дистрибуција“ има конвенционално значење, како поим општо прифатен во математичката и статистичката литература. Изјавата дека една или друга карактеристика на која било појава го почитува законот за нормална дистрибуција, воопшто не значи неповредливост на нормите кои наводно се својствени за феноменот што се проучува, а класифицирањето на последното како втор тип на закон не значи некаков вид на абнормалност на овој феномен. Во оваа смисла, терминот „нормална дистрибуција“ не е сосема соодветен.

Нормалната распределба (законот Гаус-Лапласова) е тип на континуирана распределба. Каде што Moivre (илјада седумстотини седумдесет и три, Франција) го изведе нормалниот закон за распределба на веројатност. Основните идеи на ова откритие за првпат биле користени во теоријата на грешки од К. Гаус (1809, Германија) и А. Лаплас (1812, Франција), кои дале значаен теоретски придонес во развојот на самиот закон. Конкретно, К. Гаус во неговите случувања произлегува од сознанието дека најверојатната вредност на случајната променлива е аритметичката средина. Општите услови за појава на нормална дистрибуција беа утврдени од А.М. Љапунова. Тој докажа дека ако карактеристиката што се проучува е резултат на вкупното влијание на многу фактори, од кои секој има мала поврзаност со мнозинството од другите, а влијанието на секој фактор врз конечниот резултат е многу преклопено со вкупното влијание на сите други фактори, тогаш распределбата станува блиску до нормалата.

Распределбата на веројатноста на континуирана случајна променлива се нарекува нормална и има густина:

1 +1 (& #) 2

/ (x, x,<т) = - ^ е 2 st2

каде што x е математичко очекување или просечна вредност. Како што можете да видите, нормалната дистрибуција се одредува со два параметри: x и °. За да се дефинира нормална распределба, доволно е да се знае математичкото очекување или средната и стандардната девијација. Овие две величини го одредуваат центарот на групирањето и обликот

крива на графикот. Графикот на функцијата u (xx, b) се нарекува нормална крива (Гаусова крива) со параметри x и b (сл. 12).

Кривата на нормалната дистрибуција има точки на флексија на X ± 1. Ако е претставено графички, тогаш помеѓу X = + l и 1 = -1 е 0,683 делови од целата површина на кривата (т.е. 68,3%). Во границите на X = + 2 и X- 2. има 0,954 области (95,4%), а помеѓу X = + 3 и X = - 3 - 0,997 делови од целата дистрибутивна област (99,7%). На сл. Слика 13 ја илустрира природата на нормалната дистрибуција со едно-, две- и три-сигма граници.

Со нормална распределба, аритметичката средина, режимот и медијаната ќе бидат еднакви една со друга. Обликот на нормална крива има форма на еднотеме симетрична крива, чии гранки асимптотички се приближуваат до оската на апсцисата. Најголемата ордината на кривата одговара на x = 0. Во оваа точка на оската на апсцисата се поставува нумеричката вредност на карактеристиките, еднаква на аритметичката средина, режимот и медијаната. Од двете страни на врвот на кривата доаѓаат нејзините гранки, менувајќи го обликот на конвексноста во конкавност во одредени точки. Овие точки се симетрични и одговараат на вредностите x = ± 1, односно вредностите на карактеристиките чии отстапувања од просекот се нумерички еднакви на стандардното отстапување. Ординатата, која одговара на аритметичката средина, ја дели целата област помеѓу кривата и апсцисата на половина. Значи, веројатноста за појава на вредности на проучуваната карактеристика е поголема и помала од просекот

аритметиката ќе биде еднаква на 0,50, односно x, (~ ^ x) = 0,50 V

Сл. 12. Крива на нормална дистрибуција (Гаусова крива)

Обликот и положбата на нормалната крива ја одредуваат вредноста на средната и стандардната девијација. Математички е докажано дека менувањето на вредноста на просекот (математичкото очекување) не го менува обликот на нормалната крива, туку само води до нејзино поместување по оската на апсцисата. Кривата се поместува надесно ако ~ се зголеми, и налево ако дојде ~.

Сл. 14. Нормални криви на дистрибуција со различни вредности на параметритеВ

За промена на обликот на нормална крива графика при промена

стандардното отстапување може да се процени по максимум

диференцијална нормална функција на дистрибуција, еднаква на 1

Како што може да се види, како што вредноста на ° се зголемува, максималната ордината на кривата ќе се намалува. Следствено, кривата на нормалната дистрибуција ќе се компресира кон оската x и ќе добие порамна форма.

И, обратно, како што се намалува параметарот β, нормалната крива се протега во позитивна насока на оската на ординатите, а обликот на „ѕвончето“ станува позашилен (Сл. 14). Забележете дека, без оглед на вредностите на параметрите ~ и , областа ограничена со оската на апсцисата и кривата е секогаш еднаква на единството (својство на густина на дистрибуција). Ова е јасно илустрирано со графикот (сл. 13).

Горенаведените карактеристики на манифестацијата на „нормалност“ на дистрибуција ни овозможуваат да идентификуваме голем број заеднички својства што ги имаат кривите на нормалната дистрибуција:

1) секоја нормална крива достигнува максимална точка = x) доаѓа непрекинато десно и лево од него, постепено приближувајќи се до оската x;

2) секоја нормална крива е симетрична во однос на права линија,

паралелно со оската на ординатите и минува низ максималната точка = x)

максималната ордината е ^^^ i;

3) секоја нормална крива има форма на „ѕвонче“, има конвексност што е насочена нагоре до максималната точка. Во точките x ~ ° и x + b ја менува конвексноста, и колку е помало a, толку е поостро „ѕвончето“, а колку е поголемо a, толку врвот на „ѕвончето“ станува поостри (сл. 14). Промена во математичкото очекување (со константна вредност

в) не доведува до промена на обликот на кривата.

Кога x = 0 и ° = 1, нормалната крива се нарекува нормализирана крива или нормална дистрибуција во канонска форма.

Нормализираната крива е опишана со следнава формула:

Изградбата на нормална крива врз основа на емпириски податоци се врши со помош на формулата:

пи 1 - "" = --- 7 = e

каде и ™ е теоретска фреквенција на секој интервал (група) на распределбата; "- Збир на фреквенции еднаков на волуменот на населението; "- интервален чекор;

исто - односот на обемот на кругот до неговиот дијаметар, што е

e - основата на природните логаритми, еднаква на 2,71828;

Вториот и третиот дел од формулата) е функција

нормализирано отстапување CN), кое може да се пресмета за која било вредност на X. Табелите на вредностите на CN) обично се нарекуваат „ординатни табели на нормалната крива“ (Додаток 3). Кога се користат овие функции, работната формула за нормална дистрибуција добива едноставна форма:

Пример.Да го разгледаме случајот со конструирање на нормална крива користејќи го примерот на податоците за распределбата на 57 работници по ниво на дневна заработка (Табела 42). Според Табела 42, ја наоѓаме аритметичката средина:

~ = ^ = И6 54 =

Ја пресметуваме стандардната девијација:

За секој ред од табелата ја наоѓаме вредноста на нормализираното отстапување

x и ~x | 12 g => - = - ^ 2 = 1,92

А 6.25 (дд I од првиот интервал, итн.).

Во колона 8 од табелата. 42 ја запишуваме вредноста на табелата на функцијата Di) од апликацијата, на пример, за првиот интервал X = 1,92 наоѓаме „1,9“ наспроти „2“ (0,0632).

За да се пресметаат теоретските фреквенции, односно ординатите на кривата на нормалната дистрибуција, се пресметува множителот:

* = ^ = 36,5 а 6,25

Ги множиме сите пронајдени вредности на табелата на функцијата / (r) со 36,5. Значи, за првиот интервал добиваме 0,0632x36,5 = 2,31 тони.

фреквенции (P"<5) комбинираат (во нашиот пример - првите два и последните два интервали).

Ако екстремните теоретски фреквенции значително се разликуваат од нула, несовпаѓањето помеѓу збировите на емпириските и теоретските фреквенции може да биде значајно.

Графикот на дистрибуција на емпириски и теоретски фреквенции (нормална крива) според примерот што се разгледува е прикажан на слика 15.

Да разгледаме пример за одредување на фреквенциите на нормална распределба за случајот кога нема фреквенција во екстремните интервали (Табела 43). Еве емпириски

X - нормализирано отстапување, (в) a - Стандардна девијација.

фреквенцијата на првиот интервал е нула. Резултирачкиот збир на неодредени фреквенции не е еднаков на збирот на нивните емпириски вредности (56 * 57). Во овој случај, теоретската фреквенција се пресметува за миење на добиените вредности на центарот на интервалот, нормализираното отстапување и неговата функција.

Во Табела 43, овие вредности се заокружени со правоаголник. При исцртување на нормална крива, во такви случаи теоретската крива се продолжува. Во случајот што се разгледува, нормалната крива ќе продолжи кон негативни отстапувања од просекот, бидејќи првата неодредена фреквенција е еднаква на 5. Пресметаната теоретска фреквенција (разјаснета) за првиот интервал ќе биде еднаква на единство. Збирот на рафинираните фреквенции се совпаѓа со емпириските

Табела 42

Пресметани вредности

Статистички параметри

Интервал,

Број на единици,

x) 2

нормализирани одделенија

теоретски

фреквенција на серии на нормална дистрибуција,

/ 0) x - А

>>

Илјада шестотини и педесет и четири

a = 6,25

^i=36,5 А

Табела 43

Пресметка на фреквенции на нормална дистрибуција (порамнување на емпириските фреквенции според нормалниот закон)

Број на единици,

Пресметани вредности

Статистички параметри

Интервал (и-2)

Средната вредност (центар) на интервалот,

(Јас, -xf

^ x т-x) 1 n и

нормализирано отстапување

xs- Х

т= x --L

табела вредност на функцијата, f (t)

теоретски

фреквенција на серии на нормална дистрибуција

разјаснета теоретска вредност на фреквенцијата,

w

-

-

-

-

-

o = 2,41

Ориз. 15. Емпириска дистрибуција(1) и нормална крива (2)

Кривата на нормална дистрибуција за испитуваната популација може да се конструира на друг начин (за разлика од оној што беше дискутиран погоре). Значи, ако е неопходно да се има приближна идеја за кореспонденцијата на вистинската дистрибуција со нормалната, пресметките се вршат во следната низа. Се одредува максималната ордината, која одговара на просечната големина на карактеристиките), потоа, откако се пресмета стандардното отстапување, се пресметуваат координатите на точките на кривата на нормалната дистрибуција според шемата наведена во табелите 42 и 43. Така, според почетните и пресметаните податоци во табела 43, просекот треба да биде ~ = 26 Оваа вредност средната се совпаѓа со центарот на четвртиот интервал (25-27). Значи, фреквенцијата на овој интервал „20“ може да се земе (при исцртување на графикот) како максимална ордината). Имајќи ја пресметаната дисперзија (β = 2,41 cm, Табела 43), ги пресметуваме координатните вредности на сите потребни точки на кривата на нормалната дистрибуција (табели 44, 45). Користејќи ги добиените координати, цртаме нормална крива (сл. 16), земајќи ја фреквенцијата на четвртиот интервал како максимална ордината.

Конзистентноста на емпириската дистрибуција со нормалната може да се утврди и преку поедноставени пресметки. Така, ако односот на индикаторот за степен на асиметрија (^) до неговата средна квадратна грешка sh a "или односот на индикаторот за куртоза (E x) до неговата средна квадратна грешка t & го надмине бројот "3" во апсолутна вредност, a е донесен заклучок за несовпаѓањето помеѓу емпириската распределба и природата на нормалните распределби (т.е.

Атз Е X

Ако A>3 или w д "> 3).

Постојат и други, не трудоинтензивни методи за утврдување на „нормалноста“ на дистрибуцијата: а) споредување на аритметичката средина со режимот и медијаната; б) употреба на фигури на Вестергард; в) примена на графичка слика со помош на полулогаритамска мрежа Турбина;г) пресметка на посебни критериуми за совпаѓање итн.

Табела 44

Координати 7 точки од кривата на нормалната дистрибуција

Табела 45

Пресметка на координати на точки на крива на нормална дистрибуција

x- 1,5 (7 =

X - a = 23,6

X - 0,5 (7 = = 24,8

x + 0,5-ти = 27,2

X + a = 28,4

X+1,5 (7 =

Сл. 16. Кривата на нормална дистрибуција нацртана со користење на седум точки

Во пракса, кога се проучува популација со цел да се усогласи нејзината дистрибуција со нормалната, често се користи „правилото 3cr“.

Математички е докажано дека веројатноста дека отстапувањето од просекот во апсолутна вредност ќе биде помало од тројно стандардното отстапување е еднаква на 0,9973, односно веројатноста апсолутната вредност на отстапувањето да ја надмине тројната стандардна девијација е 0,0027 или многу мал. Врз основа на принципот на неможност за неверојатни настани, „случајот на надминување“ на членот 3 може да се смета за практично невозможен. Ако случајната променлива е распределена нормално, тогаш апсолутната вредност на нејзиното отстапување од математичкото очекување (средна вредност) не надминува тројно од стандардното отстапување.

Во практични пресметки тие работат на овој начин. Ако, со оглед на непознатата природа на распределбата на случајната променлива што се испитува, пресметаната вредност на отстапувањето од средната вредност се покаже дека е помала од вредноста на 3 ST, тогаш постои причина да се верува дека карактеристиката што се испитува е распределена нормално. Доколку наведениот параметар надмине нумеричка вредност 3 ST, можеме да претпоставиме дека распределбата на вредноста што се испитува не е конзистентна со нормалната распределба.

Пресметката на теоретските фреквенции за сериите на емпириска дистрибуција што се проучува обично се нарекува порамнување на емпириските криви според нормалниот (или кој било друг) закон за распределба. Овој процес е важен и теоретски и практично значење. Порамнувањето на емпириските податоци открива шема во нивната дистрибуција, која може да биде прикриена од случајната форма на нејзината манифестација. Шемата воспоставена на овој начин може да се користи за решавање на голем број практични проблеми.

Истражувачот наидува на дистрибуција блиска до нормалата во различни области на науката и области на практична човечка активност. Во економијата, овој вид на дистрибуција е поретко отколку, да речеме, во технологијата или биологијата. Ова се должи на самата природа на социо-економските појави, кои се карактеризираат со голема сложеност на меѓусебно поврзани и меѓусебно поврзани фактори, како и со присуство на голем број услови кои ја ограничуваат слободната „игра“ на случаи. Но, економистот мора да се повика на нормалната дистрибуција, анализирајќи ја структурата на емпириските распределби, како некој вид стандард. Таквата споредба овозможува да се разјасни природата на оние внатрешни услови што ја одредуваат оваа бројка за дистрибуција.

Пенетрација на сфера статистичко истражувањево областа на социо-економските појави овозможија да се открие постоењето на голем број различни видови криви на дистрибуција. Сепак, не треба да се претпоставува дека теоретскиот концепт на кривата на нормална дистрибуција генерално е од мала корист во статистичката и математичката анализа на овој тип феномен. Можеби не е секогаш прифатливо во анализата на одредено статистичка дистрибуција, но во областа на теоријата и практиката од огромно значење е методот на истражување на примерок.

Да ги именуваме главните аспекти на примената на нормалната дистрибуција во статистичката и математичката анализа.

1. Да се ​​одреди веројатноста за одредена вредност на карактеристика. Ова е неопходно кога се тестираат хипотезите за кореспонденцијата на одредена емпириска дистрибуција со нормалата.

2. При проценка на одреден број параметри, на пример, просеци, користејќи го методот на максимална веројатност. Нејзината суштина лежи во дефиницијата на закон на кој подлежи севкупноста. Се одредува и проценката што ги дава максималните вредности. Најдоброто приближување на параметрите на популацијата е дадено со односот:

y = - 2 = e 2

3. Да се ​​определи веројатноста за примерок значи во однос на општите средства.

4. При определување на интервалот на доверба во кој се наоѓа приближната вредност на карактеристиките на општата популација.

Споделете со пријателите или заштедете за себе:

Се вчитува...