Պիրսոնի բաշխում (chi-square բաշխում): Վիճակագրության դասական մեթոդներ. chi-square test Ksi քառակուսի բաշխում

Խի քառակուսի բաշխումը վիճակագրության մեջ ամենալայն օգտագործվողներից է վիճակագրական վարկածների փորձարկման համար: Հիմնվելով chi-square բաշխման վրա, կառուցված է ամենահզոր թեստերից մեկը՝ Pearson chi-square թեստը:

Համաձայնության չափանիշը անհայտ բաշխման ենթադրյալ օրենքի մասին վարկածը ստուգելու չափանիշն է։

χ2 (chi-square) թեստն օգտագործվում է տարբեր բաշխումների վարկածը ստուգելու համար։ Սա նրա արժանապատվությունն է։

Չափանիշի հաշվարկման բանաձևը հավասար է

որտեղ m-ը և m-ը համապատասխանաբար էմպիրիկ և տեսական հաճախականություններ են

խնդրո առարկա բաշխումը;

n-ն ազատության աստիճանների թիվն է:

Ստուգելու համար մենք պետք է համեմատենք էմպիրիկ (դիտարկված) և տեսական (հաշվարկված նորմալ բաշխման ենթադրությամբ) հաճախականությունները։

Եթե ​​էմպիրիկ հաճախականությունները լիովին համընկնում են հաշվարկված կամ ակնկալվող հաճախությունների հետ, S (E – T) = 0, իսկ χ2 չափանիշը նույնպես հավասար կլինի զրոյի: Եթե ​​S (E – T) հավասար չէ զրոյի, դա ցույց կտա անհամապատասխանություն հաշվարկված հաճախականությունների և շարքի էմպիրիկ հաճախությունների միջև: Նման դեպքերում անհրաժեշտ է գնահատել χ2 չափանիշի նշանակությունը, որը տեսականորեն կարող է տատանվել զրոյից մինչև անսահմանություն։ Դա արվում է χ2ф-ի փաստացի ստացված արժեքը համեմատելով նրա կրիտիկական արժեքի հետ (χ2st): Զրոյական վարկածը, այսինքն՝ այն ենթադրությունը, որ էմպիրիկ և տեսական կամ ակնկալվող հաճախությունների միջև անհամապատասխանությունը պատահական է, հերքվում է, եթե χ2ф-ը մեծ է կամ հավասար է: χ2-րդ ընդունված նշանակության մակարդակի (a) և ազատության աստիճանների քանակի համար (n):

χ2 պատահական փոփոխականի հավանական արժեքների բաշխումը շարունակական է և ասիմետրիկ: Այն կախված է ազատության աստիճանների քանակից (n) և մոտենում է նորմալ բաշխմանը, քանի որ դիտումների քանակը մեծանում է: Հետևաբար, χ2 չափանիշի կիրառումը գնահատման համար դիսկրետ բաշխումներկապված է որոշ սխալների հետ, որոնք ազդում են դրա արժեքի վրա, հատկապես փոքր նմուշներում: Ավելի ճշգրիտ գնահատականներ ստանալու համար բաշխվել է նմուշ տատանումների շարք, պետք է ունենա առնվազն 50 տարբերակ։ χ2 չափանիշի ճիշտ կիրառումը պահանջում է նաև, որ էքստրեմալ դասերում տարբերակների հաճախականությունները չպետք է լինեն 5-ից պակաս. եթե դրանք 5-ից պակաս են, ապա դրանք համակցվում են հարևան դասերի հաճախականությունների հետ այնպես, որ ընդհանուր գումարը մեծ կամ հավասար է 5-ի: Ըստ հաճախականությունների համակցության՝ դասերի (N) թիվը նվազում է: Ազատության աստիճանների թիվը սահմանվում է դասերի երկրորդական թվով՝ հաշվի առնելով տատանումների ազատության սահմանափակումների քանակը։



Քանի որ χ2 չափանիշի որոշման ճշգրտությունը մեծապես կախված է տեսական հաճախականությունների (T) հաշվարկի ճշգրտությունից, էմպիրիկ և հաշվարկված հաճախականությունների միջև տարբերությունը ստանալու համար պետք է օգտագործվեն չկլորացված տեսական հաճախականություններ:

Որպես օրինակ, վերցնենք մի ուսումնասիրություն, որը հրապարակվել է մի կայքում, որը նվիրված է օգտագործմանը վիճակագրական մեթոդներհումանիտար գիտությունների մեջ։

Chi-square թեստը թույլ է տալիս համեմատել հաճախականությունների բաշխումները՝ անկախ նրանից՝ դրանք սովորաբար բաշխված են, թե ոչ:

Հաճախականությունը վերաբերում է իրադարձության դեպքերի քանակին: Սովորաբար, իրադարձությունների առաջացման հաճախականությունը կարգավորվում է, երբ փոփոխականները չափվում են անունների սանդղակով, և դրանց այլ բնութագրերը, բացի հաճախությունից, անհնար կամ խնդրահարույց են ընտրելու համար: Այլ կերպ ասած, երբ փոփոխականն ունի որակական բնութագրեր։ Բացի այդ, շատ հետազոտողներ հակված են թեստի միավորները փոխակերպել մակարդակների (բարձր, միջին, ցածր) և կազմել միավորների բաշխման աղյուսակներ՝ պարզելու այս մակարդակների մարդկանց թիվը: Ապացուցելու համար, որ մակարդակներից մեկում (կատեգորիաներից մեկում) մարդկանց թիվն իսկապես ավելի մեծ է (պակաս), օգտագործվում է նաև Chi-square գործակիցը։

Եկեք նայենք ամենապարզ օրինակին.

Ավելի երիտասարդ դեռահասների շրջանում անցկացվել է թեստ՝ բացահայտելու ինքնագնահատականը: Թեստի միավորները վերածվել են երեք մակարդակի՝ բարձր, միջին, ցածր: Հաճախականությունները բաշխվել են հետևյալ կերպ.

Բարձր (B) 27 մարդ:

Միջին (C) 12 մարդ:

Ցածր (L) 11 մարդ

Ակնհայտ է, որ երեխաների մեծամասնությունը բարձր ինքնագնահատական ​​ունի, բայց դա վիճակագրորեն ապացուցման կարիք ունի։ Դա անելու համար մենք օգտագործում ենք Chi-square թեստը:

Մեր խնդիրն է ստուգել, ​​թե արդյոք ստացված էմպիրիկ տվյալները տարբերվում են տեսականորեն նույնքան հավանականներից։ Դա անելու համար անհրաժեշտ է գտնել տեսական հաճախականությունները: Մեր դեպքում տեսական հաճախականությունները հավասարապես հավանական հաճախականություններ են, որոնք հայտնաբերվում են բոլոր հաճախականությունները գումարելով և բաժանելով կատեգորիաների թվին։

Մեր դեպքում.

(B + C + H) / 3 = (27 + 12 + 11) / 3 = 16.6

Խի-քառակուսի թեստի հաշվարկման բանաձևը.

χ2 = ∑(E - T)I / T

Մենք աղյուսակը պատրաստում ենք.

Գտեք վերջին սյունակի գումարը.

Այժմ դուք պետք է գտնեք չափանիշի կրիտիկական արժեքը՝ օգտագործելով կրիտիկական արժեքների աղյուսակը (Աղյուսակ 1 հավելվածում): Դա անելու համար մեզ անհրաժեշտ է ազատության աստիճանների թիվը (n):

n = (R - 1) * (C - 1)

որտեղ R-ը աղյուսակի տողերի թիվն է, C-ն՝ սյունակների քանակը:

Մեր դեպքում կա միայն մեկ սյունակ (նկատի ունի բնօրինակ էմպիրիկ հաճախականությունները) և երեք տող (կատեգորիաներ), այնպես որ բանաձևը փոխվում է՝ մենք բացառում ենք սյունակները։

n = (R - 1) = 3-1 = 2

p≤0.05 և n = 2 սխալի հավանականության համար կրիտիկական արժեքը χ2 = 5.99 է:

Ստացված էմպիրիկ արժեքը մեծ է կրիտիկականից. հաճախականությունների տարբերությունները նշանակալի են (χ2= 9,64; p≤0,05):

Ինչպես տեսնում եք, չափանիշը հաշվարկելը շատ պարզ է և շատ ժամանակ չի պահանջում: Chi-square թեստի գործնական արժեքը հսկայական է: Այս մեթոդն առավել արժեքավոր է հարցաթերթիկների պատասխանները վերլուծելիս:


Դիտարկենք ավելի բարդ օրինակ:

Օրինակ՝ հոգեբանը ցանկանում է իմանալ՝ ճի՞շտ է արդյոք, որ ուսուցիչներն ավելի շատ կողմնակալ են տղաների, քան աղջիկների նկատմամբ։ Նրանք. ավելի հավանական է գովել աղջիկներին: Դա անելու համար հոգեբանը վերլուծել է ուսուցիչների կողմից գրված աշակերտների բնութագրերը երեք բառերի առաջացման հաճախականության համար՝ «ակտիվ», «ջանասեր», «կարգապահ», և հաշվվել են նաև բառերի հոմանիշները: Բառերի առաջացման հաճախականության վերաբերյալ տվյալները մուտքագրվել են աղյուսակում.

Ստացված տվյալները մշակելու համար օգտագործում ենք chi-square թեստը։

Դա անելու համար մենք կկառուցենք էմպիրիկ հաճախականությունների բաշխման աղյուսակ, այսինքն. այն հաճախականությունները, որոնք մենք դիտում ենք.

Տեսականորեն մենք ակնկալում ենք, որ հաճախականությունները կբաշխվեն հավասարաչափ, այսինքն. հաճախականությունը համամասնորեն բաշխվելու է տղաների և աղջիկների միջև։ Եկեք կառուցենք տեսական հաճախականությունների աղյուսակ: Դա անելու համար տողերի գումարը բազմապատկեք սյունակի գումարով և ստացված թիվը բաժանեք ընդհանուր գումարի (ների) վրա:

Հաշվարկների վերջնական աղյուսակը կունենա հետևյալ տեսքը.

χ2 = ∑(E - T)I / T

n = (R - 1), որտեղ R-ն աղյուսակի տողերի թիվն է:

Մեր դեպքում, chi-square = 4.21; n = 2:

Օգտագործելով չափանիշի կրիտիկական արժեքների աղյուսակը, մենք գտնում ենք. n = 2 և 0,05 սխալի մակարդակով, կրիտիկական արժեքը χ2 = 5,99 է:

Ստացված արժեքը փոքր է կրիտիկական արժեքից, ինչը նշանակում է, որ զրոյական վարկածն ընդունված է:

Եզրակացություն՝ ուսուցիչները չեն կարևորում երեխայի սեռը նրա համար բնութագրեր գրելիս։


Եզրակացություն.

Կ.Փիրսոնը նշանակալի ներդրում է ունեցել զարգացման գործում մաթեմատիկական վիճակագրություն(մեծ թվով հիմնարար հասկացություններ): Փիրսոնի հիմնական փիլիսոփայական դիրքորոշումը ձևակերպված է հետևյալ կերպ. դրանք գիտական ​​նախադասությունների մեջ միացնելու կանոնները մեկուսացված են գիտության քերականությամբ, որը գիտության փիլիսոփայությունն է։ Համընդհանուր կարգապահությունը՝ կիրառական վիճակագրությունը, թույլ է տալիս կապել տարբեր հասկացություններն ու երևույթները, թեև Փիրսոնի կարծիքով՝ դա սուբյեկտիվ է։

Կ. Փիրսոնի շինություններից շատերը ուղղակիորեն կապված են կամ մշակվել են մարդաբանական նյութերի օգտագործմամբ: Նա մշակել է թվային դասակարգման բազմաթիվ մեթոդներ և վիճակագրական չափանիշներ, որոնք օգտագործվում են գիտության բոլոր բնագավառներում։


գրականություն.

1. Bogolyubov A. N. Մաթեմատիկա. Մեխանիկա. Կենսագրական տեղեկագիրք. - Կիև. Նաուկովա Դումկա, 1983 թ.

2. Kolmogorov A. N., Yushkevich A. P. (խմբ.): 19-րդ դարի մաթեմատիկա. - Մ.: Գիտություն: - T.I.

3. 3. Բորովկով Ա.Ա. Մաթեմատիկայի վիճակագրություն. Մ.: Նաուկա, 1994 թ.

4. 8. Feller V. Ներածություն հավանականության տեսությանը և դրա կիրառությունները: - Մ.՝ Միր, Թ.2, 1984։

5. 9. Հարման Գ., Ժամանակակից գործոնային վերլուծություն. - Մ.: Վիճակագրություն, 1972:

Նախքան վերջ XIXդարում, նորմալ բաշխումը համարվում էր տվյալների փոփոխության համընդհանուր օրենքը: Այնուամենայնիվ, Կ. Փիրսոնը նշեց, որ էմպիրիկ հաճախականությունները կարող են մեծապես տարբերվել նորմալ բաշխումից: Հարց առաջացավ, թե ինչպես դա ապացուցել։ Պահանջվում էր ոչ միայն գրաֆիկական համեմատություն, որը սուբյեկտիվ է, այլեւ խիստ քանակական հիմնավորում։

Ահա թե ինչպես է հորինվել չափանիշը χ 2(չի քառակուսի), որը ստուգում է էմպիրիկ (դիտարկվող) և տեսական (ակնկալվող) հաճախականությունների անհամապատասխանության նշանակությունը։ Դա տեղի է ունեցել դեռևս 1900 թվականին, սակայն չափանիշը դեռևս կիրառվում է այսօր։ Ավելին, այն հարմարեցվել է խնդիրների լայն շրջանակի լուծման համար։ Առաջին հերթին սա կատեգորիկ տվյալների վերլուծությունն է, այսինքն. նրանք, որոնք արտահայտվում են ոչ թե քանակով, այլ ինչ-որ կատեգորիայի պատկանմամբ։ Օրինակ՝ մեքենայի դասը, փորձի մասնակցի սեռը, բույսի տեսակը և այլն։ Նման տվյալների վրա չեն կարող կիրառվել այնպիսի մաթեմատիկական գործողություններ, ինչպիսիք են գումարումը և բազմապատկումը, հաճախականությունները կարող են հաշվարկվել միայն դրանց համար:

Նշում ենք դիտարկվող հաճախականությունները Մոտ (դիտված), ակնկալվում է - E (Սպասվում է). Որպես օրինակ՝ վերցնենք 60 անգամ գլանափաթեթ գլորելու արդյունքը։ Եթե ​​այն սիմետրիկ է և միատեսակ, ապա ցանկացած կողմ ստանալու հավանականությունը 1/6 է, հետևաբար յուրաքանչյուր կողմ ստանալու ակնկալվող թիվը 10 է (1/6∙60): Դիտարկված և սպասվող հաճախականությունները գրում ենք աղյուսակում և գծում հիստոգրամա։

Զուր վարկածն այն է, որ հաճախականությունները համահունչ են, այսինքն՝ փաստացի տվյալները չեն հակասում սպասվող տվյալներին։ Այլընտրանքային վարկածն այն է, որ հաճախականությունների շեղումները դուրս են գալիս պատահական տատանումներից, անհամապատասխանությունները վիճակագրորեն նշանակալի են: Խիստ եզրակացություն անելու համար մեզ անհրաժեշտ է.

  1. Դիտարկվող և սպասվող հաճախությունների միջև անհամապատասխանության ամփոփ չափում:
  2. Այս չափման բաշխումը, եթե այն վարկածը, որ տարբերություններ չկան, ճիշտ է:

Սկսենք հաճախականությունների միջև հեռավորությունից: Եթե ​​դուք պարզապես վերցնեք տարբերությունը Օ - Ե, ապա նման չափումը կախված կլինի տվյալների (հաճախականությունների) մասշտաբից։ Օրինակ, 20 - 5 = 15 և 1020 - 1005 = 15: Երկու դեպքում էլ տարբերությունը 15 է: Բայց առաջին դեպքում ակնկալվող հաճախականությունները 3 անգամ պակաս են դիտվածից, իսկ երկրորդ դեպքում՝ ընդամենը 1,5: %: Մեզ անհրաժեշտ է հարաբերական չափում, որը կախված չէ մասշտաբից։

Ուշադրություն դարձնենք հետևյալ փաստերին. Ընդհանուր առմամբ, կատեգորիաների թիվը, որոնցում չափվում են հաճախականությունները, կարող է շատ ավելի մեծ լինել, ուստի հավանականությունը, որ մեկ դիտարկումը կհայտնվի այս կամ այն ​​կատեգորիայի մեջ, բավականին փոքր է: Եթե ​​այո, ապա այդպիսի պատահական փոփոխականի բաշխումը ենթարկվելու է հազվագյուտ իրադարձությունների օրենքին, որը հայտնի է որպես Պուասոնի օրենքը. Պուասոնի օրենքում, ինչպես հայտնի է, մաթեմատիկական ակնկալիքի արժեքը և շեղումը համընկնում են (պարամետր λ ) Սա նշանակում է, որ ակնկալվող հաճախականությունը անվանական փոփոխականի որոշ կատեգորիայի համար E iկլինի միաժամանակյա և դրա ցրումը. Ավելին, Պուասոնի օրենքը մեծ թվով դիտարկումներով հակված է նորմալ: Համակցելով այս երկու փաստերը՝ մենք ստանում ենք, որ եթե դիտարկված և սպասվող հաճախությունների միջև համաձայնության վարկածը ճիշտ է, ապա. մեծ թվով դիտարկումներով, արտահայտություն

Կարևոր է հիշել, որ նորմալությունը կհայտնվի միայն բավականաչափ բարձր հաճախականություններում: Վիճակագրության մեջ ընդհանուր առմամբ ընդունված է, որ դիտումների ընդհանուր թիվը (հաճախականությունների գումարը) պետք է լինի առնվազն 50, իսկ ակնկալվող հաճախականությունը յուրաքանչյուր աստիճանում պետք է լինի առնվազն 5: Միայն այս դեպքում վերը նշված արժեքն ունի ստանդարտ նորմալ բաշխում: . Ենթադրենք, որ այս պայմանը կատարվում է։

Ստանդարտ նորմալ բաշխումն ունի գրեթե բոլոր արժեքները ±3-ի սահմաններում (երեք սիգմա կանոն): Այսպիսով, մենք ստացանք մեկ աստիճանավորման հաճախականությունների հարաբերական տարբերությունը: Մեզ ընդհանրացնող միջոց է պետք։ Դուք չեք կարող պարզապես գումարել բոլոր շեղումները. մենք ստանում ենք 0 (գուշակեք, թե ինչու): Փիրսոնն առաջարկեց գումարել այդ շեղումների քառակուսիները:

Սա նշանն է Chi-square թեստ Փիրսոն. Եթե ​​հաճախականություններն իսկապես համապատասխանում են ակնկալվողներին, ապա չափանիշի արժեքը կլինի համեմատաբար փոքր (քանի որ շեղումների մեծ մասը զրոյի մոտ է): Բայց եթե չափանիշը մեծ է, ապա դա ցույց է տալիս հաճախականությունների միջև զգալի տարբերություններ:

Պիրսոնի չափանիշը դառնում է «մեծ», երբ նման կամ նույնիսկ ավելի մեծ արժեքի առաջացումը դառնում է անհավանական: Իսկ նման հավանականությունը հաշվարկելու համար անհրաժեշտ է իմանալ չափանիշի բաշխվածությունը, երբ փորձը բազմիցս կրկնվում է, երբ հաճախականության համաձայնության վարկածը ճիշտ է։

Ինչպես հեշտ է տեսնել, chi-square արժեքը նույնպես կախված է տերմինների քանակից: Որքան շատ լինեն, այնքան մեծ կլինի չափանիշի արժեքը, քանի որ յուրաքանչյուր տերմին կնպաստի ընդհանուրին: Հետեւաբար, յուրաքանչյուր քանակի համար անկախպայմաններով, կլինի իր բաշխումը։ Պարզվում է, որ χ 2բաշխումների մի ամբողջ ընտանիք է:

Եվ ահա մենք հասնում ենք մի նուրբ պահի. Ինչ է թիվը անկախպայմանները? Թվում է, թե ցանկացած տերմին (այսինքն՝ շեղում) անկախ է: Ք.Պիրսոնը նույնպես այդպես էր կարծում, բայց պարզվեց, որ նա սխալվում էր։ Փաստորեն, անկախ անդամների թիվը մեկով պակաս կլինի անվանական փոփոխականի աստիճանավորումների քանակից n. Ինչո՞ւ։ Որովհետև եթե մենք ունենք նմուշ, որի համար հաճախականությունների գումարն արդեն հաշվարկված է, ապա հաճախականություններից մեկը միշտ կարող է որոշվել որպես ընդհանուր թվի և մնացած բոլորի գումարի տարբերություն։ Հետևաբար, տատանումները մի փոքր ավելի քիչ կլինեն: Ռոնալդ Ֆիշերը նկատել է այս փաստը 20 տարի անց, երբ Փիրսոնը մշակեց իր չափանիշը: Նույնիսկ սեղանները պետք է վերամշակվեին։

Այս առիթով Ֆիշերը նոր հայեցակարգ է ներկայացրել վիճակագրության մեջ. ազատության աստիճանը(ազատության աստիճաններ), որը ներկայացնում է անկախ տերմինների քանակը գումարում։ Ազատության աստիճանների հասկացությունն ունի մաթեմատիկական բացատրություն և ի հայտ է գալիս միայն նորմալի հետ կապված բաշխումներում (Student's, Fisher-Snedecor և բուն chi-square):

Ազատության աստիճանների իմաստը ավելի լավ հասկանալու համար դիմենք ֆիզիկական անալոգին: Եկեք պատկերացնենք, որ մի կետ ազատ շարժվում է տարածության մեջ: Այն ունի 3 աստիճան ազատություն, քանի որ կարող է շարժվել ցանկացած ուղղությամբ եռաչափ տարածության մեջ: Եթե ​​կետը շարժվում է ցանկացած մակերևույթի երկայնքով, ապա այն արդեն ունի ազատության երկու աստիճան (հետ և առաջ, ձախ և աջ), չնայած այն շարունակում է մնալ եռաչափ տարածության մեջ: Աղբյուրի երկայնքով շարժվող կետը կրկին գտնվում է եռաչափ տարածության մեջ, բայց ունի ազատության միայն մեկ աստիճան, քանի որ կարող է շարժվել առաջ կամ հետ: Ինչպես տեսնում եք, տարածքը, որտեղ գտնվում է օբյեկտը, միշտ չէ, որ համապատասխանում է իրական շարժման ազատությանը:

Մոտավորապես նույն կերպ, վիճակագրական չափանիշի բաշխումը կարող է կախված լինել ավելի փոքր թվով տարրերից, քան այն հաշվարկելու համար անհրաժեշտ պայմանները: Ընդհանուր առմամբ, ազատության աստիճանների թիվը ավելի քիչ է, քան գոյություն ունեցող կախվածությունների քանակով դիտարկումների թիվը:

Այսպիսով, chi քառակուսի բաշխումը ( χ 2) բաշխումների ընտանիք է, որոնցից յուրաքանչյուրը կախված է ազատության աստիճանի պարամետրից։ Իսկ chi-square թեստի պաշտոնական սահմանումը հետեւյալն է. Բաշխում χ 2(chi-square) s կազատության աստիճանները քառակուսիների գումարի բաշխումն է կանկախ ստանդարտ նորմալ պատահական փոփոխականներ:

Հաջորդը, մենք կարող ենք անցնել բուն բանաձևին, որով հաշվարկվում է chi-square բաշխման ֆունկցիան, բայց, բարեբախտաբար, մեզ համար ամեն ինչ վաղուց հաշվարկված է: Հետաքրքրության հավանականությունը ստանալու համար կարող եք օգտագործել կա՛մ համապատասխան վիճակագրական աղյուսակը, կա՛մ պատրաստի ֆունկցիա Excel-ում:

Հետաքրքիր է տեսնել, թե ինչպես է փոխվում chi-square-ի բաշխման ձևը՝ կախված ազատության աստիճանների քանակից:

Ազատության աստիճանների աճով, chi-square-ի բաշխումը հակված է նորմալ լինելու: Դա բացատրվում է կենտրոնական սահմանային թեորեմի գործողությամբ, ըստ որի մեծ թվով անկախ պատահական փոփոխականների գումարն ունի նորմալ բաշխում։ Քառակուսիների մասին ոչինչ չի ասում))։

Հիպոթեզի փորձարկում՝ օգտագործելով Pearson chi-square թեստը

Այժմ մենք գալիս ենք հիպոթեզների փորձարկմանը՝ օգտագործելով chi-square մեթոդը: Ընդհանուր առմամբ, տեխնոլոգիան մնում է: Զրոյական վարկածն այն է, որ դիտարկվող հաճախականությունները համապատասխանում են սպասվածներին (այսինքն, դրանց միջև տարբերություն չկա, քանի որ դրանք վերցված են նույն պոպուլյացիայից): Եթե ​​դա այդպես է, ապա ցրումը կլինի համեմատաբար փոքր՝ պատահական տատանումների սահմաններում։ Դիսպերսիայի չափը որոշվում է chi-square թեստի միջոցով: Այնուհետև կամ չափանիշն ինքնին համեմատվում է կրիտիկական արժեքի հետ (նշանակության համապատասխան մակարդակի և ազատության աստիճանի համար), կամ, որ ավելի ճիշտ է, հաշվարկվում է դիտարկվող p արժեքը, այսինքն. նույն կամ նույնիսկ ավելի մեծ չափանիշի արժեք ստանալու հավանականությունը, եթե զրոյական վարկածը ճշմարիտ է:

Որովհետեւ մենք շահագրգռված ենք հաճախականությունների համաձայնությամբ, ապա վարկածը կմերժվի, երբ չափանիշը ավելի մեծ լինի, քան կրիտիկական մակարդակը։ Նրանք. չափանիշը միակողմանի է. Այնուամենայնիվ, երբեմն (երբեմն) անհրաժեշտ է ստուգել ձախակողմյան վարկածը: Օրինակ, երբ էմպիրիկ տվյալները շատ նման են տեսական տվյալներին։ Այնուհետև չափանիշը կարող է ընկնել անհավանական շրջան, բայց ձախ կողմում: Փաստն այն է, որ բնական պայմաններում դժվար թե հաճախականություններ ձեռք բերվեն, որոնք գործնականում համընկնում են տեսականի հետ։ Միշտ կա որոշ պատահականություն, որը տալիս է սխալ: Բայց եթե նման սխալ չկա, ապա միգուցե տվյալները կեղծվել են։ Բայց այնուամենայնիվ, աջակողմյան վարկածը սովորաբար ստուգվում է:

Վերադառնանք զառերի խնդրին։ Եկեք հաշվարկենք chi-square թեստի արժեքը՝ օգտագործելով առկա տվյալները:

Հիմա եկեք գտնենք կրիտիկական արժեքը ազատության 5 աստիճանում ( կ) և նշանակության մակարդակ 0,05 ( α ) ըստ Չի քառակուսի բաշխման կրիտիկական արժեքների աղյուսակի:

Այսինքն՝ 0.05 քվանտիլը 5 աստիճան ազատության chi քառակուսի բաշխում է (աջ պոչը): χ 2 0,05; 5 = 11,1.

Եկեք համեմատենք փաստացի և աղյուսակային արժեքները: 3.4 ( χ 2) < 11,1 (χ 2 0,05; 5) Հաշվարկված չափանիշն ավելի փոքր է ստացվել, ինչը նշանակում է, որ հաճախականությունների հավասարության (համաձայնության) վարկածը չի մերժվում։ Նկարում իրավիճակն այսպիսին է.

Եթե ​​հաշվարկված արժեքը ընկներ կրիտիկական տարածաշրջանում, ապա զրոյական վարկածը կմերժվեր:

Ավելի ճիշտ կլինի նաև հաշվարկել p-արժեքը։ Դա անելու համար հարկավոր է աղյուսակում գտնել ամենամոտ արժեքը ազատության որոշակի քանակի համար և նայել համապատասխան նշանակության մակարդակին: Բայց սա անցյալ դարում. Մենք կօգտագործենք համակարգիչ, մասնավորապես MS Excel: Excel-ն ունի chi-square-ի հետ կապված մի քանի գործառույթ:

Ստորև ներկայացնում ենք դրանց համառոտ նկարագրությունը:

CH2.OBR- չափանիշի կրիտիկական արժեքը տվյալ հավանականությամբ ձախ կողմում (ինչպես վիճակագրական աղյուսակներում)

CH2.OBR.PH– աջ կողմում տրված հավանականության չափանիշի կրիտիկական արժեքը: Ֆունկցիան ըստ էության կրկնօրինակում է նախորդը: Բայց այստեղ դուք կարող եք անմիջապես նշել մակարդակը α , քան 1-ից հանելը: Սա ավելի հարմար է, քանի որ շատ դեպքերում բաշխման ճիշտ պոչն է անհրաժեշտ:

CH2.DIST– p-արժեքը ձախ կողմում (խտությունը կարելի է հաշվարկել):

CH2.DIST.PH- p-արժեքը աջ կողմում:

CHI2.ԹԵՍՏ– անմիջապես անցկացնում է chi-square թեստը երկու հաճախականությունների միջակայքերի համար: Ազատության աստիճանների թիվը վերցվում է մեկով պակաս սյունակում հաճախականությունների քանակից (ինչպես պետք է լինի)՝ վերադարձնելով p արժեք։

Եկեք հաշվարկենք մեր փորձի համար կրիտիկական (աղյուսակային) արժեքը 5 աստիճանի ազատության և ալֆա 0,05-ի համար: Excel-ի բանաձևը կունենա հետևյալ տեսքը.

CH2.OBR(0.95;5)

CH2.OBR.PH(0.05;5)

Արդյունքը կլինի նույնը՝ 11.0705։ Սա այն արժեքն է, որը մենք տեսնում ենք աղյուսակում (կլորացվում է մինչև 1 տասնորդական տեղ):

Վերջապես հաշվարկենք p-արժեքը 5 աստիճանի ազատության չափանիշի համար χ 2= 3.4. Մեզ անհրաժեշտ է հավանականությունը աջ կողմում, ուստի մենք վերցնում ենք ֆունկցիան HH-ի ավելացումով (աջ պոչ)

CH2.DIST.PH(3.4;5) = 0.63857

Սա նշանակում է, որ 5 աստիճան ազատության դեպքում չափանիշի արժեքը ստանալու հավանականությունը մեծ է χ 2= 3,4 և ավելի հավասար է գրեթե 64%-ի: Բնականաբար, վարկածը չի մերժվում (p-արժեքը 5%-ից մեծ է, հաճախականությունները շատ լավ համընկնում են։

Հիմա եկեք ստուգենք հաճախությունների համաձայնության վարկածը՝ օգտագործելով chi-square թեստը և Excel ֆունկցիան CHI2.TEST:

Ոչ աղյուսակներ, ոչ ծանր հաշվարկներ: Որպես ֆունկցիայի արգումենտ նշելով դիտարկվող և սպասվող հաճախականություններով սյունակները՝ մենք անմիջապես ստանում ենք p-արժեքը։ Գեղեցկություն.

Հիմա պատկերացրեք, որ դուք զառախաղ եք խաղում կասկածելի տղայի հետ: Միավորների բաշխումը 1-ից 5-ը մնում է նույնը, բայց նա գլորում է 26 վեցեր (նետումների ընդհանուր թիվը դառնում է 78):

P-արժեքն այս դեպքում ստացվում է 0,003, ինչը շատ ավելի քիչ է, քան 0,05: Զառերի վավերականությանը կասկածելու լավ պատճառներ կան: Ահա թե ինչպիսին է այդ հավանականությունը chi-square բաշխման գծապատկերում:

Այստեղ ինքնին «chi-square» չափանիշը 17.8 է, որը, բնականաբար, ավելի մեծ է, քան աղյուսակը (11.1):

Հուսով եմ կարողացա բացատրել, թե որն է համաձայնության չափանիշը χ 2(Pearson chi-square) և ինչպես այն կարող է օգտագործվել վիճակագրական վարկածները ստուգելու համար:

Վերջապես ևս մեկ կարևոր պայմանի մասին. Chi-square թեստը ճիշտ է աշխատում միայն այն դեպքում, երբ բոլոր հաճախականությունների թիվը գերազանցում է 50-ը, և նվազագույն ակնկալվող արժեքը յուրաքանչյուր աստիճանի համար 5-ից ոչ պակաս է: Եթե որևէ կատեգորիայի ակնկալվող հաճախականությունը 5-ից պակաս է, բայց բոլոր հաճախականությունների գումարը գերազանցում է: 50, ապա այդպիսի կատեգորիան համակցվում է ամենամոտի հետ, որպեսզի դրանց ընդհանուր հաճախականությունը գերազանցի 5-ը: Եթե դա հնարավոր չէ, կամ հաճախականությունների գումարը 50-ից փոքր է, ապա պետք է օգտագործել վարկածների փորձարկման ավելի ճշգրիտ մեթոդներ: Նրանց մասին կխոսենք մեկ այլ անգամ:

Ստորև բերված է տեսանյութ, թե ինչպես կարելի է փորձարկել հիպոթեզը Excel-ում՝ օգտագործելով chi-square թեստը:

Թող U 1, U 2, ..,U k լինեն անկախ ստանդարտ նորմալ արժեքներ. K = U 1 2 +U 2 2 + .. + U k 2 պատահական փոփոխականի բաշխումը կոչվում է խի քառակուսի բաշխում կազատության աստիճաններ (գրել K~χ 2 (k)): Սա միամոդալ բաշխում է՝ դրական թեքությամբ և հետևյալ բնութագրերով՝ ռեժիմ M=k-2 ակնկալվող արժեքը m=k դիսպերսիա D=2k (նկ.): Պարամետրի բավականաչափ մեծ արժեքով կբաշխումը χ 2 (k) ունի մոտավորապես նորմալ բաշխում պարամետրերով

Մաթեմատիկական վիճակագրության խնդիրներ լուծելիս օգտագործվում են χ 2 (k) կրիտիկական կետերը՝ կախված α տվյալ հավանականությունից և ազատության աստիճանների քանակից։ կ(Հավելված 2): Ք 2 kr = Χ 2 (k; α) կրիտիկական կետը այն շրջանի սահմանն է, որից աջ ընկած է բաշխման խտության կորի տակ գտնվող տարածքի 100- α %-ը: Հավանականությունը, որ K~χ 2 (k) պատահական փոփոխականի արժեքը փորձարկման ժամանակ կիջնի χ 2 (k) կետից աջ, չի գերազանցում α P(K≥χ 2 kp)≤ α): Օրինակ՝ K~χ 2 (20) պատահական փոփոխականի համար սահմանում ենք α=0,05 հավանականությունը։ Օգտվելով chi-square բաշխման կրիտիկական կետերի աղյուսակից (աղյուսակներ) մենք գտնում ենք χ 2 kp = χ 2 (20;0.05) = 31.4: Սա նշանակում է, որ այս պատահական փոփոխականի հավանականությունը Կընդունեք 31,4-ից ավելի արժեք, 0,05-ից պակաս (նկ.):

Բրինձ. Բաշխման խտության գրաֆիկ χ 2 (k) ազատության աստիճանների քանակի տարբեր արժեքների համար կ

Կրիտիկական χ 2 (k) կետերն օգտագործվում են հետևյալ հաշվիչներում.

  1. Բազմագծայինության առկայության ստուգում (բազմագծայինության մասին):
Հիպոթեզի փորձարկումը Chi-square-ի միջոցով միայն կպատասխանի «կա հարաբերություններ» հարցին, անհրաժեշտ է հետագա հետազոտություն՝ հարաբերությունների ուղղությունը ստուգելու համար: Ավելին, Chi-square թեստն ունի որոշակի սխալ ցածր հաճախականության տվյալների հետ աշխատելիս։

Հետևաբար, կապի ուղղությունը ստուգելու համար ընտրեք հարաբերակցության վերլուծություն, մասնավորապես՝ վարկածի փորձարկում՝ օգտագործելով Պիրսոնի հարաբերակցության գործակիցը, t-test-ի միջոցով նշանակալիության հետագա ստուգմամբ:

Նշանակության մակարդակի α Χ 2 արժեքի համար կարելի է գտնել MS Excel ֆունկցիայի միջոցով՝ =HI2OBR(α;ազատության աստիճաններ)

n-1 .995 .990 .975 .950 .900 .750 .500 .250 .100 .050 .025 .010 .005
1 0.00004 0.00016 0.00098 0.00393 0.01579 0.10153 0.45494 1.32330 2.70554 3.84146 5.02389 6.63490 7.87944
2 0.01003 0.02010 0.05064 0.10259 0.21072 0.57536 1.38629 2.77259 4.60517 5.99146 7.37776 9.21034 10.59663
3 0.07172 0.11483 0.21580 0.35185 0.58437 1.21253 2.36597 4.10834 6.25139 7.81473 9.34840 11.34487 12.83816
4 0.20699 0.29711 0.48442 0.71072 1.06362 1.92256 3.35669 5.38527 7.77944 9.48773 11.14329 13.27670 14.86026
5 0.41174 0.55430 0.83121 1.14548 1.61031 2.67460 4.35146 6.62568 9.23636 11.07050 12.83250 15.08627 16.74960
6 0.67573 0.87209 1.23734 1.63538 2.20413 3.45460 5.34812 7.84080 10.64464 12.59159 14.44938 16.81189 18.54758
7 0.98926 1.23904 1.68987 2.16735 2.83311 4.25485 6.34581 9.03715 12.01704 14.06714 16.01276 18.47531 20.27774
8 1.34441 1.64650 2.17973 2.73264 3.48954 5.07064 7.34412 10.21885 13.36157 15.50731 17.53455 20.09024 21.95495
9 1.73493 2.08790 2.70039 3.32511 4.16816 5.89883 8.34283 11.38875 14.68366 16.91898 19.02277 21.66599 23.58935
10 2.15586 2.55821 3.24697 3.94030 4.86518 6.73720 9.34182 12.54886 15.98718 18.30704 20.48318 23.20925 25.18818
11 2.60322 3.05348 3.81575 4.57481 5.57778 7.58414 10.34100 13.70069 17.27501 19.67514 21.92005 24.72497 26.75685
12 3.07382 3.57057 4.40379 5.22603 6.30380 8.43842 11.34032 14.84540 18.54935 21.02607 23.33666 26.21697 28.29952
13 3.56503 4.10692 5.00875 5.89186 7.04150 9.29907 12.33976 15.98391 19.81193 22.36203 24.73560 27.68825 29.81947
14 4.07467 4.66043 5.62873 6.57063 7.78953 10.16531 13.33927 17.11693 21.06414 23.68479 26.11895 29.14124 31.31935
15 4.60092 5.22935 6.26214 7.26094 8.54676 11.03654 14.33886 18.24509 22.30713 24.99579 27.48839 30.57791 32.80132
16 5.14221 5.81221 6.90766 7.96165 9.31224 11.91222 15.33850 19.36886 23.54183 26.29623 28.84535 31.99993 34.26719
17 5.69722 6.40776 7.56419 8.67176 10.08519 12.79193 16.33818 20.48868 24.76904 27.58711 30.19101 33.40866 35.71847
18 6.26480 7.01491 8.23075 9.39046 10.86494 13.67529 17.33790 21.60489 25.98942 28.86930 31.52638 34.80531 37.15645
19 6.84397 7.63273 8.90652 10.11701 11.65091 14.56200 18.33765 22.71781 27.20357 30.14353 32.85233 36.19087 38.58226
20 7.43384 8.26040 9.59078 10.85081 12.44261 15.45177 19.33743 23.82769 28.41198 31.41043 34.16961 37.56623 39.99685
21 8.03365 8.89720 10.28290 11.59131 13.23960 16.34438 20.33723 24.93478 29.61509 32.67057 35.47888 38.93217 41.40106
22 8.64272 9.54249 10.98232 12.33801 14.04149 17.23962 21.33704 26.03927 30.81328 33.92444 36.78071 40.28936 42.79565
23 9.26042 10.19572 11.68855 13.09051 14.84796 18.13730 22.33688 27.14134 32.00690 35.17246 38.07563 41.63840 44.18128
24 9.88623 10.85636 12.40115 13.84843 15.65868 19.03725 23.33673 28.24115 33.19624 36.41503 39.36408 42.97982 45.55851
25 10.51965 11.52398 13.11972 14.61141 16.47341 19.93934 24.33659 29.33885 34.38159 37.65248 40.64647 44.31410 46.92789
26 11.16024 12.19815 13.84390 15.37916 17.29188 20.84343 25.33646 30.43457 35.56317 38.88514 41.92317 45.64168 48.28988
27 11.80759 12.87850 14.57338 16.15140 18.11390 21.74940 26.33634 31.52841 36.74122 40.11327 43.19451 46.96294 49.64492
28 12.46134 13.56471 15.30786 16.92788 18.93924 22.65716 27.33623 32.62049 37.91592 41.33714 44.46079 48.27824 50.99338
29 13.12115 14.25645 16.04707 17.70837 19.76774 23.56659 28.33613 33.71091 39.08747 42.55697 45.72229 49.58788 52.33562
30 13.78672 14.95346 16.79077 18.49266 20.59923 24.47761 29.33603 34.79974 40.25602 43.77297 46.97924 50.89218 53.67196
Ազատության աստիճանների քանակը կ Նշանակության մակարդակ ա
0,01 0,025 0.05 0,95 0,975 0.99
1 6.6 5.0 3.8 0.0039 0.00098 0.00016
2 9.2 7.4 6.0 0.103 0.051 0.020
3 11.3 9.4 7.8 0.352 0.216 0.115
4 13.3 11.1 9.5 0.711 0.484 0.297
5 15.1 12.8 11.1 1.15 0.831 0.554
6 16.8 14.4 12.6 1.64 1.24 0.872
7 18.5 16.0 14.1 2.17 1.69 1.24
8 20.1 17.5 15.5 2.73 2.18 1.65
9 21.7 19.0 16.9 3.33 2.70 2.09
10 23.2 20.5 18.3 3.94 3.25 2.56
11 24.7 21.9 19.7 4.57 3.82 3.05
12 26.2 23.3 21 .0 5.23 4.40 3.57
13 27.7 24.7 22.4 5.89 5.01 4.11
14 29.1 26.1 23.7 6.57 5.63 4.66
15 30.6 27.5 25.0 7.26 6.26 5.23
16 32.0 28.8 26.3 7.96 6.91 5.81
17 33.4 30.2 27.6 8.67 7.56 6.41
18 34.8 31.5 28.9 9.39 8.23 7.01
19 36.2 32.9 30.1 10.1 8.91 7.63
20 37.6 34.2 31.4 10.9 9.59 8.26
21 38.9 35.5 32.7 11.6 10.3 8.90
22 40.3 36.8 33.9 12.3 11.0 9.54
23 41.6 38.1 35.2 13.1 11.7 10.2
24 43.0 39.4 36.4 13.8 12.4 10.9
25 44.3 40.6 37.7 14.6 13.1 11.5
26 45.6 41.9 38.9 15.4 13.8 12.2
27 47.0 43.2 40.1 16.2 14.6 12.9
28 48.3 44.5 41.3 16.9 15.3 13.6
29 49.6 45.7 42.6 17.7 16.0 14.3
30 50.9 47.0 43.8 18.5 16.8 15.0

Pearson (chi-squared), Student and Fisher բաշխումները

Օգտագործելով նորմալ բաշխումը, սահմանվում են երեք բաշխումներ, որոնք այժմ հաճախ օգտագործվում են վիճակագրական տվյալների մշակման մեջ: Այս բաշխումները բազմիցս հայտնվում են գրքի հետագա բաժիններում:

Պիրսոնի բաշխում (chi - քառակուսի) – պատահական փոփոխականի բաշխում

Որտեղ պատահական փոփոխականներ X 1 , X 2 ,…, X nանկախ և ունեն նույն բաշխումը Ն(0,1). Այս դեպքում տերմինների քանակը, այսինքն. n, կոչվում է «chi-square» բաշխման «ազատության աստիճանների թիվը»։

Խի-քառակուսի բաշխումն օգտագործվում է շեղումը գնահատելիս (օգտագործելով վստահության միջակայքը), համաձայնության, միատարրության, անկախության վարկածները ստուգելիս, հիմնականում որակական (դասակարգված) փոփոխականների համար, որոնք ընդունում են վերջավոր թվով արժեքներ և շատ այլ առաջադրանքներում: Վիճակագրական վերլուծությունտվյալները

Բաշխում տ Student's t-ը պատահական փոփոխականի բաշխումն է

որտեղ են պատահական փոփոխականները UԵվ Xանկախ, Uունի ստանդարտ նորմալ բաշխում Ն(0.1), և X– chi բաշխում – քառակուսի գ nազատության աստիճաններ. Որտեղ nկոչվում է Ուսանողների բաշխման «ազատության աստիճանների թիվը»:

Ուսանողական բաշխումը ներդրվել է 1908 թվականին անգլիացի վիճակագիր Վ. Գոսեթի կողմից, ով աշխատում էր գարեջրի գործարանում։ Այս գործարանում տնտեսական և տեխնիկական որոշումներ կայացնելու համար օգտագործվել են հավանական և վիճակագրական մեթոդներ, ուստի նրա ղեկավարությունն արգելել է Վ.Գոսեթին գիտական ​​հոդվածներ հրատարակել իր անունով։ Այս կերպ պաշտպանվել են Վ.Գոսեթի կողմից մշակված հավանականական և վիճակագրական մեթոդների տեսքով առևտրային գաղտնիքները և «նոու-հաուն»։ Սակայն նա հնարավորություն ունեցավ հրատարակել «Ուսանող» կեղծանունով։ Gosset-Student-ի պատմությունը ցույց է տալիս, որ նույնիսկ հարյուր տարի առաջ բրիտանացի մենեջերները տեղյակ էին մեծին տնտեսական արդյունավետությունըհավանական-վիճակագրական մեթոդներ.

Ներկայումս Student բաշխումը ամենահայտնի բաշխումներից մեկն է, որն օգտագործվում է իրական տվյալների վերլուծության մեջ: Այն օգտագործվում է մաթեմատիկական ակնկալիքների, կանխատեսման արժեքի և այլ բնութագրերի գնահատման ժամանակ՝ օգտագործելով վստահության միջակայքերը, մաթեմատիկական ակնկալիքների արժեքների, ռեգրեսիայի գործակիցների, նմուշի միատարրության վարկածների և այլնի վերաբերյալ վարկածների փորձարկման ժամանակ: .

Ֆիշերի բաշխումը պատահական փոփոխականի բաշխումն է

որտեղ են պատահական փոփոխականները X 1Եվ X 2անկախ են և ունեն խի-քառակուսի բաշխումներ՝ ազատության աստիճանների քանակով կ 1 Եվ կ 2 համապատասխանաբար. Միաժամանակ զույգը (կ 1 , կ 2 ) – Ֆիշերի բաշխման մի զույգ «ազատության աստիճաններ», մասնավորապես. կ 1 համարիչի ազատության աստիճանների թիվն է և կ 2 – հայտարարի ազատության աստիճանների թիվը. Պատահական փոփոխականի բաշխում Ֆանվանվել է անգլիացի մեծ վիճակագիր Ռ.Ֆիշերի (1890-1962) պատվին, ով այն ակտիվորեն օգտագործել է իր աշխատություններում։

Ֆիշերի բաշխումն օգտագործվում է ռեգրեսիոն վերլուծության, շեղումների հավասարության և կիրառական վիճակագրության այլ խնդիրներում մոդելի համարժեքության մասին վարկածները ստուգելիս:

Chi-square, Student և Fisher բաշխման ֆունկցիաների արտահայտությունները, դրանց խտությունները և բնութագրերը, ինչպես նաև դրանց գործնական օգտագործման համար անհրաժեշտ աղյուսակները կարելի է գտնել մասնագիտացված գրականության մեջ (տե՛ս, օրինակ,):

23. Chi-square-ի և Student-ի բաշխման հայեցակարգը և գրաֆիկական տեսքը

1) n ազատության աստիճանով բաշխումը (chi-square) n անկախ ստանդարտ նորմալ պատահական փոփոխականների քառակուսիների գումարի բաշխումն է։

Բաշխում (chi-square)- պատահական փոփոխականի բաշխում (և դրանցից յուրաքանչյուրի մաթեմատիկական ակնկալիքը 0 է, իսկ ստանդարտ շեղումը 1)

որտեղ են պատահական փոփոխականները անկախ են և ունեն նույն բաշխումը։ Այս դեպքում տերմինների քանակը, այսինքն. , կոչվում է «chi-square» բաշխման «ազատության աստիճանների թիվը»։ Խի քառակուսի թիվը որոշվում է մեկ պարամետրով՝ ազատության աստիճանների քանակով։ Քանի որ ազատության աստիճանների թիվը մեծանում է, բաշխումը դանդաղորեն մոտենում է նորմալին:

Այնուհետեւ նրանց քառակուսիների գումարը

պատահական փոփոխական է, որը բաշխված է այսպես կոչված chi-square օրենքի համաձայն՝ k = n ազատության աստիճաններով; եթե տերմինները կապված են ինչ-որ առնչությամբ (օրինակ՝ ), ապա ազատության աստիճանների թիվը k = n – 1։

Այս բաշխման խտությունը

Ահա գամմա ֆունկցիան. մասնավորապես Г(n + 1) = n! .

Հետեւաբար, chi-square-ի բաշխումը որոշվում է մեկ պարամետրով՝ ազատության աստիճանների քանակով k.

Դիտողություն 1. Ազատության աստիճանների քանակի ավելացման հետ chi-square-ի բաշխումը աստիճանաբար մոտենում է նորմալին:

Դիտողություն 2. Օգտագործելով chi-square բաշխումը, որոշվում են պրակտիկայում հանդիպող բազմաթիվ այլ բաշխումներ, օրինակ՝ պատահական փոփոխականի բաշխումը՝ պատահական վեկտորի երկարությունը (X1, X2,..., Xn), կոորդինատները. որոնք անկախ են և բաշխված են սովորական օրենքի համաձայն։

χ2 բաշխումն առաջին անգամ դիտարկվել է Ռ. Հելմերտի (1876) և Կ. Փիրսոնի (1900 թ.) կողմից։

Math.expect.=n; D=2n

2) Ուսանողների բաշխում

Դիտարկենք երկու անկախ պատահական փոփոխական. ազատության աստիճաններ. Հետո արժեքը

ունի բաշխում, որը կոչվում է t-բաշխում կամ Student բաշխում՝ k ազատության աստիճաններով: Այս դեպքում k-ն կոչվում է Student բաշխման «ազատության աստիճանների թիվը»:

Քանի որ ազատության աստիճանների թիվը մեծանում է, Ուսանողների բաշխումն արագորեն մոտենում է նորմալին:

Այս բաշխումը ներդրվել է 1908 թվականին անգլիացի վիճակագիր Վ.Գոսեթի կողմից, ով աշխատում էր գարեջրի գործարանում։ Այս գործարանում տնտեսական և տեխնիկական որոշումներ կայացնելու համար օգտագործվել են հավանական և վիճակագրական մեթոդներ, ուստի նրա ղեկավարությունն արգելել է Վ.Գոսեթին գիտական ​​հոդվածներ հրատարակել իր անունով։ Այս կերպ պաշտպանվել են Վ.Գոսեթի կողմից մշակված հավանականական և վիճակագրական մեթոդների տեսքով առևտրային գաղտնիքները և «նոու-հաուն»։ Սակայն նա հնարավորություն ունեցավ հրատարակել «Ուսանող» կեղծանունով։ Gosset-Student-ի պատմությունը ցույց է տալիս, որ նույնիսկ հարյուր տարի առաջ Մեծ Բրիտանիայի ղեկավարները տեղյակ էին որոշումների կայացման հավանականական և վիճակագրական մեթոդների ավելի մեծ տնտեսական արդյունավետության մասին:

Կիսվեք ընկերների հետ կամ խնայեք ինքներդ.

Բեռնվում է...