Պիրսոնի բաշխում (chi-square բաշխում): Վիճակագրության դասական մեթոդներ. chi-square test Ksi քառակուսի բաշխում

Խի քառակուսի բաշխումը վիճակագրության մեջ ամենալայն օգտագործվողներից է վիճակագրական վարկածների փորձարկման համար: Հիմնվելով chi-square բաշխման վրա, կառուցված է ամենահզոր թեստերից մեկը՝ Pearson chi-square թեստը:

Համաձայնության չափանիշը անհայտ բաշխման ենթադրյալ օրենքի մասին վարկածը ստուգելու չափանիշն է։

χ2 (chi-square) թեստն օգտագործվում է տարբեր բաշխումների վարկածը ստուգելու համար։ Սա նրա արժանապատվությունն է։

Չափանիշի հաշվարկման բանաձևը հավասար է

որտեղ m-ը և m-ը համապատասխանաբար էմպիրիկ և տեսական հաճախականություններ են

խնդրո առարկա բաշխումը;

n-ն ազատության աստիճանների թիվն է:

Ստուգելու համար մենք պետք է համեմատենք էմպիրիկ (դիտարկված) և տեսական (հաշվարկված նորմալ բաշխման ենթադրությամբ) հաճախականությունները։

Եթե էմպիրիկ հաճախականությունները լիովին համընկնում են հաշվարկված կամ ակնկալվող հաճախությունների հետ, S (E – T) = 0, իսկ χ2 չափանիշը նույնպես հավասար կլինի զրոյի: Եթե S (E – T) հավասար չէ զրոյի, դա ցույց կտա անհամապատասխանություն հաշվարկված հաճախականությունների և շարքի էմպիրիկ հաճախությունների միջև: Նման դեպքերում անհրաժեշտ է գնահատել χ2 չափանիշի նշանակությունը, որը տեսականորեն կարող է տատանվել զրոյից մինչև անսահմանություն։ Դա արվում է χ2ф-ի փաստացի ստացված արժեքը համեմատելով նրա կրիտիկական արժեքի հետ (χ2st): Զրոյական վարկածը, այսինքն՝ այն ենթադրությունը, որ էմպիրիկ և տեսական կամ ակնկալվող հաճախությունների միջև անհամապատասխանությունը պատահական է, հերքվում է, եթե χ2ф-ը մեծ է կամ հավասար է: χ2-րդ ընդունված նշանակության մակարդակի (a) և ազատության աստիճանների քանակի համար (n):

χ2 պատահական փոփոխականի հավանական արժեքների բաշխումը շարունակական է և ասիմետրիկ: Այն կախված է ազատության աստիճանների քանակից (n) և մոտենում է նորմալ բաշխմանը, քանի որ դիտումների քանակը մեծանում է: Հետևաբար, χ2 չափանիշի կիրառումը գնահատման համար դիսկրետ բաշխումներկապված է որոշ սխալների հետ, որոնք ազդում են դրա արժեքի վրա, հատկապես փոքր նմուշներում: Ավելի ճշգրիտ գնահատականներ ստանալու համար բաշխվել է նմուշ տատանումների շարք, պետք է ունենա առնվազն 50 տարբերակ։ χ2 չափանիշի ճիշտ կիրառումը պահանջում է նաև, որ էքստրեմալ դասերում տարբերակների հաճախականությունները չպետք է լինեն 5-ից պակաս. եթե դրանք 5-ից պակաս են, ապա դրանք համակցվում են հարևան դասերի հաճախականությունների հետ այնպես, որ ընդհանուր գումարը մեծ կամ հավասար է 5-ի: Ըստ հաճախականությունների համակցության՝ դասերի (N) թիվը նվազում է: Ազատության աստիճանների թիվը սահմանվում է դասերի երկրորդական թվով՝ հաշվի առնելով տատանումների ազատության սահմանափակումների քանակը։

Քանի որ χ2 չափանիշի որոշման ճշգրտությունը մեծապես կախված է տեսական հաճախականությունների (T) հաշվարկի ճշգրտությունից, էմպիրիկ և հաշվարկված հաճախականությունների միջև տարբերությունը ստանալու համար պետք է օգտագործվեն չկլորացված տեսական հաճախականություններ:

Որպես օրինակ, վերցնենք մի ուսումնասիրություն, որը հրապարակվել է մի կայքում, որը նվիրված է օգտագործմանը վիճակագրական մեթոդներհումանիտար գիտությունների մեջ։

Chi-square թեստը թույլ է տալիս համեմատել հաճախականությունների բաշխումները՝ անկախ նրանից՝ դրանք սովորաբար բաշխված են, թե ոչ:

Հաճախականությունը վերաբերում է իրադարձության դեպքերի քանակին: Սովորաբար, իրադարձությունների առաջացման հաճախականությունը կարգավորվում է, երբ փոփոխականները չափվում են անունների սանդղակով, և դրանց այլ բնութագրերը, բացի հաճախությունից, անհնար կամ խնդրահարույց են ընտրելու համար: Այլ կերպ ասած, երբ փոփոխականն ունի որակական բնութագրեր։ Բացի այդ, շատ հետազոտողներ հակված են թեստի միավորները փոխակերպել մակարդակների (բարձր, միջին, ցածր) և կազմել միավորների բաշխման աղյուսակներ՝ պարզելու այս մակարդակների մարդկանց թիվը: Ապացուցելու համար, որ մակարդակներից մեկում (կատեգորիաներից մեկում) մարդկանց թիվն իսկապես ավելի մեծ է (պակաս), օգտագործվում է նաև Chi-square գործակիցը։

Եկեք նայենք ամենապարզ օրինակին.

Ավելի երիտասարդ դեռահասների շրջանում անցկացվել է թեստ՝ բացահայտելու ինքնագնահատականը: Թեստի միավորները վերածվել են երեք մակարդակի՝ բարձր, միջին, ցածր: Հաճախականությունները բաշխվել են հետևյալ կերպ.

Բարձր (B) 27 մարդ:

Միջին (C) 12 մարդ:

Ցածր (L) 11 մարդ

Ակնհայտ է, որ երեխաների մեծամասնությունը բարձր ինքնագնահատական ունի, բայց դա վիճակագրորեն ապացուցման կարիք ունի։ Դա անելու համար մենք օգտագործում ենք Chi-square թեստը:

Մեր խնդիրն է ստուգել, թե արդյոք ստացված էմպիրիկ տվյալները տարբերվում են տեսականորեն նույնքան հավանականներից։ Դա անելու համար անհրաժեշտ է գտնել տեսական հաճախականությունները: Մեր դեպքում տեսական հաճախականությունները հավասարապես հավանական հաճախականություններ են, որոնք հայտնաբերվում են բոլոր հաճախականությունները գումարելով և բաժանելով կատեգորիաների թվին։

Մեր դեպքում.

(B + C + H) / 3 = (27 + 12 + 11) / 3 = 16.6

Խի-քառակուսի թեստի հաշվարկման բանաձևը.

χ2 = ∑(E - T)I / T

Մենք աղյուսակը պատրաստում ենք.

Գտեք վերջին սյունակի գումարը.

Այժմ դուք պետք է գտնեք չափանիշի կրիտիկական արժեքը՝ օգտագործելով կրիտիկական արժեքների աղյուսակը (Աղյուսակ 1 հավելվածում): Դա անելու համար մեզ անհրաժեշտ է ազատության աստիճանների թիվը (n):

n = (R - 1) * (C - 1)

որտեղ R-ը աղյուսակի տողերի թիվն է, C-ն՝ սյունակների քանակը:

Մեր դեպքում կա միայն մեկ սյունակ (նկատի ունի բնօրինակ էմպիրիկ հաճախականությունները) և երեք տող (կատեգորիաներ), այնպես որ բանաձևը փոխվում է՝ մենք բացառում ենք սյունակները։

n = (R - 1) = 3-1 = 2

p≤0.05 և n = 2 սխալի հավանականության համար կրիտիկական արժեքը χ2 = 5.99 է:

Ստացված էմպիրիկ արժեքը մեծ է կրիտիկականից. հաճախականությունների տարբերությունները նշանակալի են (χ2= 9,64; p≤0,05):

Ինչպես տեսնում եք, չափանիշը հաշվարկելը շատ պարզ է և շատ ժամանակ չի պահանջում: Chi-square թեստի գործնական արժեքը հսկայական է: Այս մեթոդն առավել արժեքավոր է հարցաթերթիկների պատասխանները վերլուծելիս:

Դիտարկենք ավելի բարդ օրինակ:

Օրինակ՝ հոգեբանը ցանկանում է իմանալ՝ ճի՞շտ է արդյոք, որ ուսուցիչներն ավելի շատ կողմնակալ են տղաների, քան աղջիկների նկատմամբ։ Նրանք. ավելի հավանական է գովել աղջիկներին: Դա անելու համար հոգեբանը վերլուծել է ուսուցիչների կողմից գրված աշակերտների բնութագրերը երեք բառերի առաջացման հաճախականության համար՝ «ակտիվ», «ջանասեր», «կարգապահ», և հաշվվել են նաև բառերի հոմանիշները: Բառերի առաջացման հաճախականության վերաբերյալ տվյալները մուտքագրվել են աղյուսակում.

Ստացված տվյալները մշակելու համար օգտագործում ենք chi-square թեստը։

Դա անելու համար մենք կկառուցենք էմպիրիկ հաճախականությունների բաշխման աղյուսակ, այսինքն. այն հաճախականությունները, որոնք մենք դիտում ենք.

Տեսականորեն մենք ակնկալում ենք, որ հաճախականությունները կբաշխվեն հավասարաչափ, այսինքն. հաճախականությունը համամասնորեն բաշխվելու է տղաների և աղջիկների միջև։ Եկեք կառուցենք տեսական հաճախականությունների աղյուսակ: Դա անելու համար տողերի գումարը բազմապատկեք սյունակի գումարով և ստացված թիվը բաժանեք ընդհանուր գումարի (ների) վրա:

Հաշվարկների վերջնական աղյուսակը կունենա հետևյալ տեսքը.

χ2 = ∑(E - T)I / T

n = (R - 1), որտեղ R-ն աղյուսակի տողերի թիվն է:

Մեր դեպքում, chi-square = 4.21; n = 2:

Օգտագործելով չափանիշի կրիտիկական արժեքների աղյուսակը, մենք գտնում ենք. n = 2 և 0,05 սխալի մակարդակով, կրիտիկական արժեքը χ2 = 5,99 է:

Ստացված արժեքը փոքր է կրիտիկական արժեքից, ինչը նշանակում է, որ զրոյական վարկածն ընդունված է:

Եզրակացություն՝ ուսուցիչները չեն կարևորում երեխայի սեռը նրա համար բնութագրեր գրելիս։

Եզրակացություն.

Կ.Փիրսոնը նշանակալի ներդրում է ունեցել զարգացման գործում մաթեմատիկական վիճակագրություն(մեծ թվով հիմնարար հասկացություններ): Փիրսոնի հիմնական փիլիսոփայական դիրքորոշումը ձևակերպված է հետևյալ կերպ. դրանք գիտական նախադասությունների մեջ միացնելու կանոնները մեկուսացված են գիտության քերականությամբ, որը գիտության փիլիսոփայությունն է։ Համընդհանուր կարգապահությունը՝ կիրառական վիճակագրությունը, թույլ է տալիս կապել տարբեր հասկացություններն ու երևույթները, թեև Փիրսոնի կարծիքով՝ դա սուբյեկտիվ է։

Կ. Փիրսոնի շինություններից շատերը ուղղակիորեն կապված են կամ մշակվել են մարդաբանական նյութերի օգտագործմամբ: Նա մշակել է թվային դասակարգման բազմաթիվ մեթոդներ և վիճակագրական չափանիշներ, որոնք օգտագործվում են գիտության բոլոր բնագավառներում։

գրականություն.

1. Bogolyubov A. N. Մաթեմատիկա. Մեխանիկա. Կենսագրական տեղեկագիրք. - Կիև. Նաուկովա Դումկա, 1983 թ.

2. Kolmogorov A. N., Yushkevich A. P. (խմբ.): 19-րդ դարի մաթեմատիկա. - Մ.: Գիտություն: - T.I.

3. 3. Բորովկով Ա.Ա. Մաթեմատիկայի վիճակագրություն. Մ.: Նաուկա, 1994 թ.

4. 8. Feller V. Ներածություն հավանականության տեսությանը և դրա կիրառությունները: - Մ.՝ Միր, Թ.2, 1984։

5. 9. Հարման Գ., Ժամանակակից գործոնային վերլուծություն. - Մ.: Վիճակագրություն, 1972:

Նախքան վերջ XIXդարում, նորմալ բաշխումը համարվում էր տվյալների փոփոխության համընդհանուր օրենքը: Այնուամենայնիվ, Կ. Փիրսոնը նշեց, որ էմպիրիկ հաճախականությունները կարող են մեծապես տարբերվել նորմալ բաշխումից: Հարց առաջացավ, թե ինչպես դա ապացուցել։ Պահանջվում էր ոչ միայն գրաֆիկական համեմատություն, որը սուբյեկտիվ է, այլեւ խիստ քանակական հիմնավորում։

Ահա թե ինչպես է հորինվել չափանիշը χ 2(չի քառակուսի), որը ստուգում է էմպիրիկ (դիտարկվող) և տեսական (ակնկալվող) հաճախականությունների անհամապատասխանության նշանակությունը։ Դա տեղի է ունեցել դեռևս 1900 թվականին, սակայն չափանիշը դեռևս կիրառվում է այսօր։ Ավելին, այն հարմարեցվել է խնդիրների լայն շրջանակի լուծման համար։ Առաջին հերթին սա կատեգորիկ տվյալների վերլուծությունն է, այսինքն. նրանք, որոնք արտահայտվում են ոչ թե քանակով, այլ ինչ-որ կատեգորիայի պատկանմամբ։ Օրինակ՝ մեքենայի դասը, փորձի մասնակցի սեռը, բույսի տեսակը և այլն։ Նման տվյալների վրա չեն կարող կիրառվել այնպիսի մաթեմատիկական գործողություններ, ինչպիսիք են գումարումը և բազմապատկումը, հաճախականությունները կարող են հաշվարկվել միայն դրանց համար:

Նշում ենք դիտարկվող հաճախականությունները Մոտ (դիտված), ակնկալվում է - E (Սպասվում է). Որպես օրինակ՝ վերցնենք 60 անգամ գլանափաթեթ գլորելու արդյունքը։ Եթե այն սիմետրիկ է և միատեսակ, ապա ցանկացած կողմ ստանալու հավանականությունը 1/6 է, հետևաբար յուրաքանչյուր կողմ ստանալու ակնկալվող թիվը 10 է (1/6∙60): Դիտարկված և սպասվող հաճախականությունները գրում ենք աղյուսակում և գծում հիստոգրամա։

Զուր վարկածն այն է, որ հաճախականությունները համահունչ են, այսինքն՝ փաստացի տվյալները չեն հակասում սպասվող տվյալներին։ Այլընտրանքային վարկածն այն է, որ հաճախականությունների շեղումները դուրս են գալիս պատահական տատանումներից, անհամապատասխանությունները վիճակագրորեն նշանակալի են: Խիստ եզրակացություն անելու համար մեզ անհրաժեշտ է.

Դիտարկվող և սպասվող հաճախությունների միջև անհամապատասխանության ամփոփ չափում:
Այս չափման բաշխումը, եթե այն վարկածը, որ տարբերություններ չկան, ճիշտ է:

Սկսենք հաճախականությունների միջև հեռավորությունից: Եթե դուք պարզապես վերցնեք տարբերությունը Օ - Ե, ապա նման չափումը կախված կլինի տվյալների (հաճախականությունների) մասշտաբից։ Օրինակ, 20 - 5 = 15 և 1020 - 1005 = 15: Երկու դեպքում էլ տարբերությունը 15 է: Բայց առաջին դեպքում ակնկալվող հաճախականությունները 3 անգամ պակաս են դիտվածից, իսկ երկրորդ դեպքում՝ ընդամենը 1,5: %: Մեզ անհրաժեշտ է հարաբերական չափում, որը կախված չէ մասշտաբից։

Ուշադրություն դարձնենք հետևյալ փաստերին. Ընդհանուր առմամբ, կատեգորիաների թիվը, որոնցում չափվում են հաճախականությունները, կարող է շատ ավելի մեծ լինել, ուստի հավանականությունը, որ մեկ դիտարկումը կհայտնվի այս կամ այն կատեգորիայի մեջ, բավականին փոքր է: Եթե այո, ապա այդպիսի պատահական փոփոխականի բաշխումը ենթարկվելու է հազվագյուտ իրադարձությունների օրենքին, որը հայտնի է որպես Պուասոնի օրենքը. Պուասոնի օրենքում, ինչպես հայտնի է, մաթեմատիկական ակնկալիքի արժեքը և շեղումը համընկնում են (պարամետր λ ) Սա նշանակում է, որ ակնկալվող հաճախականությունը անվանական փոփոխականի որոշ կատեգորիայի համար E iկլինի միաժամանակյա և դրա ցրումը. Ավելին, Պուասոնի օրենքը մեծ թվով դիտարկումներով հակված է նորմալ: Համակցելով այս երկու փաստերը՝ մենք ստանում ենք, որ եթե դիտարկված և սպասվող հաճախությունների միջև համաձայնության վարկածը ճիշտ է, ապա. մեծ թվով դիտարկումներով, արտահայտություն

Կարևոր է հիշել, որ նորմալությունը կհայտնվի միայն բավականաչափ բարձր հաճախականություններում: Վիճակագրության մեջ ընդհանուր առմամբ ընդունված է, որ դիտումների ընդհանուր թիվը (հաճախականությունների գումարը) պետք է լինի առնվազն 50, իսկ ակնկալվող հաճախականությունը յուրաքանչյուր աստիճանում պետք է լինի առնվազն 5: Միայն այս դեպքում վերը նշված արժեքն ունի ստանդարտ նորմալ բաշխում: . Ենթադրենք, որ այս պայմանը կատարվում է։

Ստանդարտ նորմալ բաշխումն ունի գրեթե բոլոր արժեքները ±3-ի սահմաններում (երեք սիգմա կանոն): Այսպիսով, մենք ստացանք մեկ աստիճանավորման հաճախականությունների հարաբերական տարբերությունը: Մեզ ընդհանրացնող միջոց է պետք։ Դուք չեք կարող պարզապես գումարել բոլոր շեղումները. մենք ստանում ենք 0 (գուշակեք, թե ինչու): Փիրսոնն առաջարկեց գումարել այդ շեղումների քառակուսիները:

Սա նշանն է Chi-square թեստ Փիրսոն. Եթե հաճախականություններն իսկապես համապատասխանում են ակնկալվողներին, ապա չափանիշի արժեքը կլինի համեմատաբար փոքր (քանի որ շեղումների մեծ մասը զրոյի մոտ է): Բայց եթե չափանիշը մեծ է, ապա դա ցույց է տալիս հաճախականությունների միջև զգալի տարբերություններ:

Պիրսոնի չափանիշը դառնում է «մեծ», երբ նման կամ նույնիսկ ավելի մեծ արժեքի առաջացումը դառնում է անհավանական: Իսկ նման հավանականությունը հաշվարկելու համար անհրաժեշտ է իմանալ չափանիշի բաշխվածությունը, երբ փորձը բազմիցս կրկնվում է, երբ հաճախականության համաձայնության վարկածը ճիշտ է։

Ինչպես հեշտ է տեսնել, chi-square արժեքը նույնպես կախված է տերմինների քանակից: Որքան շատ լինեն, այնքան մեծ կլինի չափանիշի արժեքը, քանի որ յուրաքանչյուր տերմին կնպաստի ընդհանուրին: Հետեւաբար, յուրաքանչյուր քանակի համար անկախպայմաններով, կլինի իր բաշխումը։ Պարզվում է, որ χ 2բաշխումների մի ամբողջ ընտանիք է:

Եվ ահա մենք հասնում ենք մի նուրբ պահի. Ինչ է թիվը անկախպայմանները? Թվում է, թե ցանկացած տերմին (այսինքն՝ շեղում) անկախ է: Ք.Պիրսոնը նույնպես այդպես էր կարծում, բայց պարզվեց, որ նա սխալվում էր։ Փաստորեն, անկախ անդամների թիվը մեկով պակաս կլինի անվանական փոփոխականի աստիճանավորումների քանակից n. Ինչո՞ւ։ Որովհետև եթե մենք ունենք նմուշ, որի համար հաճախականությունների գումարն արդեն հաշվարկված է, ապա հաճախականություններից մեկը միշտ կարող է որոշվել որպես ընդհանուր թվի և մնացած բոլորի գումարի տարբերություն։ Հետևաբար, տատանումները մի փոքր ավելի քիչ կլինեն: Ռոնալդ Ֆիշերը նկատել է այս փաստը 20 տարի անց, երբ Փիրսոնը մշակեց իր չափանիշը: Նույնիսկ սեղանները պետք է վերամշակվեին։

Այս առիթով Ֆիշերը նոր հայեցակարգ է ներկայացրել վիճակագրության մեջ. ազատության աստիճանը(ազատության աստիճաններ), որը ներկայացնում է անկախ տերմինների քանակը գումարում։ Ազատության աստիճանների հասկացությունն ունի մաթեմատիկական բացատրություն և ի հայտ է գալիս միայն նորմալի հետ կապված բաշխումներում (Student's, Fisher-Snedecor և բուն chi-square):

Ազատության աստիճանների իմաստը ավելի լավ հասկանալու համար դիմենք ֆիզիկական անալոգին: Եկեք պատկերացնենք, որ մի կետ ազատ շարժվում է տարածության մեջ: Այն ունի 3 աստիճան ազատություն, քանի որ կարող է շարժվել ցանկացած ուղղությամբ եռաչափ տարածության մեջ: Եթե կետը շարժվում է ցանկացած մակերևույթի երկայնքով, ապա այն արդեն ունի ազատության երկու աստիճան (հետ և առաջ, ձախ և աջ), չնայած այն շարունակում է մնալ եռաչափ տարածության մեջ: Աղբյուրի երկայնքով շարժվող կետը կրկին գտնվում է եռաչափ տարածության մեջ, բայց ունի ազատության միայն մեկ աստիճան, քանի որ կարող է շարժվել առաջ կամ հետ: Ինչպես տեսնում եք, տարածքը, որտեղ գտնվում է օբյեկտը, միշտ չէ, որ համապատասխանում է իրական շարժման ազատությանը:

Մոտավորապես նույն կերպ, վիճակագրական չափանիշի բաշխումը կարող է կախված լինել ավելի փոքր թվով տարրերից, քան այն հաշվարկելու համար անհրաժեշտ պայմանները: Ընդհանուր առմամբ, ազատության աստիճանների թիվը ավելի քիչ է, քան գոյություն ունեցող կախվածությունների քանակով դիտարկումների թիվը:

Այսպիսով, chi քառակուսի բաշխումը ( χ 2) բաշխումների ընտանիք է, որոնցից յուրաքանչյուրը կախված է ազատության աստիճանի պարամետրից։ Իսկ chi-square թեստի պաշտոնական սահմանումը հետեւյալն է. Բաշխում χ 2(chi-square) s կազատության աստիճանները քառակուսիների գումարի բաշխումն է կանկախ ստանդարտ նորմալ պատահական փոփոխականներ:

Հաջորդը, մենք կարող ենք անցնել բուն բանաձևին, որով հաշվարկվում է chi-square բաշխման ֆունկցիան, բայց, բարեբախտաբար, մեզ համար ամեն ինչ վաղուց հաշվարկված է: Հետաքրքրության հավանականությունը ստանալու համար կարող եք օգտագործել կա՛մ համապատասխան վիճակագրական աղյուսակը, կա՛մ պատրաստի ֆունկցիա Excel-ում:

Հետաքրքիր է տեսնել, թե ինչպես է փոխվում chi-square-ի բաշխման ձևը՝ կախված ազատության աստիճանների քանակից:

Ազատության աստիճանների աճով, chi-square-ի բաշխումը հակված է նորմալ լինելու: Դա բացատրվում է կենտրոնական սահմանային թեորեմի գործողությամբ, ըստ որի մեծ թվով անկախ պատահական փոփոխականների գումարն ունի նորմալ բաշխում։ Քառակուսիների մասին ոչինչ չի ասում))։

Հիպոթեզի փորձարկում՝ օգտագործելով Pearson chi-square թեստը

Այժմ մենք գալիս ենք հիպոթեզների փորձարկմանը՝ օգտագործելով chi-square մեթոդը: Ընդհանուր առմամբ, տեխնոլոգիան մնում է: Զրոյական վարկածն այն է, որ դիտարկվող հաճախականությունները համապատասխանում են սպասվածներին (այսինքն, դրանց միջև տարբերություն չկա, քանի որ դրանք վերցված են նույն պոպուլյացիայից): Եթե դա այդպես է, ապա ցրումը կլինի համեմատաբար փոքր՝ պատահական տատանումների սահմաններում։ Դիսպերսիայի չափը որոշվում է chi-square թեստի միջոցով: Այնուհետև կամ չափանիշն ինքնին համեմատվում է կրիտիկական արժեքի հետ (նշանակության համապատասխան մակարդակի և ազատության աստիճանի համար), կամ, որ ավելի ճիշտ է, հաշվարկվում է դիտարկվող p արժեքը, այսինքն. նույն կամ նույնիսկ ավելի մեծ չափանիշի արժեք ստանալու հավանականությունը, եթե զրոյական վարկածը ճշմարիտ է:

Որովհետեւ մենք շահագրգռված ենք հաճախականությունների համաձայնությամբ, ապա վարկածը կմերժվի, երբ չափանիշը ավելի մեծ լինի, քան կրիտիկական մակարդակը։ Նրանք. չափանիշը միակողմանի է. Այնուամենայնիվ, երբեմն (երբեմն) անհրաժեշտ է ստուգել ձախակողմյան վարկածը: Օրինակ, երբ էմպիրիկ տվյալները շատ նման են տեսական տվյալներին։ Այնուհետև չափանիշը կարող է ընկնել անհավանական շրջան, բայց ձախ կողմում: Փաստն այն է, որ բնական պայմաններում դժվար թե հաճախականություններ ձեռք բերվեն, որոնք գործնականում համընկնում են տեսականի հետ։ Միշտ կա որոշ պատահականություն, որը տալիս է սխալ: Բայց եթե նման սխալ չկա, ապա միգուցե տվյալները կեղծվել են։ Բայց այնուամենայնիվ, աջակողմյան վարկածը սովորաբար ստուգվում է:

Վերադառնանք զառերի խնդրին։ Եկեք հաշվարկենք chi-square թեստի արժեքը՝ օգտագործելով առկա տվյալները:

Հիմա եկեք գտնենք կրիտիկական արժեքը ազատության 5 աստիճանում ( կ) և նշանակության մակարդակ 0,05 ( α ) ըստ Չի քառակուսի բաշխման կրիտիկական արժեքների աղյուսակի:

Այսինքն՝ 0.05 քվանտիլը 5 աստիճան ազատության chi քառակուսի բաշխում է (աջ պոչը): χ 2 0,05; 5 = 11,1.

Եկեք համեմատենք փաստացի և աղյուսակային արժեքները: 3.4 ( χ 2) < 11,1 (χ 2 0,05; 5) Հաշվարկված չափանիշն ավելի փոքր է ստացվել, ինչը նշանակում է, որ հաճախականությունների հավասարության (համաձայնության) վարկածը չի մերժվում։ Նկարում իրավիճակն այսպիսին է.

Եթե հաշվարկված արժեքը ընկներ կրիտիկական տարածաշրջանում, ապա զրոյական վարկածը կմերժվեր:

Ավելի ճիշտ կլինի նաև հաշվարկել p-արժեքը։ Դա անելու համար հարկավոր է աղյուսակում գտնել ամենամոտ արժեքը ազատության որոշակի քանակի համար և նայել համապատասխան նշանակության մակարդակին: Բայց սա անցյալ դարում. Մենք կօգտագործենք համակարգիչ, մասնավորապես MS Excel: Excel-ն ունի chi-square-ի հետ կապված մի քանի գործառույթ:

Ստորև ներկայացնում ենք դրանց համառոտ նկարագրությունը:

CH2.OBR- չափանիշի կրիտիկական արժեքը տվյալ հավանականությամբ ձախ կողմում (ինչպես վիճակագրական աղյուսակներում)

CH2.OBR.PH– աջ կողմում տրված հավանականության չափանիշի կրիտիկական արժեքը: Ֆունկցիան ըստ էության կրկնօրինակում է նախորդը: Բայց այստեղ դուք կարող եք անմիջապես նշել մակարդակը α , քան 1-ից հանելը: Սա ավելի հարմար է, քանի որ շատ դեպքերում բաշխման ճիշտ պոչն է անհրաժեշտ:

CH2.DIST– p-արժեքը ձախ կողմում (խտությունը կարելի է հաշվարկել):

CH2.DIST.PH- p-արժեքը աջ կողմում:

CHI2.ԹԵՍՏ– անմիջապես անցկացնում է chi-square թեստը երկու հաճախականությունների միջակայքերի համար: Ազատության աստիճանների թիվը վերցվում է մեկով պակաս սյունակում հաճախականությունների քանակից (ինչպես պետք է լինի)՝ վերադարձնելով p արժեք։

Եկեք հաշվարկենք մեր փորձի համար կրիտիկական (աղյուսակային) արժեքը 5 աստիճանի ազատության և ալֆա 0,05-ի համար: Excel-ի բանաձևը կունենա հետևյալ տեսքը.

CH2.OBR(0.95;5)

CH2.OBR.PH(0.05;5)

Արդյունքը կլինի նույնը՝ 11.0705։ Սա այն արժեքն է, որը մենք տեսնում ենք աղյուսակում (կլորացվում է մինչև 1 տասնորդական տեղ):

Վերջապես հաշվարկենք p-արժեքը 5 աստիճանի ազատության չափանիշի համար χ 2= 3.4. Մեզ անհրաժեշտ է հավանականությունը աջ կողմում, ուստի մենք վերցնում ենք ֆունկցիան HH-ի ավելացումով (աջ պոչ)

CH2.DIST.PH(3.4;5) = 0.63857

Սա նշանակում է, որ 5 աստիճան ազատության դեպքում չափանիշի արժեքը ստանալու հավանականությունը մեծ է χ 2= 3,4 և ավելի հավասար է գրեթե 64%-ի: Բնականաբար, վարկածը չի մերժվում (p-արժեքը 5%-ից մեծ է, հաճախականությունները շատ լավ համընկնում են։

Հիմա եկեք ստուգենք հաճախությունների համաձայնության վարկածը՝ օգտագործելով chi-square թեստը և Excel ֆունկցիան CHI2.TEST:

Ոչ աղյուսակներ, ոչ ծանր հաշվարկներ: Որպես ֆունկցիայի արգումենտ նշելով դիտարկվող և սպասվող հաճախականություններով սյունակները՝ մենք անմիջապես ստանում ենք p-արժեքը։ Գեղեցկություն.

Հիմա պատկերացրեք, որ դուք զառախաղ եք խաղում կասկածելի տղայի հետ: Միավորների բաշխումը 1-ից 5-ը մնում է նույնը, բայց նա գլորում է 26 վեցեր (նետումների ընդհանուր թիվը դառնում է 78):

P-արժեքն այս դեպքում ստացվում է 0,003, ինչը շատ ավելի քիչ է, քան 0,05: Զառերի վավերականությանը կասկածելու լավ պատճառներ կան: Ահա թե ինչպիսին է այդ հավանականությունը chi-square բաշխման գծապատկերում:

Այստեղ ինքնին «chi-square» չափանիշը 17.8 է, որը, բնականաբար, ավելի մեծ է, քան աղյուսակը (11.1):

Հուսով եմ կարողացա բացատրել, թե որն է համաձայնության չափանիշը χ 2(Pearson chi-square) և ինչպես այն կարող է օգտագործվել վիճակագրական վարկածները ստուգելու համար:

Վերջապես ևս մեկ կարևոր պայմանի մասին. Chi-square թեստը ճիշտ է աշխատում միայն այն դեպքում, երբ բոլոր հաճախականությունների թիվը գերազանցում է 50-ը, և նվազագույն ակնկալվող արժեքը յուրաքանչյուր աստիճանի համար 5-ից ոչ պակաս է: Եթե որևէ կատեգորիայի ակնկալվող հաճախականությունը 5-ից պակաս է, բայց բոլոր հաճախականությունների գումարը գերազանցում է: 50, ապա այդպիսի կատեգորիան համակցվում է ամենամոտի հետ, որպեսզի դրանց ընդհանուր հաճախականությունը գերազանցի 5-ը: Եթե դա հնարավոր չէ, կամ հաճախականությունների գումարը 50-ից փոքր է, ապա պետք է օգտագործել վարկածների փորձարկման ավելի ճշգրիտ մեթոդներ: Նրանց մասին կխոսենք մեկ այլ անգամ:

Ստորև բերված է տեսանյութ, թե ինչպես կարելի է փորձարկել հիպոթեզը Excel-ում՝ օգտագործելով chi-square թեստը:

Թող U 1, U 2, ..,U k լինեն անկախ ստանդարտ նորմալ արժեքներ. K = U 1 2 +U 2 2 + .. + U k 2 պատահական փոփոխականի բաշխումը կոչվում է խի քառակուսի բաշխում կազատության աստիճաններ (գրել K~χ 2 (k)): Սա միամոդալ բաշխում է՝ դրական թեքությամբ և հետևյալ բնութագրերով՝ ռեժիմ M=k-2 ակնկալվող արժեքը m=k դիսպերսիա D=2k (նկ.): Պարամետրի բավականաչափ մեծ արժեքով կբաշխումը χ 2 (k) ունի մոտավորապես նորմալ բաշխում պարամետրերով

Մաթեմատիկական վիճակագրության խնդիրներ լուծելիս օգտագործվում են χ 2 (k) կրիտիկական կետերը՝ կախված α տվյալ հավանականությունից և ազատության աստիճանների քանակից։ կ(Հավելված 2): Ք 2 kr = Χ 2 (k; α) կրիտիկական կետը այն շրջանի սահմանն է, որից աջ ընկած է բաշխման խտության կորի տակ գտնվող տարածքի 100- α %-ը: Հավանականությունը, որ K~χ 2 (k) պատահական փոփոխականի արժեքը փորձարկման ժամանակ կիջնի χ 2 (k) կետից աջ, չի գերազանցում α P(K≥χ 2 kp)≤ α): Օրինակ՝ K~χ 2 (20) պատահական փոփոխականի համար սահմանում ենք α=0,05 հավանականությունը։ Օգտվելով chi-square բաշխման կրիտիկական կետերի աղյուսակից (աղյուսակներ) մենք գտնում ենք χ 2 kp = χ 2 (20;0.05) = 31.4: Սա նշանակում է, որ այս պատահական փոփոխականի հավանականությունը Կընդունեք 31,4-ից ավելի արժեք, 0,05-ից պակաս (նկ.):

Բրինձ. Բաշխման խտության գրաֆիկ χ 2 (k) ազատության աստիճանների քանակի տարբեր արժեքների համար կ

Կրիտիկական χ 2 (k) կետերն օգտագործվում են հետևյալ հաշվիչներում.

Բազմագծայինության առկայության ստուգում (բազմագծայինության մասին):

Հիպոթեզի փորձարկումը Chi-square-ի միջոցով միայն կպատասխանի «կա հարաբերություններ» հարցին, անհրաժեշտ է հետագա հետազոտություն՝ հարաբերությունների ուղղությունը ստուգելու համար: Ավելին, Chi-square թեստն ունի որոշակի սխալ ցածր հաճախականության տվյալների հետ աշխատելիս։

Հետևաբար, կապի ուղղությունը ստուգելու համար ընտրեք հարաբերակցության վերլուծություն, մասնավորապես՝ վարկածի փորձարկում՝ օգտագործելով Պիրսոնի հարաբերակցության գործակիցը, t-test-ի միջոցով նշանակալիության հետագա ստուգմամբ:

Նշանակության մակարդակի α Χ 2 արժեքի համար կարելի է գտնել MS Excel ֆունկցիայի միջոցով՝ =HI2OBR(α;ազատության աստիճաններ)

n-1	.995	.990	.975	.950	.900	.750	.500	.250	.100	.050	.025	.010	.005
1	0.00004	0.00016	0.00098	0.00393	0.01579	0.10153	0.45494	1.32330	2.70554	3.84146	5.02389	6.63490	7.87944
2	0.01003	0.02010	0.05064	0.10259	0.21072	0.57536	1.38629	2.77259	4.60517	5.99146	7.37776	9.21034	10.59663
3	0.07172	0.11483	0.21580	0.35185	0.58437	1.21253	2.36597	4.10834	6.25139	7.81473	9.34840	11.34487	12.83816
4	0.20699	0.29711	0.48442	0.71072	1.06362	1.92256	3.35669	5.38527	7.77944	9.48773	11.14329	13.27670	14.86026
5	0.41174	0.55430	0.83121	1.14548	1.61031	2.67460	4.35146	6.62568	9.23636	11.07050	12.83250	15.08627	16.74960
6	0.67573	0.87209	1.23734	1.63538	2.20413	3.45460	5.34812	7.84080	10.64464	12.59159	14.44938	16.81189	18.54758
7	0.98926	1.23904	1.68987	2.16735	2.83311	4.25485	6.34581	9.03715	12.01704	14.06714	16.01276	18.47531	20.27774
8	1.34441	1.64650	2.17973	2.73264	3.48954	5.07064	7.34412	10.21885	13.36157	15.50731	17.53455	20.09024	21.95495
9	1.73493	2.08790	2.70039	3.32511	4.16816	5.89883	8.34283	11.38875	14.68366	16.91898	19.02277	21.66599	23.58935
10	2.15586	2.55821	3.24697	3.94030	4.86518	6.73720	9.34182	12.54886	15.98718	18.30704	20.48318	23.20925	25.18818
11	2.60322	3.05348	3.81575	4.57481	5.57778	7.58414	10.34100	13.70069	17.27501	19.67514	21.92005	24.72497	26.75685
12	3.07382	3.57057	4.40379	5.22603	6.30380	8.43842	11.34032	14.84540	18.54935	21.02607	23.33666	26.21697	28.29952
13	3.56503	4.10692	5.00875	5.89186	7.04150	9.29907	12.33976	15.98391	19.81193	22.36203	24.73560	27.68825	29.81947
14	4.07467	4.66043	5.62873	6.57063	7.78953	10.16531	13.33927	17.11693	21.06414	23.68479	26.11895	29.14124	31.31935
15	4.60092	5.22935	6.26214	7.26094	8.54676	11.03654	14.33886	18.24509	22.30713	24.99579	27.48839	30.57791	32.80132
16	5.14221	5.81221	6.90766	7.96165	9.31224	11.91222	15.33850	19.36886	23.54183	26.29623	28.84535	31.99993	34.26719
17	5.69722	6.40776	7.56419	8.67176	10.08519	12.79193	16.33818	20.48868	24.76904	27.58711	30.19101	33.40866	35.71847
18	6.26480	7.01491	8.23075	9.39046	10.86494	13.67529	17.33790	21.60489	25.98942	28.86930	31.52638	34.80531	37.15645
19	6.84397	7.63273	8.90652	10.11701	11.65091	14.56200	18.33765	22.71781	27.20357	30.14353	32.85233	36.19087	38.58226
20	7.43384	8.26040	9.59078	10.85081	12.44261	15.45177	19.33743	23.82769	28.41198	31.41043	34.16961	37.56623	39.99685
21	8.03365	8.89720	10.28290	11.59131	13.23960	16.34438	20.33723	24.93478	29.61509	32.67057	35.47888	38.93217	41.40106
22	8.64272	9.54249	10.98232	12.33801	14.04149	17.23962	21.33704	26.03927	30.81328	33.92444	36.78071	40.28936	42.79565
23	9.26042	10.19572	11.68855	13.09051	14.84796	18.13730	22.33688	27.14134	32.00690	35.17246	38.07563	41.63840	44.18128
24	9.88623	10.85636	12.40115	13.84843	15.65868	19.03725	23.33673	28.24115	33.19624	36.41503	39.36408	42.97982	45.55851
25	10.51965	11.52398	13.11972	14.61141	16.47341	19.93934	24.33659	29.33885	34.38159	37.65248	40.64647	44.31410	46.92789
26	11.16024	12.19815	13.84390	15.37916	17.29188	20.84343	25.33646	30.43457	35.56317	38.88514	41.92317	45.64168	48.28988
27	11.80759	12.87850	14.57338	16.15140	18.11390	21.74940	26.33634	31.52841	36.74122	40.11327	43.19451	46.96294	49.64492
28	12.46134	13.56471	15.30786	16.92788	18.93924	22.65716	27.33623	32.62049	37.91592	41.33714	44.46079	48.27824	50.99338
29	13.12115	14.25645	16.04707	17.70837	19.76774	23.56659	28.33613	33.71091	39.08747	42.55697	45.72229	49.58788	52.33562
30	13.78672	14.95346	16.79077	18.49266	20.59923	24.47761	29.33603	34.79974	40.25602	43.77297	46.97924	50.89218	53.67196

Ազատության աստիճանների քանակը կ	Նշանակության մակարդակ ա
Ազատության աստիճանների քանակը կ	0,01	0,025	0.05	0,95	0,975	0.99
1	6.6	5.0	3.8	0.0039	0.00098	0.00016
2	9.2	7.4	6.0	0.103	0.051	0.020
3	11.3	9.4	7.8	0.352	0.216	0.115
4	13.3	11.1	9.5	0.711	0.484	0.297
5	15.1	12.8	11.1	1.15	0.831	0.554
6	16.8	14.4	12.6	1.64	1.24	0.872
7	18.5	16.0	14.1	2.17	1.69	1.24
8	20.1	17.5	15.5	2.73	2.18	1.65
9	21.7	19.0	16.9	3.33	2.70	2.09
10	23.2	20.5	18.3	3.94	3.25	2.56
11	24.7	21.9	19.7	4.57	3.82	3.05
12	26.2	23.3	21 .0	5.23	4.40	3.57
13	27.7	24.7	22.4	5.89	5.01	4.11
14	29.1	26.1	23.7	6.57	5.63	4.66
15	30.6	27.5	25.0	7.26	6.26	5.23
16	32.0	28.8	26.3	7.96	6.91	5.81
17	33.4	30.2	27.6	8.67	7.56	6.41
18	34.8	31.5	28.9	9.39	8.23	7.01
19	36.2	32.9	30.1	10.1	8.91	7.63
20	37.6	34.2	31.4	10.9	9.59	8.26
21	38.9	35.5	32.7	11.6	10.3	8.90
22	40.3	36.8	33.9	12.3	11.0	9.54
23	41.6	38.1	35.2	13.1	11.7	10.2
24	43.0	39.4	36.4	13.8	12.4	10.9
25	44.3	40.6	37.7	14.6	13.1	11.5
26	45.6	41.9	38.9	15.4	13.8	12.2
27	47.0	43.2	40.1	16.2	14.6	12.9
28	48.3	44.5	41.3	16.9	15.3	13.6
29	49.6	45.7	42.6	17.7	16.0	14.3
30	50.9	47.0	43.8	18.5	16.8	15.0

Pearson (chi-squared), Student and Fisher բաշխումները

Օգտագործելով նորմալ բաշխումը, սահմանվում են երեք բաշխումներ, որոնք այժմ հաճախ օգտագործվում են վիճակագրական տվյալների մշակման մեջ: Այս բաշխումները բազմիցս հայտնվում են գրքի հետագա բաժիններում:

Պիրսոնի բաշխում (chi - քառակուսի) – պատահական փոփոխականի բաշխում

Որտեղ պատահական փոփոխականներ X 1 , X 2 ,…, X nանկախ և ունեն նույն բաշխումը Ն(0,1). Այս դեպքում տերմինների քանակը, այսինքն. n, կոչվում է «chi-square» բաշխման «ազատության աստիճանների թիվը»։

Խի-քառակուսի բաշխումն օգտագործվում է շեղումը գնահատելիս (օգտագործելով վստահության միջակայքը), համաձայնության, միատարրության, անկախության վարկածները ստուգելիս, հիմնականում որակական (դասակարգված) փոփոխականների համար, որոնք ընդունում են վերջավոր թվով արժեքներ և շատ այլ առաջադրանքներում: Վիճակագրական վերլուծությունտվյալները

Բաշխում տ Student's t-ը պատահական փոփոխականի բաշխումն է

որտեղ են պատահական փոփոխականները UԵվ Xանկախ, Uունի ստանդարտ նորմալ բաշխում Ն(0.1), և X– chi բաշխում – քառակուսի գ nազատության աստիճաններ. Որտեղ nկոչվում է Ուսանողների բաշխման «ազատության աստիճանների թիվը»:

Ուսանողական բաշխումը ներդրվել է 1908 թվականին անգլիացի վիճակագիր Վ. Գոսեթի կողմից, ով աշխատում էր գարեջրի գործարանում։ Այս գործարանում տնտեսական և տեխնիկական որոշումներ կայացնելու համար օգտագործվել են հավանական և վիճակագրական մեթոդներ, ուստի նրա ղեկավարությունն արգելել է Վ.Գոսեթին գիտական հոդվածներ հրատարակել իր անունով։ Այս կերպ պաշտպանվել են Վ.Գոսեթի կողմից մշակված հավանականական և վիճակագրական մեթոդների տեսքով առևտրային գաղտնիքները և «նոու-հաուն»։ Սակայն նա հնարավորություն ունեցավ հրատարակել «Ուսանող» կեղծանունով։ Gosset-Student-ի պատմությունը ցույց է տալիս, որ նույնիսկ հարյուր տարի առաջ բրիտանացի մենեջերները տեղյակ էին մեծին տնտեսական արդյունավետությունըհավանական-վիճակագրական մեթոդներ.

Ներկայումս Student բաշխումը ամենահայտնի բաշխումներից մեկն է, որն օգտագործվում է իրական տվյալների վերլուծության մեջ: Այն օգտագործվում է մաթեմատիկական ակնկալիքների, կանխատեսման արժեքի և այլ բնութագրերի գնահատման ժամանակ՝ օգտագործելով վստահության միջակայքերը, մաթեմատիկական ակնկալիքների արժեքների, ռեգրեսիայի գործակիցների, նմուշի միատարրության վարկածների և այլնի վերաբերյալ վարկածների փորձարկման ժամանակ: .

Ֆիշերի բաշխումը պատահական փոփոխականի բաշխումն է

որտեղ են պատահական փոփոխականները X 1Եվ X 2անկախ են և ունեն խի-քառակուսի բաշխումներ՝ ազատության աստիճանների քանակով կ 1 Եվ կ 2 համապատասխանաբար. Միաժամանակ զույգը (կ 1 , կ 2 ) – Ֆիշերի բաշխման մի զույգ «ազատության աստիճաններ», մասնավորապես. կ 1 համարիչի ազատության աստիճանների թիվն է և կ 2 – հայտարարի ազատության աստիճանների թիվը. Պատահական փոփոխականի բաշխում Ֆանվանվել է անգլիացի մեծ վիճակագիր Ռ.Ֆիշերի (1890-1962) պատվին, ով այն ակտիվորեն օգտագործել է իր աշխատություններում։

Ֆիշերի բաշխումն օգտագործվում է ռեգրեսիոն վերլուծության, շեղումների հավասարության և կիրառական վիճակագրության այլ խնդիրներում մոդելի համարժեքության մասին վարկածները ստուգելիս:

Chi-square, Student և Fisher բաշխման ֆունկցիաների արտահայտությունները, դրանց խտությունները և բնութագրերը, ինչպես նաև դրանց գործնական օգտագործման համար անհրաժեշտ աղյուսակները կարելի է գտնել մասնագիտացված գրականության մեջ (տե՛ս, օրինակ,):

23. Chi-square-ի և Student-ի բաշխման հայեցակարգը և գրաֆիկական տեսքը

1) n ազատության աստիճանով բաշխումը (chi-square) n անկախ ստանդարտ նորմալ պատահական փոփոխականների քառակուսիների գումարի բաշխումն է։

Բաշխում (chi-square)- պատահական փոփոխականի բաշխում (և դրանցից յուրաքանչյուրի մաթեմատիկական ակնկալիքը 0 է, իսկ ստանդարտ շեղումը 1)

որտեղ են պատահական փոփոխականները անկախ են և ունեն նույն բաշխումը։ Այս դեպքում տերմինների քանակը, այսինքն. , կոչվում է «chi-square» բաշխման «ազատության աստիճանների թիվը»։ Խի քառակուսի թիվը որոշվում է մեկ պարամետրով՝ ազատության աստիճանների քանակով։ Քանի որ ազատության աստիճանների թիվը մեծանում է, բաշխումը դանդաղորեն մոտենում է նորմալին:

Այնուհետեւ նրանց քառակուսիների գումարը

պատահական փոփոխական է, որը բաշխված է այսպես կոչված chi-square օրենքի համաձայն՝ k = n ազատության աստիճաններով; եթե տերմինները կապված են ինչ-որ առնչությամբ (օրինակ՝ ), ապա ազատության աստիճանների թիվը k = n – 1։

Այս բաշխման խտությունը

Ահա գամմա ֆունկցիան. մասնավորապես Г(n + 1) = n! .

Հետեւաբար, chi-square-ի բաշխումը որոշվում է մեկ պարամետրով՝ ազատության աստիճանների քանակով k.

Դիտողություն 1. Ազատության աստիճանների քանակի ավելացման հետ chi-square-ի բաշխումը աստիճանաբար մոտենում է նորմալին:

Դիտողություն 2. Օգտագործելով chi-square բաշխումը, որոշվում են պրակտիկայում հանդիպող բազմաթիվ այլ բաշխումներ, օրինակ՝ պատահական փոփոխականի բաշխումը՝ պատահական վեկտորի երկարությունը (X1, X2,..., Xn), կոորդինատները. որոնք անկախ են և բաշխված են սովորական օրենքի համաձայն։

χ2 բաշխումն առաջին անգամ դիտարկվել է Ռ. Հելմերտի (1876) և Կ. Փիրսոնի (1900 թ.) կողմից։

Math.expect.=n; D=2n

2) Ուսանողների բաշխում

Դիտարկենք երկու անկախ պատահական փոփոխական. ազատության աստիճաններ. Հետո արժեքը

ունի բաշխում, որը կոչվում է t-բաշխում կամ Student բաշխում՝ k ազատության աստիճաններով: Այս դեպքում k-ն կոչվում է Student բաշխման «ազատության աստիճանների թիվը»:

Քանի որ ազատության աստիճանների թիվը մեծանում է, Ուսանողների բաշխումն արագորեն մոտենում է նորմալին:

Այս բաշխումը ներդրվել է 1908 թվականին անգլիացի վիճակագիր Վ.Գոսեթի կողմից, ով աշխատում էր գարեջրի գործարանում։ Այս գործարանում տնտեսական և տեխնիկական որոշումներ կայացնելու համար օգտագործվել են հավանական և վիճակագրական մեթոդներ, ուստի նրա ղեկավարությունն արգելել է Վ.Գոսեթին գիտական հոդվածներ հրատարակել իր անունով։ Այս կերպ պաշտպանվել են Վ.Գոսեթի կողմից մշակված հավանականական և վիճակագրական մեթոդների տեսքով առևտրային գաղտնիքները և «նոու-հաուն»։ Սակայն նա հնարավորություն ունեցավ հրատարակել «Ուսանող» կեղծանունով։ Gosset-Student-ի պատմությունը ցույց է տալիս, որ նույնիսկ հարյուր տարի առաջ Մեծ Բրիտանիայի ղեկավարները տեղյակ էին որոշումների կայացման հավանականական և վիճակագրական մեթոդների ավելի մեծ տնտեսական արդյունավետության մասին: