Պիրսոնի բաշխում (chi-square բաշխում): Վիճակագրության դասական մեթոդներ. chi-square test Ksi քառակուսի բաշխում
Խի քառակուսի բաշխումը վիճակագրության մեջ ամենալայն օգտագործվողներից է վիճակագրական վարկածների փորձարկման համար: Հիմնվելով chi-square բաշխման վրա, կառուցված է ամենահզոր թեստերից մեկը՝ Pearson chi-square թեստը:
Համաձայնության չափանիշը անհայտ բաշխման ենթադրյալ օրենքի մասին վարկածը ստուգելու չափանիշն է։
χ2 (chi-square) թեստն օգտագործվում է տարբեր բաշխումների վարկածը ստուգելու համար։ Սա նրա արժանապատվությունն է։
Չափանիշի հաշվարկման բանաձևը հավասար է
որտեղ m-ը և m-ը համապատասխանաբար էմպիրիկ և տեսական հաճախականություններ են
խնդրո առարկա բաշխումը;
n-ն ազատության աստիճանների թիվն է:
Ստուգելու համար մենք պետք է համեմատենք էմպիրիկ (դիտարկված) և տեսական (հաշվարկված նորմալ բաշխման ենթադրությամբ) հաճախականությունները։
Եթե էմպիրիկ հաճախականությունները լիովին համընկնում են հաշվարկված կամ ակնկալվող հաճախությունների հետ, S (E – T) = 0, իսկ χ2 չափանիշը նույնպես հավասար կլինի զրոյի: Եթե S (E – T) հավասար չէ զրոյի, դա ցույց կտա անհամապատասխանություն հաշվարկված հաճախականությունների և շարքի էմպիրիկ հաճախությունների միջև: Նման դեպքերում անհրաժեշտ է գնահատել χ2 չափանիշի նշանակությունը, որը տեսականորեն կարող է տատանվել զրոյից մինչև անսահմանություն։ Դա արվում է χ2ф-ի փաստացի ստացված արժեքը համեմատելով նրա կրիտիկական արժեքի հետ (χ2st): Զրոյական վարկածը, այսինքն՝ այն ենթադրությունը, որ էմպիրիկ և տեսական կամ ակնկալվող հաճախությունների միջև անհամապատասխանությունը պատահական է, հերքվում է, եթե χ2ф-ը մեծ է կամ հավասար է: χ2-րդ ընդունված նշանակության մակարդակի (a) և ազատության աստիճանների քանակի համար (n):
χ2 պատահական փոփոխականի հավանական արժեքների բաշխումը շարունակական է և ասիմետրիկ: Այն կախված է ազատության աստիճանների քանակից (n) և մոտենում է նորմալ բաշխմանը, քանի որ դիտումների քանակը մեծանում է: Հետևաբար, χ2 չափանիշի կիրառումը գնահատման համար դիսկրետ բաշխումներկապված է որոշ սխալների հետ, որոնք ազդում են դրա արժեքի վրա, հատկապես փոքր նմուշներում: Ավելի ճշգրիտ գնահատականներ ստանալու համար բաշխվել է նմուշ տատանումների շարք, պետք է ունենա առնվազն 50 տարբերակ։ χ2 չափանիշի ճիշտ կիրառումը պահանջում է նաև, որ էքստրեմալ դասերում տարբերակների հաճախականությունները չպետք է լինեն 5-ից պակաս. եթե դրանք 5-ից պակաս են, ապա դրանք համակցվում են հարևան դասերի հաճախականությունների հետ այնպես, որ ընդհանուր գումարը մեծ կամ հավասար է 5-ի: Ըստ հաճախականությունների համակցության՝ դասերի (N) թիվը նվազում է: Ազատության աստիճանների թիվը սահմանվում է դասերի երկրորդական թվով՝ հաշվի առնելով տատանումների ազատության սահմանափակումների քանակը։
Քանի որ χ2 չափանիշի որոշման ճշգրտությունը մեծապես կախված է տեսական հաճախականությունների (T) հաշվարկի ճշգրտությունից, էմպիրիկ և հաշվարկված հաճախականությունների միջև տարբերությունը ստանալու համար պետք է օգտագործվեն չկլորացված տեսական հաճախականություններ:
Որպես օրինակ, վերցնենք մի ուսումնասիրություն, որը հրապարակվել է մի կայքում, որը նվիրված է օգտագործմանը վիճակագրական մեթոդներհումանիտար գիտությունների մեջ։
Chi-square թեստը թույլ է տալիս համեմատել հաճախականությունների բաշխումները՝ անկախ նրանից՝ դրանք սովորաբար բաշխված են, թե ոչ:
Հաճախականությունը վերաբերում է իրադարձության դեպքերի քանակին: Սովորաբար, իրադարձությունների առաջացման հաճախականությունը կարգավորվում է, երբ փոփոխականները չափվում են անունների սանդղակով, և դրանց այլ բնութագրերը, բացի հաճախությունից, անհնար կամ խնդրահարույց են ընտրելու համար: Այլ կերպ ասած, երբ փոփոխականն ունի որակական բնութագրեր։ Բացի այդ, շատ հետազոտողներ հակված են թեստի միավորները փոխակերպել մակարդակների (բարձր, միջին, ցածր) և կազմել միավորների բաշխման աղյուսակներ՝ պարզելու այս մակարդակների մարդկանց թիվը: Ապացուցելու համար, որ մակարդակներից մեկում (կատեգորիաներից մեկում) մարդկանց թիվն իսկապես ավելի մեծ է (պակաս), օգտագործվում է նաև Chi-square գործակիցը։
Եկեք նայենք ամենապարզ օրինակին.
Ավելի երիտասարդ դեռահասների շրջանում անցկացվել է թեստ՝ բացահայտելու ինքնագնահատականը: Թեստի միավորները վերածվել են երեք մակարդակի՝ բարձր, միջին, ցածր: Հաճախականությունները բաշխվել են հետևյալ կերպ.
Բարձր (B) 27 մարդ:
Միջին (C) 12 մարդ:
Ցածր (L) 11 մարդ
Ակնհայտ է, որ երեխաների մեծամասնությունը բարձր ինքնագնահատական ունի, բայց դա վիճակագրորեն ապացուցման կարիք ունի։ Դա անելու համար մենք օգտագործում ենք Chi-square թեստը:
Մեր խնդիրն է ստուգել, թե արդյոք ստացված էմպիրիկ տվյալները տարբերվում են տեսականորեն նույնքան հավանականներից։ Դա անելու համար անհրաժեշտ է գտնել տեսական հաճախականությունները: Մեր դեպքում տեսական հաճախականությունները հավասարապես հավանական հաճախականություններ են, որոնք հայտնաբերվում են բոլոր հաճախականությունները գումարելով և բաժանելով կատեգորիաների թվին։
Մեր դեպքում.
(B + C + H) / 3 = (27 + 12 + 11) / 3 = 16.6
Խի-քառակուսի թեստի հաշվարկման բանաձևը.
χ2 = ∑(E - T)I / T
Մենք աղյուսակը պատրաստում ենք.
Գտեք վերջին սյունակի գումարը.
Այժմ դուք պետք է գտնեք չափանիշի կրիտիկական արժեքը՝ օգտագործելով կրիտիկական արժեքների աղյուսակը (Աղյուսակ 1 հավելվածում): Դա անելու համար մեզ անհրաժեշտ է ազատության աստիճանների թիվը (n):
n = (R - 1) * (C - 1)
որտեղ R-ը աղյուսակի տողերի թիվն է, C-ն՝ սյունակների քանակը:
Մեր դեպքում կա միայն մեկ սյունակ (նկատի ունի բնօրինակ էմպիրիկ հաճախականությունները) և երեք տող (կատեգորիաներ), այնպես որ բանաձևը փոխվում է՝ մենք բացառում ենք սյունակները։
n = (R - 1) = 3-1 = 2
p≤0.05 և n = 2 սխալի հավանականության համար կրիտիկական արժեքը χ2 = 5.99 է:
Ստացված էմպիրիկ արժեքը մեծ է կրիտիկականից. հաճախականությունների տարբերությունները նշանակալի են (χ2= 9,64; p≤0,05):
Ինչպես տեսնում եք, չափանիշը հաշվարկելը շատ պարզ է և շատ ժամանակ չի պահանջում: Chi-square թեստի գործնական արժեքը հսկայական է: Այս մեթոդն առավել արժեքավոր է հարցաթերթիկների պատասխանները վերլուծելիս:
Դիտարկենք ավելի բարդ օրինակ:
Օրինակ՝ հոգեբանը ցանկանում է իմանալ՝ ճի՞շտ է արդյոք, որ ուսուցիչներն ավելի շատ կողմնակալ են տղաների, քան աղջիկների նկատմամբ։ Նրանք. ավելի հավանական է գովել աղջիկներին: Դա անելու համար հոգեբանը վերլուծել է ուսուցիչների կողմից գրված աշակերտների բնութագրերը երեք բառերի առաջացման հաճախականության համար՝ «ակտիվ», «ջանասեր», «կարգապահ», և հաշվվել են նաև բառերի հոմանիշները: Բառերի առաջացման հաճախականության վերաբերյալ տվյալները մուտքագրվել են աղյուսակում.
Ստացված տվյալները մշակելու համար օգտագործում ենք chi-square թեստը։
Դա անելու համար մենք կկառուցենք էմպիրիկ հաճախականությունների բաշխման աղյուսակ, այսինքն. այն հաճախականությունները, որոնք մենք դիտում ենք.
Տեսականորեն մենք ակնկալում ենք, որ հաճախականությունները կբաշխվեն հավասարաչափ, այսինքն. հաճախականությունը համամասնորեն բաշխվելու է տղաների և աղջիկների միջև։ Եկեք կառուցենք տեսական հաճախականությունների աղյուսակ: Դա անելու համար տողերի գումարը բազմապատկեք սյունակի գումարով և ստացված թիվը բաժանեք ընդհանուր գումարի (ների) վրա:
Հաշվարկների վերջնական աղյուսակը կունենա հետևյալ տեսքը.
χ2 = ∑(E - T)I / T
n = (R - 1), որտեղ R-ն աղյուսակի տողերի թիվն է:
Մեր դեպքում, chi-square = 4.21; n = 2:
Օգտագործելով չափանիշի կրիտիկական արժեքների աղյուսակը, մենք գտնում ենք. n = 2 և 0,05 սխալի մակարդակով, կրիտիկական արժեքը χ2 = 5,99 է:
Ստացված արժեքը փոքր է կրիտիկական արժեքից, ինչը նշանակում է, որ զրոյական վարկածն ընդունված է:
Եզրակացություն՝ ուսուցիչները չեն կարևորում երեխայի սեռը նրա համար բնութագրեր գրելիս։
Եզրակացություն.
Կ.Փիրսոնը նշանակալի ներդրում է ունեցել զարգացման գործում մաթեմատիկական վիճակագրություն(մեծ թվով հիմնարար հասկացություններ): Փիրսոնի հիմնական փիլիսոփայական դիրքորոշումը ձևակերպված է հետևյալ կերպ. դրանք գիտական նախադասությունների մեջ միացնելու կանոնները մեկուսացված են գիտության քերականությամբ, որը գիտության փիլիսոփայությունն է։ Համընդհանուր կարգապահությունը՝ կիրառական վիճակագրությունը, թույլ է տալիս կապել տարբեր հասկացություններն ու երևույթները, թեև Փիրսոնի կարծիքով՝ դա սուբյեկտիվ է։
Կ. Փիրսոնի շինություններից շատերը ուղղակիորեն կապված են կամ մշակվել են մարդաբանական նյութերի օգտագործմամբ: Նա մշակել է թվային դասակարգման բազմաթիվ մեթոդներ և վիճակագրական չափանիշներ, որոնք օգտագործվում են գիտության բոլոր բնագավառներում։
գրականություն.
1. Bogolyubov A. N. Մաթեմատիկա. Մեխանիկա. Կենսագրական տեղեկագիրք. - Կիև. Նաուկովա Դումկա, 1983 թ.
2. Kolmogorov A. N., Yushkevich A. P. (խմբ.): 19-րդ դարի մաթեմատիկա. - Մ.: Գիտություն: - T.I.
3. 3. Բորովկով Ա.Ա. Մաթեմատիկայի վիճակագրություն. Մ.: Նաուկա, 1994 թ.
4. 8. Feller V. Ներածություն հավանականության տեսությանը և դրա կիրառությունները: - Մ.՝ Միր, Թ.2, 1984։
5. 9. Հարման Գ., Ժամանակակից գործոնային վերլուծություն. - Մ.: Վիճակագրություն, 1972:
Նախքան վերջ XIXդարում, նորմալ բաշխումը համարվում էր տվյալների փոփոխության համընդհանուր օրենքը: Այնուամենայնիվ, Կ. Փիրսոնը նշեց, որ էմպիրիկ հաճախականությունները կարող են մեծապես տարբերվել նորմալ բաշխումից: Հարց առաջացավ, թե ինչպես դա ապացուցել։ Պահանջվում էր ոչ միայն գրաֆիկական համեմատություն, որը սուբյեկտիվ է, այլեւ խիստ քանակական հիմնավորում։
Ահա թե ինչպես է հորինվել չափանիշը χ 2(չի քառակուսի), որը ստուգում է էմպիրիկ (դիտարկվող) և տեսական (ակնկալվող) հաճախականությունների անհամապատասխանության նշանակությունը։ Դա տեղի է ունեցել դեռևս 1900 թվականին, սակայն չափանիշը դեռևս կիրառվում է այսօր։ Ավելին, այն հարմարեցվել է խնդիրների լայն շրջանակի լուծման համար։ Առաջին հերթին սա կատեգորիկ տվյալների վերլուծությունն է, այսինքն. նրանք, որոնք արտահայտվում են ոչ թե քանակով, այլ ինչ-որ կատեգորիայի պատկանմամբ։ Օրինակ՝ մեքենայի դասը, փորձի մասնակցի սեռը, բույսի տեսակը և այլն։ Նման տվյալների վրա չեն կարող կիրառվել այնպիսի մաթեմատիկական գործողություններ, ինչպիսիք են գումարումը և բազմապատկումը, հաճախականությունները կարող են հաշվարկվել միայն դրանց համար:
Նշում ենք դիտարկվող հաճախականությունները Մոտ (դիտված), ակնկալվում է - E (Սպասվում է). Որպես օրինակ՝ վերցնենք 60 անգամ գլանափաթեթ գլորելու արդյունքը։ Եթե այն սիմետրիկ է և միատեսակ, ապա ցանկացած կողմ ստանալու հավանականությունը 1/6 է, հետևաբար յուրաքանչյուր կողմ ստանալու ակնկալվող թիվը 10 է (1/6∙60): Դիտարկված և սպասվող հաճախականությունները գրում ենք աղյուսակում և գծում հիստոգրամա։
Զուր վարկածն այն է, որ հաճախականությունները համահունչ են, այսինքն՝ փաստացի տվյալները չեն հակասում սպասվող տվյալներին։ Այլընտրանքային վարկածն այն է, որ հաճախականությունների շեղումները դուրս են գալիս պատահական տատանումներից, անհամապատասխանությունները վիճակագրորեն նշանակալի են: Խիստ եզրակացություն անելու համար մեզ անհրաժեշտ է.
- Դիտարկվող և սպասվող հաճախությունների միջև անհամապատասխանության ամփոփ չափում:
- Այս չափման բաշխումը, եթե այն վարկածը, որ տարբերություններ չկան, ճիշտ է:
Սկսենք հաճախականությունների միջև հեռավորությունից: Եթե դուք պարզապես վերցնեք տարբերությունը Օ - Ե, ապա նման չափումը կախված կլինի տվյալների (հաճախականությունների) մասշտաբից։ Օրինակ, 20 - 5 = 15 և 1020 - 1005 = 15: Երկու դեպքում էլ տարբերությունը 15 է: Բայց առաջին դեպքում ակնկալվող հաճախականությունները 3 անգամ պակաս են դիտվածից, իսկ երկրորդ դեպքում՝ ընդամենը 1,5: %: Մեզ անհրաժեշտ է հարաբերական չափում, որը կախված չէ մասշտաբից։
Ուշադրություն դարձնենք հետևյալ փաստերին. Ընդհանուր առմամբ, կատեգորիաների թիվը, որոնցում չափվում են հաճախականությունները, կարող է շատ ավելի մեծ լինել, ուստի հավանականությունը, որ մեկ դիտարկումը կհայտնվի այս կամ այն կատեգորիայի մեջ, բավականին փոքր է: Եթե այո, ապա այդպիսի պատահական փոփոխականի բաշխումը ենթարկվելու է հազվագյուտ իրադարձությունների օրենքին, որը հայտնի է որպես Պուասոնի օրենքը. Պուասոնի օրենքում, ինչպես հայտնի է, մաթեմատիկական ակնկալիքի արժեքը և շեղումը համընկնում են (պարամետր λ ) Սա նշանակում է, որ ակնկալվող հաճախականությունը անվանական փոփոխականի որոշ կատեգորիայի համար E iկլինի միաժամանակյա և դրա ցրումը. Ավելին, Պուասոնի օրենքը մեծ թվով դիտարկումներով հակված է նորմալ: Համակցելով այս երկու փաստերը՝ մենք ստանում ենք, որ եթե դիտարկված և սպասվող հաճախությունների միջև համաձայնության վարկածը ճիշտ է, ապա. մեծ թվով դիտարկումներով, արտահայտություն
Կարևոր է հիշել, որ նորմալությունը կհայտնվի միայն բավականաչափ բարձր հաճախականություններում: Վիճակագրության մեջ ընդհանուր առմամբ ընդունված է, որ դիտումների ընդհանուր թիվը (հաճախականությունների գումարը) պետք է լինի առնվազն 50, իսկ ակնկալվող հաճախականությունը յուրաքանչյուր աստիճանում պետք է լինի առնվազն 5: Միայն այս դեպքում վերը նշված արժեքն ունի ստանդարտ նորմալ բաշխում: . Ենթադրենք, որ այս պայմանը կատարվում է։
Ստանդարտ նորմալ բաշխումն ունի գրեթե բոլոր արժեքները ±3-ի սահմաններում (երեք սիգմա կանոն): Այսպիսով, մենք ստացանք մեկ աստիճանավորման հաճախականությունների հարաբերական տարբերությունը: Մեզ ընդհանրացնող միջոց է պետք։ Դուք չեք կարող պարզապես գումարել բոլոր շեղումները. մենք ստանում ենք 0 (գուշակեք, թե ինչու): Փիրսոնն առաջարկեց գումարել այդ շեղումների քառակուսիները:
Սա նշանն է Chi-square թեստ Փիրսոն. Եթե հաճախականություններն իսկապես համապատասխանում են ակնկալվողներին, ապա չափանիշի արժեքը կլինի համեմատաբար փոքր (քանի որ շեղումների մեծ մասը զրոյի մոտ է): Բայց եթե չափանիշը մեծ է, ապա դա ցույց է տալիս հաճախականությունների միջև զգալի տարբերություններ:
Պիրսոնի չափանիշը դառնում է «մեծ», երբ նման կամ նույնիսկ ավելի մեծ արժեքի առաջացումը դառնում է անհավանական: Իսկ նման հավանականությունը հաշվարկելու համար անհրաժեշտ է իմանալ չափանիշի բաշխվածությունը, երբ փորձը բազմիցս կրկնվում է, երբ հաճախականության համաձայնության վարկածը ճիշտ է։
Ինչպես հեշտ է տեսնել, chi-square արժեքը նույնպես կախված է տերմինների քանակից: Որքան շատ լինեն, այնքան մեծ կլինի չափանիշի արժեքը, քանի որ յուրաքանչյուր տերմին կնպաստի ընդհանուրին: Հետեւաբար, յուրաքանչյուր քանակի համար անկախպայմաններով, կլինի իր բաշխումը։ Պարզվում է, որ χ 2բաշխումների մի ամբողջ ընտանիք է:
Եվ ահա մենք հասնում ենք մի նուրբ պահի. Ինչ է թիվը անկախպայմանները? Թվում է, թե ցանկացած տերմին (այսինքն՝ շեղում) անկախ է: Ք.Պիրսոնը նույնպես այդպես էր կարծում, բայց պարզվեց, որ նա սխալվում էր։ Փաստորեն, անկախ անդամների թիվը մեկով պակաս կլինի անվանական փոփոխականի աստիճանավորումների քանակից n. Ինչո՞ւ։ Որովհետև եթե մենք ունենք նմուշ, որի համար հաճախականությունների գումարն արդեն հաշվարկված է, ապա հաճախականություններից մեկը միշտ կարող է որոշվել որպես ընդհանուր թվի և մնացած բոլորի գումարի տարբերություն։ Հետևաբար, տատանումները մի փոքր ավելի քիչ կլինեն: Ռոնալդ Ֆիշերը նկատել է այս փաստը 20 տարի անց, երբ Փիրսոնը մշակեց իր չափանիշը: Նույնիսկ սեղանները պետք է վերամշակվեին։
Այս առիթով Ֆիշերը նոր հայեցակարգ է ներկայացրել վիճակագրության մեջ. ազատության աստիճանը(ազատության աստիճաններ), որը ներկայացնում է անկախ տերմինների քանակը գումարում։ Ազատության աստիճանների հասկացությունն ունի մաթեմատիկական բացատրություն և ի հայտ է գալիս միայն նորմալի հետ կապված բաշխումներում (Student's, Fisher-Snedecor և բուն chi-square):
Ազատության աստիճանների իմաստը ավելի լավ հասկանալու համար դիմենք ֆիզիկական անալոգին: Եկեք պատկերացնենք, որ մի կետ ազատ շարժվում է տարածության մեջ: Այն ունի 3 աստիճան ազատություն, քանի որ կարող է շարժվել ցանկացած ուղղությամբ եռաչափ տարածության մեջ: Եթե կետը շարժվում է ցանկացած մակերևույթի երկայնքով, ապա այն արդեն ունի ազատության երկու աստիճան (հետ և առաջ, ձախ և աջ), չնայած այն շարունակում է մնալ եռաչափ տարածության մեջ: Աղբյուրի երկայնքով շարժվող կետը կրկին գտնվում է եռաչափ տարածության մեջ, բայց ունի ազատության միայն մեկ աստիճան, քանի որ կարող է շարժվել առաջ կամ հետ: Ինչպես տեսնում եք, տարածքը, որտեղ գտնվում է օբյեկտը, միշտ չէ, որ համապատասխանում է իրական շարժման ազատությանը:
Մոտավորապես նույն կերպ, վիճակագրական չափանիշի բաշխումը կարող է կախված լինել ավելի փոքր թվով տարրերից, քան այն հաշվարկելու համար անհրաժեշտ պայմանները: Ընդհանուր առմամբ, ազատության աստիճանների թիվը ավելի քիչ է, քան գոյություն ունեցող կախվածությունների քանակով դիտարկումների թիվը:
Այսպիսով, chi քառակուսի բաշխումը ( χ 2) բաշխումների ընտանիք է, որոնցից յուրաքանչյուրը կախված է ազատության աստիճանի պարամետրից։ Իսկ chi-square թեստի պաշտոնական սահմանումը հետեւյալն է. Բաշխում χ 2(chi-square) s կազատության աստիճանները քառակուսիների գումարի բաշխումն է կանկախ ստանդարտ նորմալ պատահական փոփոխականներ:
Հաջորդը, մենք կարող ենք անցնել բուն բանաձևին, որով հաշվարկվում է chi-square բաշխման ֆունկցիան, բայց, բարեբախտաբար, մեզ համար ամեն ինչ վաղուց հաշվարկված է: Հետաքրքրության հավանականությունը ստանալու համար կարող եք օգտագործել կա՛մ համապատասխան վիճակագրական աղյուսակը, կա՛մ պատրաստի ֆունկցիա Excel-ում:
Հետաքրքիր է տեսնել, թե ինչպես է փոխվում chi-square-ի բաշխման ձևը՝ կախված ազատության աստիճանների քանակից:
Ազատության աստիճանների աճով, chi-square-ի բաշխումը հակված է նորմալ լինելու: Դա բացատրվում է կենտրոնական սահմանային թեորեմի գործողությամբ, ըստ որի մեծ թվով անկախ պատահական փոփոխականների գումարն ունի նորմալ բաշխում։ Քառակուսիների մասին ոչինչ չի ասում))։
Հիպոթեզի փորձարկում՝ օգտագործելով Pearson chi-square թեստը
Այժմ մենք գալիս ենք հիպոթեզների փորձարկմանը՝ օգտագործելով chi-square մեթոդը: Ընդհանուր առմամբ, տեխնոլոգիան մնում է: Զրոյական վարկածն այն է, որ դիտարկվող հաճախականությունները համապատասխանում են սպասվածներին (այսինքն, դրանց միջև տարբերություն չկա, քանի որ դրանք վերցված են նույն պոպուլյացիայից): Եթե դա այդպես է, ապա ցրումը կլինի համեմատաբար փոքր՝ պատահական տատանումների սահմաններում։ Դիսպերսիայի չափը որոշվում է chi-square թեստի միջոցով: Այնուհետև կամ չափանիշն ինքնին համեմատվում է կրիտիկական արժեքի հետ (նշանակության համապատասխան մակարդակի և ազատության աստիճանի համար), կամ, որ ավելի ճիշտ է, հաշվարկվում է դիտարկվող p արժեքը, այսինքն. նույն կամ նույնիսկ ավելի մեծ չափանիշի արժեք ստանալու հավանականությունը, եթե զրոյական վարկածը ճշմարիտ է:
Որովհետեւ մենք շահագրգռված ենք հաճախականությունների համաձայնությամբ, ապա վարկածը կմերժվի, երբ չափանիշը ավելի մեծ լինի, քան կրիտիկական մակարդակը։ Նրանք. չափանիշը միակողմանի է. Այնուամենայնիվ, երբեմն (երբեմն) անհրաժեշտ է ստուգել ձախակողմյան վարկածը: Օրինակ, երբ էմպիրիկ տվյալները շատ նման են տեսական տվյալներին։ Այնուհետև չափանիշը կարող է ընկնել անհավանական շրջան, բայց ձախ կողմում: Փաստն այն է, որ բնական պայմաններում դժվար թե հաճախականություններ ձեռք բերվեն, որոնք գործնականում համընկնում են տեսականի հետ։ Միշտ կա որոշ պատահականություն, որը տալիս է սխալ: Բայց եթե նման սխալ չկա, ապա միգուցե տվյալները կեղծվել են։ Բայց այնուամենայնիվ, աջակողմյան վարկածը սովորաբար ստուգվում է:
Վերադառնանք զառերի խնդրին։ Եկեք հաշվարկենք chi-square թեստի արժեքը՝ օգտագործելով առկա տվյալները:
Հիմա եկեք գտնենք կրիտիկական արժեքը ազատության 5 աստիճանում ( կ) և նշանակության մակարդակ 0,05 ( α ) ըստ Չի քառակուսի բաշխման կրիտիկական արժեքների աղյուսակի:
Այսինքն՝ 0.05 քվանտիլը 5 աստիճան ազատության chi քառակուսի բաշխում է (աջ պոչը): χ 2 0,05; 5 = 11,1.
Եկեք համեմատենք փաստացի և աղյուսակային արժեքները: 3.4 ( χ 2) < 11,1 (χ 2 0,05; 5) Հաշվարկված չափանիշն ավելի փոքր է ստացվել, ինչը նշանակում է, որ հաճախականությունների հավասարության (համաձայնության) վարկածը չի մերժվում։ Նկարում իրավիճակն այսպիսին է.
Եթե հաշվարկված արժեքը ընկներ կրիտիկական տարածաշրջանում, ապա զրոյական վարկածը կմերժվեր:
Ավելի ճիշտ կլինի նաև հաշվարկել p-արժեքը։ Դա անելու համար հարկավոր է աղյուսակում գտնել ամենամոտ արժեքը ազատության որոշակի քանակի համար և նայել համապատասխան նշանակության մակարդակին: Բայց սա անցյալ դարում. Մենք կօգտագործենք համակարգիչ, մասնավորապես MS Excel: Excel-ն ունի chi-square-ի հետ կապված մի քանի գործառույթ:
Ստորև ներկայացնում ենք դրանց համառոտ նկարագրությունը:
CH2.OBR- չափանիշի կրիտիկական արժեքը տվյալ հավանականությամբ ձախ կողմում (ինչպես վիճակագրական աղյուսակներում)
CH2.OBR.PH– աջ կողմում տրված հավանականության չափանիշի կրիտիկական արժեքը: Ֆունկցիան ըստ էության կրկնօրինակում է նախորդը: Բայց այստեղ դուք կարող եք անմիջապես նշել մակարդակը α , քան 1-ից հանելը: Սա ավելի հարմար է, քանի որ շատ դեպքերում բաշխման ճիշտ պոչն է անհրաժեշտ:
CH2.DIST– p-արժեքը ձախ կողմում (խտությունը կարելի է հաշվարկել):
CH2.DIST.PH- p-արժեքը աջ կողմում:
CHI2.ԹԵՍՏ– անմիջապես անցկացնում է chi-square թեստը երկու հաճախականությունների միջակայքերի համար: Ազատության աստիճանների թիվը վերցվում է մեկով պակաս սյունակում հաճախականությունների քանակից (ինչպես պետք է լինի)՝ վերադարձնելով p արժեք։
Եկեք հաշվարկենք մեր փորձի համար կրիտիկական (աղյուսակային) արժեքը 5 աստիճանի ազատության և ալֆա 0,05-ի համար: Excel-ի բանաձևը կունենա հետևյալ տեսքը.
CH2.OBR(0.95;5)
CH2.OBR.PH(0.05;5)
Արդյունքը կլինի նույնը՝ 11.0705։ Սա այն արժեքն է, որը մենք տեսնում ենք աղյուսակում (կլորացվում է մինչև 1 տասնորդական տեղ):
Վերջապես հաշվարկենք p-արժեքը 5 աստիճանի ազատության չափանիշի համար χ 2= 3.4. Մեզ անհրաժեշտ է հավանականությունը աջ կողմում, ուստի մենք վերցնում ենք ֆունկցիան HH-ի ավելացումով (աջ պոչ)
CH2.DIST.PH(3.4;5) = 0.63857
Սա նշանակում է, որ 5 աստիճան ազատության դեպքում չափանիշի արժեքը ստանալու հավանականությունը մեծ է χ 2= 3,4 և ավելի հավասար է գրեթե 64%-ի: Բնականաբար, վարկածը չի մերժվում (p-արժեքը 5%-ից մեծ է, հաճախականությունները շատ լավ համընկնում են։
Հիմա եկեք ստուգենք հաճախությունների համաձայնության վարկածը՝ օգտագործելով chi-square թեստը և Excel ֆունկցիան CHI2.TEST:
Ոչ աղյուսակներ, ոչ ծանր հաշվարկներ: Որպես ֆունկցիայի արգումենտ նշելով դիտարկվող և սպասվող հաճախականություններով սյունակները՝ մենք անմիջապես ստանում ենք p-արժեքը։ Գեղեցկություն.
Հիմա պատկերացրեք, որ դուք զառախաղ եք խաղում կասկածելի տղայի հետ: Միավորների բաշխումը 1-ից 5-ը մնում է նույնը, բայց նա գլորում է 26 վեցեր (նետումների ընդհանուր թիվը դառնում է 78):
P-արժեքն այս դեպքում ստացվում է 0,003, ինչը շատ ավելի քիչ է, քան 0,05: Զառերի վավերականությանը կասկածելու լավ պատճառներ կան: Ահա թե ինչպիսին է այդ հավանականությունը chi-square բաշխման գծապատկերում:
Այստեղ ինքնին «chi-square» չափանիշը 17.8 է, որը, բնականաբար, ավելի մեծ է, քան աղյուսակը (11.1):
Հուսով եմ կարողացա բացատրել, թե որն է համաձայնության չափանիշը χ 2(Pearson chi-square) և ինչպես այն կարող է օգտագործվել վիճակագրական վարկածները ստուգելու համար:
Վերջապես ևս մեկ կարևոր պայմանի մասին. Chi-square թեստը ճիշտ է աշխատում միայն այն դեպքում, երբ բոլոր հաճախականությունների թիվը գերազանցում է 50-ը, և նվազագույն ակնկալվող արժեքը յուրաքանչյուր աստիճանի համար 5-ից ոչ պակաս է: Եթե որևէ կատեգորիայի ակնկալվող հաճախականությունը 5-ից պակաս է, բայց բոլոր հաճախականությունների գումարը գերազանցում է: 50, ապա այդպիսի կատեգորիան համակցվում է ամենամոտի հետ, որպեսզի դրանց ընդհանուր հաճախականությունը գերազանցի 5-ը: Եթե դա հնարավոր չէ, կամ հաճախականությունների գումարը 50-ից փոքր է, ապա պետք է օգտագործել վարկածների փորձարկման ավելի ճշգրիտ մեթոդներ: Նրանց մասին կխոսենք մեկ այլ անգամ:
Ստորև բերված է տեսանյութ, թե ինչպես կարելի է փորձարկել հիպոթեզը Excel-ում՝ օգտագործելով chi-square թեստը:
Թող U 1, U 2, ..,U k լինեն անկախ ստանդարտ նորմալ արժեքներ. K = U 1 2 +U 2 2 + .. + U k 2 պատահական փոփոխականի բաշխումը կոչվում է խի քառակուսի բաշխում կազատության աստիճաններ (գրել K~χ 2 (k)): Սա միամոդալ բաշխում է՝ դրական թեքությամբ և հետևյալ բնութագրերով՝ ռեժիմ M=k-2 ակնկալվող արժեքը m=k դիսպերսիա D=2k (նկ.): Պարամետրի բավականաչափ մեծ արժեքով կբաշխումը χ 2 (k) ունի մոտավորապես նորմալ բաշխում պարամետրերով
Մաթեմատիկական վիճակագրության խնդիրներ լուծելիս օգտագործվում են χ 2 (k) կրիտիկական կետերը՝ կախված α տվյալ հավանականությունից և ազատության աստիճանների քանակից։ կ(Հավելված 2): Ք 2 kr = Χ 2 (k; α) կրիտիկական կետը այն շրջանի սահմանն է, որից աջ ընկած է բաշխման խտության կորի տակ գտնվող տարածքի 100- α %-ը: Հավանականությունը, որ K~χ 2 (k) պատահական փոփոխականի արժեքը փորձարկման ժամանակ կիջնի χ 2 (k) կետից աջ, չի գերազանցում α P(K≥χ 2 kp)≤ α): Օրինակ՝ K~χ 2 (20) պատահական փոփոխականի համար սահմանում ենք α=0,05 հավանականությունը։ Օգտվելով chi-square բաշխման կրիտիկական կետերի աղյուսակից (աղյուսակներ) մենք գտնում ենք χ 2 kp = χ 2 (20;0.05) = 31.4: Սա նշանակում է, որ այս պատահական փոփոխականի հավանականությունը Կընդունեք 31,4-ից ավելի արժեք, 0,05-ից պակաս (նկ.):
Բրինձ. Բաշխման խտության գրաֆիկ χ 2 (k) ազատության աստիճանների քանակի տարբեր արժեքների համար կ
Կրիտիկական χ 2 (k) կետերն օգտագործվում են հետևյալ հաշվիչներում.
- Բազմագծայինության առկայության ստուգում (բազմագծայինության մասին):
Հետևաբար, կապի ուղղությունը ստուգելու համար ընտրեք հարաբերակցության վերլուծություն, մասնավորապես՝ վարկածի փորձարկում՝ օգտագործելով Պիրսոնի հարաբերակցության գործակիցը, t-test-ի միջոցով նշանակալիության հետագա ստուգմամբ:
Նշանակության մակարդակի α Χ 2 արժեքի համար կարելի է գտնել MS Excel ֆունկցիայի միջոցով՝ =HI2OBR(α;ազատության աստիճաններ)
n-1 | .995 | .990 | .975 | .950 | .900 | .750 | .500 | .250 | .100 | .050 | .025 | .010 | .005 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 0.00004 | 0.00016 | 0.00098 | 0.00393 | 0.01579 | 0.10153 | 0.45494 | 1.32330 | 2.70554 | 3.84146 | 5.02389 | 6.63490 | 7.87944 |
2 | 0.01003 | 0.02010 | 0.05064 | 0.10259 | 0.21072 | 0.57536 | 1.38629 | 2.77259 | 4.60517 | 5.99146 | 7.37776 | 9.21034 | 10.59663 |
3 | 0.07172 | 0.11483 | 0.21580 | 0.35185 | 0.58437 | 1.21253 | 2.36597 | 4.10834 | 6.25139 | 7.81473 | 9.34840 | 11.34487 | 12.83816 |
4 | 0.20699 | 0.29711 | 0.48442 | 0.71072 | 1.06362 | 1.92256 | 3.35669 | 5.38527 | 7.77944 | 9.48773 | 11.14329 | 13.27670 | 14.86026 |
5 | 0.41174 | 0.55430 | 0.83121 | 1.14548 | 1.61031 | 2.67460 | 4.35146 | 6.62568 | 9.23636 | 11.07050 | 12.83250 | 15.08627 | 16.74960 |
6 | 0.67573 | 0.87209 | 1.23734 | 1.63538 | 2.20413 | 3.45460 | 5.34812 | 7.84080 | 10.64464 | 12.59159 | 14.44938 | 16.81189 | 18.54758 |
7 | 0.98926 | 1.23904 | 1.68987 | 2.16735 | 2.83311 | 4.25485 | 6.34581 | 9.03715 | 12.01704 | 14.06714 | 16.01276 | 18.47531 | 20.27774 |
8 | 1.34441 | 1.64650 | 2.17973 | 2.73264 | 3.48954 | 5.07064 | 7.34412 | 10.21885 | 13.36157 | 15.50731 | 17.53455 | 20.09024 | 21.95495 |
9 | 1.73493 | 2.08790 | 2.70039 | 3.32511 | 4.16816 | 5.89883 | 8.34283 | 11.38875 | 14.68366 | 16.91898 | 19.02277 | 21.66599 | 23.58935 |
10 | 2.15586 | 2.55821 | 3.24697 | 3.94030 | 4.86518 | 6.73720 | 9.34182 | 12.54886 | 15.98718 | 18.30704 | 20.48318 | 23.20925 | 25.18818 |
11 | 2.60322 | 3.05348 | 3.81575 | 4.57481 | 5.57778 | 7.58414 | 10.34100 | 13.70069 | 17.27501 | 19.67514 | 21.92005 | 24.72497 | 26.75685 |
12 | 3.07382 | 3.57057 | 4.40379 | 5.22603 | 6.30380 | 8.43842 | 11.34032 | 14.84540 | 18.54935 | 21.02607 | 23.33666 | 26.21697 | 28.29952 |
13 | 3.56503 | 4.10692 | 5.00875 | 5.89186 | 7.04150 | 9.29907 | 12.33976 | 15.98391 | 19.81193 | 22.36203 | 24.73560 | 27.68825 | 29.81947 |
14 | 4.07467 | 4.66043 | 5.62873 | 6.57063 | 7.78953 | 10.16531 | 13.33927 | 17.11693 | 21.06414 | 23.68479 | 26.11895 | 29.14124 | 31.31935 |
15 | 4.60092 | 5.22935 | 6.26214 | 7.26094 | 8.54676 | 11.03654 | 14.33886 | 18.24509 | 22.30713 | 24.99579 | 27.48839 | 30.57791 | 32.80132 |
16 | 5.14221 | 5.81221 | 6.90766 | 7.96165 | 9.31224 | 11.91222 | 15.33850 | 19.36886 | 23.54183 | 26.29623 | 28.84535 | 31.99993 | 34.26719 |
17 | 5.69722 | 6.40776 | 7.56419 | 8.67176 | 10.08519 | 12.79193 | 16.33818 | 20.48868 | 24.76904 | 27.58711 | 30.19101 | 33.40866 | 35.71847 |
18 | 6.26480 | 7.01491 | 8.23075 | 9.39046 | 10.86494 | 13.67529 | 17.33790 | 21.60489 | 25.98942 | 28.86930 | 31.52638 | 34.80531 | 37.15645 |
19 | 6.84397 | 7.63273 | 8.90652 | 10.11701 | 11.65091 | 14.56200 | 18.33765 | 22.71781 | 27.20357 | 30.14353 | 32.85233 | 36.19087 | 38.58226 |
20 | 7.43384 | 8.26040 | 9.59078 | 10.85081 | 12.44261 | 15.45177 | 19.33743 | 23.82769 | 28.41198 | 31.41043 | 34.16961 | 37.56623 | 39.99685 |
21 | 8.03365 | 8.89720 | 10.28290 | 11.59131 | 13.23960 | 16.34438 | 20.33723 | 24.93478 | 29.61509 | 32.67057 | 35.47888 | 38.93217 | 41.40106 |
22 | 8.64272 | 9.54249 | 10.98232 | 12.33801 | 14.04149 | 17.23962 | 21.33704 | 26.03927 | 30.81328 | 33.92444 | 36.78071 | 40.28936 | 42.79565 |
23 | 9.26042 | 10.19572 | 11.68855 | 13.09051 | 14.84796 | 18.13730 | 22.33688 | 27.14134 | 32.00690 | 35.17246 | 38.07563 | 41.63840 | 44.18128 |
24 | 9.88623 | 10.85636 | 12.40115 | 13.84843 | 15.65868 | 19.03725 | 23.33673 | 28.24115 | 33.19624 | 36.41503 | 39.36408 | 42.97982 | 45.55851 |
25 | 10.51965 | 11.52398 | 13.11972 | 14.61141 | 16.47341 | 19.93934 | 24.33659 | 29.33885 | 34.38159 | 37.65248 | 40.64647 | 44.31410 | 46.92789 |
26 | 11.16024 | 12.19815 | 13.84390 | 15.37916 | 17.29188 | 20.84343 | 25.33646 | 30.43457 | 35.56317 | 38.88514 | 41.92317 | 45.64168 | 48.28988 |
27 | 11.80759 | 12.87850 | 14.57338 | 16.15140 | 18.11390 | 21.74940 | 26.33634 | 31.52841 | 36.74122 | 40.11327 | 43.19451 | 46.96294 | 49.64492 |
28 | 12.46134 | 13.56471 | 15.30786 | 16.92788 | 18.93924 | 22.65716 | 27.33623 | 32.62049 | 37.91592 | 41.33714 | 44.46079 | 48.27824 | 50.99338 |
29 | 13.12115 | 14.25645 | 16.04707 | 17.70837 | 19.76774 | 23.56659 | 28.33613 | 33.71091 | 39.08747 | 42.55697 | 45.72229 | 49.58788 | 52.33562 |
30 | 13.78672 | 14.95346 | 16.79077 | 18.49266 | 20.59923 | 24.47761 | 29.33603 | 34.79974 | 40.25602 | 43.77297 | 46.97924 | 50.89218 | 53.67196 |
Ազատության աստիճանների քանակը կ | Նշանակության մակարդակ ա | |||||
0,01 | 0,025 | 0.05 | 0,95 | 0,975 | 0.99 | |
1 | 6.6 | 5.0 | 3.8 | 0.0039 | 0.00098 | 0.00016 |
2 | 9.2 | 7.4 | 6.0 | 0.103 | 0.051 | 0.020 |
3 | 11.3 | 9.4 | 7.8 | 0.352 | 0.216 | 0.115 |
4 | 13.3 | 11.1 | 9.5 | 0.711 | 0.484 | 0.297 |
5 | 15.1 | 12.8 | 11.1 | 1.15 | 0.831 | 0.554 |
6 | 16.8 | 14.4 | 12.6 | 1.64 | 1.24 | 0.872 |
7 | 18.5 | 16.0 | 14.1 | 2.17 | 1.69 | 1.24 |
8 | 20.1 | 17.5 | 15.5 | 2.73 | 2.18 | 1.65 |
9 | 21.7 | 19.0 | 16.9 | 3.33 | 2.70 | 2.09 |
10 | 23.2 | 20.5 | 18.3 | 3.94 | 3.25 | 2.56 |
11 | 24.7 | 21.9 | 19.7 | 4.57 | 3.82 | 3.05 |
12 | 26.2 | 23.3 | 21 .0 | 5.23 | 4.40 | 3.57 |
13 | 27.7 | 24.7 | 22.4 | 5.89 | 5.01 | 4.11 |
14 | 29.1 | 26.1 | 23.7 | 6.57 | 5.63 | 4.66 |
15 | 30.6 | 27.5 | 25.0 | 7.26 | 6.26 | 5.23 |
16 | 32.0 | 28.8 | 26.3 | 7.96 | 6.91 | 5.81 |
17 | 33.4 | 30.2 | 27.6 | 8.67 | 7.56 | 6.41 |
18 | 34.8 | 31.5 | 28.9 | 9.39 | 8.23 | 7.01 |
19 | 36.2 | 32.9 | 30.1 | 10.1 | 8.91 | 7.63 |
20 | 37.6 | 34.2 | 31.4 | 10.9 | 9.59 | 8.26 |
21 | 38.9 | 35.5 | 32.7 | 11.6 | 10.3 | 8.90 |
22 | 40.3 | 36.8 | 33.9 | 12.3 | 11.0 | 9.54 |
23 | 41.6 | 38.1 | 35.2 | 13.1 | 11.7 | 10.2 |
24 | 43.0 | 39.4 | 36.4 | 13.8 | 12.4 | 10.9 |
25 | 44.3 | 40.6 | 37.7 | 14.6 | 13.1 | 11.5 |
26 | 45.6 | 41.9 | 38.9 | 15.4 | 13.8 | 12.2 |
27 | 47.0 | 43.2 | 40.1 | 16.2 | 14.6 | 12.9 |
28 | 48.3 | 44.5 | 41.3 | 16.9 | 15.3 | 13.6 |
29 | 49.6 | 45.7 | 42.6 | 17.7 | 16.0 | 14.3 |
30 | 50.9 | 47.0 | 43.8 | 18.5 | 16.8 | 15.0 |
Pearson (chi-squared), Student and Fisher բաշխումները
Օգտագործելով նորմալ բաշխումը, սահմանվում են երեք բաշխումներ, որոնք այժմ հաճախ օգտագործվում են վիճակագրական տվյալների մշակման մեջ: Այս բաշխումները բազմիցս հայտնվում են գրքի հետագա բաժիններում:
Պիրսոնի բաշխում (chi - քառակուսի) – պատահական փոփոխականի բաշխում
Որտեղ պատահական փոփոխականներ X 1 , X 2 ,…, X nանկախ և ունեն նույն բաշխումը Ն(0,1). Այս դեպքում տերմինների քանակը, այսինքն. n, կոչվում է «chi-square» բաշխման «ազատության աստիճանների թիվը»։
Խի-քառակուսի բաշխումն օգտագործվում է շեղումը գնահատելիս (օգտագործելով վստահության միջակայքը), համաձայնության, միատարրության, անկախության վարկածները ստուգելիս, հիմնականում որակական (դասակարգված) փոփոխականների համար, որոնք ընդունում են վերջավոր թվով արժեքներ և շատ այլ առաջադրանքներում: Վիճակագրական վերլուծությունտվյալները
Բաշխում տ Student's t-ը պատահական փոփոխականի բաշխումն է
որտեղ են պատահական փոփոխականները UԵվ Xանկախ, Uունի ստանդարտ նորմալ բաշխում Ն(0.1), և X– chi բաշխում – քառակուսի գ nազատության աստիճաններ. Որտեղ nկոչվում է Ուսանողների բաշխման «ազատության աստիճանների թիվը»:
Ուսանողական բաշխումը ներդրվել է 1908 թվականին անգլիացի վիճակագիր Վ. Գոսեթի կողմից, ով աշխատում էր գարեջրի գործարանում։ Այս գործարանում տնտեսական և տեխնիկական որոշումներ կայացնելու համար օգտագործվել են հավանական և վիճակագրական մեթոդներ, ուստի նրա ղեկավարությունն արգելել է Վ.Գոսեթին գիտական հոդվածներ հրատարակել իր անունով։ Այս կերպ պաշտպանվել են Վ.Գոսեթի կողմից մշակված հավանականական և վիճակագրական մեթոդների տեսքով առևտրային գաղտնիքները և «նոու-հաուն»։ Սակայն նա հնարավորություն ունեցավ հրատարակել «Ուսանող» կեղծանունով։ Gosset-Student-ի պատմությունը ցույց է տալիս, որ նույնիսկ հարյուր տարի առաջ բրիտանացի մենեջերները տեղյակ էին մեծին տնտեսական արդյունավետությունըհավանական-վիճակագրական մեթոդներ.
Ներկայումս Student բաշխումը ամենահայտնի բաշխումներից մեկն է, որն օգտագործվում է իրական տվյալների վերլուծության մեջ: Այն օգտագործվում է մաթեմատիկական ակնկալիքների, կանխատեսման արժեքի և այլ բնութագրերի գնահատման ժամանակ՝ օգտագործելով վստահության միջակայքերը, մաթեմատիկական ակնկալիքների արժեքների, ռեգրեսիայի գործակիցների, նմուշի միատարրության վարկածների և այլնի վերաբերյալ վարկածների փորձարկման ժամանակ: .
Ֆիշերի բաշխումը պատահական փոփոխականի բաշխումն է
որտեղ են պատահական փոփոխականները X 1Եվ X 2անկախ են և ունեն խի-քառակուսի բաշխումներ՝ ազատության աստիճանների քանակով կ 1 Եվ կ 2 համապատասխանաբար. Միաժամանակ զույգը (կ 1 , կ 2 ) – Ֆիշերի բաշխման մի զույգ «ազատության աստիճաններ», մասնավորապես. կ 1 համարիչի ազատության աստիճանների թիվն է և կ 2 – հայտարարի ազատության աստիճանների թիվը. Պատահական փոփոխականի բաշխում Ֆանվանվել է անգլիացի մեծ վիճակագիր Ռ.Ֆիշերի (1890-1962) պատվին, ով այն ակտիվորեն օգտագործել է իր աշխատություններում։
Ֆիշերի բաշխումն օգտագործվում է ռեգրեսիոն վերլուծության, շեղումների հավասարության և կիրառական վիճակագրության այլ խնդիրներում մոդելի համարժեքության մասին վարկածները ստուգելիս:
Chi-square, Student և Fisher բաշխման ֆունկցիաների արտահայտությունները, դրանց խտությունները և բնութագրերը, ինչպես նաև դրանց գործնական օգտագործման համար անհրաժեշտ աղյուսակները կարելի է գտնել մասնագիտացված գրականության մեջ (տե՛ս, օրինակ,):
23. Chi-square-ի և Student-ի բաշխման հայեցակարգը և գրաֆիկական տեսքը
1) n ազատության աստիճանով բաշխումը (chi-square) n անկախ ստանդարտ նորմալ պատահական փոփոխականների քառակուսիների գումարի բաշխումն է։
Բաշխում (chi-square)- պատահական փոփոխականի բաշխում (և դրանցից յուրաքանչյուրի մաթեմատիկական ակնկալիքը 0 է, իսկ ստանդարտ շեղումը 1)
որտեղ են պատահական փոփոխականները անկախ են և ունեն նույն բաշխումը։ Այս դեպքում տերմինների քանակը, այսինքն. , կոչվում է «chi-square» բաշխման «ազատության աստիճանների թիվը»։ Խի քառակուսի թիվը որոշվում է մեկ պարամետրով՝ ազատության աստիճանների քանակով։ Քանի որ ազատության աստիճանների թիվը մեծանում է, բաշխումը դանդաղորեն մոտենում է նորմալին:
Այնուհետեւ նրանց քառակուսիների գումարը
պատահական փոփոխական է, որը բաշխված է այսպես կոչված chi-square օրենքի համաձայն՝ k = n ազատության աստիճաններով; եթե տերմինները կապված են ինչ-որ առնչությամբ (օրինակ՝ ), ապա ազատության աստիճանների թիվը k = n – 1։
Այս բաշխման խտությունը
Ահա գամմա ֆունկցիան. մասնավորապես Г(n + 1) = n! .
Հետեւաբար, chi-square-ի բաշխումը որոշվում է մեկ պարամետրով՝ ազատության աստիճանների քանակով k.
Դիտողություն 1. Ազատության աստիճանների քանակի ավելացման հետ chi-square-ի բաշխումը աստիճանաբար մոտենում է նորմալին:
Դիտողություն 2. Օգտագործելով chi-square բաշխումը, որոշվում են պրակտիկայում հանդիպող բազմաթիվ այլ բաշխումներ, օրինակ՝ պատահական փոփոխականի բաշխումը՝ պատահական վեկտորի երկարությունը (X1, X2,..., Xn), կոորդինատները. որոնք անկախ են և բաշխված են սովորական օրենքի համաձայն։
χ2 բաշխումն առաջին անգամ դիտարկվել է Ռ. Հելմերտի (1876) և Կ. Փիրսոնի (1900 թ.) կողմից։
Math.expect.=n; D=2n
2) Ուսանողների բաշխում
Դիտարկենք երկու անկախ պատահական փոփոխական. ազատության աստիճաններ. Հետո արժեքը
ունի բաշխում, որը կոչվում է t-բաշխում կամ Student բաշխում՝ k ազատության աստիճաններով: Այս դեպքում k-ն կոչվում է Student բաշխման «ազատության աստիճանների թիվը»:
Քանի որ ազատության աստիճանների թիվը մեծանում է, Ուսանողների բաշխումն արագորեն մոտենում է նորմալին:
Այս բաշխումը ներդրվել է 1908 թվականին անգլիացի վիճակագիր Վ.Գոսեթի կողմից, ով աշխատում էր գարեջրի գործարանում։ Այս գործարանում տնտեսական և տեխնիկական որոշումներ կայացնելու համար օգտագործվել են հավանական և վիճակագրական մեթոդներ, ուստի նրա ղեկավարությունն արգելել է Վ.Գոսեթին գիտական հոդվածներ հրատարակել իր անունով։ Այս կերպ պաշտպանվել են Վ.Գոսեթի կողմից մշակված հավանականական և վիճակագրական մեթոդների տեսքով առևտրային գաղտնիքները և «նոու-հաուն»։ Սակայն նա հնարավորություն ունեցավ հրատարակել «Ուսանող» կեղծանունով։ Gosset-Student-ի պատմությունը ցույց է տալիս, որ նույնիսկ հարյուր տարի առաջ Մեծ Բրիտանիայի ղեկավարները տեղյակ էին որոշումների կայացման հավանականական և վիճակագրական մեթոդների ավելի մեծ տնտեսական արդյունավետության մասին: