Տվյալների խմբավորում և բաշխման շարքի կառուցում: Տատանումների շարքերի վիճակագրական ուսումնասիրություն և միջին արժեքների հաշվարկ Ինչպես գտնել վիճակագրության տատանումների շարքը

Վիճակը:

Աշխատողների տարիքային կազմի վերաբերյալ տվյալներ կան (տարիներ)՝ 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28։ , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29:

    1. Կառուցեք ինտերվալային բաշխման շարք:
    2. Կառուցեք շարքի գրաֆիկական պատկերը:
    3. Գրաֆիկորեն որոշեք ռեժիմը և մեդիանը:

Լուծում:

1) Ըստ Սթարջեսի բանաձևի, բնակչությունը պետք է բաժանվի 1 + 3,322 լգ 30 = 6 խմբերի:

Առավելագույն տարիքը՝ 38, նվազագույնը՝ 18։

Ինտերվալի լայնությունը Քանի որ ինտերվալների ծայրերը պետք է լինեն ամբողջ թվեր, մենք պոպուլյացիան բաժանում ենք 5 խմբի։ Ինտերվալի լայնությունը - 4:

Հաշվարկները հեշտացնելու համար մենք տվյալները կդասավորենք աճման կարգով՝ 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29, 29, 30, 30, 31, 32, 32, 33, 34, 35, 38, 38:

Աշխատողների տարիքային բաշխում

Գրաֆիկորեն, շարքը կարող է պատկերվել որպես հիստոգրամ կամ պոլիգոն: Հիստոգրամ - գծապատկեր: Սյունակի հիմքը միջակայքի լայնությունն է: Սյունակի բարձրությունը հավասար է հաճախականությանը:

Բազմանկյուն (կամ բաշխման բազմանկյուն) - հաճախականության գրաֆիկ: Հիստոգրամի միջոցով այն կառուցելու համար մենք միացնում ենք ուղղանկյունների վերին կողմերի միջնակետերը: Մենք փակում ենք Ox առանցքի բազմանկյունը ծայրահեղ x արժեքների միջակայքի կեսին հավասար հեռավորությունների վրա:

Ռեժիմը (Mo) ուսումնասիրվող հատկանիշի արժեքն է, որն առավել հաճախ հանդիպում է տվյալ պոպուլյացիայի մեջ:

Հիստոգրամից ռեժիմը որոշելու համար անհրաժեշտ է ընտրել ամենաբարձր ուղղանկյունը, այս ուղղանկյան աջ գագաթից գիծ գծել նախորդ ուղղանկյան վերին աջ անկյունը, իսկ մոդալ ուղղանկյան ձախ գագաթից գծել գիծ դեպի Հաջորդ ուղղանկյան ձախ գագաթը: Այս ուղիղների հատման կետից գծեք x-ի առանցքին ուղղահայաց: The abscissa կլինի նորաձեւություն. Mo ≈ 27,5: Սա նշանակում է, որ այս բնակչության մեջ ամենատարածված տարիքը 27-28 տարեկանն է։

Միջին (Me)-ը ուսումնասիրվող հատկանիշի արժեքն է, որը գտնվում է դասավորված տատանումների շարքի մեջտեղում:

Մենք գտնում ենք մեդիանը՝ օգտագործելով կուտակումը: Կուտակում - կուտակված հաճախականությունների գրաֆիկ: Աբսցիսները շարքի տարբերակներ են։ Օրդինատները կուտակված հաճախականություններ են:

Կուտակման վրա մեդիանը որոշելու համար մենք գտնում ենք օրդինատների առանցքի երկայնքով կետ, որը համապատասխանում է կուտակված հաճախականությունների 50%-ին (մեր դեպքում՝ 15), դրա միջով ուղիղ գիծ գծում ենք Ox-ի առանցքին զուգահեռ և այն կետից. դրա հատումը կուտակման հետ, ուղղահայաց նկարեք x առանցքին: Abscissa-ն միջինն է: Ես ≈ 25.9. Սա նշանակում է, որ այս բնակչության աշխատողների կեսը 26 տարեկանից ցածր է։

Վիճակագրական տերմինների բառարան

Ընդհանուր վիճակագրության հարցեր

Ի՞ՆՉ Է ԲԺՇԿԱԿԱՆ ՎԻՃԱԿԱԳՐՈՒԹՅՈՒՆԸ:

Վիճակագրությունը իրադարձությունների, երևույթների, առարկաների քանակական նկարագրությունն ու չափումն է։ Այն հասկացվում է որպես գործնական գործունեության ճյուղ (զանգվածային երևույթների վերաբերյալ տվյալների հավաքում, մշակում և վերլուծություն), որպես գիտելիքի ճյուղ, այսինքն. հատուկ գիտական ​​կարգապահությունև, որպես ամփոփ, վերջնական թվային ցուցիչների հավաքածու՝ հավաքագրված սոցիալական երևույթների ցանկացած բնագավառ բնութագրելու համար:

Վիճակագրությունը գիտություն է, որն ուսումնասիրում է զանգվածային երևույթների օրինաչափությունները՝ օգտագործելով ցուցանիշների ընդհանրացման մեթոդը։

Բժշկական վիճակագրություն՝ անկախ հասարակագիտություն, սովորելով զանգվածային սոցիալական երևույթների քանակական կողմըանքակտելիորեն կապված են դրանց որակական կողմի հետ՝ թույլ տալով ցուցանիշների ընդհանրացման մեթոդուսումնասիրել այս երևույթների օրինաչափությունները, տնտեսական կարևորագույն գործընթացները, սոցիալական կյանքըհասարակությունը, նրա առողջությունը, բնակչությանը բուժօգնության կազմակերպման համակարգը։

Վիճակագրական մեթոդները զանգվածային դիտողական նյութերի մշակման տեխնիկայի մի շարք են, որոնք ներառում են՝ խմբավորում, ամփոփում, ցուցիչների ստացում, դրանց վիճակագրական վերլուծություն և այլն։

Բժշկության մեջ վիճակագրական մեթոդներն օգտագործվում են.

  1. վիճակի ուսումնասիրություն հանրային առողջությունԲնակչությունը որպես ամբողջություն և նրա հիմնական խմբերը՝ հավաքելով և վերլուծելով վիճակագրական տվյալներ բնակչության թվի և կազմի, նրա վերարտադրության վերաբերյալ, ֆիզիկական զարգացում, տարբեր հիվանդությունների տարածվածությունը և տևողությունը և այլն;
  2. կապերի նույնականացում և հաստատում ընդհանուր մակարդակհիվանդացություն և մահացություն ցանկացած առանձին հիվանդություններից տարբեր գործոններով միջավայրը;
  3. բժշկական հաստատությունների ցանցի, դրանց գործունեության և անձնակազմի վերաբերյալ թվային տվյալների հավաքագրում և ուսումնասիրություն՝ առողջապահական գործունեության պլանավորման, ցանցի զարգացման պլանների և առողջապահական հաստատությունների գործունեության մոնիտորինգի և առանձին բժշկական հաստատությունների աշխատանքի որակի գնահատման համար.
  4. հիվանդությունների կանխարգելման և բուժման միջոցառումների արդյունավետության գնահատում.
  5. հետազոտությունների արդյունքների վիճակագրական նշանակության որոշումը կլինիկայում և փորձարարությունում:

Բժշկական վիճակագրության բաժիններ.

  • ընդհանուր տեսական և մեթոդական հիմքերըվիճակագրություն,
  • բնակչության առողջության վիճակագրություն,
  • առողջապահական վիճակագրություն.

ՏՎՅԱԼՆԵՐԻ ԲԱԶԱՆԻ ՍՏԵՂԾՈՒՄ MS EXCEL-ում

Որպեսզի տվյալների բազան հարմար լինի հետագա մշակման համար, պետք է հետևել պարզ սկզբունքներին.

1) Տվյալների բազա ստեղծելու օպտիմալ ծրագիրը MS Excel-ն է: Excel-ի տվյալները հետագայում հեշտությամբ կարող են փոխանցվել այլ մասնագիտացված վիճակագրական փաթեթներ, ինչպիսիք են Statistica, SPSS և այլն՝ ավելի բարդ մանիպուլյացիաների համար: Այնուամենայնիվ, հաշվարկների մինչև 80-90%-ը կարող է հարմար կերպով իրականացվել հենց Excel-ում՝ օգտագործելով Տվյալների վերլուծության հավելումը:

2) Տվյալների բազայի հետ աղյուսակի վերին տողը ձևավորվում է որպես վերնագիր, որտեղ մուտքագրվում են այն ցուցանիշների անվանումները, որոնք հաշվի են առնվել այս սյունակում: Անցանկալի է օգտագործել բջիջների միաձուլումը (այս պահանջը հիմնականում վերաբերում է տվյալների ամբողջ տվյալներին), քանի որ դա շատ գործողություններ կդարձնի անվավեր: Նաև չպետք է ստեղծեք «երկհարկանի» վերնագիր, որում վերին տողում նշվում է միատարր ցուցիչների խմբի անվանումը, իսկ ներքևի տողում նշվում են հատուկ ցուցանիշներ: Միատարր ցուցանիշները խմբավորելու համար ավելի լավ է դրանք նշել մեկ գունավոր լցոնով կամ իրենց անվան մեջ ներառել խմբավորման հատկանիշը փակագծերում:

Օրինակ, ոչ այսպես.

ԱՐՅԱՆ ԸՆԴՀԱՆՈՒՐ ԹԵՍՏ
ԷՐ LEU TR
ER (UAC) LEU (UAC) TR (UAC)

Վերջին տարբերակում ապահովված է և՛ «մեկ պատմություն» վերնագիրը, և՛ տվյալների տեսողական միատարրությունը (բոլորը վերաբերում են UAC ցուցանիշներին):

3) Առաջին սյունակը պետք է պարունակի հիվանդի սերիական համարը այս տվյալների բազայում՝ առանց այն կապելու ուսումնասիրվող ցուցիչներից որևէ մեկին: Սա թույլ կտա ձեզ հետագայում ապահովել հիվանդների սկզբնական կարգի հեշտ վերադարձը ցանկացած փուլում, նույնիսկ ցուցակի բազմաթիվ տեսակավորումներից հետո:

4) Երկրորդ սյունակը սովորաբար լրացվում է հիվանդների ազգանուններով (կամ լրիվ անուններով):

5) քանակական ցուցանիշները (նրանք, որոնք չափվում են թվերով, օրինակ՝ հասակ, քաշ, զարկերակային ճնշում, զարկերակ և այլն) թվային ձևաչափով մուտքագրվում են աղյուսակ. Թվում է, թե դա արդեն պարզ է, բայց պետք է հիշել, որ Excel-ում, սկսած 2007-ի տարբերակից, կոտորակային արժեքները նշվում են կետով՝ 4.5: Եթե ​​դուք գրում եք ստորակետով առանձնացված թիվ, այն կընկալվի որպես տեքստ, և այս սյունակները պետք է վերաշարադրվեն:

6) Ավելի դժվար է որակական ցուցանիշներով: Դրանցից նրանք, որոնք ունեն իմաստի երկու տարբերակ (այսպես կոչված երկուական արժեքներ. Այո-Ոչ, Ներկա-Բացակայող, Արական-Իգական), ավելի լավ է թարգմանել. երկուական համակարգ 0 և 1: 1 արժեքը սովորաբար վերագրվում է դրական արժեքի (Այո, ներկա), 0՝ բացասական արժեքի (Ոչ, բացակայում է):

7) Որակական ցուցանիշները, որոնք ունեն մի քանի արժեքներ, տարբերվում են սրությամբ, երևույթի մակարդակով (Թույլ-Միջին-Ուժեղ; Սառը-Տաք-Տաք) կարելի է դասակարգել և, համապատասխանաբար, նաև թարգմանել թվերի։ Երևույթի ամենացածր մակարդակին նշանակվում է ամենացածր աստիճանը՝ 0 կամ 1, հաջորդ աստիճանները նշված են ըստ շարքերի արժեքների։ Օրինակ՝ հիվանդություն չկա՝ 0, թեթև ծանրությունը՝ 1, միջին աստիճան- 2, ծանր - 3:

8) Երբեմն մի քանի արժեքներ համապատասխանում են մեկ որակի ցուցանիշին: Օրինակ՝ «Համատեղ ախտորոշում» սյունակում, եթե կան մի քանի հիվանդություններ, մենք ցանկանում ենք նշել դրանք՝ բաժանված ստորակետերով։ Դա չպետք է արվի, քանի որ նման տվյալների մշակումը շատ դժվար է և չի կարող ավտոմատացվել: Հետևաբար, ավելի լավ է մի քանի սյունակներ պատրաստել հիվանդությունների հատուկ խմբերով («սրտանոթային համակարգի հիվանդություններ», «ստամոքս-աղիքային տրակտի հիվանդություններ» և այլն) կամ որոշակի նոզոլոգիաներով («քրոնիկ գաստրիտ», «IHD» և այլն): , որտեղ մենք տվյալները մուտքագրում ենք երկուական, երկուական ձևով՝ 1 (որը նշանակում է «Այս հիվանդությունը գոյություն ունի») - 0 («Այս հիվանդությունը գոյություն չունի»):

9) Ցուցանիշների առանձին խմբերը տարբերելու համար կարող եք ակտիվորեն օգտագործել գույնը. օրինակ, UAC ցուցիչներով սյունակները ընդգծված են կարմիրով, OAM-ի տվյալները դեղինով և այլն:

10) Յուրաքանչյուր հիվանդ պետք է համապատասխանի աղյուսակի մեկ տողին:

Տվյալների բազայի նման ձևավորումը թույլ է տալիս ոչ միայն զգալիորեն պարզեցնել դրա վիճակագրական մշակման գործընթացը, այլև հեշտացնել դրա ավարտը նյութի հավաքագրման փուլում:

ՈՐ ՄԵԹՈԴ ԸՆՏՐԵԼ ՎԻՃԱԿԱԳՐԱԿԱՆ ՎԵՐԼՈՒԾՈՒԹՅԱՆ ՀԱՄԱՐ:

Բոլոր տվյալների հավաքագրումից հետո յուրաքանչյուր հետազոտողի առաջ կանգնած է վիճակագրական մշակման ամենահարմար մեթոդի ընտրության հարցը: Եվ դա զարմանալի չէ. ժամանակակից վիճակագրությունը միավորում է հսկայական թվով տարբեր չափանիշներ և մեթոդներ: Նրանք բոլորն ունեն իրենց առանձնահատկությունները և կարող են հարմար լինել կամ չլինել երկու թվացյալ նման իրավիճակների համար: Այս հոդվածում մենք կփորձենք համակարգել բոլոր հիմնական, ամենատարածված մեթոդները վիճակագրական վերլուծությունըստ իրենց նպատակի.

Այնուամենայնիվ, նախ մի քանի խոսք այն մասին, թե ինչպիսի վիճակագրական տվյալներ կան, քանի որ հենց դա է որոշում վերլուծության ամենահարմար մեթոդի ընտրությունը:

Չափման սանդղակ

Ուսումնասիրություն կատարելիս որոշվում են յուրաքանչյուր դիտարկման միավորի արժեքները տարբեր նշաններ. Կախված այն մասշտաբից, որի վրա դրանք չափվում են, բոլոր նշանները բաժանվում են քանակականԵվ որակ. Ուսումնասիրություններում որակական ցուցանիշները բաշխվում են ըստ այսպես կոչված անվանականսանդղակ. Բացի այդ, ցուցանիշները կարող են ներկայացվել ըստ կոչումսանդղակ.

Օրինակ, համեմատություն է արվում մարզիկների և նստակյաց կենսակերպ վարող մարդկանց սրտի աշխատանքի վերաբերյալ:

Այս դեպքում առարկաների մոտ որոշվել են հետևյալ նշանները.

  • հարկ- է անվանականցուցանիշ, որը վերցնում է երկու արժեք՝ արական կամ իգական:
  • տարիքը - քանակականցուցիչ,
  • սպորտային - անվանականցուցիչ, որն ունի երկու նշանակություն՝ ներգրավված կամ չզբաղված,
  • սրտի հաճախությունը - քանակականցուցիչ,
  • սիստոլիկ արյան ճնշումը - քանակականցուցիչ,
  • կրծքավանդակի ցավի բողոքների առկայությունը- է բարձր որակցուցիչ, որի արժեքները կարող են որոշվել ինչպես անվանական(բողոքներ կան - բողոքներ չկան), և ըստ կոչումսանդղակ՝ կախված հաճախականությունից (օրինակ, եթե ցավն առաջանում է օրական մի քանի անգամ, ցուցիչին տրվում է 3 աստիճան, ամիսը մի քանի անգամ՝ 2, տարին մի քանի անգամ՝ 1, եթե կրծքավանդակի ցավից բողոքներ չկան, 0 աստիճան։ նշանակված է):

Համեմատված պոպուլյացիաների թիվը

Հաջորդ խնդիրը, որը պետք է լուծվի վիճակագրական մեթոդ ընտրելիս, ուսումնասիրության շրջանակներում համեմատվող պոպուլյացիաների քանակն է:

  • Շատ դեպքերում, կլինիկական փորձարկումներում մենք գործ ունենք հիվանդների երկու խմբի հետ. հիմնականԵվ վերահսկողություն. Հիմնական, կամ փորձառու, ընդհանուր առմամբ համարվում է այն խումբը, որտեղ կիրառվել է ուսումնասիրվող ախտորոշման կամ բուժման մեթոդը, կամ որտեղ հիվանդները տառապում են այս հետազոտության առարկա հանդիսացող հիվանդությամբ։ ՓորձարկումԽումբը, ի տարբերություն, բաղկացած է հիվանդներից, ովքեր ստանում են սովորական խնամք, պլացեբո կամ նրանք, ովքեր չունեն ուսումնասիրվող հիվանդություն: Նման պոպուլյացիաները, որոնք ներկայացված են տարբեր հիվանդների կողմից, կոչվում են անկապ.
    Դեռ կան կապված, կամ կրկնապատկվում է, ագրեգատներ, երբ մենք խոսում ենք նույն մարդկանց մասին, բայց ստացված որոշ բնութագրերի արժեքները համեմատվում են. առաջ և հետոհետազոտություն. Համեմատվող պոպուլյացիաների թիվը նույնպես հավասար է 2-ի, սակայն նրանց նկատմամբ կիրառվում են տարբեր տեխնիկա, քան անկապների համար:
  • Մեկ այլ տարբերակ նկարագրելն է մեկամբողջություն, որը, պետք է խոստովանել, ընդհանուր առմամբ ընկած է ցանկացած հետազոտության հիմքում։ Նույնիսկ եթե աշխատանքի հիմնական նպատակը երկու կամ ավելի խմբերի համեմատությունն է, նախ պետք է բնութագրել նրանցից յուրաքանչյուրը: Դրա համար օգտագործվող մեթոդները նկարագրական վիճակագրություն. Բացի այդ, մեկ պոպուլյացիայի համար կարող են կիրառվել մեթոդներ հարաբերակցության վերլուծություն , օգտագործվում է ուսումնասիրվող երկու կամ ավելի բնութագրերի միջև կապ գտնելու համար (օրինակ՝ հասակի կախվածությունը մարմնի քաշից կամ սրտի զարկերի կախվածությունը մարմնի ջերմաստիճանից):
  • Վերջապես, կարող են լինել մի քանի պոպուլյացիա, որոնք համեմատվում են: Սա շատ տարածված է բժշկական հետազոտություններում: Հիվանդները կարող են խմբավորվել՝ կախված տարբեր դեղամիջոցների օգտագործումից (օրինակ՝ հակահիպերտոնիկ դեղամիջոցների արդյունավետությունը համեմատելիս՝ 1-ին խումբ՝ ACE ինհիբիտորներ, 2՝ բետա-բլոկլերներ, 3՝ կենտրոնական գործող դեղամիջոցներ), ըստ հիվանդության ծանրության ( խումբ 1 - մեղմ, 2 - միջին, 3 - ծանր) և այլն:

Կարևոր է նաև հարցնել բաշխման նորմալությունըուսումնասիրվող պոպուլյացիաները. Սա որոշում է, թե արդյոք մեթոդները կարող են կիրառվել պարամետրային վերլուծությունկամ պարզապես ոչ պարամետրիկ. Պայմանները, որոնք պետք է պահպանվեն նորմալ բաշխված պոպուլյացիաներում, հետևյալն են.

  1. թվաբանական միջինի, եղանակի և միջինի արժեքների առավելագույն հարևանություն կամ հավասարություն.
  2. «Երեք սիգմա» կանոնին համապատասխանելը (առնվազն 68,3% տարբերակները գտնվում են M±1σ միջակայքում, առնվազն 95,5% տարբերակները գտնվում են M±2σ միջակայքում, առնվազն 99,7% տարբերակները գտնվում են M±3σ միջակայքում;
  3. ցուցանիշները չափվում են քանակական մասշտաբով.
  4. Բաշխման նորմալության թեստավորման դրական արդյունքներ՝ օգտագործելով հատուկ չափանիշներ՝ Կոլմոգորով-Սմիրնով կամ Շապիրո-Վիլք:

Ուսումնասիրվող պոպուլյացիաների համար մեր նշած բոլոր բնութագրերը որոշելուց հետո առաջարկում ենք օգտագործել հետևյալ աղյուսակը՝ վիճակագրական վերլուծության առավել օպտիմալ մեթոդը ընտրելու համար:

Մեթոդ Ցուցանիշի չափման սանդղակ Համեմատված պոպուլյացիաների թիվը Մշակման նպատակը Տվյալների բաշխում
Ուսանողի t-test քանակական 2 նորմալ
Ուսանողի t-թեստ Բոնֆերոնի ուղղումով քանակական 3 կամ ավելի ոչ մի համեմատություն հարակից հավաքածուներ նորմալ
Զուգակցված ուսանողի t-թեստ քանակական 2 նորմալ
Միակողմանի շեղումների վերլուծություն (ANOVA) քանակական 3 կամ ավելի անկապ բնակչության համեմատություն նորմալ
Միակողմանի շեղումների վերլուծություն (ANOVA) կրկնվող չափումներով քանակական 3 կամ ավելի հարակից պոպուլյացիաների համեմատություն նորմալ
Mann-Whitney U թեստ քանակական, դասակարգման 2 անկապ բնակչության համեմատություն ցանկացած
Ռոզենբաումի Q թեստ քանակական, դասակարգման 2 անկապ բնակչության համեմատություն ցանկացած
Կրուսկալ-Ուալիսի թեստ քանակական 3 կամ ավելի անկապ բնակչության համեմատություն ցանկացած
Wilcoxon թեստ քանակական, դասակարգման 2 հարակից պոպուլյացիաների համեմատություն ցանկացած
G- նշանի թեստ քանակական, դասակարգման 2 հարակից պոպուլյացիաների համեմատություն ցանկացած
Ֆրիդմանի չափանիշ քանակական, դասակարգման 3 կամ ավելի հարակից պոպուլյացիաների համեմատություն ցանկացած
Պիրսոնի χ2 թեստ անվանական 2 կամ ավելի անկապ բնակչության համեմատություն ցանկացած
Ֆիշերի ճշգրիտ թեստը անվանական 2 անկապ բնակչության համեմատություն ցանկացած
McNemar թեստ անվանական 2 հարակից պոպուլյացիաների համեմատություն ցանկացած
Կոքրանի Q թեստ անվանական 3 կամ ավելի հարակից պոպուլյացիաների համեմատություն ցանկացած
Հարաբերական ռիսկ (Ռիսկի հարաբերակցություն, RR) անվանական 2 անկապ պոպուլյացիաների համեմատությունը կոհորտային հետազոտություններում ցանկացած
Հնարավորությունների հարաբերակցություն (OR) անվանական 2 անկապ պոպուլյացիաների համեմատությունը դեպքերի վերահսկման ուսումնասիրություններում ցանկացած
Պիրսոնի հարաբերակցության գործակիցը քանակական Չափումների 2 շարք նորմալ
Սփիրմանի աստիճանի հարաբերակցության գործակիցը քանակական, դասակարգման Չափումների 2 շարք նշանների միջև կապերի բացահայտում ցանկացած
Քենդալի հարաբերակցության գործակիցը քանակական, դասակարգման Չափումների 2 շարք նշանների միջև կապերի բացահայտում ցանկացած
Քենդալի համապատասխանության գործակիցը քանակական, դասակարգման Չափումների 3 կամ ավելի տող նշանների միջև կապերի բացահայտում ցանկացած
Միջին արժեքների (M) և միջին սխալների (մ) հաշվարկ քանակական 1 նկարագրական վիճակագրություն ցանկացած
Միջինների (Me) և տոկոսների (քառորդիլների) հաշվարկ կոչում 1 նկարագրական վիճակագրություն ցանկացած
Հարաբերական արժեքների (P) և միջին սխալների (մ) հաշվարկ անվանական 1 նկարագրական վիճակագրություն ցանկացած
Shapiro-Wilk թեստ քանակական 1 բաշխման վերլուծություն ցանկացած
Կոլմոգորով-Սմիրնով չափանիշ քանակական 1 բաշխման վերլուծություն ցանկացած
Սմիրնով-Կրամեր-ֆոն Միզեսի չափանիշ ω 2 քանակական 1 բաշխման վերլուծություն ցանկացած
Կապլան-Մայերի մեթոդ ցանկացած 1 գոյատևման վերլուծություն ցանկացած
Քոքսի համաչափ վտանգի մոդելը ցանկացած 1 գոյատևման վերլուծություն ցանկացած

Մեծ վիճակագիրներ

Կարլ Փիրսոն (մարտի 27, 1857 - ապրիլի 27, 1936)

1857 թվականի մարտի 27-ին ծնվել է անգլիացի մեծ մաթեմատիկոս, վիճակագիր, կենսաբան և փիլիսոփա Կարլ Փիրսոնը; հիմնադիր մաթեմատիկական վիճակագրություն, կենսաչափության հիմնադիրներից։

27 տարեկանում ստանալով պրոֆեսորի պաշտոն կիրառական մաթեմատիկաԼոնդոնի համալսարանական քոլեջում Կառլ Փիրսոնը սկսեց ուսումնասիրել վիճակագրությունը, որը նա ընկալեց որպես ընդհանուր գիտական ​​գործիք, որը համապատասխանում էր ուսանողներին լայն հայացքներ տրամադրելու անհրաժեշտության մասին իր բոլորովին ոչ ընդհանուր ընդունված մտքերին:

Վիճակագրության ոլորտում Պիրսոնի հիմնական ձեռքբերումները ներառում են բնութագրերի հարաբերակցության և պատահականության տեսության հիմքերի մշակումը, էմպիրիկ բաշխումները նկարագրելու համար «Պիրսոնի կորերի» ներդրումը և չափազանց կարևոր «խի քառակուսի» չափանիշը, ինչպես նաև մեծ թվով վիճակագրական աղյուսակներ։ Փիրսոնը կիրառեց վիճակագրական մեթոդը և հատկապես հարաբերակցության տեսությունը գիտության շատ ճյուղերում։

Ահա նրա հայտարարություններից մեկը. «Մոդեռնի առաջին սիրողական ներդրումը վիճակագրական մեթոդներՀաստատված գիտությանը բնորոշ արհամարհանքով են ընդունում։ Բայց ես ապրեցի այն ժամանակները, երբ նրանցից շատերը սկսեցին թաքուն կիրառել հենց այն մեթոդները, որոնք նրանք ի սկզբանե դատապարտում էին»:

Եվ արդեն 1920 թվականին Փիրսոնը գրություն է գրել, որում նա նշում է, որ կենսաչափական դպրոցի նպատակն է «վիճակագրությունը վերածել կիրառական մաթեմատիկայի ճյուղի, ընդհանրացնել, մերժել կամ արդարացնել քաղաքական և սոցիալական վիճակագիրների հին դպրոցի սուղ մեթոդները։ , և, ընդհանրապես, վիճակագրությունը խաղադաշտից վերածել գիտության լուրջ ճյուղի սիրողականների և բանավիճողների: Անհրաժեշտ էր քննադատել անկատար և հաճախ սխալ մեթոդները բժշկության, մարդաբանության, գանգագիտության, հոգեբանության, քրեագիտության, կենսաբանության, սոցիոլոգիայի մեջ: այս գիտություններին նոր և ավելի հզոր միջոցներով ապահովելու համար Ճակատամարտը տևեց գրեթե քսան տարի, բայց շատ նշաններ հայտնվեցին, որ հին ռազմական գործողությունները ետևում մնացին, և նոր մեթոդները համընդհանուր ընդունված էին:

Կառլ Փիրսոնը ուներ շատ բազմազան հետաքրքրություններ. նա ֆիզիկա էր սովորում Հայդելբերգում, հետաքրքրվում էր կրոնի սոցիալական և տնտեսական դերով և նույնիսկ դասախոսություններ էր կարդացել Գերմանիայի պատմության և գրականության մասին Քեմբրիջում և Լոնդոնում:

Քիչ հայտնի փաստն այն է, որ 28 տարեկանում Կարլ Փիրսոնը դասախոսություններ է կարդացել «կանանց հարցի» վերաբերյալ և նույնիսկ հիմնել է Տղամարդկանց և Կանանց ակումբը, որը գոյություն է ունեցել մինչև 1889 թվականը, որտեղ կանանց հետ կապված ամեն ինչ, ներառյալ սեռերի միջև հարաբերությունները, եղել է։ ազատ և անսահմանափակ քննարկում:

Ակումբը բաղկացած էր հավասար թվով տղամարդկանցից և կանանցից, հիմնականում միջին դասի լիբերալներ, սոցիալիստներ և ֆեմինիստներ։

Ակումբի քննարկումների թեման եղել է հարցերի լայն շրջանակ՝ հին հունական Աթենքում սեռական հարաբերություններից մինչև բուդդայական միանձնուհիների վիճակը, ամուսնության նկատմամբ վերաբերմունքից մինչև մարմնավաճառության խնդիրներ։ Ըստ էության, Տղամարդկանց և Կանանց Ակումբը վիճարկեց կին-տղամարդ փոխգործակցության վաղուց հաստատված նորմերը, ինչպես նաև «պատշաճ» սեռականության մասին գաղափարները: Վիկտորիանական Անգլիայում, որտեղ սեքսուալությունը շատերի կողմից դիտվում էր որպես «հիմք» և «կենդանական», իսկ սեռական դաստիարակության մասին անտեղյակությունը տարածված էր, նման հարցերի քննարկումն իսկապես արմատական ​​էր:

1898 թվականին Թագավորական միության կողմից Փիրսոնը պարգևատրվեց Դարվինի մեդալով, որը նա հրաժարվեց՝ համարելով, որ մրցանակները «պետք է տրվեն երիտասարդներին՝ նրանց խրախուսելու համար»։

Ֆլորենս Նայթինգեյլ (12 մայիսի 1820 - 13 օգոստոսի 1910)

Ֆլորենս Նայթինգեյլ (1820-1910) - բուժքույր և հասարակական գործիչ Մեծ Բրիտանիայում, ում ծննդյան օրը մենք այսօր նշում ենք բուժքույրերի միջազգային օրը։

Նա ծնվել է Ֆլորենցիայում՝ հարուստ արիստոկրատական ​​ընտանիքում, ստացել է գերազանց կրթություն և գիտեր վեց լեզու։ ՀԵՏ երիտասարդություներազում էր դառնալ ողորմության քույր, 1853-ին նա բուժքույրական կրթություն ստացավ Կայզերվերթում գտնվող հովիվ Ֆլենդերի քույրերի համայնքում և դարձավ Լոնդոնի փոքրիկ մասնավոր հիվանդանոցի մենեջեր:

1854-ի հոկտեմբերին, ընթացքում Ղրիմի պատերազմ, Ֆլորենցիան 38 օգնականների հետ միասին գնաց Ղրիմի դաշտային հիվանդանոցներ։ Վիրավորների խնամքը կազմակերպելիս նա հետևողականորեն պահպանել է սանիտարական և հիգիենայի սկզբունքները։ Արդյունքում, վեց ամսից պակաս ժամանակում հիվանդանոցներում մահացությունը 42-ից նվազել է մինչև 2,2%:

Բանակում բժշկական ծառայությունը բարեփոխելու խնդիր դնելով՝ Նայթինգեյլը հոգացել է, որ հիվանդանոցները հագեցած լինեն օդափոխության և կոյուղու համակարգերով. հիվանդանոցի անձնակազմը պետք է ենթարկվեր անհրաժեշտ նախապատրաստություն. Կազմակերպվել է ռազմաբժշկական ուսումնարան, զինվորների և սպաների միջև բացատրական աշխատանք է տարվել հիվանդությունների կանխարգելման կարևորության վերաբերյալ։

Ֆլորենս Նայթինգեյլի մեծ ներդրումը բժշկական վիճակագրության մեջ:

  • Նրա 800 էջանոց գիրքը Բրիտանական բանակի հիվանդանոցների առողջության, արդյունավետության և կառավարման վրա ազդող գործոնների մասին նշումներ (1858) պարունակում էր մի ամբողջ բաժին՝ նվիրված վիճակագրությանը և պատկերազարդված դիագրամներով:
  • Նայթինգեյլը վիճակագրության մեջ գրաֆիկական պատկերների օգտագործման նորարար էր։ Նա հորինել է կարկանդակ գծապատկերներ, որոնք նա անվանել է «աքլորի սանր» և օգտագործել մահացության կառուցվածքը նկարագրելու համար: Նրա գծապատկերներից շատերը ներառվել են բանակում առողջապահական հիմնախնդիրների հանձնաժողովի զեկույցում, ինչը հանգեցրել է բանակային բժշկության բարեփոխման որոշմանը։
  • Նա մշակել է հիվանդանոցներում վիճակագրության հավաքագրման առաջին ձևը, որը հիվանդանոցային գործունեության վերաբերյալ ժամանակակից հաշվետվությունների ձևերի նախորդն է:

1859 թվականին նա ընտրվեց Թագավորական վիճակագրական ընկերության անդամ և այնուհետև դարձավ Ամերիկյան վիճակագրական ասոցիացիայի պատվավոր անդամ:

Յոհան Կարլ Ֆրիդրիխ Գաուս (ապրիլի 30, 1777 - փետրվարի 23, 1855)

1777 թվականի ապրիլի 30-ին Բրաունշվեյգ քաղաքում ծնվել է գերմանացի մեծ մաթեմատիկոս, մեխանիկ, ֆիզիկոս, աստղագետ, չափագրող և վիճակագիր Յոհան Կարլ Ֆրիդրիխ Գաուսը։

Նա համարվում է բոլոր ժամանակների մեծագույն մաթեմատիկոսներից մեկը՝ «Մաթեմատիկոսների արքան»։ Քոփլիի մեդալի դափնեկիր (1838), Շվեդիայի (1821) և Ռուսաստանի (1824) գիտությունների ակադեմիաների և Անգլիայի թագավորական ընկերության արտասահմանյան անդամ։

Արդեն երեք տարեկանում Կառլը կարող էր կարդալ և գրել, նույնիսկ ուղղելով հոր հաշվարկի սխալները: Ըստ լեգենդի՝ դպրոցի մաթեմատիկայի ուսուցիչը երեխաներին երկար ժամանակ զբաղեցնելու համար խնդրել է նրանց թվերի գումարը հաշվել 1-ից մինչև 100: Երիտասարդ Գաուսը նկատել է, որ հակառակ ծայրերից զույգ-զույգ գումարները նույնն են՝ 1+100= 101, 2+99=101 և այլն և այլն, և անմիջապես ստացվեց արդյունքը՝ 50×101=5050: Մինչեւ խոր ծերություն նա սովոր էր իր հաշվարկների մեծ մասն իր գլխում անել։

Կառլ Գաուսի հիմնական գիտական ​​նվաճումները վիճակագրության մեջ մեթոդի ստեղծումն է նվազագույն քառակուսիները, որը ընկած է ռեգրեսիոն վերլուծության հիմքում։

Նա նաև մանրամասնորեն ուսումնասիրել է բնականոն բաշխման օրենքը, որը տարածված է բնության մեջ, որի գրաֆիկը այդ ժամանակվանից հաճախ կոչվում է Գաուսի: Լայնորեն հայտնի է դարձել «երեք սիգմա» կանոնը (Գաուսի կանոնը), որը նկարագրում է նորմալ բաշխումը:

Լև Սեմյոնովիչ Կամինսկի (1889 - 1962)

Մեծ հաղթանակի 75-ամյակին Հայրենական պատերազմԿցանկանայի հիշել և խոսել մի հրաշալի գիտնականի, ԽՍՀՄ ռազմաբժշկական և սանիտարական վիճակագրության հիմնադիրներից մեկի՝ Լև Սեմենովիչ Կամինսկու մասին (1889-1962 թթ.):

Ծնվել է 1889 թվականի մայիսի 27-ին Կիևում։ Գերազանցությամբ ավարտելուց հետո 1918 թ Բժշկական ֆակուլտետՊետրոգրադի համալսարան Կամինսկին եղել է Կարմիր բանակի շարքերում, 1919 թվականի ապրիլից մինչև 1920 թվականի վերջը ծառայել է որպես Հարավ-արևելյան ճակատի 136-րդ համախմբված տարհանման հիվանդանոցի գլխավոր բժիշկ։

1922 թվականից Լև Սեմյոնովիչը ղեկավարում էր Հյուսիս-արևմտյան երկաթուղու բժշկական և սանիտարական ծառայության սանիտարահամաճարակային բաժինը։ Այս տարիների ընթացքում սկսվեց գիտական ​​գործունեությունԿամինսկու ղեկավարությամբ պրոֆ. Ս.Ա.Նովոսելսկի. Իրենց համատեղ հիմնարար աշխատությունում՝ «Կորուստները անցյալ պատերազմներում», վիճակագրական նյութը վերլուծվել է 1756-1918 թվականներին աշխարհի տարբեր բանակների պատերազմներում մարդկային կորուստների վերաբերյալ: Հետագա աշխատություններում Կամինսկին մշակել և հիմնավորել է ռազմական նոր, ավելի ճշգրիտ դասակարգումը: կորուստներ.

«Ազգային սնուցում և հանրային առողջություն» մենագրությունը (1929) մանրամասն ուսումնասիրել է հանրային առողջության վրա պատերազմների ազդեցության սանիտարահիգիենիկ ասպեկտները, ինչպես նաև պատերազմի ժամանակ բնակչության և բանակի բժշկական օգնության կազմակերպման հարցերը։

1935-1943 թվականներին Լև Սեմենովիչը ղեկավարել է ԽՍՀՄ առողջապահության ժողովրդական կոմիսարիատի սանիտարական (1942 թվականից՝ բժշկական) վիճակագրության բաժինը։ 1943 թվականի հոկտեմբերին պրոֆեսոր Կամինսկին դարձավ Ռազմաբժշկական ակադեմիայի ռազմաբժշկական վիճակագրության բաժնի վարիչ։ Ս.

Լև Սեմենովիչը կողմնակից էր համատարած իրականացմանը քանակական մեթոդներսանիտարական և բժշկական վիճակագրության պրակտիկայում: 1959 թվականին նրա հեղինակությամբ հրատարակվել է ուսումնական ձեռնարկ«Լաբորատոր և կլինիկական տվյալների վիճակագրական մշակում. վիճակագրության կիրառում բժշկի գիտական ​​և գործնական աշխատանքում», որը երկար տարիներ դարձավ բժշկական վիճակագրության լավագույն հայրենական դասագրքերից մեկը: Նախաբանում Լ.Ս.Կամինսկին նշում է.
«... Կարևոր է, որ ներկա բժիշկները իմանան, թե ինչպես սկսել գործին և իմանան, թե ինչպես հավաքել և մշակել ճիշտ թվերը, որոնք հարմար են համեմատությունների և համեմատությունների համար»:

Չափանիշներ և մեթոդներ

ՈՒՍԱՆՈՂԱԿԱՆ t-ՉԱՓԱՆԻՇ ԱՆԿԱԽ ԲՆԱԿՉՈՒԹՅԱՆ ՀԱՄԱՐ

Student's t-test-ը հիպոթեզների (վիճակագրական թեստեր) վիճակագրական ստուգման մեթոդների դասի ընդհանուր անվանումն է՝ հիմնված Student բաշխման վրա: T-թեստի ամենատարածված օգտագործումը ներառում է երկու նմուշներում միջինների հավասարության փորձարկում:

Այս չափանիշը մշակվել է Ուիլյամ Սիլի Գոսեթ

2. Ինչի՞ համար է օգտագործվում Student's t-test-ը:

Student's t թեստը օգտագործվում է միջինների տարբերությունների վիճակագրական նշանակությունը որոշելու համար: Այն կարող է օգտագործվել ինչպես անկախ նմուշների համեմատության դեպքում (օրինակ՝ շաքարախտով հիվանդների խումբ և առողջ մարդկանց խումբ), այնպես էլ հարակից պոպուլյացիաները համեմատելիս (օրինակ՝ նույն հիվանդների մոտ սրտի միջին հաճախականությունը ընդունելուց առաջ և հետո): հակաառիթմիկ դեղամիջոց): Վերջին դեպքում հաշվարկվում է զուգավորված Student t-թեստը

3. Ո՞ր դեպքերում կարող է օգտագործվել Student’s t-test-ը:

Student-ի t-թեստը կիրառելու համար անհրաժեշտ է, որ սկզբնական տվյալները ունենան նորմալ բաշխում։ Կարևոր է նաև համեմատվող խմբերի շեղումների (բաշխումների) հավասարությունը (հոմոսկեդաստիկություն)։ Անհավասար շեղումների դեպքում օգտագործվում է Welch-ի կողմից փոփոխված t-թեստը (Welch's t):

Բացակայության դեպքում նորմալ բաշխումհամեմատվող նմուշներ, Student's t-test-ի փոխարեն օգտագործվում են ոչ պարամետրային վիճակագրության նմանատիպ մեթոդներ, որոնցից ամենահայտնին. Mann-Whitney U թեստ.

4. Ինչպե՞ս հաշվարկել Student's t-test-ը:

Միջին արժեքները համեմատելու համար Student's t-test-ը հաշվարկվում է օգտագործելով հետեւյալ բանաձեւը:

Որտեղ Մ 1- առաջին համեմատված բնակչության (խմբի) միջին թվաբանականը, Մ 2- երկրորդ համեմատվող բնակչության (խմբի) միջին թվաբանականը. մ 1- առաջին թվաբանական միջինի միջին սխալը, մ 2- երկրորդ թվաբանական միջինի միջին սխալը:

Ստացված Student-ի t-test արժեքը պետք է ճիշտ մեկնաբանվի: Դա անելու համար մենք պետք է իմանանք յուրաքանչյուր խմբի առարկաների քանակը (n 1 և n 2): Գտեք ազատության աստիճանների թիվը զհետևյալ բանաձևի համաձայն.

F = (n 1 + n 2) - 2

Դրանից հետո մենք որոշում ենք Student-ի t-թեստի կրիտիկական արժեքը կարևորության անհրաժեշտ մակարդակի համար (օրինակ՝ p = 0.05) և ազատության որոշակի քանակի աստիճանի համար։ զըստ աղյուսակի (տես ստորև):

  • Եթե ​​Student's t-test-ի հաշվարկված արժեքը հավասար է կամ ավելի մեծ է, քան աղյուսակից հայտնաբերված կրիտիկական արժեքը, մենք եզրակացնում ենք, որ համեմատվող արժեքների միջև եղած տարբերությունները վիճակագրորեն նշանակալի են:
  • Եթե ​​հաշվարկված Student-ի t-test-ի արժեքը փոքր է աղյուսակի արժեքից, ապա համեմատվող արժեքների միջև եղած տարբերությունները վիճակագրորեն նշանակալի չեն:

Երկաթի նոր պատրաստուկի արդյունավետությունն ուսումնասիրելու համար ընտրվել են սակավարյունությամբ հիվանդների երկու խումբ։ Առաջին խմբում հիվանդները երկու շաբաթով նոր դեղամիջոց են ստացել, իսկ երկրորդ խմբում՝ պլացեբո։ Դրանից հետո չափվել է ծայրամասային արյան մեջ հեմոգլոբինի մակարդակը։ Առաջին խմբում հեմոգլոբինի միջին մակարդակը կազմել է 115,4±1,2 գ/լ, իսկ երկրորդ խմբում՝ 103,7±2,3 գ/լ (տվյալները ներկայացված են M±m ձևաչափով), համեմատվող պոպուլյացիաներն ունեն նորմալ բաշխում։ Առաջին խմբի թիվը եղել է 34, իսկ երկրորդինը՝ 40 հիվանդ։ Անհրաժեշտ է եզրակացություն անել ստացված տարբերությունների վիճակագրական նշանակության և նոր երկաթի պատրաստման արդյունավետության մասին։

Լուծում:Տարբերությունների նշանակությունը գնահատելու համար մենք օգտագործում ենք Student-ի t-թեստը, որը հաշվարկվում է որպես միջին արժեքների տարբերություն՝ բաժանված քառակուսի սխալների գումարի վրա.

Հաշվարկները կատարելուց հետո t-test արժեքը պարզվել է 4,51։ Մենք գտնում ենք ազատության աստիճանների թիվը որպես (34 + 40) - 2 = 72: Ստացված Student's t-test արժեքը 4.51 համեմատում ենք աղյուսակում նշված p = 0.05 կրիտիկական արժեքի հետ. 1.993: Քանի որ չափանիշի հաշվարկված արժեքը ավելի մեծ է, քան կրիտիկական արժեքը, մենք եզրակացնում ենք, որ դիտարկված տարբերությունները վիճակագրորեն նշանակալի են (նշանակության մակարդակ p<0,05).


ԶՈՒՅԳ ՈՒՍԱՆՈՂԻ t-TEST

Զուգակցված Student-ի t-թեստը Student-ի մեթոդի փոփոխություններից մեկն է, որն օգտագործվում է զուգակցված (կրկնվող) չափումների տարբերությունների վիճակագրական նշանակությունը որոշելու համար:

1. t-test-ի զարգացման պատմություն

մշակվել է t-test Ուիլյամ ԳոսեթԳինես ընկերությունում գարեջրի որակը գնահատելու համար։ Ընկերության հանդեպ առևտրային գաղտնիքները չհրապարակելու հետ կապված պարտավորությունների պատճառով Գոսեթի հոդվածը տպագրվել է 1908 թվականին Biometrics ամսագրում «Ուսանող» կեղծանունով։

2. Ինչի՞ համար է օգտագործվում զուգավորված Student-ի t-թեստը:

Զուգակցված Student-ի t-թեստն օգտագործվում է երկու կախված (զույգ) նմուշների համեմատության համար: Կախված չափումներ են համարվում նույն հիվանդների մոտ, բայց տարբեր ժամանակներում, օրինակ՝ արյան ճնշումը հիպերտոնիկ հիվանդների մոտ հակահիպերտոնիկ դեղամիջոց ընդունելուց առաջ և հետո: Զրոյական վարկածը նշում է, որ համեմատվող նմուշների միջև տարբերություններ չկան, այլընտրանքային վարկածը նշում է, որ կան վիճակագրորեն նշանակալի տարբերություններ:

3. Ո՞ր դեպքերում կարող եք օգտագործել զուգավորված Student-ի t-test-ը:

Հիմնական պայմանը նմուշների կախվածությունն է, այսինքն՝ համեմատվող արժեքները պետք է ստացվեն նույն հիվանդների մոտ մեկ պարամետրի կրկնվող չափումներից։

Ինչպես անկախ նմուշների համեմատության դեպքում, զուգավորված t-թեստ օգտագործելու համար սկզբնական տվյալները պետք է նորմալ բաշխվեն: Եթե ​​այս պայմանը չկատարվի, ապա պետք է օգտագործվեն ոչ պարամետրային վիճակագրական մեթոդներ՝ համեմատելու ընտրանքային միջոցները, ինչպիսիք են. G- նշանի թեստկամ Wilcoxon T-թեստ.

Զուգակցված t թեստը կարող է օգտագործվել միայն երկու նմուշ համեմատելիս: Եթե ​​Ձեզ անհրաժեշտ է համեմատել երեք կամ ավելի կրկնվող չափումներ, դուք պետք է օգտագործեք միակողմանի շեղումների վերլուծություն (ANOVA) կրկնվող չափումների համար.

4. Ինչպե՞ս հաշվարկել զուգորդված Student-ի t-թեստը:

Զուգակցված Student-ի t-թեստը հաշվարկվում է հետևյալ բանաձևով.

Որտեղ Մ դ- առաջ և հետո չափված ցուցանիշների միջև եղած տարբերությունների միջին թվաբանականը, σd- ցուցանիշների տարբերությունների ստանդարտ շեղում, n- ուսումնասիրված առարկաների քանակը.

5. Ինչպե՞ս մեկնաբանել Student-ի t-test արժեքը:

Ստացված զուգորդված Student-ի t-թեստի արժեքի մեկնաբանումը չի տարբերվում t-թեստի գնահատականից՝ չկապակցված պոպուլյացիաների համար: Առաջին հերթին պետք է գտնել ազատության աստիճանների թիվը զհետևյալ բանաձևի համաձայն.

F = n - 1

Դրանից հետո մենք որոշում ենք Student-ի t-թեստի կրիտիկական արժեքը կարևորության անհրաժեշտ մակարդակի համար (օրինակ՝ p.<0,05) и при данном числе степеней свободы զըստ աղյուսակի (տես ստորև):

Մենք համեմատում ենք չափանիշի կրիտիկական և հաշվարկված արժեքները.

  • Եթե ​​զուգակցված Student t-թեստի հաշվարկված արժեքը հավասար է կամ մեծ է աղյուսակից հայտնաբերված կրիտիկական արժեքից, մենք եզրակացնում ենք, որ համեմատվող արժեքների միջև տարբերությունները վիճակագրորեն նշանակալի են:
  • Եթե ​​հաշվարկված զուգակցված Student-ի t-թեստի արժեքը փոքր է աղյուսակի արժեքից, ապա համեմատվող արժեքների տարբերությունները վիճակագրորեն նշանակալի չեն:

6. Student's t-test-ի հաշվարկման օրինակ

Նոր հիպոգլիկեմիկ գործակալի արդյունավետությունը գնահատելու համար շաքարային դիաբետով հիվանդների մոտ արյան գլյուկոզի մակարդակը չափվել է դեղը ընդունելուց առաջ և հետո: Արդյունքում ստացվել են հետևյալ տվյալները.

Լուծում:

1. Հաշվեք արժեքների յուրաքանչյուր զույգի տարբերությունը (դ).

Հիվանդ Ն Արյան գլյուկոզայի մակարդակը, մմոլ/լ Տարբերություն (դ)
նախքան դեղը վերցնելը դեղը վերցնելուց հետո
1 9.6 5.7 3.9
2 8.1 5.4 2.7
3 8.8 6.4 2.4
4 7.9 5.5 2.4
5 9.2 5.3 3.9
6 8.0 5.2 2.8
7 8.4 5.1 3.3
8 10.1 6.9 3.2
9 7.8 7.5 2.3
10 8.1 5.0 3.1

2. Բանաձևով գտե՛ք տարբերությունների միջին թվաբանականը.

3. Գտե՛ք տարբերությունների ստանդարտ շեղումը միջինից՝ օգտագործելով բանաձևը.

4. Հաշվե՛ք զուգավորված Student’s t-թեստը.

5. Համեմատենք Student-ի t-test 8.6-ի ստացված արժեքը աղյուսակի արժեքի հետ, որը, եթե f ազատության աստիճանները հավասար են 10 - 1 = 9 և նշանակության մակարդակը p = 0.05, կազմում է 2.262: Քանի որ ստացված արժեքը կրիտիկական արժեքից մեծ է, մենք եզրակացնում ենք, որ արյան գլյուկոզայի մակարդակի վիճակագրորեն զգալի տարբերություններ կան նոր դեղամիջոցի ընդունումից առաջ և հետո:

Ցուցադրել Student's t-test-ի կրիտիկական արժեքների աղյուսակը

MANN-WHITNEY U-ՉԱՓԱՆԻՇ

Mann-Whitney U թեստը ոչ պարամետրային վիճակագրական թեստ է, որն օգտագործվում է երկու անկախ նմուշների համեմատության համար քանակականորեն չափված հատկանիշի մակարդակի առումով: Մեթոդը հիմնված է որոշելու վրա, թե արդյոք երկու փոփոխական շարքերի միջև հատվող արժեքների գոտին (առաջին նմուշում պարամետրերի արժեքների դասակարգված շարքը և երկրորդ նմուշում նույնը) բավականաչափ փոքր է: Որքան ցածր է չափանիշի արժեքը, այնքան ավելի հավանական է, որ նմուշներում պարամետրերի արժեքների միջև եղած տարբերությունները հուսալի են:

1. U-չափանիշի զարգացման պատմություն

Նմուշների միջև տարբերությունները պարզելու այս մեթոդն առաջարկվել է 1945 թվականին ամերիկացի քիմիկոսի և վիճակագրի կողմից։ Ֆրենկ Ուիլքոքսոն.
1947 թվականին այն զգալիորեն վերանայվել և ընդլայնվել է մաթեմատիկոսների կողմից Հ.Բ. Մանն(H.B. Mann) և Դ.Ռ. Ուիթնի(D.R. Whitney), որի անուններով այսօր սովորաբար կոչվում է.

2. Ինչի՞ համար է օգտագործվում Mann-Whitney U թեստը:

Mann-Whitney U թեստը օգտագործվում է երկու անկախ նմուշների միջև եղած տարբերությունները գնահատելու համար՝ ցանկացած քանակական բնութագրի մակարդակի առումով:

3. Ի՞նչ դեպքերում կարելի է կիրառել Mann-Whitney U թեստը:

Mann-Whitney U թեստը ոչ պարամետրիկ թեստ է, հետևաբար, ի տարբերություն Ուսանողի t-test

U- թեստը հարմար է փոքր նմուշները համեմատելու համար. յուրաքանչյուր նմուշ պետք է ունենա առնվազն 3 բնորոշ արժեք: Թույլատրվում է, որ մեկ նմուշում լինի 2 արժեք, բայց հետո երկրորդը պետք է ունենա առնվազն հինգ։

Mann-Whitney U թեստի կիրառման պայմանը համեմատվող խմբերում համապատասխան հատկանիշի արժեքների բացակայությունն է (բոլոր թվերը տարբեր են) կամ նման համընկնումների շատ փոքր թիվը:

Երեք կամ ավելի խմբերի համեմատման համար Mann-Whitney U թեստի անալոգն է Կրուսկալ-Ուալիսի թեստ.

4. Ինչպե՞ս հաշվարկել Mann-Whitney U թեստը:

Նախ, երկու համեմատված նմուշներից էլ՝ ա մեկ դասակարգված շարք, դիտարկման միավորները դասավորելով ըստ աճող հատկանիշի աստիճանի և ավելի փոքր արժեքին ավելի ցածր աստիճան հատկացնելով։ Մի քանի միավորների համար հատկանիշի հավասար արժեքների դեպքում դրանցից յուրաքանչյուրին վերագրվում է հաջորդական դասակարգման արժեքների միջին թվաբանականը:

Օրինակ, մեկ դասակարգված շարքում 2-րդ և 3-րդ տեղերը զբաղեցնող երկու միավորները ունեն նույն արժեքները: Հետևաբար, նրանցից յուրաքանչյուրին վերագրվում է (3 + 2) / 2 = 2,5-ի հավասար կոչում:

Կազմված մեկ դասակարգված շարքում շարքերի ընդհանուր թիվը հավասար է լինելու.

N = n 1 + n 2

որտեղ n 1-ը առաջին նմուշի տարրերի թիվն է, իսկ n 2-ը երկրորդ նմուշի տարրերի թիվն է:

Հաջորդը, մենք կրկին բաժանում ենք մեկ դասակարգված շարքը երկուսի, որոնք բաղկացած են համապատասխանաբար առաջին և երկրորդ նմուշների միավորներից՝ միաժամանակ հիշելով յուրաքանչյուր միավորի վարկանիշային արժեքները: Մենք հաշվում ենք առանձին-առանձին այն շարքերի գումարը, որոնք բաժին են ընկնում առաջին նմուշի տարրերի բաժնեմասին, իսկ առանձին-առանձին` երկրորդ նմուշի տարրերի բաժնեմասին: Մենք որոշում ենք n x տարրերով նմուշին համապատասխանող երկու շարքային գումարներից (T x) ավելի մեծը:

Ի վերջո, մենք գտնում ենք Mann-Whitney U թեստի արժեքը՝ օգտագործելով բանաձևը.

5. Ինչպե՞ս մեկնաբանել Mann-Whitney U թեստի արժեքը:

Մենք համեմատում ենք U- թեստի ստացված արժեքը՝ օգտագործելով աղյուսակը վիճակագրական նշանակության ընտրված մակարդակի համար (p=0.05 կամ p=0.01) U-ի կրիտիկական արժեքի հետ համեմատվող նմուշների տվյալ քանակի համար.

  • Եթե ​​ստացված արժեքը U ավելի քիչաղյուսակային կամ հավասար էնրան, ապա ճանաչվում է դիտարկվող նմուշներում հատկանիշի մակարդակների տարբերությունների վիճակագրական նշանակությունը (ընդունվում է այլընտրանքային վարկածը)։ Որքան փոքր է U արժեքը, այնքան բարձր է տարբերությունների հուսալիությունը:
  • Եթե ​​ստացված արժեքը U ավելինաղյուսակային, զրոյական վարկածն ընդունված է։
Ցուցադրել Mann-Whitney U թեստի կրիտիկական արժեքների աղյուսակը p=0.05-ում

WILCOxon Չափանիշ

Վիլքոքսոնի թեստը հարակից նմուշների համար (նաև կոչվում է Wilcoxon T-test, Wilcoxon test, Wilcoxon signed rank test, Wilcoxon rank sum test) ոչ պարամետրիկ վիճակագրական թեստ է, որն օգտագործվում է երկու հարակից (զույգված) նմուշները համեմատելու համար՝ չափված ցանկացած քանակական բնութագրի մակարդակի առումով։ շարունակական կամ հերթական սանդղակով։

Մեթոդի էությունն այն է, որ համեմատվում են այս կամ այն ​​ուղղությամբ տեղաշարժերի ծանրության բացարձակ արժեքները: Դա անելու համար նախ դասակարգվում են տեղաշարժերի բոլոր բացարձակ արժեքները, այնուհետև ամփոփվում են շարքերը: Եթե ​​այս կամ այն ​​ուղղությամբ տեղաշարժերը պատահական են լինում, ապա դրանց շարքերի գումարները մոտավորապես հավասար կլինեն: Եթե ​​մեկ ուղղությամբ տեղաշարժերի ինտենսիվությունը ավելի մեծ է, ապա հակառակ ուղղությամբ տեղաշարժերի բացարձակ արժեքների շարքերի գումարը զգալիորեն ցածր կլինի, քան պատահական փոփոխություններով:

1. Հարակից նմուշների համար Wilcoxon թեստի մշակման պատմություն

Թեստն առաջին անգամ առաջարկվել է 1945 թվականին ամերիկացի վիճակագիր և քիմիկոս Ֆրենկ Ուիլքոքսոնի կողմից (1892-1965): Նույն գիտական ​​աշխատության մեջ հեղինակը նկարագրել է մեկ այլ չափանիշ, որն օգտագործվում է անկախ նմուշների համեմատության դեպքում.

2. Ինչի՞ համար է օգտագործվում Wilcoxon թեստը:

Wilcoxon T թեստը օգտագործվում է նույն պոպուլյացիայի վրա, բայց տարբեր պայմաններում կամ տարբեր ժամանակներում կատարված չափումների երկու խմբերի միջև տարբերությունները գնահատելու համար: Այս թեստը կարող է բացահայտել փոփոխությունների ուղղությունն ու սրությունը, այսինքն՝ արդյոք ցուցանիշներն ավելի շատ են տեղաշարժվում մի ուղղությամբ, քան մյուս ուղղությամբ:

Իրավիճակի դասական օրինակ, որտեղ կարող է օգտագործվել Wilcoxon T-թեստը հարակից պոպուլյացիաների համար, նախքան և հետո հետազոտությունն է, որը համեմատում է գնահատականները բուժումից առաջ և հետո: Օրինակ, հակահիպերտոնիկ դեղամիջոցի արդյունավետությունն ուսումնասիրելիս արյան ճնշումը համեմատվում է դեղը ընդունելուց առաջ և հետո:

3. Wilcoxon T-test-ի օգտագործման պայմաններն ու սահմանափակումները

  1. Ուիլքոքսոնի թեստը ոչ պարամետրիկ թեստ է, հետևաբար, ի տարբերություն Զույգերի ուսանողական t-test, չի պահանջում համեմատվող պոպուլյացիաների նորմալ բաշխում։
  2. Առարկաների թիվը Wilcoxon T-թեստն օգտագործելիս պետք է լինի առնվազն 5:
  3. Ուսումնասիրված հատկանիշը կարող է չափվել ինչպես քանակական շարունակական սանդղակով (արյան ճնշում, սրտի հաճախություն, լեյկոցիտների պարունակություն 1 մլ արյան մեջ), այնպես էլ հերթական սանդղակով (միավորների քանակը, հիվանդության ծանրությունը, միկրոօրգանիզմներով աղտոտվածության աստիճանը):
  4. Այս չափանիշը կիրառվում է միայն երկու շարք չափումների համեմատության ժամանակ: Երեք կամ ավելի հարակից պոպուլյացիաների համեմատության համար Wilcoxon T-թեստի անալոգն է Ֆրիդմանի չափանիշ.

4. Ինչպե՞ս հաշվարկել Wilcoxon T-թեստը հարակից նմուշների համար:

  1. Հաշվեք յուրաքանչյուր առարկայի համար զուգակցված չափումների արժեքների տարբերությունը: Զրոյական տեղաշարժերը հետագայում հաշվի չեն առնվում:
  2. Որոշեք, թե տարբերություններից որոնք են բնորոշ, այսինքն՝ համապատասխանում են հաճախականությամբ գերիշխող ցուցանիշի փոփոխության ուղղությանը։
  3. Զույգերի տարբերությունները դասակարգե՛ք ըստ բացարձակ արժեքների (այսինքն՝ առանց նշանը հաշվի առնելու), աճման կարգով։ Տարբերության փոքր բացարձակ արժեքին տրվում է ավելի ցածր աստիճան:
  4. Հաշվե՛ք ատիպիկ տեղաշարժերին համապատասխանող շարքերի գումարը:

Այսպիսով, հարակից նմուշների համար Wilcoxon T-թեստը հաշվարկվում է հետևյալ բանաձևով.

որտեղ ΣRr-ը ցուցանիշի ատիպիկ փոփոխություններին համապատասխանող շարքերի գումարն է:

5. Ինչպե՞ս մեկնաբանել Wilcoxon թեստի արժեքը:

Wilcoxon T-թեստի արդյունքում ստացված արժեքը համեմատվում է վիճակագրական նշանակության ընտրված մակարդակի աղյուսակի կրիտիկական արժեքի հետ ( p=0.05կամ p=0.01) համեմատվող նմուշների տվյալ քանակի համար n.

  • Եթե ​​հաշվարկված (էմպիրիկ) արժեքը T em. պակաս, քան աղյուսակավորված T kr. կամ դրան հավասար, ապա ճանաչվում է տիպային ուղղությամբ ցուցանիշի փոփոխությունների վիճակագրական նշանակությունը (ընդունվում է այլընտրանքային վարկածը)։ Որքան ցածր է T արժեքը, այնքան բարձր է տարբերությունների հուսալիությունը:
  • Եթե ​​T emp. ավելի շատ T kr. , ընդունված է ցուցիչի փոփոխությունների վիճակագրական նշանակության բացակայության մասին զրոյական վարկածը։

Հարակից նմուշների համար Wilcoxon թեստի հաշվարկման օրինակ

Դեղագործական ընկերությունը ոչ ստերոիդային հակաբորբոքային դեղերի խմբից նոր դեղամիջոց է ուսումնասիրում։ Այդ նպատակով ընտրվել է հիպերթերմիայով ARVI-ով տառապող 10 կամավորներից բաղկացած խումբ։ Նրանց մարմնի ջերմաստիճանը չափվել է նոր դեղամիջոցն ընդունելուց առաջ և 30 րոպե հետո։ Անհրաժեշտ է եզրակացություն անել դեղամիջոցի ընդունման արդյունքում մարմնի ջերմաստիճանի նվազման նշանակության մասին։

  1. Աղբյուրի տվյալները ներկայացված են հետևյալ աղյուսակում.
  2. Wilcoxon T-թեստը հաշվարկելու համար մենք հաշվարկում ենք զույգ ցուցիչների տարբերությունները և դասակարգում դրանց բացարձակ արժեքները: Այս դեպքում մենք կարմիրով առանձնացնում ենք անտիպ շարքերը.
    Ն Ազգանունը մարմնի t մինչեւ դեղը ընդունելը t մարմինը դեղը ընդունելուց հետո Ցուցանիշների տարբերությունը, դ |դ| կոչում
    1. Իվանովը 39.0 37.6 -1.4 1.4 7
    2. Պետրովը 39.5 38.7 -0.8 0.8 5
    3. Սիդորովը 38.6 38.7 0.1 0.1 1.5
    4. Պոպովը 39.1 38.5 -0.6 0.6 4
    5. Նիկոլաեւը 40.1 38.6 -1.5 1.5 8
    6. Կոզլովը 39.3 37.5 -1.8 1.8 9
    7. Իգնատիեւ 38.9 38.8 -0.1 0.1 1.5
    8. Սեմենովը 39.2 38.0 -1.2 1.2 6
    9. Եգորովը 39.8 39.8 0
    10. Ալեքսեև 38.8 39.3 0.5 0.5 3
    Ինչպես տեսնում ենք, բնորոշ տեղաշարժցուցանիշը դրա նվազումն է, որը նշվել է 10-ից 7-ի դեպքում: Մի դեպքում (հիվանդ Եգորովի մոտ) դեղը ընդունելուց հետո ջերմաստիճանը չի փոխվել, և, հետևաբար, այս դեպքը չի օգտագործվել հետագա վերլուծության մեջ: Երկու դեպքում (հիվանդների Սիդորովի և Ալեքսեևի մոտ) նշվել է ատիպիկ տեղաշարժջերմաստիճանը վեր. Ատիպիկ հերթափոխին համապատասխանող դասակարգումները 1,5 և 3 են։
  3. Եկեք հաշվարկենք Wilcoxon T-թեստը, որը հավասար է ցուցիչի ատիպիկ տեղաշարժին համապատասխանող շարքերի գումարին.

    T = ΣRr = 3 + 1,5 = 4,5

  4. Համեմատենք T emp. հետ Տ կր. , որը նշանակության մակարդակում p=0.05 և n=9 հավասար է 8-ի։ Հետևաբար, T emp.
  5. Մենք եզրակացնում ենք. ARVI-ով հիվանդների մարմնի ջերմաստիճանի նվազումը նոր դեղամիջոցի ընդունման արդյունքում վիճակագրորեն նշանակալի է (p.<0.05).
Ցույց տվեք Wilcoxon T- թեստի կրիտիկական արժեքների աղյուսակը

PEARSON CHI-QUARE ՉԱՓԱՆԻՇ

Pearson-ի χ 2 թեստը ոչ պարամետրիկ մեթոդ է, որը թույլ է տալիս մեզ գնահատել տարբերությունների նշանակությունը յուրաքանչյուր կատեգորիայի մեջ ընկած ընտրանքի արդյունքների փաստացի (բացահայտված ուսումնասիրության) թվի կամ որակական բնութագրերի և տեսական թվի միջև, որը ակնկալվում է: ուսումնասիրված խմբերը, եթե զրոյական վարկածը ճիշտ է: Պարզ ասած, մեթոդը թույլ է տալիս գնահատել երկու կամ ավելի հարաբերական ցուցանիշների (հաճախականություններ, համամասնություններ) տարբերությունների վիճակագրական նշանակությունը:

1. χ 2 չափանիշի զարգացման պատմություն

Պատահականության աղյուսակների վերլուծության Chi-square թեստը մշակվել և առաջարկվել է 1900 թվականին անգլիացի մաթեմատիկոսի, վիճակագրի, կենսաբանի և փիլիսոփայի կողմից, մաթեմատիկական վիճակագրության հիմնադիրը և կենսաչափության հիմնադիրներից մեկը: Կարլ Փիրսոն(1857-1936).

2. Ինչու՞ է օգտագործվում Պիրսոնի χ 2 թեստը:

Վերլուծության մեջ կարող է օգտագործվել chi-square թեստը արտակարգ իրավիճակների աղյուսակներպարունակող տեղեկատվություն արդյունքների հաճախականության վերաբերյալ՝ կախված ռիսկի գործոնի առկայությունից: Օրինակ, չորս դաշտային անկանխատեսելի աղյուսակը հետևյալն է.

Կա արդյունք (1) Ոչ մի արդյունք (0) Ընդամենը
Կա ռիսկի գործոն (1) Ա Բ A+B
Ռիսկի գործոն չկա (0) Գ Դ C+D
Ընդամենը A+C B+D A+B+C+D

Ինչպե՞ս լրացնել նման արտակարգ իրավիճակների աղյուսակը: Դիտարկենք մի փոքրիկ օրինակ:

Հետազոտություն է անցկացվում արտրիումային հիպերտոնիայի զարգացման ռիսկի վրա ծխելու ազդեցության վերաբերյալ։ Այդ նպատակով ընտրվել են առարկաների երկու խումբ՝ առաջինը ներառում էր 70 մարդ, ովքեր օրական ծխում են առնվազն 1 տուփ ծխախոտ, երկրորդում՝ 80 նույն տարիքի չծխողներ։ Առաջին խմբում 40 մարդ ունեցել է արյան բարձր ճնշում։ Երկրորդում զարկերակային գերճնշում է նկատվել 32 մարդու մոտ։ Ըստ այդմ, ծխողների խմբում արյան նորմալ ճնշումը եղել է 30 մարդու մոտ (70 - 40 = 30), իսկ չծխողների խմբում՝ 48 (80 - 32 = 48):

Մենք լրացնում ենք չորս դաշտային անկանխատեսելի աղյուսակը նախնական տվյալներով.

Ստացված պատահականության աղյուսակում յուրաքանչյուր տող համապատասխանում է առարկաների որոշակի խմբի: Սյունակները ցույց են տալիս զարկերակային հիպերտոնիա կամ նորմալ արյան ճնշում ունեցող մարդկանց թիվը:

Խնդիրը, որը դրված է հետազոտողին, հետևյալն է. կա՞ն արդյոք վիճակագրորեն նշանակալի տարբերություններ արյան ճնշում ունեցող մարդկանց հաճախականության միջև ծխողների և չծխողների շրջանում: Այս հարցին կարելի է պատասխանել՝ հաշվարկելով Pearson chi-square թեստը և համեմատելով ստացված արժեքը կրիտիկականի հետ։

  1. Համեմատելի ցուցանիշները պետք է չափվեն անվանական սանդղակով (օրինակ՝ հիվանդի սեռը արական կամ իգական է) կամ հերթական սանդղակով (օրինակ՝ զարկերակային հիպերտոնիայի աստիճանը տատանվում է 0-ից 3):
  2. Այս մեթոդը թույլ է տալիս վերլուծել ոչ միայն չորս դաշտային աղյուսակները, երբ և՛ գործոնը, և՛ արդյունքը երկուական փոփոխականներ են, այսինքն՝ դրանք ունեն միայն երկու հնարավոր արժեք (օրինակ՝ արական կամ իգական սեռ, առկայություն կամ բացակայություն։ որոշակի հիվանդություն անամնեզում...): Pearson chi-square թեստը կարող է օգտագործվել նաև բազմադաշտ աղյուսակների վերլուծության դեպքում, երբ գործոնը և (կամ) արդյունքը վերցնում են երեք կամ ավելի արժեքներ:
  3. Համեմատվող խմբերը պետք է անկախ լինեն, այսինքն՝ chi-square թեստը չպետք է օգտագործվի նախքան և հետո դիտարկումները համեմատելիս: McNemar թեստ(երկու հարակից պոպուլյացիաները համեմատելիս) կամ հաշվարկված Կոքրանի Q թեստ(երեք և ավելի խմբերի համեմատության դեպքում).
  4. Չորս դաշտային աղյուսակները վերլուծելիս ակնկալվող արժեքներյուրաքանչյուր բջիջում պետք է լինի առնվազն 10: Եթե առնվազն մեկ բջիջում ակնկալվող երևույթը վերցնում է 5-ից 9 արժեք, ապա պետք է հաշվարկվի chi-square թեստը: Յեյթսի փոփոխությամբ. Եթե ​​առնվազն մեկ խցում ակնկալվող երեւույթը 5-ից պակաս է, ապա վերլուծությունը պետք է օգտագործվի Ֆիշերի ճշգրիտ թեստը.
  5. Բազմադաշտային աղյուսակները վերլուծելիս դիտումների ակնկալվող թիվը չպետք է լինի 5-ից պակաս բջիջների ավելի քան 20%-ում:

4. Ինչպե՞ս հաշվարկել Pearson chi-square թեստը:

Chi-square թեստը հաշվարկելու համար ձեզ հարկավոր է.

Այս ալգորիթմը կիրառելի է ինչպես չորս դաշտային, այնպես էլ բազմադաշտ աղյուսակների համար:

5. Ինչպե՞ս մեկնաբանել Pearson chi-square թեստի արժեքը:

Եթե ​​χ 2 չափանիշի ստացված արժեքը մեծ է կրիտիկական արժեքից, ապա եզրակացնում ենք, որ կա վիճակագրական կապ ուսումնասիրված ռիսկի գործոնի և նշանակության համապատասխան մակարդակի արդյունքի միջև:

6. Pearson chi-square թեստի հաշվարկման օրինակ

Եկեք որոշենք ծխելու գործոնի ազդեցության վիճակագրական նշանակությունը զարկերակային հիպերտոնիայի առաջացման վրա՝ օգտագործելով վերը քննարկված աղյուսակը.

  1. Մենք հաշվարկում ենք ակնկալվող արժեքները յուրաքանչյուր բջիջի համար.
  2. Գտեք Pearson chi-square թեստի արժեքը.

    χ 2 = (40-33.6) 2 /33.6 + (30-36.4) 2 /36.4 + (32-38.4) 2 /38.4 + (48-41.6) 2 /41.6 = 4.396.

  3. Ազատության աստիճանների թիվը f = (2-1)*(2-1) = 1. Օգտագործելով աղյուսակը, գտնում ենք Pearson chi-square թեստի կրիտիկական արժեքը, որը նշանակալիության մակարդակում p=0.05 և թիվը. ազատության աստիճան 1-ը 3,841 է։
  4. Մենք համեմատում ենք chi-square թեստի ստացված արժեքը կրիտիկականի հետ՝ 4,396 > 3,841, հետևաբար, զարկերակային հիպերտոնիայի հաճախականության կախվածությունը ծխելու առկայությունից վիճակագրորեն նշանակալի է։ Այս հարաբերությունների նշանակության մակարդակը համապատասխանում է պ<0.05.
Ցույց տալ Պիրսոնի chi-square թեստի կրիտիկական արժեքների աղյուսակը

ՖԻՇԵՐԻ ՃՇՏԱԿԱՆ ՉԱՓԱՆԻՇ

Ֆիշերի ճշգրիտ թեստը թեստ է, որն օգտագործվում է համեմատելու երկու հարաբերական ցուցանիշները, որոնք բնութագրում են երկու արժեք ունեցող որոշակի բնութագրի հաճախականությունը: Ֆիշերի ճշգրիտ թեստը հաշվարկելու սկզբնական տվյալները սովորաբար խմբավորվում են չորս դաշտային աղյուսակի տեսքով։

1. Չափանիշի զարգացման պատմություն

Չափանիշն առաջին անգամ առաջարկվեց Ռոնալդ Ֆիշերիր «Փորձերի դիզայն» գրքում: Դա տեղի է ունեցել 1935 թ. Ինքը՝ Ֆիշերը, պնդում էր, որ Մյուրիել Բրիստոլն իրեն դրդել է այս գաղափարին։ 1920-ականների սկզբին Ռոնալդը, Մյուրիելը և Ուիլյամ Ռոաչը տեղակայվեցին Անգլիայում գյուղատնտեսական փորձարարական կայանում։ Մյուրիելը պնդում էր, որ ինքը կարող է որոշել, թե ինչ կարգով են թեյն ու կաթը լցնում իր բաժակի մեջ։ Այն ժամանակ նրա հայտարարությունը ճշտել չհաջողվեց։

Սա հիմք է տվել Ֆիշերի «զրոյական վարկածի» գաղափարին։ Նպատակը չէր ապացուցել, որ Մյուրիելը կարող է տարբերել տարբեր կերպ պատրաստված թեյի բաժակները։ Որոշվել է հերքել այն վարկածը, որ կինը պատահական ընտրություն է կատարում։ Որոշվեց, որ զրոյական վարկածը ոչ կարող է ապացուցվել, ոչ էլ հիմնավորվել։ Բայց դա կարելի է հերքել փորձերի ժամանակ։

Պատրաստվել է 8 բաժակ։ Առաջին չորսը նախ լցնում են կաթով, մյուս չորսում՝ թեյով։ Բաժակները խառնվել էին։ Բրիստոլն առաջարկել է համտեսել թեյը և բաժանել բաժակները՝ ըստ թեյի պատրաստման եղանակի։ Արդյունքը պետք է լիներ երկու խումբ. Պատմությունն ասում է, որ փորձը հաջող է անցել։

Ֆիշերի թեստի շնորհիվ Բրիստոլի ինտուիտիվ գործողության հավանականությունը կրճատվեց մինչև 0,01428: Այսինքն՝ 70-ից մեկ դեպքում հնարավոր է եղել ճիշտ նույնականացնել բաժակը։ Նույնիսկ եթե ավելացնեք բաժակների քանակը:

Այս պատմությունը խթան հաղորդեց «զրոյական վարկածի» զարգացմանը։ Միաժամանակ առաջարկվել է Ֆիշերի ճշգրիտ չափանիշը, որի էությունը կախված և անկախ փոփոխականների բոլոր հնարավոր համակցությունների թվարկումն է։

2. Ինչի՞ համար է օգտագործվում Ֆիշերի ճշգրիտ թեստը:

Ֆիշերի ճշգրիտ թեստը հիմնականում օգտագործվում է փոքր նմուշները համեմատելու համար: Դրա համար երկու լավ պատճառ կա. Նախ, չափանիշի հաշվարկը բավականին դժվար է և կարող է երկար ժամանակ պահանջել կամ պահանջել հզոր հաշվողական ռեսուրսներ: Երկրորդ՝ չափանիշը բավականին ճշգրիտ է (ինչն արտացոլվում է նույնիսկ նրա անվան մեջ), ինչը թույլ է տալիս այն օգտագործել փոքր թվով դիտարկումներով ուսումնասիրություններում։

Բժշկության մեջ առանձնահատուկ տեղ է հատկացված Ֆիշերի ճշգրիտ թեստին։ Սա բժշկական տվյալների մշակման կարևոր մեթոդ է և գտել է իր կիրառությունը բազմաթիվ գիտական ​​հետազոտություններում։ Դրա շնորհիվ հնարավոր է ուսումնասիրել որոշակի գործոնների և արդյունքների փոխհարաբերությունները, համեմատել պաթոլոգիական վիճակների հաճախականությունը սուբյեկտների երկու խմբերի միջև և այլն։

3. Ո՞ր դեպքերում կարող է օգտագործվել Ֆիշերի ճշգրիտ թեստը:

  1. Համեմատվող փոփոխականները պետք է չափվեն անվանական սանդղակով և ունենան ընդամենը երկու արժեք, օրինակ՝ արյան ճնշումը նորմալ է կամ բարձրացված, արդյունքը բարենպաստ է կամ անբարենպաստ, հետվիրահատական ​​բարդություններ կան, թե ոչ։
  2. Ֆիշերի ճշգրիտ թեստը նախատեսված է երկու անկախ խմբերի համեմատելու համար, որոնք բաժանված են գործակցով: Ըստ այդմ, գործոնը նույնպես պետք է ունենա միայն երկու հնարավոր արժեք.
  3. Չափանիշը հարմար է շատ փոքր նմուշները համեմատելու համար. Ֆիշերի ճշգրիտ թեստը կարող է օգտագործվել չորս ամբողջական աղյուսակների վերլուծության համար ակնկալվող երևույթի 5-ից փոքր արժեքների դեպքում, ինչը կիրառման սահմանափակում է: Pearson chi-square թեստ, նույնիսկ հաշվի առնելով Յեյթսի ուղղումը։
  4. Ֆիշերի ճշգրիտ թեստը կարող է լինել միակողմանի կամ երկկողմանի: Միակողմանի տարբերակով հստակ հայտնի է, թե ցուցիչներից մեկը որտեղ է շեղվելու։ Օրինակ, ուսումնասիրությունը համեմատում է, թե քանի հիվանդ է ապաքինվել՝ համեմատած վերահսկիչ խմբի հետ: Ենթադրվում է, որ թերապիան չի կարող վատթարացնել հիվանդների վիճակը, այլ միայն բուժել կամ ոչ։
    Երկկողմանի թեստը գնահատում է հաճախականության տարբերությունները երկու ուղղություններով: Այսինքն՝ գնահատվում է փորձարարական խմբում երևույթի և՛ ավելի բարձր, և՛ ավելի ցածր հաճախականության հավանականությունը վերահսկիչ խմբի համեմատ:

Ֆիշերի ճշգրիտ թեստի անալոգն է Pearson chi-square թեստ, մինչդեռ Ֆիշերի ճշգրիտ թեստն ավելի մեծ հզորություն ունի, հատկապես փոքր նմուշները համեմատելիս, և, հետևաբար, առավելություն ունի այս դեպքում։

4. Ինչպե՞ս հաշվարկել Ֆիշերի ճշգրիտ թեստը:

Ենթադրենք, մենք ուսումնասիրում ենք բնածին արատներով (ԲԶԲ) երեխաների ծնունդների հաճախականության կախվածությունը հղիության ընթացքում մոր ծխելուց։ Դրա համար ընտրվել են հղիների երկու խումբ, որոնցից մեկը փորձարարական խումբ էր՝ բաղկացած 80 կանանցից, ովքեր ծխում էին հղիության առաջին եռամսյակում, իսկ երկրորդը՝ համեմատական ​​խումբ՝ ներառյալ 90 կին, որոնք վարում էին ողջ հղիության ընթացքում առողջ ապրելակերպ։ Փորձարարական խմբում պտղի բնածին արատների դեպքերը եղել են 10, համեմատական ​​խմբում՝ 2։

Նախ, մենք ստեղծում ենք չորս դաշտային անկանխատեսելի աղյուսակ.

Ֆիշերի ճշգրիտ թեստը հաշվարկվում է հետևյալ բանաձևով.

որտեղ N-ը երկու խմբերի առարկաների ընդհանուր թիվն է. ! - գործակից, որը թվերի և թվերի հաջորդականության արտադրյալն է, որոնցից յուրաքանչյուրը նախորդից փոքր է 1-ով (օրինակ՝ 4! = 4 3 2 1)

Հաշվարկների արդյունքում մենք գտնում ենք, որ P = 0,0137:

5. Ինչպե՞ս մեկնաբանել Ֆիշերի ճշգրիտ թեստի արժեքը:

Մեթոդի առավելությունն այն է, որ ստացված չափանիշը համապատասխանում է p նշանակության մակարդակի ճշգրիտ արժեքին: Այսինքն՝ մեր օրինակում ստացված 0,0137 արժեքը համեմատվող խմբերի միջև պտղի բնածին արատների հաճախականության տարբերությունների նշանակության մակարդակն է։ Անհրաժեշտ է միայն համեմատել այս թիվը կարևորության կրիտիկական մակարդակի հետ, որը սովորաբար բժշկական հետազոտություններում ընդունվում է որպես 0,05:

  • Եթե ​​Ֆիշերի ճշգրիտ թեստի արժեքը կրիտիկական արժեքից մեծ է, ապա զրոյական վարկածն ընդունվում է և եզրակացություն է արվում, որ արդյունքի հաճախականության մեջ վիճակագրորեն նշանակալի տարբերություններ չկան՝ կախված ռիսկի գործոնի առկայությունից:
  • Եթե ​​Ֆիշերի ճշգրիտ թեստի արժեքը կրիտիկական արժեքից փոքր է, այլընտրանքային վարկածն ընդունվում է և եզրակացություն է արվում, որ կան վիճակագրորեն նշանակալի տարբերություններ արդյունքի հաճախականության մեջ՝ կախված ռիսկի գործոնի ազդեցությունից:

Մեր օրինակում Պ< 0,05, в связи с чем делаем вывод о наличии прямой взаимосвязи курения и вероятности развития ВПР плода. Частота возникновения врожденной патологии у детей курящих женщин статистически значимо выше, чем у некурящих.


ՀԱՎԱԿԱՆՈՒԹՅՈՒՆՆԵՐԻ ՀԱՐԱԲԱՑՎԱԾՔ

Հավանականությունների հարաբերակցությունը վիճակագրական ցուցիչ է (ռուսերենում դրա անունը սովորաբար կրճատվում է որպես OR, իսկ անգլերենում ՝ OR «հավանականության հարաբերակցությունից»), թվային առումով նկարագրելու հիմնական ուղիներից մեկը, թե որքան է որոշակի արդյունքի բացակայությունը կամ առկայությունը: կապված որոշակի վիճակագրական խմբում որոշակի գործոնի առկայության կամ բացակայության հետ:

1. Հնարավորությունների հարաբերակցության ցուցիչի զարգացման պատմություն

«Շանս» տերմինը գալիս է մոլախաղերի տեսությունից, որտեղ այս հայեցակարգն օգտագործվում էր շահած դիրքերի և պարտվողների հարաբերակցությունը նշելու համար: Գիտական ​​բժշկական գրականության մեջ հավանականության հարաբերակցության ցուցանիշն առաջին անգամ հիշատակվել է 1951 թվականին Ջ.Կորնֆիլդի աշխատության մեջ։ Հետագայում այս հետազոտողը հրապարակեց փաստաթղթեր, որոնք նշում էին հավանականության հարաբերակցության համար 95% վստահության միջակայքը հաշվարկելու անհրաժեշտությունը: (Cornfield, J. A Method for Estimating Comparative Rates from Clinical Data. Applications to Cancer of Lung, Breast, and Cervix // Journal of the National Cancer Institute, 1951. - N.11. - P.1269–1275.)

2. Ինչի՞ համար է օգտագործվում հավանականության գործակիցը:

Հնարավորությունների հարաբերակցությունը գնահատում է որոշակի արդյունքի և ռիսկի գործոնի միջև կապը:

Հնարավորությունների հարաբերակցությունը թույլ է տալիս համեմատել ուսումնասիրության խմբերը ըստ ռիսկի որոշակի գործոնի հայտնաբերման հաճախականության: Կարևոր է, որ հավանականությունների հարաբերակցության կիրառման արդյունքը լինի ոչ միայն գործոնի և արդյունքի միջև կապի վիճակագրական նշանակության որոշումը, այլև դրա քանակական գնահատումը։

3. Հնարավորությունների գործակիցների օգտագործման պայմաններն ու սահմանափակումները

  1. Արդյունքների և գործոնի ցուցանիշները պետք է չափվեն անվանական սանդղակով: Օրինակ, արդյունավետ նշանը պտղի մեջ բնածին արատների առկայությունն է կամ բացակայությունը, ուսումնասիրված գործոնը մոր ծխելն է (ծխում է կամ չի ծխում):
  2. Այս մեթոդը թույլ է տալիս վերլուծել միայն չորս դաշտային աղյուսակները, երբ և՛ գործոնը, և՛ արդյունքը երկուական փոփոխականներ են, այսինքն՝ ունեն միայն երկու հնարավոր արժեք (օրինակ՝ սեռը՝ արական կամ իգական, զարկերակային հիպերտոնիա՝ առկայություն կամ բացակայություն, հիվանդության ելք՝ բարելավումով կամ առանց…):
  3. Համեմատվող խմբերը պետք է լինեն անկախ, այսինքն՝ հավանականությունների հարաբերակցությունը հարմար չէ դիտումները առաջ-հետո համեմատելու համար։
  4. Հավանականությունների հարաբերակցության ցուցիչը օգտագործվում է դեպքերի վերահսկման ուսումնասիրություններում (օրինակ՝ առաջին խումբը հիպերտոնիայով հիվանդներն են, երկրորդը՝ համեմատաբար առողջ մարդիկ): Հեռանկարային ուսումնասիրությունների համար, երբ խմբերը ձևավորվում են ռիսկի գործոնի առկայության կամ բացակայության հիման վրա (օրինակ՝ առաջին խումբը ծխողներն են, երկրորդը՝ չծխողները), այն կարող է նաև հաշվարկվել. հարաբերական ռիսկ.

4. Ինչպե՞ս հաշվարկել հավանականության գործակիցը:

Գործակիցների հարաբերակցությունը այն կոտորակի արժեքն է, որի համարիչը պարունակում է որոշակի իրադարձության հավանականություն առաջին խմբի համար, իսկ հայտարարը պարունակում է նույն իրադարձության հավանականությունը երկրորդ խմբի համար:

Շանսորոշակի հատկանիշ (արդյունք կամ գործոն) ունեցող առարկաների թվի հարաբերակցությունն է այն առարկաների թվին, որոնք չունեն այդ հատկանիշը:

Օրինակ՝ ենթաստամոքսային գեղձի նեկրոզով վիրահատված հիվանդների խումբ է ընտրվել, որոնց թիվը կազմել է 100 մարդ։ 5 տարի անց նրանցից 80-ը դեռ ողջ էին։ Համապատասխանաբար, գոյատևման հավանականությունը եղել է 80-ից 20-ը կամ 4-ը:

Հարմար միջոց է հաշվարկել հավանականության հարաբերակցությունը` ամփոփելով տվյալները 2x2 աղյուսակում.

Կա արդյունք (1) Ոչ մի արդյունք (0) Ընդամենը
Կա ռիսկի գործոն (1) Ա Բ A+B
Ռիսկի գործոն չկա (0) Գ Դ C+D
Ընդամենը A+C B+D A+B+C+D

Այս աղյուսակի համար հավանականության հարաբերակցությունը հաշվարկվում է հետևյալ բանաձևով.

Շատ կարևոր է գնահատել արդյունքի և ռիսկի գործոնի միջև հայտնաբերված կապի վիճակագրական նշանակությունը: Դա պայմանավորված է այն հանգամանքով, որ նույնիսկ հավանականության հարաբերակցության ցածր արժեքներով, միասնությանը մոտ, հարաբերությունները, այնուամենայնիվ, կարող են նշանակալի լինել և պետք է հաշվի առնվեն վիճակագրական եզրակացություններում: Ընդհակառակը, մեծ OR արժեքների դեպքում ցուցանիշը վիճակագրորեն աննշան է ստացվում, և, հետևաբար, բացահայտված կապը կարող է անտեսվել:

Հնարավորությունների հարաբերակցության նշանակությունը գնահատելու համար հաշվարկվում են 95% վստահության միջակայքի սահմանները (օգտագործվում է 95% CI կամ 95% CI հապավումը անգլերեն «վստահության միջակայքից»): 95% CI-ի վերին սահմանային արժեքը գտնելու բանաձևը.

95% CI-ի ստորին սահմանի արժեքը գտնելու բանաձև.

5. Ինչպե՞ս մեկնաբանել հավանականության հարաբերակցության արժեքը:

  • Եթե ​​հավանականության հարաբերակցությունը 1-ից մեծ է, դա նշանակում է, որ ռիսկի գործոն գտնելու հնարավորություններն ավելի մեծ են այն խմբում, որտեղ առկա է արդյունք: Նրանք. գործոնը ուղղակիորեն կապված է արդյունքի հավանականության հետ:
  • 1-ից պակաս հավանականության հարաբերակցությունը ցույց է տալիս, որ ռիսկի գործոնի հայտնաբերման հնարավորություններն ավելի մեծ են երկրորդ խմբում: Նրանք. գործոնը հակադարձ կապ ունի արդյունքի հավանականության հետ:
  • Մեկին հավասար հավանականության հարաբերակցությամբ, համեմատվող խմբերում ռիսկի գործոնի հայտնաբերման հնարավորությունները նույնն են: Ըստ այդմ, գործոնը որևէ ազդեցություն չի թողնում արդյունքի հավանականության վրա։

Բացի այդ, յուրաքանչյուր դեպքում հավանականության հարաբերակցության վիճակագրական նշանակությունը անպայմանորեն գնահատվում է 95% վստահության միջակայքի արժեքների հիման վրա:

  • Եթե ​​վստահության միջակայքը չի ներառում 1, այսինքն. սահմանների երկու արժեքներն էլ 1-ից բարձր են կամ ավելի ցածր, եզրակացություն է արվում գործոնի և արդյունքի միջև բացահայտված հարաբերության վիճակագրական նշանակության մասին կարևորության մակարդակում p.<0,05.
  • Եթե ​​վստահության միջակայքը ներառում է 1, այսինքն. դրա վերին սահմանը 1-ից մեծ է, իսկ ստորին սահմանը 1-ից փոքր է, եզրակացվում է, որ գործոնի և արդյունքի միջև կապի վիճակագրական նշանակություն չկա p>0,05 նշանակալիության մակարդակում:
  • Վստահության միջակայքի չափը հակադարձ համեմատական ​​է գործոնի և արդյունքի միջև կապի նշանակության մակարդակին, այսինքն. որքան փոքր է 95% CI-ն, այնքան ավելի նշանակալի է բացահայտված հարաբերությունը:

6. Հնարավորությունների հարաբերակցության ցուցանիշի հաշվարկման օրինակ

Պատկերացնենք երկու խումբ՝ առաջինը բաղկացած էր 200 կանանցից, որոնց մոտ ախտորոշվել էր պտղի բնածին արատ (Exodus+): Նրանցից 50-ը հղիության ընթացքում ծխել է (Factor+) (Ա), եղել են չծխողներ (Factor-)՝ 150 մարդ (ՀԵՏ).

Երկրորդ խումբը բաղկացած էր 100 կանանցից՝ առանց պտղի բնածին արատների նշանների (Արդյունք -), որոնցից 10 հոգի ծխել է հղիության ընթացքում (Factor+) (Բ), չի ծխել (Factor-) - 90 հոգի (D).

1. Եկեք ստեղծենք չորս դաշտային անկանխատեսելի աղյուսակ.

2. Հաշվեք հավանականության հարաբերակցության արժեքը.

ԿԱՄ = (A * D) / (B * C) = (50 * 90) / (150 * 10) = 3:

3. Գտե՛ք 95% CI-ի սահմանները: Վերոնշյալ բանաձևով հաշվարկված ստորին սահմանի արժեքը 1,45 էր, իսկ վերին սահմանը 6,21 էր:

Այսպիսով, հետազոտությունը ցույց է տվել, որ պտղի ախտորոշված ​​բնածին արատով հիվանդների մոտ ծխող կնոջ հետ հանդիպելու հավանականությունը 3 անգամ ավելի մեծ է, քան պտղի բնածին արատների նշաններ չունեցող կանանց մոտ։ Դիտարկված կախվածությունը վիճակագրորեն նշանակալի է, քանի որ 95% CI-ն չի ներառում 1-ը, դրա ստորին և վերին սահմանների արժեքները 1-ից մեծ են:


ՀԱՐԱԲԵՐԱԿԱՆ ՌԻՍԿ

Ռիսկը որոշակի արդյունքի, օրինակ՝ հիվանդության կամ վնասվածքի առաջացման հավանականությունն է: Ռիսկը կարող է արժեքներ ունենալ 0-ից (արդյունքի առաջացման հավանականություն չկա) մինչև 1 (բոլոր դեպքերում սպասվում է անբարենպաստ արդյունք): Բժշկական վիճակագրության մեջ, որպես կանոն, ելքի ռիսկի փոփոխությունները ուսումնասիրվում են՝ կախված ինչ-որ գործոնից։ Հիվանդները պայմանականորեն բաժանվում են 2 խմբի, որոնցից մեկի վրա ազդում է գործոնը, մյուսի վրա՝ ոչ։

Հարաբերական ռիսկը արդյունքների հաճախականության հարաբերակցությունն է առարկաների միջև, որոնց վրա ազդել է ուսումնասիրվող գործոնը և արդյունքների հաճախականությանը սուբյեկտների միջև, որոնց վրա չի ազդել այս գործոնը: Գիտական ​​գրականության մեջ հաճախ օգտագործվում է ցուցիչի կրճատ անվանումը՝ RR կամ RR (անգլերեն «հարաբերական ռիսկ» բառից):

1. Հարաբերական ռիսկի ցուցիչի զարգացման պատմություն

Հարաբերական ռիսկի հաշվարկը փոխառված է բժշկական վիճակագրության կողմից տնտեսագիտությունից: Ապրանքի կամ ծառայության պահանջարկի վրա քաղաքական, տնտեսական և սոցիալական գործոնների ազդեցության ճիշտ գնահատումը կարող է հանգեցնել հաջողության, իսկ այդ գործոնների թերագնահատումը կարող է հանգեցնել ֆինանսական ձախողման և ձեռնարկության սնանկացման:

2. Ինչի՞ համար է օգտագործվում հարաբերական ռիսկը:

Հարաբերական ռիսկն օգտագործվում է արդյունքի հավանականությունը համեմատելու համար՝ կախված ռիսկի գործոնի առկայությունից: Օրինակ՝ հիպերտոնիայի հաճախականության վրա ծխելու ազդեցությունը գնահատելիս, բանավոր հակաբեղմնավորիչների օգտագործումից կրծքագեղձի քաղցկեղի առաջացման կախվածությունն ուսումնասիրելիս և այլն: Հարաբերական ռիսկը կարևորագույն ցուցանիշն է բուժման որոշակի մեթոդներ նշանակելու կամ հետազոտություններ անցկացնելու համար: հնարավոր կողմնակի ազդեցությունները.

3. Հարաբերական ռիսկի կիրառման պայմաններն ու սահմանափակումները

  1. Գործոնների և արդյունքների ցուցանիշները պետք է չափվեն անվանական սանդղակով (օրինակ՝ հիվանդի սեռը՝ արական կամ իգական, զարկերակային հիպերտոնիա՝ առկա է, թե ոչ):
  2. Այս մեթոդը թույլ է տալիս վերլուծել միայն չորս դաշտային աղյուսակները, երբ և՛ գործոնը, և՛ արդյունքը անփոփոխ փոփոխականներ են, այսինքն՝ ունեն միայն երկու հնարավոր արժեք (օրինակ՝ 50 տարեկանից փոքր կամ ավելի մեծ տարիք, առկայություն կամ անամնեզում որոշակի հիվանդության բացակայություն):
  3. Հարաբերական ռիսկն օգտագործվում է հեռանկարային ուսումնասիրություններում, երբ հետազոտական ​​խմբերը ձևավորվում են ռիսկի գործոնի առկայության կամ բացակայության հիման վրա: Դեպքերի վերահսկման ուսումնասիրություններում դրա փոխարեն պետք է օգտագործվի հարաբերական ռիսկը հավանականության գործակիցները.

4. Ինչպե՞ս հաշվարկել հարաբերական ռիսկը:

Հարաբերական ռիսկը հաշվարկելու համար անհրաժեշտ է.

5. Ինչպե՞ս մեկնաբանել հարաբերական ռիսկի արժեքը:

Հարաբերական ռիսկի ցուցանիշը համեմատվում է 1-ի հետ՝ գործոնի և արդյունքի միջև կապի բնույթը որոշելու համար.

  • Եթե ​​RR-ն հավասար է 1-ի, կարող ենք եզրակացնել, որ ուսումնասիրվող գործոնը չի ազդում արդյունքի հավանականության վրա (գործոնի և արդյունքի միջև կապ չկա):
  • 1-ից մեծ արժեքների համար եզրակացվում է, որ գործոնը մեծացնում է արդյունքների հաճախականությունը (ուղղակի հարաբերություններ):
  • 1-ից պակաս արժեքների համար դա ցույց է տալիս արդյունքի հավանականության նվազում, երբ ենթարկվում է գործոնին ( հետադարձ կապ).

95% վստահության միջակայքի սահմանների արժեքները նույնպես պետք է գնահատվեն: Եթե ​​երկու արժեքները՝ և՛ ստորին, և՛ վերին սահմանը, գտնվում են 1-ի նույն կողմում, կամ, այլ կերպ ասած, վստահության միջակայքը չի ներառում 1-ը, ապա եզրակացություն է արվում բացահայտված հարաբերությունների վիճակագրական նշանակության մասին։ p-ի սխալի հավանականությամբ գործոնը և արդյունքը<0,05.

Եթե ​​95% CI-ի ստորին սահմանը 1-ից փոքր է, իսկ վերին սահմանը՝ ավելի մեծ, ապա եզրակացնում են, որ գործոնի ազդեցության վիճակագրական նշանակություն չկա արդյունքի հաճախականության վրա՝ անկախ արդյունքի արժեքից։ RR (p>0.05):

6. Հարաբերական ռիսկի ցուցանիշի հաշվարկման օրինակ

1999 թվականին Օկլահոմայում հետազոտություն է անցկացվել տղամարդկանց մոտ ստամոքսի խոցի դեպքերի վերաբերյալ։ Որպես ազդող գործոն ընտրվել է արագ սննդի կանոնավոր օգտագործումը։ Առաջին խմբում եղել է 500 տղամարդ, ովքեր անընդհատ արագ սնունդ են կերել, որոնցից 96-ի մոտ ստամոքսի խոց է ախտորոշվել։ Երկրորդ խմբում ընդգրկվել են առողջ սննդակարգի 500 կողմնակիցներ, որոնց թվում ստամոքսի խոց է ախտորոշվել 31 դեպքում։ Ստացված տվյալների հիման վրա կազմվել է հետևյալ անկանխատեսելի աղյուսակը.


ՊԻԱՐՍՈՆԻ ՀԱՄԱԿԱՐԳԱԿՑՈՒԹՅԱՆ ՉԱՓԱՆԻՇ

Պիրսոնի հարաբերակցության թեստը պարամետրային վիճակագրության մեթոդ է, որը թույլ է տալիս որոշել երկու քանակական ցուցանիշների միջև գծային կապի առկայությունը կամ բացակայությունը, ինչպես նաև գնահատել դրա սերտությունը և վիճակագրական նշանակությունը: Այլ կերպ ասած, Pearson հարաբերակցության թեստը թույլ է տալիս որոշել, թե արդյոք մի ցուցանիշը փոխվում է (աճում կամ նվազում) ի պատասխան մյուսի փոփոխությունների: Վիճակագրական հաշվարկներում և եզրակացություններում հարաբերակցության գործակիցը սովորաբար նշվում է որպես r xy կամ R xy:

1. Հարաբերակցության չափանիշի զարգացման պատմություն

Պիրսոնի հարաբերակցության թեստը մշակվել է բրիտանացի գիտնականների խմբի կողմից՝ գլխավորությամբ Կարլ Փիրսոն(1857-1936) 19-րդ դարի 90-ական թվականներին երկու պատահական փոփոխականների կովարիանսի վերլուծությունը պարզեցնելու համար։ Բացի Կարլ Փիրսոնից, մարդիկ աշխատել են նաև Պիրսոնի հարաբերակցության չափանիշի վրա Ֆրենսիս ԷջվորթԵվ Ռաֆայել Ուելդոն.

2. Ինչի՞ համար է օգտագործվում Պիրսոնի հարաբերակցության թեստը:

Պիրսոնի հարաբերակցության թեստը թույլ է տալիս որոշել քանակական մասշտաբով չափվող երկու ցուցանիշների հարաբերակցության սերտությունը (կամ ուժը): Օգտագործելով լրացուցիչ հաշվարկներ, դուք կարող եք նաև որոշել, թե որքանով է վիճակագրորեն նշանակալի հայտնաբերված հարաբերությունը:

Օրինակ, օգտագործելով Pearson հարաբերակցության չափանիշը, կարող եք պատասխանել այն հարցին, թե արդյոք կապ կա մարմնի ջերմաստիճանի և արյան մեջ լեյկոցիտների պարունակության միջև սուր շնչառական վարակների ժամանակ, հիվանդի հասակի և քաշի, ֆտորի պարունակության միջև: խմելու ջուրը և բնակչության շրջանում ատամնաբուժական կարիեսի դեպքերը.

3. Pearson chi-square թեստի օգտագործման պայմաններն ու սահմանափակումները

  1. Համադրելի ցուցանիշները պետք է չափվեն քանակական սանդղակով (օրինակ՝ սրտի հաճախությունը, մարմնի ջերմաստիճանը, լեյկոցիտների քանակը 1 մլ արյան համար, սիստոլիկ զարկերակային ճնշում):
  2. Օգտագործելով Pearson հարաբերակցության չափանիշը, դուք կարող եք որոշել միայն մեծությունների միջև գծային հարաբերությունների առկայությունը և ուժը: Միացման այլ բնութագրերը, ներառյալ ուղղությունը (ուղիղ կամ հակադարձ), փոփոխությունների բնույթը (ուղղագիծ կամ կորագիծ), ինչպես նաև մեկ փոփոխականի կախվածության առկայությունը մյուսից, որոշվում են օգտագործելով. ռեգրեսիոն վերլուծություն.
  3. Համեմատվող մեծությունների թիվը պետք է հավասար լինի երկուսի։ Երեք և ավելի պարամետրերի փոխհարաբերությունները վերլուծելու դեպքում դուք պետք է օգտագործեք մեթոդը գործոնային վերլուծություն.
  4. Պիրսոնի հարաբերակցության չափանիշը պարամետրային է, հետևաբար դրա կիրառման պայմանը համեմատվող փոփոխականներից յուրաքանչյուրի նորմալ բաշխումն է։ Եթե ​​անհրաժեշտ է կատարել ցուցանիշների հարաբերակցության վերլուծություն, որոնց բաշխումը տարբերվում է նորմայից, ներառյալ սովորական սանդղակով չափվածները, դուք պետք է օգտագործեք Սփիրմանի աստիճանի հարաբերակցության գործակիցը.
  5. Կախվածության և հարաբերակցության հասկացությունները պետք է հստակորեն տարբերվեն: Մեծությունների կախվածությունը որոշում է դրանց միջև հարաբերակցության առկայությունը, բայց ոչ հակառակը։

Օրինակ՝ երեխայի հասակը կախված է նրա տարիքից, այսինքն՝ որքան մեծ է երեխան, այնքան բարձրահասակ է։ Եթե ​​վերցնենք տարբեր տարիքի երկու երեխա, ապա մեծ հավանականության դեպքում մեծ երեխայի աճն ավելի մեծ կլինի, քան փոքրինը։ Այս երեւույթը կոչվում է կախվածություն՝ ենթադրելով ցուցիչների միջեւ պատճառահետեւանքային կապ։ Իհարկե, դրանց միջև կա նաև հարաբերակցություն, այսինքն՝ մի ցուցանիշի փոփոխություններն ուղեկցվում են մեկ այլ ցուցանիշի փոփոխություններով։

Մեկ այլ իրավիճակում հաշվի առեք երեխայի հասակի և սրտի զարկերի փոխհարաբերությունը (HR): Ինչպես հայտնի է, այս երկու արժեքներն էլ ուղղակիորեն կախված են տարիքից, ուստի շատ դեպքերում ավելի մեծ հասակի (հետևաբար ավելի մեծ տարիքի) երեխաները կունենան սրտի զարկերի ավելի ցածր արժեքներ: Այսինքն՝ կնկատվի հարաբերակցություն և կարող է բավականին մոտ լինել։ Այնուամենայնիվ, եթե վերցնենք նույն տարիքի, բայց տարբեր հասակի երեխաներին, ապա, ամենայն հավանականությամբ, նրանց սրտի զարկերը աննշանորեն կտարբերվեն, և հետևաբար կարող ենք եզրակացնել, որ սրտի հաճախությունը անկախ է հասակից:

Վերոնշյալ օրինակը ցույց է տալիս, թե որքան կարևոր է տարբերակել վիճակագրության մեջ հիմնարար ցուցանիշների կապի և կախվածության հասկացությունները՝ ճիշտ եզրակացություններ անելու համար:

4. Ինչպե՞ս հաշվարկել Պիրսոնի հարաբերակցության գործակիցը:

Պիրսոնի հարաբերակցության գործակիցը հաշվարկվում է հետևյալ բանաձևով.

5. Ինչպե՞ս մեկնաբանել Պիրսոնի հարաբերակցության գործակցի արժեքը:

Պիրսոնի հարաբերակցության գործակիցների արժեքները մեկնաբանվում են դրանց բացարձակ արժեքների հիման վրա: Հարաբերակցության գործակիցի հնարավոր արժեքները տատանվում են 0-ից ±1: Որքան մեծ է r xy-ի բացարձակ արժեքը, այնքան բարձր է երկու մեծությունների միջև հարաբերությունների սերտությունը: r xy = 0 ցույց է տալիս կապի լիակատար բացակայություն: r xy = 1 – ցույց է տալիս բացարձակ (ֆունկցիոնալ) կապի առկայությունը: Եթե ​​Պիրսոնի հարաբերակցության չափանիշի արժեքը պարզվում է, որ 1-ից ավելի է կամ -1-ից պակաս, ապա հաշվարկներում սխալ է թույլ տրվել։

Հարաբերակցության խստությունը կամ ուժը գնահատելու համար սովորաբար օգտագործվում են ընդհանուր ընդունված չափանիշներ, որոնց համաձայն r xy-ի բացարձակ արժեքները.< 0.3 свидетельствуют о թույլկապ, r xy արժեքները 0,3-ից 0,7 - միացման մասին միջինխստություն, r xy > 0,7 - o արժեքներ ուժեղհաղորդակցություններ.

Հարաբերակցության ուժի ավելի ճշգրիտ գնահատումը կարելի է ստանալ՝ օգտագործելով Chaddock աղյուսակը.

r xy հարաբերակցության գործակիցի վիճակագրական նշանակությունը գնահատվում է t-թեստի միջոցով, որը հաշվարկվում է հետևյալ բանաձևով.

Ստացված t r արժեքը համեմատվում է որոշակի նշանակության մակարդակի կրիտիկական արժեքի և n-2 ազատության աստիճանների քանակի հետ։ Եթե ​​t r-ը գերազանցում է t crit-ը, ապա եզրակացություն է արվում բացահայտված հարաբերակցության վիճակագրական նշանակության մասին:

6. Պիրսոնի հարաբերակցության գործակիցը հաշվարկելու օրինակ

Հետազոտության նպատակն էր բացահայտել, որոշել երկու քանակական ցուցանիշների՝ արյան մեջ տեստոստերոնի մակարդակի (X) և մարմնի մկանային զանգվածի տոկոսի (Y) հարաբերակցության սերտությունը և վիճակագրական նշանակությունը: 5 առարկայից (n = 5) կազմված ընտրանքի նախնական տվյալները ամփոփված են աղյուսակում.


SPEARMAN-Ի ՉԱՓԱՆԻՇ

Սփիրմանի աստիճանի հարաբերակցության գործակիցը ոչ պարամետրիկ մեթոդ է, որն օգտագործվում է երևույթների միջև կապը վիճակագրական ուսումնասիրության համար։ Այս դեպքում որոշվում է ուսումնասիրված բնութագրերի երկու քանակական շարքերի միջև իրական զուգահեռության աստիճանը և քանակապես արտահայտված գործակցի միջոցով տրվում է հաստատված կապի սերտության գնահատում:

1. Ռանկային հարաբերակցության գործակցի զարգացման պատմություն

Այս չափանիշը մշակվել և առաջարկվել է հարաբերակցության վերլուծության համար 1904 թ Չարլզ Էդվարդ Սփիրման, անգլիացի հոգեբան, Լոնդոնի և Չեստերֆիլդի համալսարանների պրոֆեսոր։

2. Ինչի՞ համար է օգտագործվում Սփիրմանի գործակիցը:

Սփիրմանի աստիճանի հարաբերակցության գործակիցը օգտագործվում է համեմատվող քանակական ցուցանիշների երկու շարքերի միջև հարաբերությունների սերտությունը բացահայտելու և գնահատելու համար: Եթե ​​ցուցիչների շարքերը, դասավորված ըստ աճի կամ նվազման աստիճանի, շատ դեպքերում համընկնում են (մի ցուցանիշի ավելի մեծ արժեքը համապատասխանում է մեկ այլ ցուցանիշի ավելի մեծ արժեքին, օրինակ՝ հիվանդի հասակը և նրա մարմնի քաշը համեմատելիս), եզրակացություն. կազմված է ներկայության մասին ուղիղհարաբերական կապ. Եթե ​​ցուցիչների շարքերն ունեն հակառակ ուղղություն (մի ցուցանիշի ավելի բարձր արժեքը համապատասխանում է մյուսի ավելի ցածր արժեքին, օրինակ՝ տարիքը և սրտի բաբախյունը համեմատելիս), ապա մենք խոսում ենք. հակադարձցուցիչների միջև կապեր.

    Spearman հարաբերակցության գործակիցը ունի հետևյալ հատկությունները.
  1. Հարաբերակցության գործակիցը կարող է արժեքներ վերցնել մինուս մեկից մինչև մեկ, իսկ rs=1-ի դեպքում կա խիստ ուղղակի կապ, իսկ rs= -1-ի հետ՝ խիստ հետադարձ կապ:
  2. Եթե ​​հարաբերակցության գործակիցը բացասական է, ապա կա հետադարձ կապ, եթե այն դրական է, ապա կա ուղղակի հարաբերություն:
  3. Եթե ​​հարաբերակցության գործակիցը հավասար է զրոյի, ուրեմն քանակների միջեւ գործնականում կապ չկա։
  4. Որքան հարաբերակցության գործակցի մոդուլը մոտ է միասնությանը, այնքան ավելի ուժեղ է հարաբերությունը չափված մեծությունների միջև:

3. Ո՞ր դեպքերում կարելի է օգտագործել Spearman գործակիցը:

Հաշվի առնելով այն հանգամանքը, որ գործակիցը ոչ պարամետրային վերլուծության մեթոդ է, բաշխման նորմալության փորձարկումը չի պահանջվում:

Համեմատելի ցուցանիշները կարող են չափվել ինչպես շարունակական սանդղակով (օրինակ՝ կարմիր արյան բջիջների քանակը 1 մկլ արյան մեջ), այնպես էլ սովորական սանդղակով (օրինակ՝ միավորներ) փորձագիտական ​​գնահատական 1-ից 5):

Spearman-ի գնահատման արդյունավետությունն ու որակը նվազում է, եթե չափված քանակներից որևէ մեկի տարբեր արժեքների միջև տարբերությունը բավականաչափ մեծ է: Խորհուրդ չի տրվում օգտագործել Spearman գործակիցը, եթե առկա է չափված քանակի արժեքների անհավասար բաշխում:

4. Ինչպե՞ս հաշվարկել Սփիրմանի գործակիցը:

Spearman աստիճանի հարաբերակցության գործակցի հաշվարկը ներառում է հետևյալ քայլերը.

5. Ինչպե՞ս մեկնաբանել Spearman գործակցի արժեքը:

Վարկանիշային հարաբերակցության գործակիցն օգտագործելիս պայմանականորեն գնահատվում է բնութագրերի միջև կապի սերտությունը՝ թույլ կապի նշան համարելով 0,3-ից պակաս գործակիցների արժեքները. 0,3-ից ավելի, բայց 0,7-ից պակաս արժեքները կապի չափավոր սերտության նշան են, իսկ 0,7 և ավելի արժեքները կապի բարձր սերտության նշան են:

Այն կարող է օգտագործվել նաև կապի խստությունը գնահատելու համար: Chaddock սանդղակ.

Ստացված գործակցի վիճակագրական նշանակությունը գնահատվում է Student's t-թեստի միջոցով։ Եթե ​​հաշվարկված t-թեստային արժեքը փոքր է աղյուսակային արժեքից ազատության որոշակի քանակի համար, ապա դիտարկված հարաբերությունը վիճակագրորեն նշանակալի չէ: Եթե ​​այն ավելի մեծ է, ապա հարաբերակցությունը համարվում է վիճակագրորեն նշանակալի:


ԿՈԼՄՈԳՈՐՈՎ-ՍՄԻՐՆՈՎ ՄԵԹՈԴ

Կոլմոգորով-Սմիրնովի թեստը ոչ պարամետրական լավության թեստ է, դասական իմաստով այն նախատեսված է պարզ վարկածներ ստուգելու այն մասին, թե արդյոք վերլուծված նմուշը պատկանում է ինչ-որ հայտնի բաշխման օրենքին: Այս չափանիշի ամենահայտնի կիրառումը ուսումնասիրվող պոպուլյացիաների բաշխման նորմալության ստուգումն է:

1. Կոլմոգորով-Սմիրնով չափանիշի զարգացման պատմություն

Կոլմոգորով-Սմիրնով չափանիշը մշակվել է խորհրդային մաթեմատիկոսների կողմից Անդրեյ Նիկոլաևիչ ԿոլմոգորովԵվ Նիկոլայ Վասիլևիչ Սմիրնով.
Կոլմոգորով Ա.Ն. (1903-1987) - Սոցիալիստական ​​աշխատանքի հերոս, Մոսկվայի պրոֆեսոր պետական ​​համալսարան, ԽՍՀՄ ԳԱ ակադեմիկոս - 20-րդ դարի մեծագույն մաթեմատիկոս, հիմնադիրներից է. ժամանակակից տեսությունհավանականությունները։
Սմիրնով Ն.Վ. (1900-1966) - ԽՍՀՄ ԳԱ թղթակից անդամ, մաթեմատիկական վիճակագրության ոչ պարամետրային մեթոդների և պատվերի վիճակագրության սահմանային բաշխման տեսության ստեղծողներից։

Այնուհետև, Կոլմոգորով-Սմիրնով պիտանիության թեստը փոփոխվեց, որպեսզի օգտագործվի ամերիկացի վիճակագիր, Ջորջ Վաշինգտոնի համալսարանի պրոֆեսոր՝ պոպուլյացիաների բաշխման նորմալությունը ստուգելու համար։ Հյուբերտ Լիլիֆորս(Hubert Whitman Lilliefors, 1928-2008): Պրոֆեսոր Լիլիֆորսը օգտագործման առաջամարտիկներից էր համակարգչային տեխնիկավիճակագրական հաշվարկներում։

Հյուբերտ Լիլիֆորս

2. Ինչու է օգտագործվում Կոլմոգորով-Սմիրնով չափանիշը:

Այս չափանիշը մեզ թույլ է տալիս գնահատել երկու նմուշների բաշխումների միջև եղած տարբերությունների նշանակությունը, ներառյալ այն օգտագործելու հնարավորությունը ուսումնասիրվող նմուշի բաշխման համապատասխանությունը նորմալ բաշխման օրենքին գնահատելու համար:

3. Ո՞ր դեպքերում կարող է կիրառվել Կոլմոգորով-Սմիրնով չափանիշը:

Կոլմոգորով-Սմիրնովի թեստը նախատեսված է քանակական տվյալների հավաքածուների նորմալ բաշխման համար:

Ստացված տվյալների ավելի հուսալիության համար դիտարկվող նմուշների ծավալները պետք է լինեն բավականաչափ մեծ՝ n ≥ 50: Երբ գնահատված պոպուլյացիայի չափը 25-ից 50 տարր է, նպատակահարմար է օգտագործել բոլշևյան ուղղումը:

4. Ինչպե՞ս հաշվարկել Կոլմոգորով-Սմիրնովի չափանիշը:

Կոլմոգորով-Սմիրնով չափանիշը հաշվարկվում է հատուկ վիճակագրական ծրագրերի միջոցով։ Այն հիմնված է ձևի վիճակագրության վրա.

Որտեղ ընթրել Ս- լրակազմի գերագույն S, Fn- ուսումնասիրվող բնակչության բաշխման գործառույթը, F(x)- նորմալ բաշխման գործառույթ

Եզրակացվող հավանականության արժեքները հիմնված են այն ենթադրության վրա, որ նորմալ բաշխման միջին և ստանդարտ շեղումը հայտնի են a priori և չեն գնահատվում տվյալների հիման վրա:

Այնուամենայնիվ, գործնականում պարամետրերը սովորաբար հաշվարկվում են անմիջապես տվյալների հիման վրա: Այս դեպքում նորմալության թեստը ներառում է կոմպոզիտային վարկած («որքանո՞վ է հավանական այս կամ ավելի մեծ նշանակության D վիճակագրություն՝ կախված տվյալներից հաշվարկված միջինից և ստանդարտ շեղումից») և տրված են Lilliefors-ի հավանականությունները (Lilliefors, 1967 թ. )

5. Ինչպե՞ս մեկնաբանել Կոլմոգորով-Սմիրնով թեստի արժեքը:

Եթե ​​Դ Կոլմոգորով-Սմիրնովի վիճակագրությունը նշանակալի է (էջ<0,05), то гипотеза о том, что соответствующее распределение нормально, должна быть отвергнута.


ՌՈՒՍԱՍՏԱՆԻ ԱԶԳԱՅԻՆ ՏՆՏԵՍՈՒԹՅԱՆ ԵՎ ՀԱՆՐԱՅԻՆ ԾԱՌԱՅՈՒԹՅԱՆ ԱԿԱԴԵՄԻԱ՝ ՌՈՒՍԱՍՏԱՆԻ ԴԱՇՆՈՒԹՅԱՆ ՆԱԽԱԳԱՀԻՆ կից.

ՕՐՅՈԼ ՄԱՍՆԱՃՅՈՒՂ

Կառավարման մաթեմատիկայի և մաթեմատիկական մեթոդների բաժին

Անկախ աշխատանք

Մաթեմատիկայի մեջ

«Վարիացիոն շարքը և դրա բնութագրերը» թեմայով

Տնտեսագիտության և կառավարման ֆակուլտետի լրիվ դրույքով ուսանողների համար

«Մարդկային ռեսուրսների կառավարում» վերապատրաստման ոլորտները.


Աշխատանքի նպատակը.Մաթեմատիկական վիճակագրության հասկացությունների և տվյալների առաջնային մշակման մեթոդների յուրացում։

Տիպիկ խնդիրների լուծման օրինակ.

Առաջադրանք 1.

Հետազոտության արդյունքում ստացվել են հետևյալ տվյալները ().

1 2 3 2 2 4 3 3 5 1 0 2 4 3 2 2 3 3 1 3 2 4 2 4 3 3 3 2 0 6

3 3 1 1 2 3 1 4 3 1 7 4 3 4 2 3 2 3 3 1 4 3 1 4 5 3 4 2 4 5

3 6 4 1 3 2 4 1 3 1 0 0 4 6 4 7 4 1 3 5

Անհրաժեշտ:

1) Կազմել տատանումների շարք (նմուշի վիճակագրական բաշխում)՝ նախապես գրելով ընտրանքների դասակարգված դիսկրետ շարք:

2) Կառուցեք հաճախականության բազմանկյուն և կուտակեք:

3) Կազմել հարաբերական հաճախությունների (հաճախականությունների) բաշխումների շարք.

4) Գտեք տատանումների շարքի հիմնական թվային բնութագրերը (դրանք գտնելու համար օգտագործեք պարզեցված բանաձևեր). ա) միջին թվաբանական, բ) միջին. Մեհև նորաձևություն Մո, գ) դիսպերսիա s 2, դ) ստանդարտ շեղում սե) տատանումների գործակից Վ.

5) բացատրել ստացված արդյունքների իմաստը.

Լուծում.

1) Կազմելու համար դասակարգված ընտրանքների դիսկրետ շարք տեսակավորել հետազոտության տվյալները ըստ չափերի և դասավորել դրանք աճման կարգով

0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2

3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

5 5 5 5 6 6 6 7 7.

Եկեք կազմենք տատանումների շարք՝ աղյուսակի առաջին շարքում գրելով դիտարկվող արժեքները (տարբերակներ), իսկ երկրորդում՝ համապատասխան հաճախականությունները (Աղյուսակ 1)

Աղյուսակ 1.

2) Հաճախականության բազմանկյունը կոտրված գիծ է միացնող կետերը ( x i; n i), ես=1, 2,…, մ, Որտեղ մ X.

Եկեք պատկերենք տատանումների շարքի հաճախությունների բազմանկյունը (նկ. 1):

Նկ.1. Հաճախականության բազմանկյուն

Դիսկրետ տատանումների շարքի կուտակային կորը (կուտակումը) ներկայացնում է կետերը միացնող կոտրված գիծ ( x i; n i nak), ես=1, 2,…, մ.

Գտնենք կուտակված հաճախականությունները n i nak(կուտակված հաճախականությունը ցույց է տալիս, թե քանի տարբերակ է նկատվել պակաս բնորոշ արժեքով X) Գտնված արժեքները մուտքագրում ենք աղյուսակ 1-ի երրորդ շարքում:



Կառուցենք կումուլատ (նկ. 2):

Նկ.2. Կուտակվում է

3) Գտնենք հարաբերական հաճախականությունները (հաճախականությունները), որտեղ , որտեղ մ- տարբեր բնութագրական արժեքների քանակը X, որը մենք կհաշվարկենք հավասար ճշգրտությամբ։

Եկեք գրենք հարաբերական հաճախությունների (հաճախականությունների) բաշխման շարքը աղյուսակ 2-ի տեսքով.

Աղյուսակ 2

4) Եկեք գտնենք տատանումների շարքի հիմնական թվային բնութագրերը.

ա) պարզեցված բանաձևով գտե՛ք թվաբանական միջինը.

,

որտեղ են պայմանական տարբերակները

դնենք Հետ= 3 (միջին դիտարկվող արժեքներից մեկը), կ= 1 (տարբերությունը երկու հարևան տարբերակների միջև) և կազմեք հաշվարկային աղյուսակ (Աղյուսակ 3):

Աղյուսակ 3.

x i nես u i u i n i u i 2 n i
-3 -12
-2 -26
-1 -14
Գումար -11

Այնուհետև թվաբանական միջինը

բ) միջին Մեհտատանումների շարքը բնութագրիչի արժեքն է, որն ընկնում է դիտարկումների դասակարգված շարքի մեջտեղում: Այս դիսկրետ տատանումների շարքը պարունակում է զույգ թվով տերմիններ ( n=80), ինչը նշանակում է, որ միջինը հավասար է երկու միջին տարբերակների գումարի կեսին:

Նորաձևություն Մոտատանումների շարքը կոչվում է այն տարբերակը, որը համապատասխանում է ամենաբարձր հաճախականությանը: Տրված տատանումների շարքի համար ամենաբարձր հաճախականությունը n max = 24 համապատասխանում է տարբերակին X= 3, նշանակում է նորաձևություն Մո=3.

գ) Տարբերություն s 2, որը ցուցանիշի հնարավոր արժեքների ցրվածության չափանիշ է Xիր միջին արժեքի շուրջ, մենք այն գտնում ենք՝ օգտագործելով պարզեցված բանաձևը.

, Որտեղ u i- պայմանական տարբերակներ

Աղյուսակ 3-ում մենք կներառենք նաև միջանկյալ հաշվարկներ:

Հետո շեղումը

դ) ստանդարտ շեղում սմենք գտնում ենք այն բանաձևով.

.

ե) տատանումների գործակից Վ: (),

Տատանումների գործակիցը անչափելի մեծություն է, ուստի այն հարմար է ցրվածությունը համեմատելու համար տատանումների շարք, որոնց տարբերակներն ունեն տարբեր չափեր։

Տատանումների գործակիցը

.

5) Ստացված արդյունքների իմաստն այն է, որ արժեքը բնութագրում է բնութագրի միջին արժեքը XԴիտարկվող ընտրանքում, այսինքն՝ միջին արժեքը կազմել է 2,86։ Ստանդարտ շեղում սնկարագրում է ցուցանիշների արժեքների բացարձակ տարածումը Xև այս դեպքում կազմում է ս≈ 1,55. Տատանումների գործակիցը Վբնութագրում է ցուցանիշի հարաբերական փոփոխականությունը X, այսինքն՝ հարաբերական տարածումը իր միջին արժեքի շուրջ, և այս դեպքում կազմում է .

Պատասխան. ; ; ; .

Առաջադրանք 2.

Կենտրոնական Ռուսաստանի 40 խոշորագույն բանկերի սեփական կապիտալի վերաբերյալ հասանելի են հետևյալ տվյալները.

12,0 49,4 22,4 39,3 90,5 15,2 75,0 73,0 62,3 25,2
70,4 50,3 72,0 71,6 43,7 68,3 28,3 44,9 86,6 61,0
41,0 70,9 27,3 22,9 88,6 42,5 41,9 55,0 56,9 68,1
120,8 52,4 42,0 119,3 49,6 110,6 54,5 99,3 111,5 26,1

Անհրաժեշտ:

1) Կառուցեք միջակայքային տատանումների շարք:

2) Հաշվարկել ընտրանքի միջինը և ընտրանքի շեղումը

3) Գտե՛ք ստանդարտ շեղումը և տատանումների գործակիցը:

4) Կառուցեք հաճախականությունների բաշխման հիստոգրամ:

Լուծում.

1) Եկեք ընտրենք կամայական թվով ինտերվալներ, օրինակ՝ 8։ Ապա միջակայքի լայնությունը կազմում է.

.

Եկեք ստեղծենք հաշվարկային աղյուսակ.

Ինտերվալ տարբերակ, x k –x k +1 Հաճախականություն, n i Ընդմիջման կեսը x i Պայմանական տարբերակ, և ես և ես n i և ես 2 n i (և ես+ 1) 2 n i
10 – 25 17,5 – 3 – 12
25 – 40 32,5 – 2 – 10
40 – 55 47,5 – 1 – 11
55 – 70 62,5
70 – 85 77,5
85 – 100 92,5
100 – 115 107,5
115 – 130 122,5
Գումար – 5

Որպես կեղծ զրո ընտրված արժեքը գ= 62.5 (այս տարբերակը գտնվում է տատանումների շարքի մոտավորապես կեսին) .

Պայմանական տարբերակները որոշվում են բանաձևով

Մեծ ծավալի տեղեկատվություն մշակելիս, ինչը հատկապես կարևոր է ժամանակակից գիտական ​​մշակումներ իրականացնելիս, հետազոտողի առաջ կանգնած է աղբյուրի տվյալները ճիշտ խմբավորելու լուրջ խնդիր։ Եթե ​​տվյալներն իրենց բնույթով դիսկրետ են, ապա, ինչպես տեսանք, խնդիրներ չեն առաջանում, պարզապես անհրաժեշտ է հաշվարկել յուրաքանչյուր հատկանիշի հաճախականությունը: Եթե ​​ուսումնասիրվող հատկանիշն ունի շարունակականնիշ (որը գործնականում ավելի տարածված է), ապա առանձնահատկությունների խմբավորման ինտերվալների օպտիմալ քանակ ընտրելը ամենևին էլ չնչին խնդիր չէ:

Շարունակական պատահական փոփոխականները խմբավորելու համար հատկանիշի ողջ տատանողական տիրույթը բաժանվում է որոշակի թվով ինտերվալների Դեպի.

Խմբավորված ընդմիջում (շարունակական) տատանումների շարքկոչվում են ինտերվալներ, որոնք դասակարգված են հատկանիշի արժեքով (), որտեղ i"-րդ ինտերվալում կամ հարաբերական հաճախականություններ () ընկած դիտարկումների թվերը նշված են համապատասխան հաճախությունների հետ միասին ().

Բնութագրական արժեքների միջակայքերը

mi հաճախականությամբ

ՀիստոգրամԵվ կուտակել (օգիվա),Մեր կողմից արդեն մանրամասն քննարկված տվյալների վիզուալիզացիայի հիանալի միջոց է, որը թույլ է տալիս առաջնային պատկերացում կազմել տվյալների կառուցվածքի մասին: Նման գրաֆիկները (նկ. 1.15) կառուցվում են շարունակական տվյալների համար այնպես, ինչպես դիսկրետ տվյալների համար, միայն հաշվի առնելով այն փաստը, որ շարունակական տվյալները ամբողջությամբ լրացնում են իրենց հնարավոր արժեքների տարածքը՝ վերցնելով ցանկացած արժեք:

Բրինձ. 1.15.

Ահա թե ինչու հիստոգրամի և կուտակման սյունակները պետք է դիպչեն միմյանց և չունեն տարածքներ, որտեղ ատրիբուտների արժեքները չեն ընկնում բոլոր հնարավորների սահմաններում:(այսինքն, հիստոգրամը և կուտակումները չպետք է ունենան «անցքեր» աբսցիսայի առանցքի երկայնքով, որոնք չեն պարունակում ուսումնասիրվող փոփոխականի արժեքները, ինչպես նկար 1.16-ում): Գծի բարձրությունը համապատասխանում է հաճախականությանը` տվյալ ինտերվալի մեջ ընկած դիտարկումների քանակին կամ հարաբերական հաճախությանը` դիտումների համամասնությանը: ինտերվալներ չպետք է հատվենև սովորաբար ունեն նույն լայնությունը:

Բրինձ. 1.16.

Հիստոգրամը և բազմանկյունը հավանականության խտության կորի (դիֆերենցիալ ֆունկցիա) մոտավորություններ են f(x)տեսական բաշխում, որը դիտարկվում է հավանականությունների տեսության ընթացքում: Հետևաբար, դրանց կառուցումը այնքան կարևոր է քանակական շարունակական տվյալների առաջնային վիճակագրական մշակման մեջ. նրանց արտաքին տեսքով կարելի է դատել հիպոթետիկ բաշխման օրենքը:

Կուտակում – միջակայքային տատանումների շարքի կուտակված հաճախությունների (հաճախականությունների) կոր: Կուտակային բաշխման ֆունկցիայի գրաֆիկը համեմատվում է կուտակայինի հետ F(x), քննարկվել է նաև հավանականությունների տեսության դասընթացում։

Հիմնականում հիստոգրամ և կուտակում հասկացությունները կապված են շարունակական տվյալների և դրանց միջակայքային տատանումների շարքի հետ, քանի որ դրանց գրաֆիկները համապատասխանաբար հավանականության խտության ֆունկցիայի և բաշխման ֆունկցիայի էմպիրիկ գնահատականներ են:

Ինտերվալների տատանումների շարքի կառուցումը սկսվում է ինտերվալների քանակի որոշմամբ կ.Եվ այս խնդիրն ուսումնասիրվող հարցում թերեւս ամենաբարդն է, ամենակարեւորն ու վիճահարույցը։

Ինտերվալների քանակը չպետք է չափազանց փոքր լինի, քանի որ դա կդարձնի հիստոգրամը չափազանց հարթ ( չափազանց հարթեցված),կորցնում է բնօրինակ տվյալների փոփոխականության բոլոր հատկանիշները. 1.17 կարող եք տեսնել, թե ինչպես են նույն տվյալները, որոնց վրա պատկերված են Նկ. 1.15, օգտագործվում է ավելի փոքր թվով ինտերվալներով հիստոգրամա կառուցելու համար (ձախ գրաֆիկ)։

Միևնույն ժամանակ, ինտերվալների քանակը չպետք է չափազանց մեծ լինի, այլապես մենք չենք կարողանա գնահատել ուսումնասիրված տվյալների բաշխման խտությունը թվային առանցքի երկայնքով. (ընդհատված),դատարկ ընդմիջումներով, անհավասար (տե՛ս նկ. 1.17, աջ գրաֆիկ):

Բրինձ. 1.17.

Ինչպե՞ս որոշել ընդմիջումների առավել նախընտրելի թիվը:

Դեռևս 1926 թ.-ին Հերբերտ Սթարջեսը առաջարկեց մի բանաձև՝ հաշվարկելու այն միջակայքերի քանակը, որոնցում անհրաժեշտ է բաժանել ուսումնասիրվող բնութագրիչի արժեքների սկզբնական հավաքածուն: Այս բանաձևը իսկապես շատ տարածված է դարձել. վիճակագրական դասագրքերից շատերն առաջարկում են այն, և շատ վիճակագրական փաթեթներ այն օգտագործում են լռելյայն: Թե որքանով է սա արդարացված և բոլոր դեպքերում, շատ լուրջ հարց է։

Այսպիսով, ինչի՞ վրա է հիմնված Սթարջեսի բանաձևը:

Դիտարկենք երկանդամ բաշխումը)

Կիսվեք ընկերների հետ կամ խնայեք ինքներդ.

Բեռնվում է...