Pearson taqsimoti (chi-kvadrat taqsimoti). Statistikaning klassik usullari: chi-kvadrat testi Ksi kvadrat taqsimoti

Xi-kvadrat taqsimoti statistik gipotezalarni tekshirish uchun statistikada eng ko'p qo'llaniladigan usullardan biridir. Xi-kvadrat taqsimotiga asoslanib, eng kuchli moslik testlaridan biri - Pearson chi-kvadrat testi tuzilgan.

Kelishuv mezoni - noma'lum taqsimotning qabul qilingan qonuni haqidagi farazni tekshirish mezoni.

ch2 (chi-kvadrat) testi turli taqsimotlar gipotezasini tekshirish uchun ishlatiladi. Bu uning qadr-qimmati.

Mezonning hisoblash formulasi ga teng

bu yerda m va m’ mos ravishda empirik va nazariy chastotalardir

ko'rib chiqilayotgan taqsimot;

n - erkinlik darajalari soni.

Tekshirish uchun biz empirik (kuzatilgan) va nazariy (normal taqsimot taxmini ostida hisoblangan) chastotalarni solishtirishimiz kerak.

Agar empirik chastotalar hisoblangan yoki kutilgan chastotalar bilan to'liq mos tushsa, S (E – T) = 0 va ch2 mezoni ham nolga teng bo'ladi. Agar S (E - T) nolga teng bo'lmasa, bu hisoblangan chastotalar va seriyaning empirik chastotalari o'rtasidagi nomuvofiqlikni ko'rsatadi. Bunday hollarda nazariy jihatdan noldan cheksizgacha o'zgarishi mumkin bo'lgan ch2 mezonining ahamiyatini baholash kerak. Bu ch2f ning haqiqatda olingan qiymatini uning kritik qiymati (ch2st) bilan solishtirish yo‘li bilan amalga oshiriladi.Nol gipoteza, ya’ni empirik va nazariy yoki kutilayotgan chastotalar o‘rtasidagi nomuvofiqlik tasodifiy degan taxmin, agar ch2f dan katta yoki teng bo‘lsa, rad etiladi. Qabul qilingan muhimlik darajasi (a) va erkinlik darajalari soni (n) uchun ch2-chi.

ch2 tasodifiy o'zgaruvchining ehtimoliy qiymatlarini taqsimlash uzluksiz va assimetrikdir. Bu erkinlik darajalari soniga (n) bog'liq va kuzatishlar soni ortib borishi bilan normal taqsimotga yaqinlashadi. Shuning uchun baholashga ch2 mezonini qo'llash diskret taqsimotlar uning qiymatiga ta'sir qiluvchi ba'zi xatolar bilan bog'liq, ayniqsa kichik namunalarda. Aniqroq hisob-kitoblarni olish uchun namuna taqsimlanadi variatsion qator, kamida 50 ta variant bo'lishi kerak. ch2 mezonini to'g'ri qo'llash, shuningdek, ekstremal sinflardagi variantlarning chastotalari 5 dan kam bo'lmasligini talab qiladi; agar ularning soni 5 dan kam bo'lsa, u holda ular qo'shni sinflarning chastotalari bilan birlashtiriladi, shunda umumiy miqdor 5 dan katta yoki teng bo'ladi. Chastotalar birikmasiga ko'ra, sinflar soni (N) kamayadi. Erkinlik darajalari soni o'zgaruvchanlik erkinligiga cheklovlar sonini hisobga olgan holda sinflarning ikkinchi darajali soni bilan belgilanadi.



ch2 mezonini aniqlashning aniqligi ko'p jihatdan nazariy chastotalarni (T) hisoblashning aniqligiga bog'liq bo'lganligi sababli, empirik va hisoblangan chastotalar orasidagi farqni olish uchun yaxlitlanmagan nazariy chastotalardan foydalanish kerak.

Misol tariqasida, foydalanishga bag'ishlangan veb-saytda chop etilgan tadqiqotni olaylik statistik usullar gumanitar fanlarda.

Chi-kvadrat testi chastota taqsimotini ularning normal taqsimlangan yoki yo'qligidan qat'iy nazar solishtirish imkonini beradi.

Chastotasi hodisaning sodir bo'lish sonini bildiradi. Odatda, hodisalarning paydo bo'lish chastotasi o'zgaruvchilar nomlar shkalasida o'lchanganda va ularning boshqa xususiyatlari, chastotadan tashqari, tanlash imkonsiz yoki muammoli bo'lganda ko'rib chiqiladi. Boshqacha qilib aytganda, o'zgaruvchi sifat xususiyatlariga ega bo'lganda. Bundan tashqari, ko'plab tadqiqotchilar test ballarini darajalarga (yuqori, o'rtacha, past) aylantirishga va bu darajadagi odamlar sonini bilish uchun ballar taqsimoti jadvallarini tuzishga moyildirlar. Darajaning birida (toifalarning birida) odamlar soni haqiqatan ham ko'proq (kamroq) ekanligini isbotlash uchun Chi-kvadrat koeffitsienti ham qo'llaniladi.

Keling, eng oddiy misolni ko'rib chiqaylik.

Yosh o'smirlar o'rtasida o'z-o'zini hurmat qilishni aniqlash uchun test o'tkazildi. Test ballari uchta darajaga aylantirildi: yuqori, o'rta, past. Chastotalar quyidagicha taqsimlandi:

Yuqori (B) 27 kishi.

O'rtacha (C) 12 kishi.

Kam (L) 11 kishi

Ko'rinib turibdiki, bolalarning aksariyati o'zini yuqori baholaydi, ammo buni statistik jihatdan isbotlash kerak. Buning uchun biz Chi-kvadrat testidan foydalanamiz.

Bizning vazifamiz olingan empirik ma'lumotlar nazariy jihatdan bir xil ehtimolli ma'lumotlardan farq qiladimi yoki yo'qligini tekshirishdir. Buning uchun siz nazariy chastotalarni topishingiz kerak. Bizning holatlarimizda nazariy chastotalar teng ehtimolli chastotalar bo'lib, ular barcha chastotalarni qo'shish va toifalar soniga bo'lish yo'li bilan topiladi.

Bizning holatda:

(B + C + H)/3 = (27+12+11)/3 = 16,6

Xi-kvadrat testini hisoblash formulasi:

ch2 = ∑(E - T)I / T

Biz jadval tuzamiz:

Oxirgi ustunning yig'indisini toping:

Endi siz kriteriyaning kritik qiymatini kritik qiymatlar jadvalidan foydalanib topishingiz kerak (Ilovadagi 1-jadval). Buning uchun bizga erkinlik darajalari soni (n) kerak.

n = (R - 1) * (C - 1)

Bu erda R - jadvaldagi qatorlar soni, C - ustunlar soni.

Bizning holatlarimizda faqat bitta ustun (asl empirik chastotalarni anglatadi) va uchta qator (toifalar) mavjud, shuning uchun formula o'zgaradi - biz ustunlarni istisno qilamiz.

n = (R - 1) = 3-1 = 2

Xatolik ehtimoli p≤0,05 va n = 2 uchun kritik qiymat ch2 = 5,99 ga teng.

Olingan empirik qiymat kritik qiymatdan katta - chastotalardagi farqlar sezilarli (ch2= 9,64; p≤0,05).

Ko'rib turganingizdek, mezonni hisoblash juda oddiy va ko'p vaqt talab qilmaydi. Chi-kvadrat testining amaliy ahamiyati juda katta. Ushbu usul anketalarga javoblarni tahlil qilishda eng qimmatlidir.


Keling, yanada murakkab misolni ko'rib chiqaylik.

Masalan, psixolog o'qituvchilarning qizlarga nisbatan o'g'il bolalarga nisbatan ko'proq moyilligi rostmi yoki yo'qligini bilmoqchi. Bular. qizlarni maqtash ehtimoli ko'proq. Buning uchun psixolog o'qituvchilar tomonidan yozilgan uchta so'zning paydo bo'lish chastotasi bo'yicha o'quvchilarning xususiyatlarini tahlil qildi: "faol", "tirishqoq", "intizomli" va so'zlarning sinonimlari ham hisobga olingan. Jadvalga so'zlarning paydo bo'lish chastotasi to'g'risidagi ma'lumotlar kiritildi:

Olingan ma'lumotlarni qayta ishlash uchun biz chi-kvadrat testidan foydalanamiz.

Buning uchun biz empirik chastotalarni taqsimlash jadvalini tuzamiz, ya'ni. Biz kuzatadigan chastotalar:

Nazariy jihatdan, biz chastotalar teng taqsimlanishini kutamiz, ya'ni. chastota o'g'il va qiz bolalar o'rtasida mutanosib ravishda taqsimlanadi. Keling, nazariy chastotalar jadvalini tuzamiz. Buning uchun satr yig'indisini ustun yig'indisiga ko'paytiring va olingan sonni umumiy yig'indiga (s) bo'ling.

Hisob-kitoblarning yakuniy jadvali quyidagicha ko'rinadi:

ch2 = ∑(E - T)I / T

n = (R - 1), bu erda R - jadvaldagi qatorlar soni.

Bizning holatda, chi-kvadrat = 4,21; n = 2.

Mezonning kritik qiymatlari jadvalidan foydalanib, biz quyidagilarni topamiz: n = 2 va xato darajasi 0,05 bo'lsa, kritik qiymat ch2 = 5,99 ni tashkil qiladi.

Olingan qiymat kritik qiymatdan kichik, ya'ni nol gipoteza qabul qilinadi.

Xulosa: o'qituvchilar bolaga xarakteristikalar yozishda uning jinsiga ahamiyat bermaydilar.


Xulosa.

K.Pirson taraqqiyotga katta hissa qo‘shgan matematik statistika(ko'p sonli asosiy tushunchalar). Pirsonning asosiy falsafiy pozitsiyasi quyidagicha ifodalangan: fan tushunchalari - bu sun'iy konstruktsiyalar, hissiy tajribani tasvirlash va tartibga solish vositalari; ularni ilmiy jumlalarga bog‘lash qoidalari fan falsafasi bo‘lgan fan grammatikasi bilan ajratilgan. Umumjahon intizom - amaliy statistika - bir-biriga bog'liq bo'lmagan tushunchalar va hodisalarni bog'lash imkonini beradi, garchi Pirsonga ko'ra, bu sub'ektivdir.

K.Pirsonning koʻpgina konstruksiyalari antropologik materiallar yordamida bevosita bogʻliq yoki ishlab chiqilgan. U fanning barcha sohalarida qo'llaniladigan sonli tasniflash va statistik mezonlarning ko'plab usullarini ishlab chiqdi.


Adabiyot.

1. Bogolyubov A. N. Matematika. Mexanika. Biografik ma'lumotnoma. - Kiev: Naukova Dumka, 1983 yil.

2. Kolmogorov A. N., Yushkevich A. P. (tahrirlar). 19-asr matematikasi. - M.: Fan. - T.I.

3. 3. Borovkov A.A. Matematik statistika. M.: Nauka, 1994 yil.

4. 8. Feller V. Ehtimollar nazariyasiga kirish va uning qo‘llanilishi. - M.: Mir, T.2, 1984 y.

5. 9. Xarman G., Zamonaviy omil tahlili. - M.: Statistika, 1972 yil.

Oldin kech XIX asrda normal taqsimot ma'lumotlarning o'zgaruvchanligining universal qonuni hisoblangan. Biroq, K.Pirson empirik chastotalar normal taqsimotdan juda farq qilishi mumkinligini ta'kidladi. Buni qanday isbotlash kerak degan savol tug'ildi. Faqat sub'ektiv bo'lgan grafik taqqoslash emas, balki qat'iy miqdoriy asoslash ham talab qilindi.

Mezon shunday ixtiro qilingan ch 2(chi kvadrat), bu empirik (kuzatilgan) va nazariy (kutilgan) chastotalar o'rtasidagi nomuvofiqlikning ahamiyatini tekshiradi. Bu 1900 yilda sodir bo'lgan, ammo bu mezon hali ham qo'llanilmoqda. Bundan tashqari, u ko'plab muammolarni hal qilish uchun moslashtirilgan. Avvalo, bu kategorik ma'lumotlarni tahlil qilish, ya'ni. miqdor bilan emas, balki qaysidir toifaga mansubligi bilan ifodalanganlar. Masalan, mashina sinfi, tajriba ishtirokchisining jinsi, o'simlik turi va boshqalar. Bunday ma'lumotlarga qo'shish va ko'paytirish kabi matematik operatsiyalarni qo'llash mumkin emas, chastotalarni faqat ular uchun hisoblash mumkin.

Biz kuzatilgan chastotalarni belgilaymiz Haqida (kuzatilgan), kutilgan - E (kutilgan). Misol tariqasida matritsani 60 marta aylantirish natijasini olaylik. Agar u nosimmetrik va bir xil bo'lsa, har qanday tomonni olish ehtimoli 1/6 ga teng va shuning uchun har bir tomonni olishning kutilgan soni 10 (1/6∙60) ga teng. Kuzatilgan va kutilgan chastotalarni jadvalga yozamiz va gistogramma chizamiz.

Nol gipoteza - chastotalar izchil, ya'ni haqiqiy ma'lumotlar kutilgan ma'lumotlarga zid emas. Muqobil gipoteza shundaki, chastotalardagi og'ishlar tasodifiy tebranishlardan tashqariga chiqadi, nomuvofiqliklar statistik ahamiyatga ega. Qattiq xulosa chiqarish uchun bizga kerak.

  1. Kuzatilgan va kutilgan chastotalar o'rtasidagi nomuvofiqlikning umumiy o'lchovi.
  2. Farqlar yo'qligi haqidagi gipoteza to'g'ri bo'lsa, bu o'lchovning taqsimlanishi.

Keling, chastotalar orasidagi masofadan boshlaylik. Agar siz shunchaki farqni olsangiz O - E, keyin bunday o'lchov ma'lumotlar (chastotalar) miqyosiga bog'liq bo'ladi. Masalan, 20 - 5 = 15 va 1020 - 1005 = 15. Ikkala holatda ham farq 15. Lekin birinchi holatda kutilgan chastotalar kuzatilganidan 3 baravar kam, ikkinchi holatda esa - atigi 1,5. %. Bizga masshtabga bog'liq bo'lmagan nisbiy o'lchov kerak.

Keling, quyidagi faktlarga e'tibor qarataylik. Umuman olganda, chastotalar o'lchanadigan toifalar soni ancha katta bo'lishi mumkin, shuning uchun bitta kuzatuvning u yoki bu toifaga kirishi ehtimoli juda kichik. Agar shunday bo'lsa, unda bunday tasodifiy o'zgaruvchining taqsimoti deb nomlanuvchi noyob hodisalar qonuniga bo'ysunadi Puasson qonuni. Ma'lumki, Puasson qonunida matematik kutish va dispersiya qiymati mos keladi (parametr λ ). Bu nominal o'zgaruvchining ayrim toifalari uchun kutilgan chastotani anglatadi E i bir vaqtda va uning tarqalishi bo'ladi. Bundan tashqari, Puasson qonuni ko'p kuzatuvlar bilan normal holatga keladi. Ushbu ikkita faktni birlashtirib, agar kuzatilgan va kutilgan chastotalar o'rtasidagi kelishuv haqidagi gipoteza to'g'ri bo'lsa, unda ko'p sonli kuzatishlar bilan, ifoda

Oddiylik faqat etarlicha yuqori chastotalarda paydo bo'lishini esdan chiqarmaslik kerak. Statistikada kuzatuvlarning umumiy soni (chastotalarning yig'indisi) kamida 50 ta bo'lishi va har bir gradatsiyada kutilayotgan chastota kamida 5 bo'lishi kerakligi umumiy qabul qilinadi. Faqat bu holatda yuqorida ko'rsatilgan qiymat standart normal taqsimotga ega bo'ladi. . Bu shart bajarilgan deb faraz qilaylik.

Standart normal taqsimot ±3 (uch sigma qoidasi) doirasidagi deyarli barcha qiymatlarga ega. Shunday qilib, biz bir gradatsiya uchun chastotalardagi nisbiy farqni oldik. Bizga umumlashtiriladigan o'lchov kerak. Siz shunchaki barcha og'ishlarni qo'shib bo'lmaydi - biz 0 ni olamiz (nima uchun taxmin qiling). Pirson bu og'ishlarning kvadratlarini qo'shishni taklif qildi.

Bu belgi Chi-kvadrat testi Pearson. Agar chastotalar haqiqatan ham kutilganlarga mos keladigan bo'lsa, unda mezonning qiymati nisbatan kichik bo'ladi (chunki ko'pchilik og'ishlar nolga teng). Ammo agar mezon katta bo'lib chiqsa, bu chastotalar orasidagi sezilarli farqlarni ko'rsatadi.

Bunday yoki undan ham kattaroq qiymatning paydo bo'lishi ehtimoldan yiroq bo'lganda, Pearson mezoni "katta" bo'ladi. Va bunday ehtimolni hisoblash uchun, tajriba ko'p marta takrorlanganda, chastota kelishuvi gipotezasi to'g'ri bo'lganda, mezonning taqsimlanishini bilish kerak.

Ko'rish oson bo'lganidek, chi-kvadrat qiymati ham atamalar soniga bog'liq. Qanchalik ko'p bo'lsa, mezon shunchalik katta qiymatga ega bo'lishi kerak, chunki har bir atama jamiga hissa qo'shadi. Shuning uchun, har bir miqdor uchun mustaqil shartlari, o'z taqsimoti bo'ladi. Ma'lum bo'ladiki ch 2 tarqatishning butun oilasi.

Va bu erda biz bir nozik daqiqaga keldik. Raqam nima mustaqil shartlari? Har qanday atama (ya'ni, og'ish) mustaqil bo'lib tuyuladi. K.Pirson ham shunday deb o'ylagan, ammo u noto'g'ri bo'lib chiqdi. Aslida, mustaqil atamalar soni nominal o'zgaruvchining gradatsiyalari sonidan bitta kam bo'ladi n. Nega? Chunki agar bizda chastotalar yig'indisi allaqachon hisoblangan namunaga ega bo'lsak, u holda chastotalardan biri har doim umumiy son va barcha qolganlarning yig'indisi o'rtasidagi farq sifatida aniqlanishi mumkin. Shunday qilib, o'zgarishlar biroz kamroq bo'ladi. Ronald Fisher bu haqiqatni Pearson o'z mezonini ishlab chiqqanidan 20 yil o'tgach payqadi. Hatto stollarni ham qayta ishlash kerak edi.

Shu munosabat bilan Fisher statistikaga yangi kontseptsiyani kiritdi - erkinlik darajasi(erkinlik darajalari), bu yig'indidagi mustaqil atamalar sonini ifodalaydi. Erkinlik darajalari tushunchasi matematik tushuntirishga ega va faqat normal (Student, Fisher-Snedecor va chi-kvadrat) bilan bog'liq taqsimotlarda namoyon bo'ladi.

Erkinlik darajalarining ma'nosini yaxshiroq tushunish uchun jismoniy analogga murojaat qilaylik. Kosmosda erkin harakatlanadigan nuqtani tasavvur qilaylik. U 3 erkinlik darajasiga ega, chunki uch o'lchamli fazoda istalgan yo'nalishda harakatlanishi mumkin. Agar nuqta har qanday sirt bo'ylab harakatlansa, u uch o'lchovli fazoda bo'lishda davom etsa ham, u allaqachon ikki erkinlik darajasiga ega (oldinga va orqaga, chapga va o'ngga). Buloq bo'ylab harakatlanadigan nuqta yana uch o'lchamli fazoda, lekin faqat bir erkinlik darajasiga ega, chunki oldinga yoki orqaga harakatlanishi mumkin. Ko'rib turganingizdek, ob'ekt joylashgan joy har doim ham haqiqiy harakat erkinligiga mos kelmaydi.

Taxminan xuddi shunday tarzda, statistik mezonni taqsimlash uni hisoblash uchun zarur bo'lgan shartlardan ko'ra kamroq elementlar soniga bog'liq bo'lishi mumkin. Umuman olganda, erkinlik darajalari soni mavjud bog'liqliklar soni bo'yicha kuzatishlar sonidan kamroq.

Shunday qilib, chi kvadrat taqsimoti ( ch 2) har biri erkinlik darajalari parametriga bog'liq bo'lgan taqsimotlar oilasidir. Va chi-kvadrat testining rasmiy ta'rifi quyidagicha. Tarqatish ch 2(chi-kvadrat) s k erkinlik darajalari - kvadratlar yig'indisining taqsimlanishi k mustaqil standart normal tasodifiy o'zgaruvchilar.

Keyinchalik, chi-kvadrat taqsimot funktsiyasi hisoblangan formulaning o'ziga o'tishimiz mumkin edi, lekin, xayriyatki, hamma narsa biz uchun uzoq vaqtdan beri hisoblab chiqilgan. Qiziqish ehtimolini olish uchun siz tegishli statistik jadvaldan yoki Excelda tayyor funktsiyadan foydalanishingiz mumkin.

Erkinlik darajalari soniga qarab chi-kvadrat taqsimotining shakli qanday o'zgarishi qiziq.

Erkinlik darajasi ortib borishi bilan, chi-kvadrat taqsimoti normal bo'lishga intiladi. Bu markaziy chegara teoremasining harakati bilan izohlanadi, unga ko'ra ko'p sonli mustaqil tasodifiy o'zgaruvchilar yig'indisi normal taqsimotga ega. Kvadratlar haqida hech narsa aytilmagan)).

Pearson chi-kvadrat testi yordamida gipotezani tekshirish

Endi biz gi-kvadrat usuli yordamida gipotezalarni tekshirishga keldik. Umuman olganda, texnologiya saqlanib qolmoqda. Nol gipoteza shundan iboratki, kuzatilgan chastotalar kutilganlarga to'g'ri keladi (ya'ni ular bir xil populyatsiyadan olinganligi sababli ular o'rtasida farq yo'q). Agar shunday bo'lsa, u holda tarqalish tasodifiy tebranishlar chegarasida nisbatan kichik bo'ladi. Dispersiya o'lchovi chi-kvadrat testi yordamida aniqlanadi. Keyinchalik, mezonning o'zi kritik qiymat bilan taqqoslanadi (tegishli ahamiyatga egalik darajasi va erkinlik darajalari uchun) yoki, to'g'rirog'i, kuzatilgan p-qiymati hisoblanadi, ya'ni. nol gipoteza to'g'ri bo'lsa, bir xil yoki undan ham kattaroq mezon qiymatini olish ehtimoli.

Chunki biz chastotalar kelishuviga qiziqamiz, keyin mezon kritik darajadan kattaroq bo'lsa, gipoteza rad etiladi. Bular. mezon bir tomonlama. Biroq, ba'zan (ba'zan) chap gipotezani sinab ko'rish kerak. Masalan, empirik ma'lumotlar nazariy ma'lumotlarga juda o'xshash bo'lsa. Keyin mezon mumkin bo'lmagan mintaqaga tushishi mumkin, ammo chap tomonda. Gap shundaki, tabiiy sharoitda nazariy chastotalar bilan amalda mos keladigan chastotalarni olish dargumon. Har doim xato beradigan tasodifiylik mavjud. Ammo bunday xatolik bo'lmasa, ehtimol ma'lumotlar soxtalashtirilgan. Ammo shunga qaramay, o'ng tomonli gipoteza odatda sinovdan o'tkaziladi.

Keling, zar muammosiga qaytaylik. Keling, mavjud ma'lumotlardan foydalanib, chi-kvadrat testining qiymatini hisoblaylik.

Endi 5 erkinlik darajasidagi kritik qiymatni topamiz ( k) va ahamiyatlilik darajasi 0,05 ( α ) chi kvadrat taqsimotining kritik qiymatlari jadvaliga muvofiq.

Ya'ni, 0,05 kvanti 5 erkinlik darajasiga ega bo'lgan chi-kvadrat taqsimoti (o'ng quyruq) ch 2 0,05; 5 = 11,1.

Haqiqiy va jadvalli qiymatlarni solishtiramiz. 3.4 ( ch 2) < 11,1 (ch 2 0,05; 5). Hisoblangan mezon kichikroq bo'lib chiqdi, ya'ni chastotalarning tengligi (kelishuvi) gipotezasi rad etilmaydi. Rasmda vaziyat shunday ko'rinadi.

Agar hisoblangan qiymat kritik mintaqaga tushib qolsa, nol gipoteza rad etiladi.

p-qiymatini ham hisoblash to'g'riroq bo'ladi. Buni amalga oshirish uchun jadvalda berilgan erkinlik darajalari uchun eng yaqin qiymatni topishingiz va mos keladigan ahamiyat darajasini ko'rishingiz kerak. Lekin bu o'tgan asr. Biz kompyuterdan, xususan MS Exceldan foydalanamiz. Excelda chi-kvadrat bilan bog'liq bir nechta funktsiyalar mavjud.

Quyida ularning qisqacha tavsifi keltirilgan.

CH2.OBR- chapda berilgan ehtimollikdagi mezonning kritik qiymati (statistik jadvallarda bo'lgani kabi)

CH2.OBR.PH- o'ngdagi berilgan ehtimollik mezonining kritik qiymati. Funktsiya asosan avvalgisini takrorlaydi. Ammo bu erda siz darhol darajani ko'rsatishingiz mumkin α , 1 dan ayirish o'rniga. Bu qulayroq, chunki ko'p hollarda tarqatishning o'ng dumi kerak.

CH2.DIST– chapda p-qiymati (zichlikni hisoblash mumkin).

CH2.DIST.PH- o'ngda p-qiymati.

CHI2.TEST- darhol ikkita chastota diapazoni uchun chi-kvadrat sinovini o'tkazadi. Erkinlik darajalari soni ustundagi chastotalar sonidan bitta kamroq qabul qilinadi (bunday bo'lishi kerak), bu p-qiymatini qaytaradi.

Keling, tajribamiz uchun 5 erkinlik darajasi va alfa 0,05 uchun kritik (jadval) qiymatini hisoblaylik. Excel formulasi quyidagicha ko'rinadi:

CH2.OBR(0,95;5)

CH2.OBR.PH(0,05;5)

Natija bir xil bo'ladi - 11.0705. Bu biz jadvalda ko'rgan qiymat (1 kasrga yaxlitlangan).

Nihoyat, 5 darajali erkinlik mezoni uchun p-qiymatini hisoblaylik ch 2= 3.4. Bizga o'ngdagi ehtimollik kerak, shuning uchun biz HH (o'ng quyruq) qo'shilishi bilan funktsiyani olamiz.

CH2.DIST.PH (3,4;5) = 0,63857

Bu shuni anglatadiki, 5 darajadagi erkinlik bilan mezon qiymatini olish ehtimoli ch 2= 3,4 va undan ko'p deyarli 64% ga teng. Tabiiyki, gipoteza rad etilmaydi (p-qiymati 5% dan katta), chastotalar juda yaxshi kelishuvda.

Endi chastotalarning kelishish haqidagi gipotezani chi-kvadrat testi va Excelning CHI2.TEST funksiyasi yordamida tekshiramiz.

Jadvallar, mashaqqatli hisoblar yo'q. Funktsiya argumentlari sifatida kuzatilgan va kutilgan chastotalarga ega ustunlarni ko'rsatib, biz darhol p-qiymatini olamiz. Go'zallik.

Endi tasavvur qiling-a, siz shubhali yigit bilan zar o'ynayapsiz. 1 dan 5 gacha bo'lgan ochkolarning taqsimlanishi bir xil bo'lib qoladi, lekin u 26 oltitani aylantiradi (jami otishlar soni 78 ga aylanadi).

Bu holda p-qiymati 0,003 ga aylanadi, bu 0,05 dan ancha past. Zarlarning haqiqiyligiga shubha qilish uchun yaxshi sabablar bor. Xi-kvadrat taqsimot jadvalida bu ehtimollik qanday ko'rinadi.

Bu erda chi-kvadrat mezonining o'zi 17,8 ga aylanadi, bu tabiiy ravishda jadvaldagi (11,1) dan kattaroqdir.

Umid qilamanki, kelishuv mezoni nima ekanligini tushuntirib bera oldim ch 2(Pirson chi-kvadrati) va undan statistik gipotezalarni tekshirish uchun qanday foydalanish mumkinligi.

Va nihoyat, yana bir bor muhim shart haqida! Chi-kvadrat testi faqat barcha chastotalar soni 50 dan oshganda va har bir gradatsiya uchun kutilayotgan minimal qiymat 5 dan kam bo'lmaganda to'g'ri ishlaydi. Agar biron bir toifada kutilgan chastota 5 dan kam bo'lsa, lekin barcha chastotalar yig'indisi oshib ketgan bo'lsa. 50, keyin bunday toifa eng yaqini bilan birlashtiriladi, shunda ularning umumiy chastotasi 5 dan oshadi. Agar buning iloji bo'lmasa yoki chastotalar yig'indisi 50 dan kam bo'lsa, gipotezalarni tekshirishning aniqroq usullaridan foydalanish kerak. Biz ular haqida boshqa safar gaplashamiz.

Quyida gi-kvadrat testi yordamida Excelda gipotezani qanday tekshirish haqida video bor.

U 1, U 2, ..,U k mustaqil etalon bo'lsin normal qiymatlar. K = U 1 2 +U 2 2 + .. + U k 2 tasodifiy miqdorning taqsimlanishi xi-kvadrat taqsimoti deyiladi. k erkinlik darajalari (K~c 2 (k) ni yozing). Bu ijobiy egrilik va quyidagi xarakteristikaga ega bo'lgan unimodal taqsimot: rejim M=k-2 kutilgan qiymat m=k dispersiya D=2k (rasm). Parametrning etarlicha katta qiymati bilan k taqsimot ch 2 (k) parametrlari bilan taxminan normal taqsimotga ega

Matematik statistika masalalarini yechishda berilgan a ehtimollik va erkinlik darajalari soniga qarab ch 2 (k) kritik nuqtalardan foydalaniladi. k(2-ilova). Kritik nuqta Χ 2 kr = Χ 2 (k; a) - o'ng tomonda taqsimot zichligi egri chizig'i ostidagi maydonning 100- a % qismi joylashgan hudud chegarasi. Sinov paytida tasodifiy miqdorning qiymati K~c 2 (k) ch 2 (k) nuqtadan o‘ngga tushishi ehtimolligi a P(K≥c 2 kp)≤ a) dan oshmaydi. Masalan, K~c 2 (20) tasodifiy miqdor uchun a=0,05 ehtimollikni o’rnatamiz. Xi-kvadrat taqsimotining kritik nuqtalari jadvalidan (jadvallardan) foydalanib, ch 2 kp = ch 2 (20;0,05) = 31,4 ni topamiz. Bu shuni anglatadiki, bu tasodifiy o'zgaruvchining ehtimoli K 31,4 dan katta, 0,05 dan kichik qiymatni qabul qiling (rasm).

Guruch. Erkinlik darajalari sonining turli qiymatlari uchun taqsimlanish zichligi grafigi ch 2 (k) k

Kritik nuqtalar ch 2 (k) quyidagi kalkulyatorlarda qo'llaniladi:

  1. Multikollinearlik mavjudligini tekshirish (multikollinearlik haqida).
Chi-kvadrat yordamida gipotezani sinab ko'rish faqat "aloqa bormi?" Degan savolga javob beradi, munosabatlar yo'nalishini tekshirish uchun qo'shimcha tadqiqotlar talab etiladi. Bundan tashqari, Chi-kvadrat testi past chastotali ma'lumotlar bilan ishlashda ma'lum bir xatoga ega.

Shuning uchun, aloqa yo'nalishini tekshirish uchun tanlang korrelyatsiya tahlili, xususan, Pearson korrelyatsiya koeffitsienti yordamida gipotezani sinovdan o'tkazish va t-testi yordamida muhimlikni qo'shimcha tekshirish.

Muhimlik darajasining har qanday qiymati uchun a kh 2 ni MS Excel funksiyasidan foydalanib topish mumkin: =HI2OBR(a;erkinlik darajalari)

n-1 .995 .990 .975 .950 .900 .750 .500 .250 .100 .050 .025 .010 .005
1 0.00004 0.00016 0.00098 0.00393 0.01579 0.10153 0.45494 1.32330 2.70554 3.84146 5.02389 6.63490 7.87944
2 0.01003 0.02010 0.05064 0.10259 0.21072 0.57536 1.38629 2.77259 4.60517 5.99146 7.37776 9.21034 10.59663
3 0.07172 0.11483 0.21580 0.35185 0.58437 1.21253 2.36597 4.10834 6.25139 7.81473 9.34840 11.34487 12.83816
4 0.20699 0.29711 0.48442 0.71072 1.06362 1.92256 3.35669 5.38527 7.77944 9.48773 11.14329 13.27670 14.86026
5 0.41174 0.55430 0.83121 1.14548 1.61031 2.67460 4.35146 6.62568 9.23636 11.07050 12.83250 15.08627 16.74960
6 0.67573 0.87209 1.23734 1.63538 2.20413 3.45460 5.34812 7.84080 10.64464 12.59159 14.44938 16.81189 18.54758
7 0.98926 1.23904 1.68987 2.16735 2.83311 4.25485 6.34581 9.03715 12.01704 14.06714 16.01276 18.47531 20.27774
8 1.34441 1.64650 2.17973 2.73264 3.48954 5.07064 7.34412 10.21885 13.36157 15.50731 17.53455 20.09024 21.95495
9 1.73493 2.08790 2.70039 3.32511 4.16816 5.89883 8.34283 11.38875 14.68366 16.91898 19.02277 21.66599 23.58935
10 2.15586 2.55821 3.24697 3.94030 4.86518 6.73720 9.34182 12.54886 15.98718 18.30704 20.48318 23.20925 25.18818
11 2.60322 3.05348 3.81575 4.57481 5.57778 7.58414 10.34100 13.70069 17.27501 19.67514 21.92005 24.72497 26.75685
12 3.07382 3.57057 4.40379 5.22603 6.30380 8.43842 11.34032 14.84540 18.54935 21.02607 23.33666 26.21697 28.29952
13 3.56503 4.10692 5.00875 5.89186 7.04150 9.29907 12.33976 15.98391 19.81193 22.36203 24.73560 27.68825 29.81947
14 4.07467 4.66043 5.62873 6.57063 7.78953 10.16531 13.33927 17.11693 21.06414 23.68479 26.11895 29.14124 31.31935
15 4.60092 5.22935 6.26214 7.26094 8.54676 11.03654 14.33886 18.24509 22.30713 24.99579 27.48839 30.57791 32.80132
16 5.14221 5.81221 6.90766 7.96165 9.31224 11.91222 15.33850 19.36886 23.54183 26.29623 28.84535 31.99993 34.26719
17 5.69722 6.40776 7.56419 8.67176 10.08519 12.79193 16.33818 20.48868 24.76904 27.58711 30.19101 33.40866 35.71847
18 6.26480 7.01491 8.23075 9.39046 10.86494 13.67529 17.33790 21.60489 25.98942 28.86930 31.52638 34.80531 37.15645
19 6.84397 7.63273 8.90652 10.11701 11.65091 14.56200 18.33765 22.71781 27.20357 30.14353 32.85233 36.19087 38.58226
20 7.43384 8.26040 9.59078 10.85081 12.44261 15.45177 19.33743 23.82769 28.41198 31.41043 34.16961 37.56623 39.99685
21 8.03365 8.89720 10.28290 11.59131 13.23960 16.34438 20.33723 24.93478 29.61509 32.67057 35.47888 38.93217 41.40106
22 8.64272 9.54249 10.98232 12.33801 14.04149 17.23962 21.33704 26.03927 30.81328 33.92444 36.78071 40.28936 42.79565
23 9.26042 10.19572 11.68855 13.09051 14.84796 18.13730 22.33688 27.14134 32.00690 35.17246 38.07563 41.63840 44.18128
24 9.88623 10.85636 12.40115 13.84843 15.65868 19.03725 23.33673 28.24115 33.19624 36.41503 39.36408 42.97982 45.55851
25 10.51965 11.52398 13.11972 14.61141 16.47341 19.93934 24.33659 29.33885 34.38159 37.65248 40.64647 44.31410 46.92789
26 11.16024 12.19815 13.84390 15.37916 17.29188 20.84343 25.33646 30.43457 35.56317 38.88514 41.92317 45.64168 48.28988
27 11.80759 12.87850 14.57338 16.15140 18.11390 21.74940 26.33634 31.52841 36.74122 40.11327 43.19451 46.96294 49.64492
28 12.46134 13.56471 15.30786 16.92788 18.93924 22.65716 27.33623 32.62049 37.91592 41.33714 44.46079 48.27824 50.99338
29 13.12115 14.25645 16.04707 17.70837 19.76774 23.56659 28.33613 33.71091 39.08747 42.55697 45.72229 49.58788 52.33562
30 13.78672 14.95346 16.79077 18.49266 20.59923 24.47761 29.33603 34.79974 40.25602 43.77297 46.97924 50.89218 53.67196
Erkinlik darajalari soni k Muhimlik darajasi a
0,01 0,025 0.05 0,95 0,975 0.99
1 6.6 5.0 3.8 0.0039 0.00098 0.00016
2 9.2 7.4 6.0 0.103 0.051 0.020
3 11.3 9.4 7.8 0.352 0.216 0.115
4 13.3 11.1 9.5 0.711 0.484 0.297
5 15.1 12.8 11.1 1.15 0.831 0.554
6 16.8 14.4 12.6 1.64 1.24 0.872
7 18.5 16.0 14.1 2.17 1.69 1.24
8 20.1 17.5 15.5 2.73 2.18 1.65
9 21.7 19.0 16.9 3.33 2.70 2.09
10 23.2 20.5 18.3 3.94 3.25 2.56
11 24.7 21.9 19.7 4.57 3.82 3.05
12 26.2 23.3 21 .0 5.23 4.40 3.57
13 27.7 24.7 22.4 5.89 5.01 4.11
14 29.1 26.1 23.7 6.57 5.63 4.66
15 30.6 27.5 25.0 7.26 6.26 5.23
16 32.0 28.8 26.3 7.96 6.91 5.81
17 33.4 30.2 27.6 8.67 7.56 6.41
18 34.8 31.5 28.9 9.39 8.23 7.01
19 36.2 32.9 30.1 10.1 8.91 7.63
20 37.6 34.2 31.4 10.9 9.59 8.26
21 38.9 35.5 32.7 11.6 10.3 8.90
22 40.3 36.8 33.9 12.3 11.0 9.54
23 41.6 38.1 35.2 13.1 11.7 10.2
24 43.0 39.4 36.4 13.8 12.4 10.9
25 44.3 40.6 37.7 14.6 13.1 11.5
26 45.6 41.9 38.9 15.4 13.8 12.2
27 47.0 43.2 40.1 16.2 14.6 12.9
28 48.3 44.5 41.3 16.9 15.3 13.6
29 49.6 45.7 42.6 17.7 16.0 14.3
30 50.9 47.0 43.8 18.5 16.8 15.0

Pearson (chi-kvadrat), Student va Fisher taqsimotlari

Oddiy taqsimotdan foydalanib, statistik ma'lumotlarni qayta ishlashda tez-tez ishlatiladigan uchta taqsimot aniqlanadi. Ushbu tarqatishlar kitobning keyingi bo'limlarida ko'p marta uchraydi.

Pearson taqsimoti (chi - kvadrat) - tasodifiy o'zgaruvchining taqsimlanishi

Qayerda tasodifiy o'zgaruvchilar X 1 , X 2 ,…, X n mustaqil va bir xil taqsimotga ega N(0,1). Bunday holda, atamalar soni, ya'ni. n, chi-kvadrat taqsimotining "erkinlik darajalari soni" deb ataladi.

Xi-kvadrat taqsimoti dispersiyani baholashda (ishonch oralig'idan foydalangan holda), kelishuv, bir xillik, mustaqillik gipotezalarini sinab ko'rishda, birinchi navbatda cheklangan miqdordagi qiymatlarni qabul qiladigan sifatli (toifalangan) o'zgaruvchilar uchun va boshqa ko'plab vazifalarda qo'llaniladi. statistik tahlil ma'lumotlar

Tarqatish t Student t - tasodifiy miqdorning taqsimlanishi

tasodifiy o'zgaruvchilar qayerda U Va X mustaqil, U standart normal taqsimotga ega N(0,1) va X– chi taqsimoti – kvadrat c n erkinlik darajalari. Qayerda n Talaba taqsimotining "erkinlik darajalari soni" deb ataladi.

Talabalar taqsimoti 1908 yilda pivo zavodida ishlagan ingliz statistik V. Gosset tomonidan kiritilgan. Bu zavodda iqtisodiy va texnik qarorlar qabul qilishda ehtimollik va statistik usullardan foydalanilgan, shuning uchun uning rahbariyati V. Gossetga oʻz nomi bilan ilmiy maqolalar chop etishni taqiqlagan. Shunday qilib, V. Gosset tomonidan ishlab chiqilgan ehtimollik va statistik usullar ko'rinishidagi tijorat sirlari va "nou-xau" himoyalangan. Biroq u “Talaba” taxallusi bilan nashr etish imkoniyatiga ega bo‘ldi. Gosset-Student hikoyasi shuni ko'rsatadiki, hatto yuz yil oldin ham ingliz menejerlari buyuklardan xabardor edilar iqtisodiy samaradorlik ehtimollik-statistik usullar.

Hozirgi vaqtda Student taqsimoti haqiqiy ma'lumotlarni tahlil qilishda ishlatiladigan eng mashhur taqsimotlardan biridir. U ishonch oraliqlaridan foydalangan holda matematik kutish, prognoz qiymati va boshqa xususiyatlarni baholashda, matematik taxminlar qiymatlari haqidagi farazlarni, regressiya koeffitsientlarini, namunaning bir xilligi gipotezalarini va boshqalarni tekshirishda qo'llaniladi. .

Fisher taqsimoti tasodifiy o'zgaruvchining taqsimotidir

tasodifiy o'zgaruvchilar qayerda X 1 Va X 2 mustaqil va erkinlik darajalari soni bilan x-kvadrat taqsimotiga ega k 1 Va k 2 mos ravishda. Shu bilan birga, er-xotin (k 1 , k 2 ) - Fisher taqsimotining bir juft "erkinlik darajasi", xususan, k 1 - numeratorning erkinlik darajalari soni, va k 2 – maxrajning erkinlik darajalari soni. Tasodifiy o'zgaruvchining taqsimlanishi F asarlarida faol foydalangan buyuk ingliz statistikasi R. Fisher (1890-1962) nomi bilan atalgan.

Fisher taqsimoti regressiya tahlilida, dispersiyalarning tengligida va amaliy statistikaning boshqa muammolarida modelning adekvatligi haqidagi farazlarni sinab ko'rishda qo'llaniladi.

Xi-kvadrat, Student va Fisher taqsimot funktsiyalari uchun ifodalar, ularning zichligi va xarakteristikalari, shuningdek ulardan amaliy foydalanish uchun zarur bo'lgan jadvallarni maxsus adabiyotlarda topish mumkin (masalan, qarang).

23. Xi-kvadrat va talabalar taqsimoti tushunchasi va grafik ko'rinishi

1) n ta erkinlik darajasiga ega bo'lgan taqsimot (xi-kvadrat) - n ta mustaqil standart normal tasodifiy o'zgaruvchilar kvadratlari yig'indisining taqsimlanishi.

Tarqatish (chi-kvadrat)- tasodifiy o'zgaruvchining taqsimlanishi (va ularning har birining matematik kutilishi 0 ga, standart og'ish esa 1 ga teng)

tasodifiy o'zgaruvchilar qayerda mustaqil va bir xil taqsimotga ega. Bunday holda, atamalar soni, ya'ni. , chi-kvadrat taqsimotining "erkinlik darajalari soni" deb ataladi. Chi-kvadrat soni bitta parametr, erkinlik darajalari soni bilan belgilanadi. Erkinlik darajalari soni ortib borishi bilan taqsimot asta-sekin me'yorga yaqinlashadi.

Keyin ularning kvadratlari yig'indisi

k = n erkinlik darajasiga ega bo'lgan "xi-kvadrat" deb ataladigan qonunga muvofiq taqsimlangan tasodifiy o'zgaruvchidir; agar atamalar qandaydir munosabat bilan bog'langan bo'lsa (masalan, ), u holda erkinlik darajalari soni k = n - 1.

Ushbu taqsimotning zichligi

Bu yerda gamma funksiyasi; xususan, G(n + 1) = n! .

Shuning uchun, xi-kvadrat taqsimoti bir parametr bilan aniqlanadi - erkinlik darajalari soni k.

Izoh 1. Erkinlik darajalari soni ortishi bilan chi-kvadrat taqsimoti asta-sekin normal holatga yaqinlashadi.

Izoh 2. Xi-kvadrat taqsimotidan foydalanib, amaliyotda uchragan boshqa ko'plab taqsimotlar aniqlanadi, masalan, tasodifiy miqdorning taqsimlanishi - tasodifiy vektorning uzunligi (X1, X2,..., Xn), koordinatalari. mustaqil va oddiy qonunga muvofiq taqsimlangan.

ch2 taqsimoti birinchi marta R. Helmert (1876) va K. Pirson (1900) tomonidan ko'rib chiqilgan.

Math.expect.=n; D=2n

2) Talabalar taqsimoti

Ikkita mustaqil tasodifiy miqdorni ko'rib chiqaylik: normal taqsimotga ega va normallashtirilgan Z (ya'ni M(Z) = 0, s (Z) = 1) va k bilan x-kvadrat qonuni bo'yicha taqsimlangan V V. erkinlik darajalari. Keyin qiymat

t-tarqatish yoki k erkinlik darajasiga ega Talaba taqsimoti deb ataladigan taqsimotga ega. Bu holda k, Talaba taqsimotining "erkinlik darajalari soni" deb ataladi.

Erkinlik darajalari soni ortib borishi bilan Talaba taqsimoti tezda normal holatga yaqinlashadi.

Ushbu taqsimot 1908 yilda pivo zavodida ishlagan ingliz statistik V. Gosset tomonidan kiritilgan. Bu zavodda iqtisodiy va texnik qarorlar qabul qilishda ehtimollik va statistik usullardan foydalanilgan, shuning uchun uning rahbariyati V. Gossetga oʻz nomi bilan ilmiy maqolalar chop etishni taqiqlagan. Shunday qilib, V. Gosset tomonidan ishlab chiqilgan ehtimollik va statistik usullar ko'rinishidagi tijorat sirlari va "nou-xau" himoyalangan. Biroq u “Talaba” taxallusi bilan nashr etish imkoniyatiga ega bo‘ldi. Gosset-Student hikoyasi shuni ko'rsatadiki, hatto yuz yil oldin Buyuk Britaniya menejerlari qaror qabul qilishning ehtimollik va statistik usullarining iqtisodiy samaradorligini bilishgan.

Do'stlaringizga ulashing yoki o'zingiz uchun saqlang:

Yuklanmoqda...