Pearson taqsimoti (chi-kvadrat taqsimoti). Statistikaning klassik usullari: chi-kvadrat testi Ksi kvadrat taqsimoti
Xi-kvadrat taqsimoti statistik gipotezalarni tekshirish uchun statistikada eng ko'p qo'llaniladigan usullardan biridir. Xi-kvadrat taqsimotiga asoslanib, eng kuchli moslik testlaridan biri - Pearson chi-kvadrat testi tuzilgan.
Kelishuv mezoni - noma'lum taqsimotning qabul qilingan qonuni haqidagi farazni tekshirish mezoni.
ch2 (chi-kvadrat) testi turli taqsimotlar gipotezasini tekshirish uchun ishlatiladi. Bu uning qadr-qimmati.
Mezonning hisoblash formulasi ga teng
bu yerda m va m’ mos ravishda empirik va nazariy chastotalardir
ko'rib chiqilayotgan taqsimot;
n - erkinlik darajalari soni.
Tekshirish uchun biz empirik (kuzatilgan) va nazariy (normal taqsimot taxmini ostida hisoblangan) chastotalarni solishtirishimiz kerak.
Agar empirik chastotalar hisoblangan yoki kutilgan chastotalar bilan to'liq mos tushsa, S (E – T) = 0 va ch2 mezoni ham nolga teng bo'ladi. Agar S (E - T) nolga teng bo'lmasa, bu hisoblangan chastotalar va seriyaning empirik chastotalari o'rtasidagi nomuvofiqlikni ko'rsatadi. Bunday hollarda nazariy jihatdan noldan cheksizgacha o'zgarishi mumkin bo'lgan ch2 mezonining ahamiyatini baholash kerak. Bu ch2f ning haqiqatda olingan qiymatini uning kritik qiymati (ch2st) bilan solishtirish yo‘li bilan amalga oshiriladi.Nol gipoteza, ya’ni empirik va nazariy yoki kutilayotgan chastotalar o‘rtasidagi nomuvofiqlik tasodifiy degan taxmin, agar ch2f dan katta yoki teng bo‘lsa, rad etiladi. Qabul qilingan muhimlik darajasi (a) va erkinlik darajalari soni (n) uchun ch2-chi.
ch2 tasodifiy o'zgaruvchining ehtimoliy qiymatlarini taqsimlash uzluksiz va assimetrikdir. Bu erkinlik darajalari soniga (n) bog'liq va kuzatishlar soni ortib borishi bilan normal taqsimotga yaqinlashadi. Shuning uchun baholashga ch2 mezonini qo'llash diskret taqsimotlar uning qiymatiga ta'sir qiluvchi ba'zi xatolar bilan bog'liq, ayniqsa kichik namunalarda. Aniqroq hisob-kitoblarni olish uchun namuna taqsimlanadi variatsion qator, kamida 50 ta variant bo'lishi kerak. ch2 mezonini to'g'ri qo'llash, shuningdek, ekstremal sinflardagi variantlarning chastotalari 5 dan kam bo'lmasligini talab qiladi; agar ularning soni 5 dan kam bo'lsa, u holda ular qo'shni sinflarning chastotalari bilan birlashtiriladi, shunda umumiy miqdor 5 dan katta yoki teng bo'ladi. Chastotalar birikmasiga ko'ra, sinflar soni (N) kamayadi. Erkinlik darajalari soni o'zgaruvchanlik erkinligiga cheklovlar sonini hisobga olgan holda sinflarning ikkinchi darajali soni bilan belgilanadi.
ch2 mezonini aniqlashning aniqligi ko'p jihatdan nazariy chastotalarni (T) hisoblashning aniqligiga bog'liq bo'lganligi sababli, empirik va hisoblangan chastotalar orasidagi farqni olish uchun yaxlitlanmagan nazariy chastotalardan foydalanish kerak.
Misol tariqasida, foydalanishga bag'ishlangan veb-saytda chop etilgan tadqiqotni olaylik statistik usullar gumanitar fanlarda.
Chi-kvadrat testi chastota taqsimotini ularning normal taqsimlangan yoki yo'qligidan qat'iy nazar solishtirish imkonini beradi.
Chastotasi hodisaning sodir bo'lish sonini bildiradi. Odatda, hodisalarning paydo bo'lish chastotasi o'zgaruvchilar nomlar shkalasida o'lchanganda va ularning boshqa xususiyatlari, chastotadan tashqari, tanlash imkonsiz yoki muammoli bo'lganda ko'rib chiqiladi. Boshqacha qilib aytganda, o'zgaruvchi sifat xususiyatlariga ega bo'lganda. Bundan tashqari, ko'plab tadqiqotchilar test ballarini darajalarga (yuqori, o'rtacha, past) aylantirishga va bu darajadagi odamlar sonini bilish uchun ballar taqsimoti jadvallarini tuzishga moyildirlar. Darajaning birida (toifalarning birida) odamlar soni haqiqatan ham ko'proq (kamroq) ekanligini isbotlash uchun Chi-kvadrat koeffitsienti ham qo'llaniladi.
Keling, eng oddiy misolni ko'rib chiqaylik.
Yosh o'smirlar o'rtasida o'z-o'zini hurmat qilishni aniqlash uchun test o'tkazildi. Test ballari uchta darajaga aylantirildi: yuqori, o'rta, past. Chastotalar quyidagicha taqsimlandi:
Yuqori (B) 27 kishi.
O'rtacha (C) 12 kishi.
Kam (L) 11 kishi
Ko'rinib turibdiki, bolalarning aksariyati o'zini yuqori baholaydi, ammo buni statistik jihatdan isbotlash kerak. Buning uchun biz Chi-kvadrat testidan foydalanamiz.
Bizning vazifamiz olingan empirik ma'lumotlar nazariy jihatdan bir xil ehtimolli ma'lumotlardan farq qiladimi yoki yo'qligini tekshirishdir. Buning uchun siz nazariy chastotalarni topishingiz kerak. Bizning holatlarimizda nazariy chastotalar teng ehtimolli chastotalar bo'lib, ular barcha chastotalarni qo'shish va toifalar soniga bo'lish yo'li bilan topiladi.
Bizning holatda:
(B + C + H)/3 = (27+12+11)/3 = 16,6
Xi-kvadrat testini hisoblash formulasi:
ch2 = ∑(E - T)I / T
Biz jadval tuzamiz:
Oxirgi ustunning yig'indisini toping:
Endi siz kriteriyaning kritik qiymatini kritik qiymatlar jadvalidan foydalanib topishingiz kerak (Ilovadagi 1-jadval). Buning uchun bizga erkinlik darajalari soni (n) kerak.
n = (R - 1) * (C - 1)
Bu erda R - jadvaldagi qatorlar soni, C - ustunlar soni.
Bizning holatlarimizda faqat bitta ustun (asl empirik chastotalarni anglatadi) va uchta qator (toifalar) mavjud, shuning uchun formula o'zgaradi - biz ustunlarni istisno qilamiz.
n = (R - 1) = 3-1 = 2
Xatolik ehtimoli p≤0,05 va n = 2 uchun kritik qiymat ch2 = 5,99 ga teng.
Olingan empirik qiymat kritik qiymatdan katta - chastotalardagi farqlar sezilarli (ch2= 9,64; p≤0,05).
Ko'rib turganingizdek, mezonni hisoblash juda oddiy va ko'p vaqt talab qilmaydi. Chi-kvadrat testining amaliy ahamiyati juda katta. Ushbu usul anketalarga javoblarni tahlil qilishda eng qimmatlidir.
Keling, yanada murakkab misolni ko'rib chiqaylik.
Masalan, psixolog o'qituvchilarning qizlarga nisbatan o'g'il bolalarga nisbatan ko'proq moyilligi rostmi yoki yo'qligini bilmoqchi. Bular. qizlarni maqtash ehtimoli ko'proq. Buning uchun psixolog o'qituvchilar tomonidan yozilgan uchta so'zning paydo bo'lish chastotasi bo'yicha o'quvchilarning xususiyatlarini tahlil qildi: "faol", "tirishqoq", "intizomli" va so'zlarning sinonimlari ham hisobga olingan. Jadvalga so'zlarning paydo bo'lish chastotasi to'g'risidagi ma'lumotlar kiritildi:
Olingan ma'lumotlarni qayta ishlash uchun biz chi-kvadrat testidan foydalanamiz.
Buning uchun biz empirik chastotalarni taqsimlash jadvalini tuzamiz, ya'ni. Biz kuzatadigan chastotalar:
Nazariy jihatdan, biz chastotalar teng taqsimlanishini kutamiz, ya'ni. chastota o'g'il va qiz bolalar o'rtasida mutanosib ravishda taqsimlanadi. Keling, nazariy chastotalar jadvalini tuzamiz. Buning uchun satr yig'indisini ustun yig'indisiga ko'paytiring va olingan sonni umumiy yig'indiga (s) bo'ling.
Hisob-kitoblarning yakuniy jadvali quyidagicha ko'rinadi:
ch2 = ∑(E - T)I / T
n = (R - 1), bu erda R - jadvaldagi qatorlar soni.
Bizning holatda, chi-kvadrat = 4,21; n = 2.
Mezonning kritik qiymatlari jadvalidan foydalanib, biz quyidagilarni topamiz: n = 2 va xato darajasi 0,05 bo'lsa, kritik qiymat ch2 = 5,99 ni tashkil qiladi.
Olingan qiymat kritik qiymatdan kichik, ya'ni nol gipoteza qabul qilinadi.
Xulosa: o'qituvchilar bolaga xarakteristikalar yozishda uning jinsiga ahamiyat bermaydilar.
Xulosa.
K.Pirson taraqqiyotga katta hissa qo‘shgan matematik statistika(ko'p sonli asosiy tushunchalar). Pirsonning asosiy falsafiy pozitsiyasi quyidagicha ifodalangan: fan tushunchalari - bu sun'iy konstruktsiyalar, hissiy tajribani tasvirlash va tartibga solish vositalari; ularni ilmiy jumlalarga bog‘lash qoidalari fan falsafasi bo‘lgan fan grammatikasi bilan ajratilgan. Umumjahon intizom - amaliy statistika - bir-biriga bog'liq bo'lmagan tushunchalar va hodisalarni bog'lash imkonini beradi, garchi Pirsonga ko'ra, bu sub'ektivdir.
K.Pirsonning koʻpgina konstruksiyalari antropologik materiallar yordamida bevosita bogʻliq yoki ishlab chiqilgan. U fanning barcha sohalarida qo'llaniladigan sonli tasniflash va statistik mezonlarning ko'plab usullarini ishlab chiqdi.
Adabiyot.
1. Bogolyubov A. N. Matematika. Mexanika. Biografik ma'lumotnoma. - Kiev: Naukova Dumka, 1983 yil.
2. Kolmogorov A. N., Yushkevich A. P. (tahrirlar). 19-asr matematikasi. - M.: Fan. - T.I.
3. 3. Borovkov A.A. Matematik statistika. M.: Nauka, 1994 yil.
4. 8. Feller V. Ehtimollar nazariyasiga kirish va uning qo‘llanilishi. - M.: Mir, T.2, 1984 y.
5. 9. Xarman G., Zamonaviy omil tahlili. - M.: Statistika, 1972 yil.
Oldin kech XIX asrda normal taqsimot ma'lumotlarning o'zgaruvchanligining universal qonuni hisoblangan. Biroq, K.Pirson empirik chastotalar normal taqsimotdan juda farq qilishi mumkinligini ta'kidladi. Buni qanday isbotlash kerak degan savol tug'ildi. Faqat sub'ektiv bo'lgan grafik taqqoslash emas, balki qat'iy miqdoriy asoslash ham talab qilindi.
Mezon shunday ixtiro qilingan ch 2(chi kvadrat), bu empirik (kuzatilgan) va nazariy (kutilgan) chastotalar o'rtasidagi nomuvofiqlikning ahamiyatini tekshiradi. Bu 1900 yilda sodir bo'lgan, ammo bu mezon hali ham qo'llanilmoqda. Bundan tashqari, u ko'plab muammolarni hal qilish uchun moslashtirilgan. Avvalo, bu kategorik ma'lumotlarni tahlil qilish, ya'ni. miqdor bilan emas, balki qaysidir toifaga mansubligi bilan ifodalanganlar. Masalan, mashina sinfi, tajriba ishtirokchisining jinsi, o'simlik turi va boshqalar. Bunday ma'lumotlarga qo'shish va ko'paytirish kabi matematik operatsiyalarni qo'llash mumkin emas, chastotalarni faqat ular uchun hisoblash mumkin.
Biz kuzatilgan chastotalarni belgilaymiz Haqida (kuzatilgan), kutilgan - E (kutilgan). Misol tariqasida matritsani 60 marta aylantirish natijasini olaylik. Agar u nosimmetrik va bir xil bo'lsa, har qanday tomonni olish ehtimoli 1/6 ga teng va shuning uchun har bir tomonni olishning kutilgan soni 10 (1/6∙60) ga teng. Kuzatilgan va kutilgan chastotalarni jadvalga yozamiz va gistogramma chizamiz.
Nol gipoteza - chastotalar izchil, ya'ni haqiqiy ma'lumotlar kutilgan ma'lumotlarga zid emas. Muqobil gipoteza shundaki, chastotalardagi og'ishlar tasodifiy tebranishlardan tashqariga chiqadi, nomuvofiqliklar statistik ahamiyatga ega. Qattiq xulosa chiqarish uchun bizga kerak.
- Kuzatilgan va kutilgan chastotalar o'rtasidagi nomuvofiqlikning umumiy o'lchovi.
- Farqlar yo'qligi haqidagi gipoteza to'g'ri bo'lsa, bu o'lchovning taqsimlanishi.
Keling, chastotalar orasidagi masofadan boshlaylik. Agar siz shunchaki farqni olsangiz O - E, keyin bunday o'lchov ma'lumotlar (chastotalar) miqyosiga bog'liq bo'ladi. Masalan, 20 - 5 = 15 va 1020 - 1005 = 15. Ikkala holatda ham farq 15. Lekin birinchi holatda kutilgan chastotalar kuzatilganidan 3 baravar kam, ikkinchi holatda esa - atigi 1,5. %. Bizga masshtabga bog'liq bo'lmagan nisbiy o'lchov kerak.
Keling, quyidagi faktlarga e'tibor qarataylik. Umuman olganda, chastotalar o'lchanadigan toifalar soni ancha katta bo'lishi mumkin, shuning uchun bitta kuzatuvning u yoki bu toifaga kirishi ehtimoli juda kichik. Agar shunday bo'lsa, unda bunday tasodifiy o'zgaruvchining taqsimoti deb nomlanuvchi noyob hodisalar qonuniga bo'ysunadi Puasson qonuni. Ma'lumki, Puasson qonunida matematik kutish va dispersiya qiymati mos keladi (parametr λ ). Bu nominal o'zgaruvchining ayrim toifalari uchun kutilgan chastotani anglatadi E i bir vaqtda va uning tarqalishi bo'ladi. Bundan tashqari, Puasson qonuni ko'p kuzatuvlar bilan normal holatga keladi. Ushbu ikkita faktni birlashtirib, agar kuzatilgan va kutilgan chastotalar o'rtasidagi kelishuv haqidagi gipoteza to'g'ri bo'lsa, unda ko'p sonli kuzatishlar bilan, ifoda
Oddiylik faqat etarlicha yuqori chastotalarda paydo bo'lishini esdan chiqarmaslik kerak. Statistikada kuzatuvlarning umumiy soni (chastotalarning yig'indisi) kamida 50 ta bo'lishi va har bir gradatsiyada kutilayotgan chastota kamida 5 bo'lishi kerakligi umumiy qabul qilinadi. Faqat bu holatda yuqorida ko'rsatilgan qiymat standart normal taqsimotga ega bo'ladi. . Bu shart bajarilgan deb faraz qilaylik.
Standart normal taqsimot ±3 (uch sigma qoidasi) doirasidagi deyarli barcha qiymatlarga ega. Shunday qilib, biz bir gradatsiya uchun chastotalardagi nisbiy farqni oldik. Bizga umumlashtiriladigan o'lchov kerak. Siz shunchaki barcha og'ishlarni qo'shib bo'lmaydi - biz 0 ni olamiz (nima uchun taxmin qiling). Pirson bu og'ishlarning kvadratlarini qo'shishni taklif qildi.
Bu belgi Chi-kvadrat testi Pearson. Agar chastotalar haqiqatan ham kutilganlarga mos keladigan bo'lsa, unda mezonning qiymati nisbatan kichik bo'ladi (chunki ko'pchilik og'ishlar nolga teng). Ammo agar mezon katta bo'lib chiqsa, bu chastotalar orasidagi sezilarli farqlarni ko'rsatadi.
Bunday yoki undan ham kattaroq qiymatning paydo bo'lishi ehtimoldan yiroq bo'lganda, Pearson mezoni "katta" bo'ladi. Va bunday ehtimolni hisoblash uchun, tajriba ko'p marta takrorlanganda, chastota kelishuvi gipotezasi to'g'ri bo'lganda, mezonning taqsimlanishini bilish kerak.
Ko'rish oson bo'lganidek, chi-kvadrat qiymati ham atamalar soniga bog'liq. Qanchalik ko'p bo'lsa, mezon shunchalik katta qiymatga ega bo'lishi kerak, chunki har bir atama jamiga hissa qo'shadi. Shuning uchun, har bir miqdor uchun mustaqil shartlari, o'z taqsimoti bo'ladi. Ma'lum bo'ladiki ch 2 tarqatishning butun oilasi.
Va bu erda biz bir nozik daqiqaga keldik. Raqam nima mustaqil shartlari? Har qanday atama (ya'ni, og'ish) mustaqil bo'lib tuyuladi. K.Pirson ham shunday deb o'ylagan, ammo u noto'g'ri bo'lib chiqdi. Aslida, mustaqil atamalar soni nominal o'zgaruvchining gradatsiyalari sonidan bitta kam bo'ladi n. Nega? Chunki agar bizda chastotalar yig'indisi allaqachon hisoblangan namunaga ega bo'lsak, u holda chastotalardan biri har doim umumiy son va barcha qolganlarning yig'indisi o'rtasidagi farq sifatida aniqlanishi mumkin. Shunday qilib, o'zgarishlar biroz kamroq bo'ladi. Ronald Fisher bu haqiqatni Pearson o'z mezonini ishlab chiqqanidan 20 yil o'tgach payqadi. Hatto stollarni ham qayta ishlash kerak edi.
Shu munosabat bilan Fisher statistikaga yangi kontseptsiyani kiritdi - erkinlik darajasi(erkinlik darajalari), bu yig'indidagi mustaqil atamalar sonini ifodalaydi. Erkinlik darajalari tushunchasi matematik tushuntirishga ega va faqat normal (Student, Fisher-Snedecor va chi-kvadrat) bilan bog'liq taqsimotlarda namoyon bo'ladi.
Erkinlik darajalarining ma'nosini yaxshiroq tushunish uchun jismoniy analogga murojaat qilaylik. Kosmosda erkin harakatlanadigan nuqtani tasavvur qilaylik. U 3 erkinlik darajasiga ega, chunki uch o'lchamli fazoda istalgan yo'nalishda harakatlanishi mumkin. Agar nuqta har qanday sirt bo'ylab harakatlansa, u uch o'lchovli fazoda bo'lishda davom etsa ham, u allaqachon ikki erkinlik darajasiga ega (oldinga va orqaga, chapga va o'ngga). Buloq bo'ylab harakatlanadigan nuqta yana uch o'lchamli fazoda, lekin faqat bir erkinlik darajasiga ega, chunki oldinga yoki orqaga harakatlanishi mumkin. Ko'rib turganingizdek, ob'ekt joylashgan joy har doim ham haqiqiy harakat erkinligiga mos kelmaydi.
Taxminan xuddi shunday tarzda, statistik mezonni taqsimlash uni hisoblash uchun zarur bo'lgan shartlardan ko'ra kamroq elementlar soniga bog'liq bo'lishi mumkin. Umuman olganda, erkinlik darajalari soni mavjud bog'liqliklar soni bo'yicha kuzatishlar sonidan kamroq.
Shunday qilib, chi kvadrat taqsimoti ( ch 2) har biri erkinlik darajalari parametriga bog'liq bo'lgan taqsimotlar oilasidir. Va chi-kvadrat testining rasmiy ta'rifi quyidagicha. Tarqatish ch 2(chi-kvadrat) s k erkinlik darajalari - kvadratlar yig'indisining taqsimlanishi k mustaqil standart normal tasodifiy o'zgaruvchilar.
Keyinchalik, chi-kvadrat taqsimot funktsiyasi hisoblangan formulaning o'ziga o'tishimiz mumkin edi, lekin, xayriyatki, hamma narsa biz uchun uzoq vaqtdan beri hisoblab chiqilgan. Qiziqish ehtimolini olish uchun siz tegishli statistik jadvaldan yoki Excelda tayyor funktsiyadan foydalanishingiz mumkin.
Erkinlik darajalari soniga qarab chi-kvadrat taqsimotining shakli qanday o'zgarishi qiziq.
Erkinlik darajasi ortib borishi bilan, chi-kvadrat taqsimoti normal bo'lishga intiladi. Bu markaziy chegara teoremasining harakati bilan izohlanadi, unga ko'ra ko'p sonli mustaqil tasodifiy o'zgaruvchilar yig'indisi normal taqsimotga ega. Kvadratlar haqida hech narsa aytilmagan)).
Pearson chi-kvadrat testi yordamida gipotezani tekshirish
Endi biz gi-kvadrat usuli yordamida gipotezalarni tekshirishga keldik. Umuman olganda, texnologiya saqlanib qolmoqda. Nol gipoteza shundan iboratki, kuzatilgan chastotalar kutilganlarga to'g'ri keladi (ya'ni ular bir xil populyatsiyadan olinganligi sababli ular o'rtasida farq yo'q). Agar shunday bo'lsa, u holda tarqalish tasodifiy tebranishlar chegarasida nisbatan kichik bo'ladi. Dispersiya o'lchovi chi-kvadrat testi yordamida aniqlanadi. Keyinchalik, mezonning o'zi kritik qiymat bilan taqqoslanadi (tegishli ahamiyatga egalik darajasi va erkinlik darajalari uchun) yoki, to'g'rirog'i, kuzatilgan p-qiymati hisoblanadi, ya'ni. nol gipoteza to'g'ri bo'lsa, bir xil yoki undan ham kattaroq mezon qiymatini olish ehtimoli.
Chunki biz chastotalar kelishuviga qiziqamiz, keyin mezon kritik darajadan kattaroq bo'lsa, gipoteza rad etiladi. Bular. mezon bir tomonlama. Biroq, ba'zan (ba'zan) chap gipotezani sinab ko'rish kerak. Masalan, empirik ma'lumotlar nazariy ma'lumotlarga juda o'xshash bo'lsa. Keyin mezon mumkin bo'lmagan mintaqaga tushishi mumkin, ammo chap tomonda. Gap shundaki, tabiiy sharoitda nazariy chastotalar bilan amalda mos keladigan chastotalarni olish dargumon. Har doim xato beradigan tasodifiylik mavjud. Ammo bunday xatolik bo'lmasa, ehtimol ma'lumotlar soxtalashtirilgan. Ammo shunga qaramay, o'ng tomonli gipoteza odatda sinovdan o'tkaziladi.
Keling, zar muammosiga qaytaylik. Keling, mavjud ma'lumotlardan foydalanib, chi-kvadrat testining qiymatini hisoblaylik.
Endi 5 erkinlik darajasidagi kritik qiymatni topamiz ( k) va ahamiyatlilik darajasi 0,05 ( α ) chi kvadrat taqsimotining kritik qiymatlari jadvaliga muvofiq.
Ya'ni, 0,05 kvanti 5 erkinlik darajasiga ega bo'lgan chi-kvadrat taqsimoti (o'ng quyruq) ch 2 0,05; 5 = 11,1.
Haqiqiy va jadvalli qiymatlarni solishtiramiz. 3.4 ( ch 2) < 11,1 (ch 2 0,05; 5). Hisoblangan mezon kichikroq bo'lib chiqdi, ya'ni chastotalarning tengligi (kelishuvi) gipotezasi rad etilmaydi. Rasmda vaziyat shunday ko'rinadi.
Agar hisoblangan qiymat kritik mintaqaga tushib qolsa, nol gipoteza rad etiladi.
p-qiymatini ham hisoblash to'g'riroq bo'ladi. Buni amalga oshirish uchun jadvalda berilgan erkinlik darajalari uchun eng yaqin qiymatni topishingiz va mos keladigan ahamiyat darajasini ko'rishingiz kerak. Lekin bu o'tgan asr. Biz kompyuterdan, xususan MS Exceldan foydalanamiz. Excelda chi-kvadrat bilan bog'liq bir nechta funktsiyalar mavjud.
Quyida ularning qisqacha tavsifi keltirilgan.
CH2.OBR- chapda berilgan ehtimollikdagi mezonning kritik qiymati (statistik jadvallarda bo'lgani kabi)
CH2.OBR.PH- o'ngdagi berilgan ehtimollik mezonining kritik qiymati. Funktsiya asosan avvalgisini takrorlaydi. Ammo bu erda siz darhol darajani ko'rsatishingiz mumkin α , 1 dan ayirish o'rniga. Bu qulayroq, chunki ko'p hollarda tarqatishning o'ng dumi kerak.
CH2.DIST– chapda p-qiymati (zichlikni hisoblash mumkin).
CH2.DIST.PH- o'ngda p-qiymati.
CHI2.TEST- darhol ikkita chastota diapazoni uchun chi-kvadrat sinovini o'tkazadi. Erkinlik darajalari soni ustundagi chastotalar sonidan bitta kamroq qabul qilinadi (bunday bo'lishi kerak), bu p-qiymatini qaytaradi.
Keling, tajribamiz uchun 5 erkinlik darajasi va alfa 0,05 uchun kritik (jadval) qiymatini hisoblaylik. Excel formulasi quyidagicha ko'rinadi:
CH2.OBR(0,95;5)
CH2.OBR.PH(0,05;5)
Natija bir xil bo'ladi - 11.0705. Bu biz jadvalda ko'rgan qiymat (1 kasrga yaxlitlangan).
Nihoyat, 5 darajali erkinlik mezoni uchun p-qiymatini hisoblaylik ch 2= 3.4. Bizga o'ngdagi ehtimollik kerak, shuning uchun biz HH (o'ng quyruq) qo'shilishi bilan funktsiyani olamiz.
CH2.DIST.PH (3,4;5) = 0,63857
Bu shuni anglatadiki, 5 darajadagi erkinlik bilan mezon qiymatini olish ehtimoli ch 2= 3,4 va undan ko'p deyarli 64% ga teng. Tabiiyki, gipoteza rad etilmaydi (p-qiymati 5% dan katta), chastotalar juda yaxshi kelishuvda.
Endi chastotalarning kelishish haqidagi gipotezani chi-kvadrat testi va Excelning CHI2.TEST funksiyasi yordamida tekshiramiz.
Jadvallar, mashaqqatli hisoblar yo'q. Funktsiya argumentlari sifatida kuzatilgan va kutilgan chastotalarga ega ustunlarni ko'rsatib, biz darhol p-qiymatini olamiz. Go'zallik.
Endi tasavvur qiling-a, siz shubhali yigit bilan zar o'ynayapsiz. 1 dan 5 gacha bo'lgan ochkolarning taqsimlanishi bir xil bo'lib qoladi, lekin u 26 oltitani aylantiradi (jami otishlar soni 78 ga aylanadi).
Bu holda p-qiymati 0,003 ga aylanadi, bu 0,05 dan ancha past. Zarlarning haqiqiyligiga shubha qilish uchun yaxshi sabablar bor. Xi-kvadrat taqsimot jadvalida bu ehtimollik qanday ko'rinadi.
Bu erda chi-kvadrat mezonining o'zi 17,8 ga aylanadi, bu tabiiy ravishda jadvaldagi (11,1) dan kattaroqdir.
Umid qilamanki, kelishuv mezoni nima ekanligini tushuntirib bera oldim ch 2(Pirson chi-kvadrati) va undan statistik gipotezalarni tekshirish uchun qanday foydalanish mumkinligi.
Va nihoyat, yana bir bor muhim shart haqida! Chi-kvadrat testi faqat barcha chastotalar soni 50 dan oshganda va har bir gradatsiya uchun kutilayotgan minimal qiymat 5 dan kam bo'lmaganda to'g'ri ishlaydi. Agar biron bir toifada kutilgan chastota 5 dan kam bo'lsa, lekin barcha chastotalar yig'indisi oshib ketgan bo'lsa. 50, keyin bunday toifa eng yaqini bilan birlashtiriladi, shunda ularning umumiy chastotasi 5 dan oshadi. Agar buning iloji bo'lmasa yoki chastotalar yig'indisi 50 dan kam bo'lsa, gipotezalarni tekshirishning aniqroq usullaridan foydalanish kerak. Biz ular haqida boshqa safar gaplashamiz.
Quyida gi-kvadrat testi yordamida Excelda gipotezani qanday tekshirish haqida video bor.
U 1, U 2, ..,U k mustaqil etalon bo'lsin normal qiymatlar. K = U 1 2 +U 2 2 + .. + U k 2 tasodifiy miqdorning taqsimlanishi xi-kvadrat taqsimoti deyiladi. k erkinlik darajalari (K~c 2 (k) ni yozing). Bu ijobiy egrilik va quyidagi xarakteristikaga ega bo'lgan unimodal taqsimot: rejim M=k-2 kutilgan qiymat m=k dispersiya D=2k (rasm). Parametrning etarlicha katta qiymati bilan k taqsimot ch 2 (k) parametrlari bilan taxminan normal taqsimotga ega
Matematik statistika masalalarini yechishda berilgan a ehtimollik va erkinlik darajalari soniga qarab ch 2 (k) kritik nuqtalardan foydalaniladi. k(2-ilova). Kritik nuqta Χ 2 kr = Χ 2 (k; a) - o'ng tomonda taqsimot zichligi egri chizig'i ostidagi maydonning 100- a % qismi joylashgan hudud chegarasi. Sinov paytida tasodifiy miqdorning qiymati K~c 2 (k) ch 2 (k) nuqtadan o‘ngga tushishi ehtimolligi a P(K≥c 2 kp)≤ a) dan oshmaydi. Masalan, K~c 2 (20) tasodifiy miqdor uchun a=0,05 ehtimollikni o’rnatamiz. Xi-kvadrat taqsimotining kritik nuqtalari jadvalidan (jadvallardan) foydalanib, ch 2 kp = ch 2 (20;0,05) = 31,4 ni topamiz. Bu shuni anglatadiki, bu tasodifiy o'zgaruvchining ehtimoli K 31,4 dan katta, 0,05 dan kichik qiymatni qabul qiling (rasm).
Guruch. Erkinlik darajalari sonining turli qiymatlari uchun taqsimlanish zichligi grafigi ch 2 (k) k
Kritik nuqtalar ch 2 (k) quyidagi kalkulyatorlarda qo'llaniladi:
- Multikollinearlik mavjudligini tekshirish (multikollinearlik haqida).
Shuning uchun, aloqa yo'nalishini tekshirish uchun tanlang korrelyatsiya tahlili, xususan, Pearson korrelyatsiya koeffitsienti yordamida gipotezani sinovdan o'tkazish va t-testi yordamida muhimlikni qo'shimcha tekshirish.
Muhimlik darajasining har qanday qiymati uchun a kh 2 ni MS Excel funksiyasidan foydalanib topish mumkin: =HI2OBR(a;erkinlik darajalari)
n-1 | .995 | .990 | .975 | .950 | .900 | .750 | .500 | .250 | .100 | .050 | .025 | .010 | .005 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 0.00004 | 0.00016 | 0.00098 | 0.00393 | 0.01579 | 0.10153 | 0.45494 | 1.32330 | 2.70554 | 3.84146 | 5.02389 | 6.63490 | 7.87944 |
2 | 0.01003 | 0.02010 | 0.05064 | 0.10259 | 0.21072 | 0.57536 | 1.38629 | 2.77259 | 4.60517 | 5.99146 | 7.37776 | 9.21034 | 10.59663 |
3 | 0.07172 | 0.11483 | 0.21580 | 0.35185 | 0.58437 | 1.21253 | 2.36597 | 4.10834 | 6.25139 | 7.81473 | 9.34840 | 11.34487 | 12.83816 |
4 | 0.20699 | 0.29711 | 0.48442 | 0.71072 | 1.06362 | 1.92256 | 3.35669 | 5.38527 | 7.77944 | 9.48773 | 11.14329 | 13.27670 | 14.86026 |
5 | 0.41174 | 0.55430 | 0.83121 | 1.14548 | 1.61031 | 2.67460 | 4.35146 | 6.62568 | 9.23636 | 11.07050 | 12.83250 | 15.08627 | 16.74960 |
6 | 0.67573 | 0.87209 | 1.23734 | 1.63538 | 2.20413 | 3.45460 | 5.34812 | 7.84080 | 10.64464 | 12.59159 | 14.44938 | 16.81189 | 18.54758 |
7 | 0.98926 | 1.23904 | 1.68987 | 2.16735 | 2.83311 | 4.25485 | 6.34581 | 9.03715 | 12.01704 | 14.06714 | 16.01276 | 18.47531 | 20.27774 |
8 | 1.34441 | 1.64650 | 2.17973 | 2.73264 | 3.48954 | 5.07064 | 7.34412 | 10.21885 | 13.36157 | 15.50731 | 17.53455 | 20.09024 | 21.95495 |
9 | 1.73493 | 2.08790 | 2.70039 | 3.32511 | 4.16816 | 5.89883 | 8.34283 | 11.38875 | 14.68366 | 16.91898 | 19.02277 | 21.66599 | 23.58935 |
10 | 2.15586 | 2.55821 | 3.24697 | 3.94030 | 4.86518 | 6.73720 | 9.34182 | 12.54886 | 15.98718 | 18.30704 | 20.48318 | 23.20925 | 25.18818 |
11 | 2.60322 | 3.05348 | 3.81575 | 4.57481 | 5.57778 | 7.58414 | 10.34100 | 13.70069 | 17.27501 | 19.67514 | 21.92005 | 24.72497 | 26.75685 |
12 | 3.07382 | 3.57057 | 4.40379 | 5.22603 | 6.30380 | 8.43842 | 11.34032 | 14.84540 | 18.54935 | 21.02607 | 23.33666 | 26.21697 | 28.29952 |
13 | 3.56503 | 4.10692 | 5.00875 | 5.89186 | 7.04150 | 9.29907 | 12.33976 | 15.98391 | 19.81193 | 22.36203 | 24.73560 | 27.68825 | 29.81947 |
14 | 4.07467 | 4.66043 | 5.62873 | 6.57063 | 7.78953 | 10.16531 | 13.33927 | 17.11693 | 21.06414 | 23.68479 | 26.11895 | 29.14124 | 31.31935 |
15 | 4.60092 | 5.22935 | 6.26214 | 7.26094 | 8.54676 | 11.03654 | 14.33886 | 18.24509 | 22.30713 | 24.99579 | 27.48839 | 30.57791 | 32.80132 |
16 | 5.14221 | 5.81221 | 6.90766 | 7.96165 | 9.31224 | 11.91222 | 15.33850 | 19.36886 | 23.54183 | 26.29623 | 28.84535 | 31.99993 | 34.26719 |
17 | 5.69722 | 6.40776 | 7.56419 | 8.67176 | 10.08519 | 12.79193 | 16.33818 | 20.48868 | 24.76904 | 27.58711 | 30.19101 | 33.40866 | 35.71847 |
18 | 6.26480 | 7.01491 | 8.23075 | 9.39046 | 10.86494 | 13.67529 | 17.33790 | 21.60489 | 25.98942 | 28.86930 | 31.52638 | 34.80531 | 37.15645 |
19 | 6.84397 | 7.63273 | 8.90652 | 10.11701 | 11.65091 | 14.56200 | 18.33765 | 22.71781 | 27.20357 | 30.14353 | 32.85233 | 36.19087 | 38.58226 |
20 | 7.43384 | 8.26040 | 9.59078 | 10.85081 | 12.44261 | 15.45177 | 19.33743 | 23.82769 | 28.41198 | 31.41043 | 34.16961 | 37.56623 | 39.99685 |
21 | 8.03365 | 8.89720 | 10.28290 | 11.59131 | 13.23960 | 16.34438 | 20.33723 | 24.93478 | 29.61509 | 32.67057 | 35.47888 | 38.93217 | 41.40106 |
22 | 8.64272 | 9.54249 | 10.98232 | 12.33801 | 14.04149 | 17.23962 | 21.33704 | 26.03927 | 30.81328 | 33.92444 | 36.78071 | 40.28936 | 42.79565 |
23 | 9.26042 | 10.19572 | 11.68855 | 13.09051 | 14.84796 | 18.13730 | 22.33688 | 27.14134 | 32.00690 | 35.17246 | 38.07563 | 41.63840 | 44.18128 |
24 | 9.88623 | 10.85636 | 12.40115 | 13.84843 | 15.65868 | 19.03725 | 23.33673 | 28.24115 | 33.19624 | 36.41503 | 39.36408 | 42.97982 | 45.55851 |
25 | 10.51965 | 11.52398 | 13.11972 | 14.61141 | 16.47341 | 19.93934 | 24.33659 | 29.33885 | 34.38159 | 37.65248 | 40.64647 | 44.31410 | 46.92789 |
26 | 11.16024 | 12.19815 | 13.84390 | 15.37916 | 17.29188 | 20.84343 | 25.33646 | 30.43457 | 35.56317 | 38.88514 | 41.92317 | 45.64168 | 48.28988 |
27 | 11.80759 | 12.87850 | 14.57338 | 16.15140 | 18.11390 | 21.74940 | 26.33634 | 31.52841 | 36.74122 | 40.11327 | 43.19451 | 46.96294 | 49.64492 |
28 | 12.46134 | 13.56471 | 15.30786 | 16.92788 | 18.93924 | 22.65716 | 27.33623 | 32.62049 | 37.91592 | 41.33714 | 44.46079 | 48.27824 | 50.99338 |
29 | 13.12115 | 14.25645 | 16.04707 | 17.70837 | 19.76774 | 23.56659 | 28.33613 | 33.71091 | 39.08747 | 42.55697 | 45.72229 | 49.58788 | 52.33562 |
30 | 13.78672 | 14.95346 | 16.79077 | 18.49266 | 20.59923 | 24.47761 | 29.33603 | 34.79974 | 40.25602 | 43.77297 | 46.97924 | 50.89218 | 53.67196 |
Erkinlik darajalari soni k | Muhimlik darajasi a | |||||
0,01 | 0,025 | 0.05 | 0,95 | 0,975 | 0.99 | |
1 | 6.6 | 5.0 | 3.8 | 0.0039 | 0.00098 | 0.00016 |
2 | 9.2 | 7.4 | 6.0 | 0.103 | 0.051 | 0.020 |
3 | 11.3 | 9.4 | 7.8 | 0.352 | 0.216 | 0.115 |
4 | 13.3 | 11.1 | 9.5 | 0.711 | 0.484 | 0.297 |
5 | 15.1 | 12.8 | 11.1 | 1.15 | 0.831 | 0.554 |
6 | 16.8 | 14.4 | 12.6 | 1.64 | 1.24 | 0.872 |
7 | 18.5 | 16.0 | 14.1 | 2.17 | 1.69 | 1.24 |
8 | 20.1 | 17.5 | 15.5 | 2.73 | 2.18 | 1.65 |
9 | 21.7 | 19.0 | 16.9 | 3.33 | 2.70 | 2.09 |
10 | 23.2 | 20.5 | 18.3 | 3.94 | 3.25 | 2.56 |
11 | 24.7 | 21.9 | 19.7 | 4.57 | 3.82 | 3.05 |
12 | 26.2 | 23.3 | 21 .0 | 5.23 | 4.40 | 3.57 |
13 | 27.7 | 24.7 | 22.4 | 5.89 | 5.01 | 4.11 |
14 | 29.1 | 26.1 | 23.7 | 6.57 | 5.63 | 4.66 |
15 | 30.6 | 27.5 | 25.0 | 7.26 | 6.26 | 5.23 |
16 | 32.0 | 28.8 | 26.3 | 7.96 | 6.91 | 5.81 |
17 | 33.4 | 30.2 | 27.6 | 8.67 | 7.56 | 6.41 |
18 | 34.8 | 31.5 | 28.9 | 9.39 | 8.23 | 7.01 |
19 | 36.2 | 32.9 | 30.1 | 10.1 | 8.91 | 7.63 |
20 | 37.6 | 34.2 | 31.4 | 10.9 | 9.59 | 8.26 |
21 | 38.9 | 35.5 | 32.7 | 11.6 | 10.3 | 8.90 |
22 | 40.3 | 36.8 | 33.9 | 12.3 | 11.0 | 9.54 |
23 | 41.6 | 38.1 | 35.2 | 13.1 | 11.7 | 10.2 |
24 | 43.0 | 39.4 | 36.4 | 13.8 | 12.4 | 10.9 |
25 | 44.3 | 40.6 | 37.7 | 14.6 | 13.1 | 11.5 |
26 | 45.6 | 41.9 | 38.9 | 15.4 | 13.8 | 12.2 |
27 | 47.0 | 43.2 | 40.1 | 16.2 | 14.6 | 12.9 |
28 | 48.3 | 44.5 | 41.3 | 16.9 | 15.3 | 13.6 |
29 | 49.6 | 45.7 | 42.6 | 17.7 | 16.0 | 14.3 |
30 | 50.9 | 47.0 | 43.8 | 18.5 | 16.8 | 15.0 |
Pearson (chi-kvadrat), Student va Fisher taqsimotlari
Oddiy taqsimotdan foydalanib, statistik ma'lumotlarni qayta ishlashda tez-tez ishlatiladigan uchta taqsimot aniqlanadi. Ushbu tarqatishlar kitobning keyingi bo'limlarida ko'p marta uchraydi.
Pearson taqsimoti (chi - kvadrat) - tasodifiy o'zgaruvchining taqsimlanishi
Qayerda tasodifiy o'zgaruvchilar X 1 , X 2 ,…, X n mustaqil va bir xil taqsimotga ega N(0,1). Bunday holda, atamalar soni, ya'ni. n, chi-kvadrat taqsimotining "erkinlik darajalari soni" deb ataladi.
Xi-kvadrat taqsimoti dispersiyani baholashda (ishonch oralig'idan foydalangan holda), kelishuv, bir xillik, mustaqillik gipotezalarini sinab ko'rishda, birinchi navbatda cheklangan miqdordagi qiymatlarni qabul qiladigan sifatli (toifalangan) o'zgaruvchilar uchun va boshqa ko'plab vazifalarda qo'llaniladi. statistik tahlil ma'lumotlar
Tarqatish t Student t - tasodifiy miqdorning taqsimlanishi
tasodifiy o'zgaruvchilar qayerda U Va X mustaqil, U standart normal taqsimotga ega N(0,1) va X– chi taqsimoti – kvadrat c n erkinlik darajalari. Qayerda n Talaba taqsimotining "erkinlik darajalari soni" deb ataladi.
Talabalar taqsimoti 1908 yilda pivo zavodida ishlagan ingliz statistik V. Gosset tomonidan kiritilgan. Bu zavodda iqtisodiy va texnik qarorlar qabul qilishda ehtimollik va statistik usullardan foydalanilgan, shuning uchun uning rahbariyati V. Gossetga oʻz nomi bilan ilmiy maqolalar chop etishni taqiqlagan. Shunday qilib, V. Gosset tomonidan ishlab chiqilgan ehtimollik va statistik usullar ko'rinishidagi tijorat sirlari va "nou-xau" himoyalangan. Biroq u “Talaba” taxallusi bilan nashr etish imkoniyatiga ega bo‘ldi. Gosset-Student hikoyasi shuni ko'rsatadiki, hatto yuz yil oldin ham ingliz menejerlari buyuklardan xabardor edilar iqtisodiy samaradorlik ehtimollik-statistik usullar.
Hozirgi vaqtda Student taqsimoti haqiqiy ma'lumotlarni tahlil qilishda ishlatiladigan eng mashhur taqsimotlardan biridir. U ishonch oraliqlaridan foydalangan holda matematik kutish, prognoz qiymati va boshqa xususiyatlarni baholashda, matematik taxminlar qiymatlari haqidagi farazlarni, regressiya koeffitsientlarini, namunaning bir xilligi gipotezalarini va boshqalarni tekshirishda qo'llaniladi. .
Fisher taqsimoti tasodifiy o'zgaruvchining taqsimotidir
tasodifiy o'zgaruvchilar qayerda X 1 Va X 2 mustaqil va erkinlik darajalari soni bilan x-kvadrat taqsimotiga ega k 1 Va k 2 mos ravishda. Shu bilan birga, er-xotin (k 1 , k 2 ) - Fisher taqsimotining bir juft "erkinlik darajasi", xususan, k 1 - numeratorning erkinlik darajalari soni, va k 2 – maxrajning erkinlik darajalari soni. Tasodifiy o'zgaruvchining taqsimlanishi F asarlarida faol foydalangan buyuk ingliz statistikasi R. Fisher (1890-1962) nomi bilan atalgan.
Fisher taqsimoti regressiya tahlilida, dispersiyalarning tengligida va amaliy statistikaning boshqa muammolarida modelning adekvatligi haqidagi farazlarni sinab ko'rishda qo'llaniladi.
Xi-kvadrat, Student va Fisher taqsimot funktsiyalari uchun ifodalar, ularning zichligi va xarakteristikalari, shuningdek ulardan amaliy foydalanish uchun zarur bo'lgan jadvallarni maxsus adabiyotlarda topish mumkin (masalan, qarang).
23. Xi-kvadrat va talabalar taqsimoti tushunchasi va grafik ko'rinishi
1) n ta erkinlik darajasiga ega bo'lgan taqsimot (xi-kvadrat) - n ta mustaqil standart normal tasodifiy o'zgaruvchilar kvadratlari yig'indisining taqsimlanishi.
Tarqatish (chi-kvadrat)- tasodifiy o'zgaruvchining taqsimlanishi (va ularning har birining matematik kutilishi 0 ga, standart og'ish esa 1 ga teng)
tasodifiy o'zgaruvchilar qayerda mustaqil va bir xil taqsimotga ega. Bunday holda, atamalar soni, ya'ni. , chi-kvadrat taqsimotining "erkinlik darajalari soni" deb ataladi. Chi-kvadrat soni bitta parametr, erkinlik darajalari soni bilan belgilanadi. Erkinlik darajalari soni ortib borishi bilan taqsimot asta-sekin me'yorga yaqinlashadi.
Keyin ularning kvadratlari yig'indisi
k = n erkinlik darajasiga ega bo'lgan "xi-kvadrat" deb ataladigan qonunga muvofiq taqsimlangan tasodifiy o'zgaruvchidir; agar atamalar qandaydir munosabat bilan bog'langan bo'lsa (masalan, ), u holda erkinlik darajalari soni k = n - 1.
Ushbu taqsimotning zichligi
Bu yerda gamma funksiyasi; xususan, G(n + 1) = n! .
Shuning uchun, xi-kvadrat taqsimoti bir parametr bilan aniqlanadi - erkinlik darajalari soni k.
Izoh 1. Erkinlik darajalari soni ortishi bilan chi-kvadrat taqsimoti asta-sekin normal holatga yaqinlashadi.
Izoh 2. Xi-kvadrat taqsimotidan foydalanib, amaliyotda uchragan boshqa ko'plab taqsimotlar aniqlanadi, masalan, tasodifiy miqdorning taqsimlanishi - tasodifiy vektorning uzunligi (X1, X2,..., Xn), koordinatalari. mustaqil va oddiy qonunga muvofiq taqsimlangan.
ch2 taqsimoti birinchi marta R. Helmert (1876) va K. Pirson (1900) tomonidan ko'rib chiqilgan.
Math.expect.=n; D=2n
2) Talabalar taqsimoti
Ikkita mustaqil tasodifiy miqdorni ko'rib chiqaylik: normal taqsimotga ega va normallashtirilgan Z (ya'ni M(Z) = 0, s (Z) = 1) va k bilan x-kvadrat qonuni bo'yicha taqsimlangan V V. erkinlik darajalari. Keyin qiymat
t-tarqatish yoki k erkinlik darajasiga ega Talaba taqsimoti deb ataladigan taqsimotga ega. Bu holda k, Talaba taqsimotining "erkinlik darajalari soni" deb ataladi.
Erkinlik darajalari soni ortib borishi bilan Talaba taqsimoti tezda normal holatga yaqinlashadi.
Ushbu taqsimot 1908 yilda pivo zavodida ishlagan ingliz statistik V. Gosset tomonidan kiritilgan. Bu zavodda iqtisodiy va texnik qarorlar qabul qilishda ehtimollik va statistik usullardan foydalanilgan, shuning uchun uning rahbariyati V. Gossetga oʻz nomi bilan ilmiy maqolalar chop etishni taqiqlagan. Shunday qilib, V. Gosset tomonidan ishlab chiqilgan ehtimollik va statistik usullar ko'rinishidagi tijorat sirlari va "nou-xau" himoyalangan. Biroq u “Talaba” taxallusi bilan nashr etish imkoniyatiga ega bo‘ldi. Gosset-Student hikoyasi shuni ko'rsatadiki, hatto yuz yil oldin Buyuk Britaniya menejerlari qaror qabul qilishning ehtimollik va statistik usullarining iqtisodiy samaradorligini bilishgan.