Pearson dağılımı (ki-kare dağılımı). Klasik istatistik yöntemleri: ki-kare testi Ksi-kare dağılımı
Ki-kare dağılımı istatistiksel hipotezleri test etmek için istatistikte en yaygın kullanılanlardan biridir. Ki-kare dağılımına dayanarak, en güçlü uyum iyiliği testlerinden biri olan Pearson ki-kare testi oluşturulmuştur.
Anlaşma kriteri, bilinmeyen bir dağılımın varsayılan yasası hakkındaki hipotezi test etme kriteridir.
χ2 (ki-kare) testi farklı dağılım hipotezini test etmek için kullanılır. Bu onun onuru.
Kriterin hesaplama formülü eşittir
burada m ve m' sırasıyla ampirik ve teorik frekanslardır
Söz konusu dağıtım;
n serbestlik derecesinin sayısıdır.
Kontrol etmek için ampirik (gözlenen) ve teorik (normal dağılım varsayımı altında hesaplanan) frekansları karşılaştırmamız gerekir.
Ampirik frekanslar, hesaplanan veya beklenen frekanslarla tamamen örtüşüyorsa, S (E – T) = 0 ve χ2 kriteri de şu şekilde olacaktır: sıfıra eşit. S (E – T) sıfıra eşit değilse, bu, hesaplanan frekanslar ile serinin ampirik frekansları arasında bir tutarsızlık olduğunu gösterecektir. Bu gibi durumlarda teorik olarak sıfırdan sonsuza kadar değişebilen χ2 kriterinin anlamlılığının değerlendirilmesi gerekmektedir. Bu, χ2ф'nin gerçekte elde edilen değerini kritik değeriyle (χ2st) karşılaştırarak yapılır. Boş hipotez, yani ampirik ve teorik veya beklenen frekanslar arasındaki tutarsızlığın rastgele olduğu varsayımı, χ2ф'nin χ2st'ye eşit veya daha büyük olması durumunda çürütülür. kabul edilen anlamlılık düzeyi (a) ve serbestlik derecesi sayısı (n) için.
Rastgele değişken χ2'nin olası değerlerinin dağılımı sürekli ve asimetriktir. Serbestlik derecesi sayısına (n) bağlıdır ve gözlem sayısı arttıkça normal dağılıma yaklaşır. Bu nedenle χ2 kriterinin değerlendirmeye uygulanması ayrık dağılımlarözellikle küçük örneklerde değerini etkileyen bazı hatalarla ilişkilidir. Daha doğru tahminler elde etmek için bir örnek şu şekilde dağıtılır: varyasyon serisi, en az 50 seçeneğe sahip olmalıdır. χ2 kriterinin doğru uygulanması aynı zamanda uç sınıflardaki değişkenlerin frekanslarının 5'ten az olmamasını da gerektirir; 5'ten az ise komşu sınıfların frekansları ile birleştirilir, böylece toplam miktar 5'ten büyük veya eşit olur. Frekansların birleşimine göre sınıf sayısı (N) azalır. Serbestlik derecesi sayısı, varyasyon özgürlüğü üzerindeki kısıtlamaların sayısı dikkate alınarak ikincil sınıf sayısına göre belirlenir.
χ2 kriterini belirlemenin doğruluğu büyük ölçüde teorik frekansların (T) hesaplanmasının doğruluğuna bağlı olduğundan, ampirik ve hesaplanan frekanslar arasındaki farkı elde etmek için yuvarlatılmamış teorik frekanslar kullanılmalıdır.
Örnek olarak, kullanımına adanmış bir web sitesinde yayınlanan bir çalışmayı ele alalım. istatistiksel yöntemler beşeri bilimlerde.
Ki-kare testi, normal dağılıp dağılmadığına bakılmaksızın frekans dağılımlarını karşılaştırmanıza olanak tanır.
Sıklık, bir olayın gerçekleşme sayısını ifade eder. Genellikle olayların meydana gelme sıklığı, değişkenler bir isim ölçeğinde ölçüldüğünde ve bunların sıklığın yanı sıra diğer özelliklerinin seçilmesi imkansız veya sorunlu olduğunda ele alınır. Başka bir deyişle, bir değişken niteliksel özelliklere sahip olduğunda. Ayrıca birçok araştırmacı, test puanlarını seviyelere (yüksek, orta, düşük) dönüştürme ve bu seviyelerdeki kişi sayısını bulmak için puan dağılım tabloları oluşturma eğilimindedir. Seviyelerden birinde (kategorilerden birinde) kişi sayısının gerçekten daha fazla (daha az) olduğunu kanıtlamak için Ki-kare katsayısı da kullanılır.
En basit örneğe bakalım.
Benlik saygısını belirlemek için genç ergenler arasında bir test yapıldı. Test puanları üç seviyeye dönüştürüldü: yüksek, orta ve düşük. Frekanslar şu şekilde dağıtıldı:
Yüksek (B) 27 kişi.
Ortalama (C) 12 kişi.
Düşük (L) 11 kişi
Çocukların çoğunluğunun özgüveninin yüksek olduğu açıktır ancak bunun istatistiksel olarak kanıtlanması gerekmektedir. Bunu yapmak için Ki-kare testini kullanıyoruz.
Görevimiz, elde edilen ampirik verilerin teorik olarak eşit olasılıklı olanlardan farklı olup olmadığını kontrol etmektir. Bunu yapmak için teorik frekansları bulmanız gerekir. Bizim durumumuzda teorik frekanslar, tüm frekansların toplanıp kategori sayısına bölünmesiyle bulunan eşit olasılıklı frekanslardır.
Bizim durumumuzda:
(B + C + H)/3 = (27+12+11)/3 = 16,6
Ki-kare testini hesaplamak için formül:
χ2 = ∑(E - T)I / T
Masayı oluşturuyoruz:
Son sütunun toplamını bulun:
Şimdi kritik değerler tablosunu kullanarak kriterin kritik değerini bulmanız gerekiyor (Ekteki Tablo 1). Bunu yapmak için serbestlik derecesi sayısına (n) ihtiyacımız var.
n = (R - 1) * (C - 1)
burada R, tablodaki satır sayısıdır, C ise sütun sayısıdır.
Bizim durumumuzda yalnızca bir sütun (orijinal ampirik frekanslar anlamına gelir) ve üç satır (kategoriler) vardır, dolayısıyla formül değişir; sütunları hariç tutarız.
n = (R - 1) = 3-1 = 2
Hata olasılığı p≤0,05 ve n = 2 için kritik değer χ2 = 5,99'dur.
Elde edilen ampirik değer kritik değerden daha büyüktür; frekanslardaki farklar önemlidir (χ2= 9,64; p≤0,05).
Gördüğünüz gibi kriterin hesaplanması çok basit ve fazla zaman almıyor. Pratik değer Ki-kare testi çok büyük. Bu yöntem, anketlere verilen yanıtları analiz ederken çok değerlidir.
Daha karmaşık bir örneğe bakalım.
Örneğin bir psikolog, öğretmenlerin kızlara göre erkeklere karşı daha önyargılı olduğunun doğru olup olmadığını bilmek istiyor. Onlar. kızları övme olasılıkları daha yüksektir. Bunu yapmak için psikolog, öğretmenler tarafından yazılan öğrencilerin özelliklerini üç kelimenin görülme sıklığı açısından analiz etti: "aktif", "çalışkan", "disiplinli" ve bu kelimelerin eşanlamlıları da sayıldı. Kelimelerin görülme sıklığına ilişkin veriler tabloya girildi:
Elde edilen verileri işlemek için ki-kare testini kullanıyoruz.
Bunu yapmak için ampirik frekansların dağılım tablosunu oluşturacağız, yani. gözlemlediğimiz frekanslar:
Teorik olarak frekansların eşit şekilde dağıtılmasını bekliyoruz. sıklık kız ve erkek çocuklar arasında orantılı olarak dağıtılacaktır. Teorik frekanslardan oluşan bir tablo oluşturalım. Bunu yapmak için satır toplamını sütun toplamıyla çarpın ve elde edilen sayıyı toplam toplam (lar) a bölün.
Hesaplamalar için son tablo şöyle görünecektir:
χ2 = ∑(E - T)I / T
n = (R - 1), burada R, tablodaki satır sayısıdır.
Bizim durumumuzda ki-kare = 4,21; n = 2.
Kriterin kritik değerleri tablosunu kullanarak şunları buluyoruz: n = 2 ve 0,05 hata seviyesi ile kritik değer χ2 = 5,99'dur.
Ortaya çıkan değer kritik değerden küçüktür, bu da sıfır hipotezinin kabul edildiği anlamına gelir.
Sonuç: Öğretmenler çocuğun özelliklerini yazarken çocuğun cinsiyetine önem vermemektedir.
Çözüm.
K. Pearson geliştirmeye önemli katkılarda bulundu matematiksel istatistik(çok sayıda temel kavram). Pearson'un ana felsefi konumu şu şekilde formüle edilmiştir: Bilimin kavramları yapay yapılardır, duyusal deneyimi tanımlama ve düzenleme araçlarıdır; bunları bilimsel cümlelere bağlamanın kuralları, bilim felsefesi olan bilimin grameri tarafından izole edilmiştir. Evrensel disiplin - uygulamalı istatistik - Pearson'a göre öznel olsa da, farklı kavram ve olguları birbirine bağlamamıza olanak tanır.
K. Pearson'un yapılarının çoğu doğrudan ilişkilidir veya antropolojik malzemeler kullanılarak geliştirilmiştir. Bilimin her alanında kullanılan çok sayıda sayısal sınıflandırma yöntemi ve istatistiksel kriter geliştirdi.
Edebiyat.
1. Bogolyubov A. N. Matematik. Mekanik. Biyografik referans kitabı. - Kiev: Naukova Dumka, 1983.
2. Kolmogorov A.N., Yushkevich A.P. (ed.). 19. yüzyılın matematiği. - M.: Bilim. -T.I.
3. 3. Borovkov A.A. Matematiksel istatistik. M.: Nauka, 1994.
4. 8. Feller V. Olasılık teorisine giriş ve uygulamaları. - M.: Mir, T.2, 1984.
5. 9. Harman G., Modern faktör analizi. - M .: İstatistikler, 1972.
İle XIX sonu yüzyılda normal dağılım, verilerdeki evrensel değişim yasası olarak kabul edildi. Ancak K. Pearson ampirik frekansların normal dağılımdan büyük ölçüde farklı olabileceğini kaydetti. Bunun nasıl kanıtlanacağı sorusu ortaya çıktı. Yalnızca subjektif olan grafiksel bir karşılaştırma değil, aynı zamanda katı bir niceliksel gerekçelendirme de gerekliydi.
Kriter böyle icat edildi χ2(ki kare) ampirik (gözlenen) ve teorik (beklenen) frekanslar arasındaki tutarsızlığın önemini test eder. Bu 1900'de oldu, ancak kriter bugün hala kullanılıyor. Üstelik çok çeşitli sorunları çözmek için uyarlanmıştır. Her şeyden önce bu, kategorik verilerin analizidir, yani. miktarla değil, bir kategoriye ait olarak ifade edilenler. Örneğin arabanın sınıfı, deney katılımcısının cinsiyeti, bitki türü vb. Bu tür verilere toplama, çarpma gibi matematiksel işlemler uygulanamaz; yalnızca bunlar için frekanslar hesaplanabilir.
Gözlemlenen frekansları belirtiyoruz Hakkında (Gözlemlendi), beklenen - E (Beklenen). Örnek olarak bir zarın 60 kez atılmasının sonucunu ele alalım. Simetrik ve düzgün ise herhangi bir tarafın gelme olasılığı 1/6 ve dolayısıyla her bir tarafın beklenen sayısı 10'dur (1/6∙60). Gözlemlenen ve beklenen frekansları bir tabloya yazıp histogramı çiziyoruz.
Boş hipotez, frekansların tutarlı olduğu, yani gerçek verilerin beklenen verilerle çelişmediği yönündedir. Alternatif bir hipotez ise frekanslardaki sapmaların rastgele dalgalanmaların ötesine geçtiği, farklılıkların istatistiksel olarak anlamlı olduğu yönündedir. Kesin bir sonuca varmak için buna ihtiyacımız var.
- Gözlemlenen ve beklenen frekanslar arasındaki tutarsızlığın özet ölçüsü.
- Bu ölçümün dağılımı eğer fark yoktur hipotezi doğrudur.
Frekanslar arasındaki mesafeyle başlayalım. Eğer sadece farkı alırsan O-E o zaman böyle bir ölçüm verinin ölçeğine (frekanslar) bağlı olacaktır. Örneğin, 20 - 5 = 15 ve 1020 - 1005 = 15. Her iki durumda da fark 15'tir. Ancak ilk durumda beklenen frekanslar gözlemlenenlerden 3 kat daha azdır ve ikinci durumda - yalnızca 1,5 %. Ölçeğe bağlı olmayan göreceli bir ölçüme ihtiyacımız var.
Aşağıdaki gerçeklere dikkat edelim. Genel olarak, frekansların ölçüldüğü kategorilerin sayısı çok daha fazla olabilir, dolayısıyla tek bir gözlemin şu veya bu kategoriye girme olasılığı oldukça düşüktür. Eğer öyleyse, böyle bir rastgele değişkenin dağılımı, nadir olaylar yasasına uyacaktır. Poisson yasası. Poisson yasasında bilindiği gibi matematiksel beklenti ve varyansın değeri çakışmaktadır (parametre λ ). Bu, nominal değişkenin bazı kategorileri için beklenen frekansın E ben eşzamanlı olacak ve dağılacaktır. Ayrıca Poisson yasası çok sayıda gözlemle normale dönme eğilimindedir. Bu iki gerçeği birleştirerek, gözlemlenen ve beklenen frekanslar arasındaki uyum hakkındaki hipotez doğruysa şunu elde ederiz: çok sayıda gözlemle, ifade
Normalliğin yalnızca yeterince yüksek frekanslarda ortaya çıkacağını unutmamak önemlidir. İstatistikte genel olarak toplam gözlem sayısının (frekansların toplamının) en az 50 olması ve her geçişte beklenen frekansın en az 5 olması gerektiği kabul edilmektedir. Ancak bu durumda yukarıda gösterilen değer standart normal dağılıma sahiptir. . Bu şartın sağlandığını varsayalım.
Standart normal dağılım hemen hemen tüm değerlere ±3 (üç sigma kuralı) dahilinde sahiptir. Böylece, bir derecelendirme için frekanslardaki göreceli farkı elde ettik. Genelleştirilebilir bir ölçüme ihtiyacımız var. Tüm sapmaları toplayamazsınız - 0 elde ederiz (nedenini tahmin edin). Pearson bu sapmaların karelerinin toplanmasını önerdi.
Bu işaret Ki-kare testi Pearson. Frekanslar gerçekten beklenenlere karşılık geliyorsa, o zaman kriterin değeri nispeten küçük olacaktır (çünkü sapmaların çoğu sıfır civarındadır). Ancak kriterin büyük çıkması, frekanslar arasında önemli farklılıklar olduğunu gösterir.
Pearson kriteri, böyle bir değerin veya daha da büyük bir değerin ortaya çıkmasının olası olmadığı durumlarda “büyük” hale gelir. Ve böyle bir olasılığı hesaplamak için, deney birçok kez tekrarlandığında, frekans uyumu hipotezinin doğru olduğu durumlarda kriterin dağılımını bilmek gerekir.
Görüldüğü gibi ki-kare değeri aynı zamanda terim sayısına da bağlıdır. Ne kadar çok olursa, kriterin değeri de o kadar büyük olmalıdır, çünkü her terim toplama katkıda bulunacaktır. Bu nedenle her miktar için bağımsızşartlara göre kendi dağıtımı olacaktır. Görünüşe göre χ2 bütün bir dağıtım ailesidir.
Ve burada hassas bir ana geliyoruz. Sayı nedir bağımsızşartlar? Görünüşe göre herhangi bir terim (yani sapma) bağımsızdır. K. Pearson da öyle düşünüyordu ama yanıldığı ortaya çıktı. Aslında bağımsız terimlerin sayısı, nominal değişkenin derecelendirme sayısından bir eksik olacaktır. N. Neden? Çünkü eğer frekansların toplamı önceden hesaplanmış bir örneğimiz varsa, o zaman frekanslardan biri her zaman toplam sayı ile diğerlerinin toplamı arasındaki fark olarak belirlenebilir. Dolayısıyla farklılık biraz daha az olacaktır. Ronald Fisher bu gerçeği Pearson'un kriterini geliştirmesinden 20 yıl sonra fark etti. Tabloların bile yeniden yapılması gerekiyordu.
Bu vesileyle Fisher istatistiğe yeni bir kavram getirdi: özgürlük derecesi(serbestlik derecesi), toplamdaki bağımsız terimlerin sayısını temsil eder. Serbestlik derecesi kavramının matematiksel bir açıklaması vardır ve yalnızca normalle ilişkili dağılımlarda (Student's, Fisher-Snedecor ve ki-karenin kendisi) ortaya çıkar.
Serbestlik derecelerinin anlamını daha iyi kavramak için fiziksel bir analoga dönelim. Uzayda serbestçe hareket eden bir nokta hayal edelim. 3 serbestlik derecesine sahiptir çünkü üç boyutlu uzayda her yöne hareket edebilir. Bir nokta herhangi bir yüzey boyunca hareket ediyorsa, o zaman üç boyutlu uzayda olmaya devam etmesine rağmen zaten iki serbestlik derecesine sahiptir (ileri geri, sol ve sağ). Bir yay boyunca hareket eden bir nokta yine üç boyutlu uzaydadır ancak yalnızca bir serbestlik derecesine sahiptir, çünkü ileri veya geri hareket edebilir. Gördüğünüz gibi nesnenin bulunduğu alan her zaman gerçek hareket özgürlüğüne karşılık gelmiyor.
Yaklaşık olarak aynı şekilde, istatistiksel bir kriterin dağılımı, onu hesaplamak için gereken terimlerden daha az sayıda öğeye bağlı olabilir. Genel olarak serbestlik derecesinin sayısı, mevcut bağımlılıkların sayısına göre gözlem sayısından daha azdır.
Böylece ki kare dağılımı ( χ2), her biri serbestlik derecesi parametresine bağlı olan bir dağılım ailesidir. Ki-kare testinin resmi tanımı ise aşağıdaki gibidir. Dağıtım χ2(ki-kare) s k serbestlik derecesi kareler toplamının dağılımıdır k bağımsız standart normal rastgele değişkenler.
Daha sonra ki-kare dağılım fonksiyonunun hesaplandığı formülün kendisine geçebiliriz, ancak neyse ki her şey bizim için uzun zamandır hesaplandı. İlgi olasılığını elde etmek için uygun istatistiksel tabloyu veya Excel'deki hazır bir işlevi kullanabilirsiniz.
Serbestlik derecesi sayısına bağlı olarak ki-kare dağılımının şeklinin nasıl değiştiğini görmek ilginçtir.
Serbestlik derecesi arttıkça ki-kare dağılımı normal olma eğilimindedir. Bu, çok sayıda bağımsız rastgele değişkenin toplamının normal bir dağılıma sahip olduğunu söyleyen merkezi limit teoreminin etkisi ile açıklanmaktadır. Kareler hakkında hiçbir şey söylemiyor)).
Pearson ki-kare testi kullanılarak hipotezin test edilmesi
Şimdi ki-kare yöntemini kullanarak hipotezleri test etmeye geldik. Genel olarak teknoloji kalır. Boş hipotez, gözlemlenen frekansların beklenen frekanslara karşılık geldiğidir (yani aynı popülasyondan alındıkları için aralarında hiçbir fark yoktur). Eğer durum böyleyse, dağılım rastgele dalgalanmaların sınırları dahilinde nispeten küçük olacaktır. Dağılımın ölçüsü ki-kare testi kullanılarak belirlenir. Daha sonra, ya kriterin kendisi kritik değerle karşılaştırılır (karşılık gelen anlamlılık düzeyi ve serbestlik dereceleri için) ya da daha doğru olanı, gözlemlenen p-değeri hesaplanır; sıfır hipotezi doğruysa aynı veya daha büyük kriter değerini elde etme olasılığı.
Çünkü frekansların uyumuyla ilgileniyorsak, kriter kritik seviyeden büyük olduğunda hipotez reddedilecektir. Onlar. Kriter tek taraflıdır. Ancak bazen (bazen) sol hipotezi test etmek gerekir. Örneğin ampirik veriler teorik verilere çok benzer olduğunda. O zaman kriter beklenmedik bir bölgeye düşebilir, ancak solda. Gerçek şu ki, doğal koşullar altında pratik olarak teorik olanlarla örtüşen frekansların elde edilmesi pek mümkün değildir. Her zaman hata veren bir rastgelelik vardır. Ancak böyle bir hata yoksa, o zaman belki de veriler tahrif edilmiştir. Ancak yine de sağ yönlü hipotez genellikle test edilir.
Zar problemine dönelim. Mevcut verileri kullanarak ki-kare testinin değerini hesaplayalım.
Şimdi 5 serbestlik derecesindeki kritik değeri bulalım ( k) ve anlamlılık düzeyi 0,05 ( α ) ki kare dağılımının kritik değerleri tablosuna göre.
Yani 0,05'lik dilim, 5 serbestlik derecesine sahip bir ki-kare dağılımıdır (sağ kuyruk). χ 2 0,05; 5 = 11,1.
Gerçek ve tablolaştırılmış değerleri karşılaştıralım. 3,4 ( χ2) < 11,1 (χ 2 0,05; 5). Hesaplanan kriterin daha küçük olduğu ortaya çıktı, bu da frekansların eşitliği (anlaşma) hipotezinin reddedilmediği anlamına geliyor. Şekilde durum şu şekilde görünüyor.
Hesaplanan değer kritik bölge içinde kalırsa sıfır hipotezi reddedilir.
P değerini de hesaplamak daha doğru olacaktır. Bunu yapmak için, belirli sayıda serbestlik derecesi için tabloda en yakın değeri bulmanız ve karşılık gelen önem düzeyine bakmanız gerekir. Ama bu geçen yüzyıl. Bir bilgisayar, özellikle MS Excel kullanacağız. Excel'in ki-kare ile ilgili çeşitli işlevleri vardır.
Aşağıda bunların kısa bir açıklaması bulunmaktadır.
CH2.OBR– soldaki belirli bir olasılıktaki kriterin kritik değeri (istatistiksel tablolarda olduğu gibi)
CH2.OBR.PH– sağdaki belirli bir olasılık için kriterin kritik değeri. İşlev esasen öncekinin kopyasıdır. Ancak burada seviyeyi hemen belirtebilirsiniz α 1'den çıkarmak yerine. Bu daha uygundur çünkü çoğu durumda ihtiyaç duyulan şey dağıtımın sağ kuyruğudur.
CH2.DAĞ– soldaki p değeri (yoğunluk hesaplanabilir).
CH2.DAĞ.PH– sağdaki p değeri.
CHI2.TEST– iki frekans aralığı için hemen bir ki-kare testi gerçekleştirir. Serbestlik derecesi sayısı, sütundaki frekans sayısından bir eksik olarak alınır (olması gerektiği gibi) ve bir p değeri döndürülür.
Deneyimiz için 5 serbestlik derecesi ve alfa 0,05 için kritik (tablo) değeri hesaplayalım. Excel formülü şöyle görünecek:
CH2.OBR(0,95;5)
CH2.OBR.PH(0,05;5)
Sonuç aynı olacaktır - 11.0705. Bu tabloda gördüğümüz değerdir (1 ondalık basamağa yuvarlanmış).
Son olarak 5 serbestlik derecesi kriteri için p değerini hesaplayalım. χ2= 3.4. Sağda bir olasılığa ihtiyacımız var, bu yüzden HH'nin (sağ kuyruk) eklenmesiyle bir fonksiyon alıyoruz
CH2.DAĞ.PH(3,4;5) = 0,63857
Bu, 5 serbestlik derecesi ile kriter değerini elde etme olasılığının şu olduğu anlamına gelir: χ2= 3,4 ve üzeri neredeyse %64'e eşittir. Doğal olarak hipotez reddedilmiyor (p değeri %5'ten büyük), frekanslar çok iyi uyum gösteriyor.
Şimdi ki-kare testini ve CHI2.TEST Excel fonksiyonunu kullanarak frekansların uyumu hakkındaki hipotezi kontrol edelim.
Tablo yok, hantal hesaplamalar yok. Gözlemlenen ve beklenen frekansları içeren sütunları fonksiyon argümanları olarak belirterek, hemen p değerini elde ederiz. Güzellik.
Şimdi şüpheli bir adamla zar oynadığınızı hayal edin. 1'den 5'e kadar puanların dağılımı aynı kalır, ancak 26 altı atar (toplam atış sayısı 78 olur).
Bu durumda p değeri 0,003 olarak ortaya çıkıyor ve bu da 0,05'ten çok daha düşük. Zarların geçerliliğinden şüphe etmek için iyi nedenler var. İşte bu olasılığın ki-kare dağılım grafiğinde nasıl göründüğü.
Ki-kare kriterinin kendisi burada 17.8 olarak ortaya çıkıyor ve bu da doğal olarak tablodakinden (11.1) daha büyük.
Umarım anlaşma kriterinin ne olduğunu açıklayabilmişimdir χ2(Pearson ki-kare) ve bunun istatistiksel hipotezleri test etmek için nasıl kullanılabileceği.
Son olarak bir kez daha önemli bir durum hakkında! Ki-kare testi yalnızca tüm frekansların sayısı 50'yi aştığında ve her derecelendirme için beklenen minimum değer 5'ten az olmadığında düzgün çalışır. Herhangi bir kategoride beklenen frekans 5'ten azsa ancak tüm frekansların toplamı şunu aşıyorsa: 50 ise, bu durumda kategori en yakın olanla birleştirilir ve böylece toplam frekansları 5'i geçer. Bu mümkün değilse veya frekansların toplamı 50'den azsa, daha doğru hipotez testi yöntemleri kullanılmalıdır. Bunları başka zaman konuşuruz.
Aşağıda ki-kare testi kullanılarak Excel'de bir hipotezin nasıl test edileceğine ilişkin bir video bulunmaktadır.
U 1 , U 2 , ..,U k bağımsız standart olsun normal değerler. Rastgele değişken K = U 1 2 +U 2 2 + .. + U k 2'nin dağılımına ki-kare dağılımı denir. k serbestlik derecesi (K~χ 2 (k) yazın). Bu, pozitif çarpıklığa ve aşağıdaki özelliklere sahip tek modlu bir dağılımdır: mod M=k-2 matematiksel beklenti m=k dispersiyonu D=2k (Şek.). Yeterli olduğunda büyük önem parametre k dağılım χ 2 (k) parametrelerle yaklaşık olarak normal bir dağılıma sahiptir
Matematiksel istatistik problemlerini çözerken, verilen olasılığa ve serbestlik derecesi sayısına bağlı olarak kritik noktalar χ 2 (k) kullanılır. k(Ek 2). Kritik nokta Χ 2 kr = Χ 2 (k; α), dağılım yoğunluk eğrisinin altındaki alanın %100- α'sının sağında yer aldığı bölgenin sınırıdır. Test sırasında rastgele değişken K~χ 2 (k) değerinin χ 2 (k) noktasının sağına düşme olasılığı α P(K≥χ 2 kp)≤ α)'yı aşmaz. Örneğin, K~χ 2 (20) rastgele değişkeni için olasılığı α=0,05 olarak belirledik. Tabloya göre kritik noktalar Ki-kare dağılımında (tablolarda) χ 2 kp = χ 2 (20;0,05) = 31,4'ü buluyoruz. Bu, bu rastgele değişkenin olasılığının k 31,4'ten büyük, 0,05'ten küçük bir değeri kabul edin (Şek.).
Pirinç. Serbestlik derecesi sayısının farklı değerleri için dağılım yoğunluğu grafiği χ 2 (k) k
Kritik noktalar χ 2 (k) aşağıdaki hesap makinelerinde kullanılır:
- Çoklu bağlantının varlığının kontrol edilmesi (çoklu bağlantı hakkında).
Bu nedenle iletişimin yönünü kontrol etmek için öğesini seçin. korelasyon analiziözellikle Pearson korelasyon katsayısı kullanılarak hipotezin test edilmesi ve t-testi kullanılarak anlamlılığın daha ileri test edilmesi.
Anlamlılık düzeyi α Χ 2'nin herhangi bir değeri için MS Excel fonksiyonu kullanılarak bulunabilir: =HI2OBR(α;serbestlik derecesi)
n-1 | .995 | .990 | .975 | .950 | .900 | .750 | .500 | .250 | .100 | .050 | .025 | .010 | .005 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 0.00004 | 0.00016 | 0.00098 | 0.00393 | 0.01579 | 0.10153 | 0.45494 | 1.32330 | 2.70554 | 3.84146 | 5.02389 | 6.63490 | 7.87944 |
2 | 0.01003 | 0.02010 | 0.05064 | 0.10259 | 0.21072 | 0.57536 | 1.38629 | 2.77259 | 4.60517 | 5.99146 | 7.37776 | 9.21034 | 10.59663 |
3 | 0.07172 | 0.11483 | 0.21580 | 0.35185 | 0.58437 | 1.21253 | 2.36597 | 4.10834 | 6.25139 | 7.81473 | 9.34840 | 11.34487 | 12.83816 |
4 | 0.20699 | 0.29711 | 0.48442 | 0.71072 | 1.06362 | 1.92256 | 3.35669 | 5.38527 | 7.77944 | 9.48773 | 11.14329 | 13.27670 | 14.86026 |
5 | 0.41174 | 0.55430 | 0.83121 | 1.14548 | 1.61031 | 2.67460 | 4.35146 | 6.62568 | 9.23636 | 11.07050 | 12.83250 | 15.08627 | 16.74960 |
6 | 0.67573 | 0.87209 | 1.23734 | 1.63538 | 2.20413 | 3.45460 | 5.34812 | 7.84080 | 10.64464 | 12.59159 | 14.44938 | 16.81189 | 18.54758 |
7 | 0.98926 | 1.23904 | 1.68987 | 2.16735 | 2.83311 | 4.25485 | 6.34581 | 9.03715 | 12.01704 | 14.06714 | 16.01276 | 18.47531 | 20.27774 |
8 | 1.34441 | 1.64650 | 2.17973 | 2.73264 | 3.48954 | 5.07064 | 7.34412 | 10.21885 | 13.36157 | 15.50731 | 17.53455 | 20.09024 | 21.95495 |
9 | 1.73493 | 2.08790 | 2.70039 | 3.32511 | 4.16816 | 5.89883 | 8.34283 | 11.38875 | 14.68366 | 16.91898 | 19.02277 | 21.66599 | 23.58935 |
10 | 2.15586 | 2.55821 | 3.24697 | 3.94030 | 4.86518 | 6.73720 | 9.34182 | 12.54886 | 15.98718 | 18.30704 | 20.48318 | 23.20925 | 25.18818 |
11 | 2.60322 | 3.05348 | 3.81575 | 4.57481 | 5.57778 | 7.58414 | 10.34100 | 13.70069 | 17.27501 | 19.67514 | 21.92005 | 24.72497 | 26.75685 |
12 | 3.07382 | 3.57057 | 4.40379 | 5.22603 | 6.30380 | 8.43842 | 11.34032 | 14.84540 | 18.54935 | 21.02607 | 23.33666 | 26.21697 | 28.29952 |
13 | 3.56503 | 4.10692 | 5.00875 | 5.89186 | 7.04150 | 9.29907 | 12.33976 | 15.98391 | 19.81193 | 22.36203 | 24.73560 | 27.68825 | 29.81947 |
14 | 4.07467 | 4.66043 | 5.62873 | 6.57063 | 7.78953 | 10.16531 | 13.33927 | 17.11693 | 21.06414 | 23.68479 | 26.11895 | 29.14124 | 31.31935 |
15 | 4.60092 | 5.22935 | 6.26214 | 7.26094 | 8.54676 | 11.03654 | 14.33886 | 18.24509 | 22.30713 | 24.99579 | 27.48839 | 30.57791 | 32.80132 |
16 | 5.14221 | 5.81221 | 6.90766 | 7.96165 | 9.31224 | 11.91222 | 15.33850 | 19.36886 | 23.54183 | 26.29623 | 28.84535 | 31.99993 | 34.26719 |
17 | 5.69722 | 6.40776 | 7.56419 | 8.67176 | 10.08519 | 12.79193 | 16.33818 | 20.48868 | 24.76904 | 27.58711 | 30.19101 | 33.40866 | 35.71847 |
18 | 6.26480 | 7.01491 | 8.23075 | 9.39046 | 10.86494 | 13.67529 | 17.33790 | 21.60489 | 25.98942 | 28.86930 | 31.52638 | 34.80531 | 37.15645 |
19 | 6.84397 | 7.63273 | 8.90652 | 10.11701 | 11.65091 | 14.56200 | 18.33765 | 22.71781 | 27.20357 | 30.14353 | 32.85233 | 36.19087 | 38.58226 |
20 | 7.43384 | 8.26040 | 9.59078 | 10.85081 | 12.44261 | 15.45177 | 19.33743 | 23.82769 | 28.41198 | 31.41043 | 34.16961 | 37.56623 | 39.99685 |
21 | 8.03365 | 8.89720 | 10.28290 | 11.59131 | 13.23960 | 16.34438 | 20.33723 | 24.93478 | 29.61509 | 32.67057 | 35.47888 | 38.93217 | 41.40106 |
22 | 8.64272 | 9.54249 | 10.98232 | 12.33801 | 14.04149 | 17.23962 | 21.33704 | 26.03927 | 30.81328 | 33.92444 | 36.78071 | 40.28936 | 42.79565 |
23 | 9.26042 | 10.19572 | 11.68855 | 13.09051 | 14.84796 | 18.13730 | 22.33688 | 27.14134 | 32.00690 | 35.17246 | 38.07563 | 41.63840 | 44.18128 |
24 | 9.88623 | 10.85636 | 12.40115 | 13.84843 | 15.65868 | 19.03725 | 23.33673 | 28.24115 | 33.19624 | 36.41503 | 39.36408 | 42.97982 | 45.55851 |
25 | 10.51965 | 11.52398 | 13.11972 | 14.61141 | 16.47341 | 19.93934 | 24.33659 | 29.33885 | 34.38159 | 37.65248 | 40.64647 | 44.31410 | 46.92789 |
26 | 11.16024 | 12.19815 | 13.84390 | 15.37916 | 17.29188 | 20.84343 | 25.33646 | 30.43457 | 35.56317 | 38.88514 | 41.92317 | 45.64168 | 48.28988 |
27 | 11.80759 | 12.87850 | 14.57338 | 16.15140 | 18.11390 | 21.74940 | 26.33634 | 31.52841 | 36.74122 | 40.11327 | 43.19451 | 46.96294 | 49.64492 |
28 | 12.46134 | 13.56471 | 15.30786 | 16.92788 | 18.93924 | 22.65716 | 27.33623 | 32.62049 | 37.91592 | 41.33714 | 44.46079 | 48.27824 | 50.99338 |
29 | 13.12115 | 14.25645 | 16.04707 | 17.70837 | 19.76774 | 23.56659 | 28.33613 | 33.71091 | 39.08747 | 42.55697 | 45.72229 | 49.58788 | 52.33562 |
30 | 13.78672 | 14.95346 | 16.79077 | 18.49266 | 20.59923 | 24.47761 | 29.33603 | 34.79974 | 40.25602 | 43.77297 | 46.97924 | 50.89218 | 53.67196 |
Serbestlik derecesi sayısı k | Önem düzeyi a | |||||
0,01 | 0,025 | 0.05 | 0,95 | 0,975 | 0.99 | |
1 | 6.6 | 5.0 | 3.8 | 0.0039 | 0.00098 | 0.00016 |
2 | 9.2 | 7.4 | 6.0 | 0.103 | 0.051 | 0.020 |
3 | 11.3 | 9.4 | 7.8 | 0.352 | 0.216 | 0.115 |
4 | 13.3 | 11.1 | 9.5 | 0.711 | 0.484 | 0.297 |
5 | 15.1 | 12.8 | 11.1 | 1.15 | 0.831 | 0.554 |
6 | 16.8 | 14.4 | 12.6 | 1.64 | 1.24 | 0.872 |
7 | 18.5 | 16.0 | 14.1 | 2.17 | 1.69 | 1.24 |
8 | 20.1 | 17.5 | 15.5 | 2.73 | 2.18 | 1.65 |
9 | 21.7 | 19.0 | 16.9 | 3.33 | 2.70 | 2.09 |
10 | 23.2 | 20.5 | 18.3 | 3.94 | 3.25 | 2.56 |
11 | 24.7 | 21.9 | 19.7 | 4.57 | 3.82 | 3.05 |
12 | 26.2 | 23.3 | 21 .0 | 5.23 | 4.40 | 3.57 |
13 | 27.7 | 24.7 | 22.4 | 5.89 | 5.01 | 4.11 |
14 | 29.1 | 26.1 | 23.7 | 6.57 | 5.63 | 4.66 |
15 | 30.6 | 27.5 | 25.0 | 7.26 | 6.26 | 5.23 |
16 | 32.0 | 28.8 | 26.3 | 7.96 | 6.91 | 5.81 |
17 | 33.4 | 30.2 | 27.6 | 8.67 | 7.56 | 6.41 |
18 | 34.8 | 31.5 | 28.9 | 9.39 | 8.23 | 7.01 |
19 | 36.2 | 32.9 | 30.1 | 10.1 | 8.91 | 7.63 |
20 | 37.6 | 34.2 | 31.4 | 10.9 | 9.59 | 8.26 |
21 | 38.9 | 35.5 | 32.7 | 11.6 | 10.3 | 8.90 |
22 | 40.3 | 36.8 | 33.9 | 12.3 | 11.0 | 9.54 |
23 | 41.6 | 38.1 | 35.2 | 13.1 | 11.7 | 10.2 |
24 | 43.0 | 39.4 | 36.4 | 13.8 | 12.4 | 10.9 |
25 | 44.3 | 40.6 | 37.7 | 14.6 | 13.1 | 11.5 |
26 | 45.6 | 41.9 | 38.9 | 15.4 | 13.8 | 12.2 |
27 | 47.0 | 43.2 | 40.1 | 16.2 | 14.6 | 12.9 |
28 | 48.3 | 44.5 | 41.3 | 16.9 | 15.3 | 13.6 |
29 | 49.6 | 45.7 | 42.6 | 17.7 | 16.0 | 14.3 |
30 | 50.9 | 47.0 | 43.8 | 18.5 | 16.8 | 15.0 |
Pearson (ki-kare), Öğrenci ve Fisher dağılımları
Normal dağılım kullanılarak, istatistiksel veri işlemede artık sıklıkla kullanılan üç dağılım tanımlanır. Bu dağılımlar kitabın ilerleyen bölümlerinde birçok kez karşımıza çıkıyor.
Pearson dağılımı (ki - kare) - rastgele bir değişkenin dağılımı
Nerede rastgele değişkenler X 1 , X 2 ,…, Xn bağımsız ve aynı dağılıma sahip N(0,1). Bu durumda terim sayısı, yani. N ki-kare dağılımının “serbestlik derecesi sayısı” olarak adlandırılır.
Ki-kare dağılımı, varyansı tahmin ederken (bir güven aralığı kullanarak), öncelikle sınırlı sayıda değer alan niteliksel (kategorize edilmiş) değişkenler için anlaşma, homojenlik, bağımsızlık hipotezlerini test ederken ve diğer birçok görevde kullanılır. istatistiksel analiz veri
Dağıtım TÖğrenci t'si rastgele bir değişkenin dağılımıdır
rastgele değişkenler nerede sen Ve X bağımsız, sen standart bir normal dağılıma sahiptir N(0.1) ve X– chi dağılımı – kare c N serbestlik dereceleri. Aynı zamanda NÖğrenci dağılımının “serbestlik derecesi sayısı” denir.
Öğrenci dağılımı 1908 yılında bir bira fabrikasında çalışan İngiliz istatistikçi W. Gosset tarafından tanıtıldı. Bu fabrikada ekonomik ve teknik kararların alınmasında olasılıksal ve istatistiksel yöntemler kullanıldı, bu nedenle yönetim V. Gosset'in kendi adı altında bilimsel makaleler yayınlamasını yasakladı. Bu sayede V. Gosset'in geliştirdiği olasılıksal ve istatistiksel yöntemler biçimindeki ticari sırlar ve “know-how” korundu. Ancak "Öğrenci" takma adıyla yayın yapma fırsatı buldu. Gosset-Student hikayesi, yüz yıl önce bile İngiliz yöneticilerin büyük gelişmelerin farkında olduklarını gösteriyor. ekonomik verimlilik
Günümüzde Öğrenci dağılımı gerçek verilerin analizinde kullanılan en iyi bilinen dağılımlardan biridir. Güven aralıklarını kullanarak matematiksel beklentiyi, tahmin edilen değeri ve diğer özellikleri tahmin ederken, matematiksel beklentilerin değerleri, regresyon katsayıları, numune homojenliği hipotezleri vb. ile ilgili hipotezleri test ederken kullanılır. .
Fisher dağılımı rastgele bir değişkenin dağılımıdır
rastgele değişkenler nerede X 1 Ve X 2 bağımsızdırlar ve serbestlik derecesi sayısıyla birlikte ki-kare dağılımlarına sahiptirler k 1 Ve k 2 sırasıyla. Aynı zamanda çift (k 1 , k 2 ) – Fisher dağılımının bir çift “serbestlik derecesi”, yani, k 1 payın serbestlik derecesi sayısıdır ve k 2 – paydanın serbestlik derecesi sayısı. Rastgele bir değişkenin dağılımı F Adını çalışmalarında aktif olarak kullanan büyük İngiliz istatistikçi R. Fisher'dan (1890-1962) almıştır.
Fisher dağılımı, regresyon analizinde, varyansların eşitliğinde ve uygulamalı istatistiğin diğer problemlerinde modelin yeterliliğine ilişkin hipotezleri test ederken kullanılır.
Ki-kare, Öğrenci ve Fisher dağılım fonksiyonlarına ilişkin ifadeler, bunların yoğunlukları ve özellikleri ile pratik kullanımları için gerekli tablolar özel literatürde bulunabilir (örneğin bkz.).
23. Ki-kare kavramı ve Öğrenci dağılımı ve grafiksel görünüm
1) N serbestlik derecesine sahip bir dağılım (ki-kare), n bağımsız standart normal rastgele değişkenin karelerinin toplamının dağılımıdır.
Dağılım (ki-kare)– rastgele bir değişkenin dağılımı (ve her birinin matematiksel beklentisi 0 ve standart sapması 1'dir)
rastgele değişkenler nerede bağımsızdır ve aynı dağılıma sahiptir. Bu durumda terim sayısı, yani. ki-kare dağılımının "serbestlik derecesi sayısı" olarak adlandırılır. Ki-kare sayısı bir parametreyle, yani serbestlik derecesi sayısıyla belirlenir. Serbestlik derecesi sayısı arttıkça dağılım yavaş yavaş normale yaklaşır.
O zaman bunların kareleri toplamı
k = n serbestlik derecesine sahip ki-kare yasasına göre dağıtılan rastgele bir değişkendir; terimler bir ilişkiyle ilişkiliyse (örneğin,), o zaman serbestlik derecesi sayısı k = n – 1.
Bu dağılımın yoğunluğu
İşte gama fonksiyonu; özellikle Г(n + 1) = n! .
Bu nedenle, ki-kare dağılımı bir parametreyle belirlenir - serbestlik derecesi sayısı k.
Açıklama 1. Serbestlik derecesi sayısı arttıkça ki-kare dağılımı giderek normale yaklaşır.
Açıklama 2. Ki-kare dağılımını kullanarak pratikte karşılaşılan diğer birçok dağılım belirlenir; örneğin, rastgele bir değişkenin dağılımı - rastgele bir vektörün uzunluğu (X1, X2,..., Xn), koordinatları bağımsızdır ve normal kanuna göre dağıtılır.
χ2 dağılımı ilk olarak R. Helmert (1876) ve K. Pearson (1900) tarafından değerlendirildi.
Math.beklenti.=n; D=2n
2) Öğrenci dağılımı
İki bağımsız rastgele değişkeni düşünün: Normal dağılıma sahip ve normalleştirilmiş Z (yani, M(Z) = 0, σ(Z) = 1) ve ki-kare yasasına göre k ile dağıtılan V. serbestlik dereceleri. Daha sonra değer
t-dağılımı veya k serbestlik derecesine sahip Öğrenci dağılımı adı verilen bir dağılıma sahiptir. Bu durumda k'ya Öğrenci dağılımının “serbestlik derecesi sayısı” denir.
Serbestlik derecesi sayısı arttıkça Öğrenci dağılımı hızla normale yaklaşır.
Bu dağılım 1908 yılında bir bira fabrikasında çalışan İngiliz istatistikçi W. Gosset tarafından ortaya atılmıştır. Bu fabrikada ekonomik ve teknik kararların alınmasında olasılıksal ve istatistiksel yöntemler kullanıldı, bu nedenle yönetim V. Gosset'in kendi adı altında bilimsel makaleler yayınlamasını yasakladı. Bu sayede V. Gosset'in geliştirdiği olasılıksal ve istatistiksel yöntemler biçimindeki ticari sırlar ve “know-how” korundu. Ancak "Öğrenci" takma adıyla yayın yapma imkanı buldu. Gosset-Student hikayesi, yüz yıl önce bile Birleşik Krallık yöneticilerinin olasılıksal ve istatistiksel karar verme yöntemlerinin daha yüksek ekonomik verimliliğinin farkında olduklarını gösteriyor.