Pearson dağılımı (ki-kare dağılımı). Klasik istatistik yöntemleri: ki-kare testi Ksi-kare dağılımı

Ki-kare dağılımı istatistiksel hipotezleri test etmek için istatistikte en yaygın kullanılanlardan biridir. Ki-kare dağılımına dayanarak, en güçlü uyum iyiliği testlerinden biri olan Pearson ki-kare testi oluşturulmuştur.

Anlaşma kriteri, bilinmeyen bir dağılımın varsayılan yasası hakkındaki hipotezi test etme kriteridir.

χ2 (ki-kare) testi farklı dağılım hipotezini test etmek için kullanılır. Bu onun onuru.

Kriterin hesaplama formülü eşittir

burada m ve m' sırasıyla ampirik ve teorik frekanslardır

Söz konusu dağıtım;

n serbestlik derecesinin sayısıdır.

Kontrol etmek için ampirik (gözlenen) ve teorik (normal dağılım varsayımı altında hesaplanan) frekansları karşılaştırmamız gerekir.

Ampirik frekanslar, hesaplanan veya beklenen frekanslarla tamamen örtüşüyorsa, S (E – T) = 0 ve χ2 kriteri de şu şekilde olacaktır: sıfıra eşit. S (E – T) sıfıra eşit değilse, bu, hesaplanan frekanslar ile serinin ampirik frekansları arasında bir tutarsızlık olduğunu gösterecektir. Bu gibi durumlarda teorik olarak sıfırdan sonsuza kadar değişebilen χ2 kriterinin anlamlılığının değerlendirilmesi gerekmektedir. Bu, χ2ф'nin gerçekte elde edilen değerini kritik değeriyle (χ2st) karşılaştırarak yapılır. Boş hipotez, yani ampirik ve teorik veya beklenen frekanslar arasındaki tutarsızlığın rastgele olduğu varsayımı, χ2ф'nin χ2st'ye eşit veya daha büyük olması durumunda çürütülür. kabul edilen anlamlılık düzeyi (a) ve serbestlik derecesi sayısı (n) için.

Rastgele değişken χ2'nin olası değerlerinin dağılımı sürekli ve asimetriktir. Serbestlik derecesi sayısına (n) bağlıdır ve gözlem sayısı arttıkça normal dağılıma yaklaşır. Bu nedenle χ2 kriterinin değerlendirmeye uygulanması ayrık dağılımlarözellikle küçük örneklerde değerini etkileyen bazı hatalarla ilişkilidir. Daha doğru tahminler elde etmek için bir örnek şu şekilde dağıtılır: varyasyon serisi, en az 50 seçeneğe sahip olmalıdır. χ2 kriterinin doğru uygulanması aynı zamanda uç sınıflardaki değişkenlerin frekanslarının 5'ten az olmamasını da gerektirir; 5'ten az ise komşu sınıfların frekansları ile birleştirilir, böylece toplam miktar 5'ten büyük veya eşit olur. Frekansların birleşimine göre sınıf sayısı (N) azalır. Serbestlik derecesi sayısı, varyasyon özgürlüğü üzerindeki kısıtlamaların sayısı dikkate alınarak ikincil sınıf sayısına göre belirlenir.

χ2 kriterini belirlemenin doğruluğu büyük ölçüde teorik frekansların (T) hesaplanmasının doğruluğuna bağlı olduğundan, ampirik ve hesaplanan frekanslar arasındaki farkı elde etmek için yuvarlatılmamış teorik frekanslar kullanılmalıdır.

Örnek olarak, kullanımına adanmış bir web sitesinde yayınlanan bir çalışmayı ele alalım. istatistiksel yöntemler beşeri bilimlerde.

Ki-kare testi, normal dağılıp dağılmadığına bakılmaksızın frekans dağılımlarını karşılaştırmanıza olanak tanır.

Sıklık, bir olayın gerçekleşme sayısını ifade eder. Genellikle olayların meydana gelme sıklığı, değişkenler bir isim ölçeğinde ölçüldüğünde ve bunların sıklığın yanı sıra diğer özelliklerinin seçilmesi imkansız veya sorunlu olduğunda ele alınır. Başka bir deyişle, bir değişken niteliksel özelliklere sahip olduğunda. Ayrıca birçok araştırmacı, test puanlarını seviyelere (yüksek, orta, düşük) dönüştürme ve bu seviyelerdeki kişi sayısını bulmak için puan dağılım tabloları oluşturma eğilimindedir. Seviyelerden birinde (kategorilerden birinde) kişi sayısının gerçekten daha fazla (daha az) olduğunu kanıtlamak için Ki-kare katsayısı da kullanılır.

En basit örneğe bakalım.

Benlik saygısını belirlemek için genç ergenler arasında bir test yapıldı. Test puanları üç seviyeye dönüştürüldü: yüksek, orta ve düşük. Frekanslar şu şekilde dağıtıldı:

Yüksek (B) 27 kişi.

Ortalama (C) 12 kişi.

Düşük (L) 11 kişi

Çocukların çoğunluğunun özgüveninin yüksek olduğu açıktır ancak bunun istatistiksel olarak kanıtlanması gerekmektedir. Bunu yapmak için Ki-kare testini kullanıyoruz.

Görevimiz, elde edilen ampirik verilerin teorik olarak eşit olasılıklı olanlardan farklı olup olmadığını kontrol etmektir. Bunu yapmak için teorik frekansları bulmanız gerekir. Bizim durumumuzda teorik frekanslar, tüm frekansların toplanıp kategori sayısına bölünmesiyle bulunan eşit olasılıklı frekanslardır.

Bizim durumumuzda:

(B + C + H)/3 = (27+12+11)/3 = 16,6

Ki-kare testini hesaplamak için formül:

χ2 = ∑(E - T)I / T

Masayı oluşturuyoruz:

Son sütunun toplamını bulun:

Şimdi kritik değerler tablosunu kullanarak kriterin kritik değerini bulmanız gerekiyor (Ekteki Tablo 1). Bunu yapmak için serbestlik derecesi sayısına (n) ihtiyacımız var.

n = (R - 1) * (C - 1)

burada R, tablodaki satır sayısıdır, C ise sütun sayısıdır.

Bizim durumumuzda yalnızca bir sütun (orijinal ampirik frekanslar anlamına gelir) ve üç satır (kategoriler) vardır, dolayısıyla formül değişir; sütunları hariç tutarız.

n = (R - 1) = 3-1 = 2

Hata olasılığı p≤0,05 ve n = 2 için kritik değer χ2 = 5,99'dur.

Elde edilen ampirik değer kritik değerden daha büyüktür; frekanslardaki farklar önemlidir (χ2= 9,64; p≤0,05).

Gördüğünüz gibi kriterin hesaplanması çok basit ve fazla zaman almıyor. Pratik değer Ki-kare testi çok büyük. Bu yöntem, anketlere verilen yanıtları analiz ederken çok değerlidir.

Daha karmaşık bir örneğe bakalım.

Örneğin bir psikolog, öğretmenlerin kızlara göre erkeklere karşı daha önyargılı olduğunun doğru olup olmadığını bilmek istiyor. Onlar. kızları övme olasılıkları daha yüksektir. Bunu yapmak için psikolog, öğretmenler tarafından yazılan öğrencilerin özelliklerini üç kelimenin görülme sıklığı açısından analiz etti: "aktif", "çalışkan", "disiplinli" ve bu kelimelerin eşanlamlıları da sayıldı. Kelimelerin görülme sıklığına ilişkin veriler tabloya girildi:

Elde edilen verileri işlemek için ki-kare testini kullanıyoruz.

Bunu yapmak için ampirik frekansların dağılım tablosunu oluşturacağız, yani. gözlemlediğimiz frekanslar:

Teorik olarak frekansların eşit şekilde dağıtılmasını bekliyoruz. sıklık kız ve erkek çocuklar arasında orantılı olarak dağıtılacaktır. Teorik frekanslardan oluşan bir tablo oluşturalım. Bunu yapmak için satır toplamını sütun toplamıyla çarpın ve elde edilen sayıyı toplam toplam (lar) a bölün.

Hesaplamalar için son tablo şöyle görünecektir:

χ2 = ∑(E - T)I / T

n = (R - 1), burada R, tablodaki satır sayısıdır.

Bizim durumumuzda ki-kare = 4,21; n = 2.

Kriterin kritik değerleri tablosunu kullanarak şunları buluyoruz: n = 2 ve 0,05 hata seviyesi ile kritik değer χ2 = 5,99'dur.

Ortaya çıkan değer kritik değerden küçüktür, bu da sıfır hipotezinin kabul edildiği anlamına gelir.

Sonuç: Öğretmenler çocuğun özelliklerini yazarken çocuğun cinsiyetine önem vermemektedir.

Çözüm.

K. Pearson geliştirmeye önemli katkılarda bulundu matematiksel istatistik(çok sayıda temel kavram). Pearson'un ana felsefi konumu şu şekilde formüle edilmiştir: Bilimin kavramları yapay yapılardır, duyusal deneyimi tanımlama ve düzenleme araçlarıdır; bunları bilimsel cümlelere bağlamanın kuralları, bilim felsefesi olan bilimin grameri tarafından izole edilmiştir. Evrensel disiplin - uygulamalı istatistik - Pearson'a göre öznel olsa da, farklı kavram ve olguları birbirine bağlamamıza olanak tanır.

K. Pearson'un yapılarının çoğu doğrudan ilişkilidir veya antropolojik malzemeler kullanılarak geliştirilmiştir. Bilimin her alanında kullanılan çok sayıda sayısal sınıflandırma yöntemi ve istatistiksel kriter geliştirdi.

Edebiyat.

1. Bogolyubov A. N. Matematik. Mekanik. Biyografik referans kitabı. - Kiev: Naukova Dumka, 1983.

2. Kolmogorov A.N., Yushkevich A.P. (ed.). 19. yüzyılın matematiği. - M.: Bilim. -T.I.

3. 3. Borovkov A.A. Matematiksel istatistik. M.: Nauka, 1994.

4. 8. Feller V. Olasılık teorisine giriş ve uygulamaları. - M.: Mir, T.2, 1984.

5. 9. Harman G., Modern faktör analizi. - M .: İstatistikler, 1972.

İle XIX sonu yüzyılda normal dağılım, verilerdeki evrensel değişim yasası olarak kabul edildi. Ancak K. Pearson ampirik frekansların normal dağılımdan büyük ölçüde farklı olabileceğini kaydetti. Bunun nasıl kanıtlanacağı sorusu ortaya çıktı. Yalnızca subjektif olan grafiksel bir karşılaştırma değil, aynı zamanda katı bir niceliksel gerekçelendirme de gerekliydi.

Kriter böyle icat edildi χ2(ki kare) ampirik (gözlenen) ve teorik (beklenen) frekanslar arasındaki tutarsızlığın önemini test eder. Bu 1900'de oldu, ancak kriter bugün hala kullanılıyor. Üstelik çok çeşitli sorunları çözmek için uyarlanmıştır. Her şeyden önce bu, kategorik verilerin analizidir, yani. miktarla değil, bir kategoriye ait olarak ifade edilenler. Örneğin arabanın sınıfı, deney katılımcısının cinsiyeti, bitki türü vb. Bu tür verilere toplama, çarpma gibi matematiksel işlemler uygulanamaz; yalnızca bunlar için frekanslar hesaplanabilir.

Gözlemlenen frekansları belirtiyoruz Hakkında (Gözlemlendi), beklenen - E (Beklenen). Örnek olarak bir zarın 60 kez atılmasının sonucunu ele alalım. Simetrik ve düzgün ise herhangi bir tarafın gelme olasılığı 1/6 ve dolayısıyla her bir tarafın beklenen sayısı 10'dur (1/6∙60). Gözlemlenen ve beklenen frekansları bir tabloya yazıp histogramı çiziyoruz.

Boş hipotez, frekansların tutarlı olduğu, yani gerçek verilerin beklenen verilerle çelişmediği yönündedir. Alternatif bir hipotez ise frekanslardaki sapmaların rastgele dalgalanmaların ötesine geçtiği, farklılıkların istatistiksel olarak anlamlı olduğu yönündedir. Kesin bir sonuca varmak için buna ihtiyacımız var.

Gözlemlenen ve beklenen frekanslar arasındaki tutarsızlığın özet ölçüsü.
Bu ölçümün dağılımı eğer fark yoktur hipotezi doğrudur.

Frekanslar arasındaki mesafeyle başlayalım. Eğer sadece farkı alırsan O-E o zaman böyle bir ölçüm verinin ölçeğine (frekanslar) bağlı olacaktır. Örneğin, 20 - 5 = 15 ve 1020 - 1005 = 15. Her iki durumda da fark 15'tir. Ancak ilk durumda beklenen frekanslar gözlemlenenlerden 3 kat daha azdır ve ikinci durumda - yalnızca 1,5 %. Ölçeğe bağlı olmayan göreceli bir ölçüme ihtiyacımız var.

Aşağıdaki gerçeklere dikkat edelim. Genel olarak, frekansların ölçüldüğü kategorilerin sayısı çok daha fazla olabilir, dolayısıyla tek bir gözlemin şu veya bu kategoriye girme olasılığı oldukça düşüktür. Eğer öyleyse, böyle bir rastgele değişkenin dağılımı, nadir olaylar yasasına uyacaktır. Poisson yasası. Poisson yasasında bilindiği gibi matematiksel beklenti ve varyansın değeri çakışmaktadır (parametre λ ). Bu, nominal değişkenin bazı kategorileri için beklenen frekansın E ben eşzamanlı olacak ve dağılacaktır. Ayrıca Poisson yasası çok sayıda gözlemle normale dönme eğilimindedir. Bu iki gerçeği birleştirerek, gözlemlenen ve beklenen frekanslar arasındaki uyum hakkındaki hipotez doğruysa şunu elde ederiz: çok sayıda gözlemle, ifade

Normalliğin yalnızca yeterince yüksek frekanslarda ortaya çıkacağını unutmamak önemlidir. İstatistikte genel olarak toplam gözlem sayısının (frekansların toplamının) en az 50 olması ve her geçişte beklenen frekansın en az 5 olması gerektiği kabul edilmektedir. Ancak bu durumda yukarıda gösterilen değer standart normal dağılıma sahiptir. . Bu şartın sağlandığını varsayalım.

Standart normal dağılım hemen hemen tüm değerlere ±3 (üç sigma kuralı) dahilinde sahiptir. Böylece, bir derecelendirme için frekanslardaki göreceli farkı elde ettik. Genelleştirilebilir bir ölçüme ihtiyacımız var. Tüm sapmaları toplayamazsınız - 0 elde ederiz (nedenini tahmin edin). Pearson bu sapmaların karelerinin toplanmasını önerdi.

Bu işaret Ki-kare testi Pearson. Frekanslar gerçekten beklenenlere karşılık geliyorsa, o zaman kriterin değeri nispeten küçük olacaktır (çünkü sapmaların çoğu sıfır civarındadır). Ancak kriterin büyük çıkması, frekanslar arasında önemli farklılıklar olduğunu gösterir.

Pearson kriteri, böyle bir değerin veya daha da büyük bir değerin ortaya çıkmasının olası olmadığı durumlarda “büyük” hale gelir. Ve böyle bir olasılığı hesaplamak için, deney birçok kez tekrarlandığında, frekans uyumu hipotezinin doğru olduğu durumlarda kriterin dağılımını bilmek gerekir.

Görüldüğü gibi ki-kare değeri aynı zamanda terim sayısına da bağlıdır. Ne kadar çok olursa, kriterin değeri de o kadar büyük olmalıdır, çünkü her terim toplama katkıda bulunacaktır. Bu nedenle her miktar için bağımsızşartlara göre kendi dağıtımı olacaktır. Görünüşe göre χ2 bütün bir dağıtım ailesidir.

Ve burada hassas bir ana geliyoruz. Sayı nedir bağımsızşartlar? Görünüşe göre herhangi bir terim (yani sapma) bağımsızdır. K. Pearson da öyle düşünüyordu ama yanıldığı ortaya çıktı. Aslında bağımsız terimlerin sayısı, nominal değişkenin derecelendirme sayısından bir eksik olacaktır. N. Neden? Çünkü eğer frekansların toplamı önceden hesaplanmış bir örneğimiz varsa, o zaman frekanslardan biri her zaman toplam sayı ile diğerlerinin toplamı arasındaki fark olarak belirlenebilir. Dolayısıyla farklılık biraz daha az olacaktır. Ronald Fisher bu gerçeği Pearson'un kriterini geliştirmesinden 20 yıl sonra fark etti. Tabloların bile yeniden yapılması gerekiyordu.

Bu vesileyle Fisher istatistiğe yeni bir kavram getirdi: özgürlük derecesi(serbestlik derecesi), toplamdaki bağımsız terimlerin sayısını temsil eder. Serbestlik derecesi kavramının matematiksel bir açıklaması vardır ve yalnızca normalle ilişkili dağılımlarda (Student's, Fisher-Snedecor ve ki-karenin kendisi) ortaya çıkar.

Serbestlik derecelerinin anlamını daha iyi kavramak için fiziksel bir analoga dönelim. Uzayda serbestçe hareket eden bir nokta hayal edelim. 3 serbestlik derecesine sahiptir çünkü üç boyutlu uzayda her yöne hareket edebilir. Bir nokta herhangi bir yüzey boyunca hareket ediyorsa, o zaman üç boyutlu uzayda olmaya devam etmesine rağmen zaten iki serbestlik derecesine sahiptir (ileri geri, sol ve sağ). Bir yay boyunca hareket eden bir nokta yine üç boyutlu uzaydadır ancak yalnızca bir serbestlik derecesine sahiptir, çünkü ileri veya geri hareket edebilir. Gördüğünüz gibi nesnenin bulunduğu alan her zaman gerçek hareket özgürlüğüne karşılık gelmiyor.

Yaklaşık olarak aynı şekilde, istatistiksel bir kriterin dağılımı, onu hesaplamak için gereken terimlerden daha az sayıda öğeye bağlı olabilir. Genel olarak serbestlik derecesinin sayısı, mevcut bağımlılıkların sayısına göre gözlem sayısından daha azdır.

Böylece ki kare dağılımı ( χ2), her biri serbestlik derecesi parametresine bağlı olan bir dağılım ailesidir. Ki-kare testinin resmi tanımı ise aşağıdaki gibidir. Dağıtım χ2(ki-kare) s k serbestlik derecesi kareler toplamının dağılımıdır k bağımsız standart normal rastgele değişkenler.

Daha sonra ki-kare dağılım fonksiyonunun hesaplandığı formülün kendisine geçebiliriz, ancak neyse ki her şey bizim için uzun zamandır hesaplandı. İlgi olasılığını elde etmek için uygun istatistiksel tabloyu veya Excel'deki hazır bir işlevi kullanabilirsiniz.

Serbestlik derecesi sayısına bağlı olarak ki-kare dağılımının şeklinin nasıl değiştiğini görmek ilginçtir.

Serbestlik derecesi arttıkça ki-kare dağılımı normal olma eğilimindedir. Bu, çok sayıda bağımsız rastgele değişkenin toplamının normal bir dağılıma sahip olduğunu söyleyen merkezi limit teoreminin etkisi ile açıklanmaktadır. Kareler hakkında hiçbir şey söylemiyor)).

Pearson ki-kare testi kullanılarak hipotezin test edilmesi

Şimdi ki-kare yöntemini kullanarak hipotezleri test etmeye geldik. Genel olarak teknoloji kalır. Boş hipotez, gözlemlenen frekansların beklenen frekanslara karşılık geldiğidir (yani aynı popülasyondan alındıkları için aralarında hiçbir fark yoktur). Eğer durum böyleyse, dağılım rastgele dalgalanmaların sınırları dahilinde nispeten küçük olacaktır. Dağılımın ölçüsü ki-kare testi kullanılarak belirlenir. Daha sonra, ya kriterin kendisi kritik değerle karşılaştırılır (karşılık gelen anlamlılık düzeyi ve serbestlik dereceleri için) ya da daha doğru olanı, gözlemlenen p-değeri hesaplanır; sıfır hipotezi doğruysa aynı veya daha büyük kriter değerini elde etme olasılığı.

Çünkü frekansların uyumuyla ilgileniyorsak, kriter kritik seviyeden büyük olduğunda hipotez reddedilecektir. Onlar. Kriter tek taraflıdır. Ancak bazen (bazen) sol hipotezi test etmek gerekir. Örneğin ampirik veriler teorik verilere çok benzer olduğunda. O zaman kriter beklenmedik bir bölgeye düşebilir, ancak solda. Gerçek şu ki, doğal koşullar altında pratik olarak teorik olanlarla örtüşen frekansların elde edilmesi pek mümkün değildir. Her zaman hata veren bir rastgelelik vardır. Ancak böyle bir hata yoksa, o zaman belki de veriler tahrif edilmiştir. Ancak yine de sağ yönlü hipotez genellikle test edilir.

Zar problemine dönelim. Mevcut verileri kullanarak ki-kare testinin değerini hesaplayalım.

Şimdi 5 serbestlik derecesindeki kritik değeri bulalım ( k) ve anlamlılık düzeyi 0,05 ( α ) ki kare dağılımının kritik değerleri tablosuna göre.

Yani 0,05'lik dilim, 5 serbestlik derecesine sahip bir ki-kare dağılımıdır (sağ kuyruk). χ 2 0,05; 5 = 11,1.

Gerçek ve tablolaştırılmış değerleri karşılaştıralım. 3,4 ( χ2) < 11,1 (χ 2 0,05; 5). Hesaplanan kriterin daha küçük olduğu ortaya çıktı, bu da frekansların eşitliği (anlaşma) hipotezinin reddedilmediği anlamına geliyor. Şekilde durum şu şekilde görünüyor.

Hesaplanan değer kritik bölge içinde kalırsa sıfır hipotezi reddedilir.

P değerini de hesaplamak daha doğru olacaktır. Bunu yapmak için, belirli sayıda serbestlik derecesi için tabloda en yakın değeri bulmanız ve karşılık gelen önem düzeyine bakmanız gerekir. Ama bu geçen yüzyıl. Bir bilgisayar, özellikle MS Excel kullanacağız. Excel'in ki-kare ile ilgili çeşitli işlevleri vardır.

Aşağıda bunların kısa bir açıklaması bulunmaktadır.

CH2.OBR– soldaki belirli bir olasılıktaki kriterin kritik değeri (istatistiksel tablolarda olduğu gibi)

CH2.OBR.PH– sağdaki belirli bir olasılık için kriterin kritik değeri. İşlev esasen öncekinin kopyasıdır. Ancak burada seviyeyi hemen belirtebilirsiniz α 1'den çıkarmak yerine. Bu daha uygundur çünkü çoğu durumda ihtiyaç duyulan şey dağıtımın sağ kuyruğudur.

CH2.DAĞ– soldaki p değeri (yoğunluk hesaplanabilir).

CH2.DAĞ.PH– sağdaki p değeri.

CHI2.TEST– iki frekans aralığı için hemen bir ki-kare testi gerçekleştirir. Serbestlik derecesi sayısı, sütundaki frekans sayısından bir eksik olarak alınır (olması gerektiği gibi) ve bir p değeri döndürülür.

Deneyimiz için 5 serbestlik derecesi ve alfa 0,05 için kritik (tablo) değeri hesaplayalım. Excel formülü şöyle görünecek:

CH2.OBR(0,95;5)

CH2.OBR.PH(0,05;5)

Sonuç aynı olacaktır - 11.0705. Bu tabloda gördüğümüz değerdir (1 ondalık basamağa yuvarlanmış).

Son olarak 5 serbestlik derecesi kriteri için p değerini hesaplayalım. χ2= 3.4. Sağda bir olasılığa ihtiyacımız var, bu yüzden HH'nin (sağ kuyruk) eklenmesiyle bir fonksiyon alıyoruz

CH2.DAĞ.PH(3,4;5) = 0,63857

Bu, 5 serbestlik derecesi ile kriter değerini elde etme olasılığının şu olduğu anlamına gelir: χ2= 3,4 ve üzeri neredeyse %64'e eşittir. Doğal olarak hipotez reddedilmiyor (p değeri %5'ten büyük), frekanslar çok iyi uyum gösteriyor.

Şimdi ki-kare testini ve CHI2.TEST Excel fonksiyonunu kullanarak frekansların uyumu hakkındaki hipotezi kontrol edelim.

Tablo yok, hantal hesaplamalar yok. Gözlemlenen ve beklenen frekansları içeren sütunları fonksiyon argümanları olarak belirterek, hemen p değerini elde ederiz. Güzellik.

Şimdi şüpheli bir adamla zar oynadığınızı hayal edin. 1'den 5'e kadar puanların dağılımı aynı kalır, ancak 26 altı atar (toplam atış sayısı 78 olur).

Bu durumda p değeri 0,003 olarak ortaya çıkıyor ve bu da 0,05'ten çok daha düşük. Zarların geçerliliğinden şüphe etmek için iyi nedenler var. İşte bu olasılığın ki-kare dağılım grafiğinde nasıl göründüğü.

Ki-kare kriterinin kendisi burada 17.8 olarak ortaya çıkıyor ve bu da doğal olarak tablodakinden (11.1) daha büyük.

Umarım anlaşma kriterinin ne olduğunu açıklayabilmişimdir χ2(Pearson ki-kare) ve bunun istatistiksel hipotezleri test etmek için nasıl kullanılabileceği.

Son olarak bir kez daha önemli bir durum hakkında! Ki-kare testi yalnızca tüm frekansların sayısı 50'yi aştığında ve her derecelendirme için beklenen minimum değer 5'ten az olmadığında düzgün çalışır. Herhangi bir kategoride beklenen frekans 5'ten azsa ancak tüm frekansların toplamı şunu aşıyorsa: 50 ise, bu durumda kategori en yakın olanla birleştirilir ve böylece toplam frekansları 5'i geçer. Bu mümkün değilse veya frekansların toplamı 50'den azsa, daha doğru hipotez testi yöntemleri kullanılmalıdır. Bunları başka zaman konuşuruz.

Aşağıda ki-kare testi kullanılarak Excel'de bir hipotezin nasıl test edileceğine ilişkin bir video bulunmaktadır.

U 1 , U 2 , ..,U k bağımsız standart olsun normal değerler. Rastgele değişken K = U 1 2 +U 2 2 + .. + U k 2'nin dağılımına ki-kare dağılımı denir. k serbestlik derecesi (K~χ 2 (k) yazın). Bu, pozitif çarpıklığa ve aşağıdaki özelliklere sahip tek modlu bir dağılımdır: mod M=k-2 matematiksel beklenti m=k dispersiyonu D=2k (Şek.). Yeterli olduğunda büyük önem parametre k dağılım χ 2 (k) parametrelerle yaklaşık olarak normal bir dağılıma sahiptir

Matematiksel istatistik problemlerini çözerken, verilen olasılığa ve serbestlik derecesi sayısına bağlı olarak kritik noktalar χ 2 (k) kullanılır. k(Ek 2). Kritik nokta Χ 2 kr = Χ 2 (k; α), dağılım yoğunluk eğrisinin altındaki alanın %100- α'sının sağında yer aldığı bölgenin sınırıdır. Test sırasında rastgele değişken K~χ 2 (k) değerinin χ 2 (k) noktasının sağına düşme olasılığı α P(K≥χ 2 kp)≤ α)'yı aşmaz. Örneğin, K~χ 2 (20) rastgele değişkeni için olasılığı α=0,05 olarak belirledik. Tabloya göre kritik noktalar Ki-kare dağılımında (tablolarda) χ 2 kp = χ 2 (20;0,05) = 31,4'ü buluyoruz. Bu, bu rastgele değişkenin olasılığının k 31,4'ten büyük, 0,05'ten küçük bir değeri kabul edin (Şek.).

Pirinç. Serbestlik derecesi sayısının farklı değerleri için dağılım yoğunluğu grafiği χ 2 (k) k

Kritik noktalar χ 2 (k) aşağıdaki hesap makinelerinde kullanılır:

Çoklu bağlantının varlığının kontrol edilmesi (çoklu bağlantı hakkında).

Ki-kare kullanarak bir hipotezi test etmek yalnızca “bir ilişki var mı?” sorusuna cevap verecektir, ilişkinin yönünü test etmek için daha fazla araştırmaya ihtiyaç vardır. Ayrıca, Ki-kare testi düşük frekanslı verilerle çalışırken belirli bir hataya sahiptir.

Bu nedenle iletişimin yönünü kontrol etmek için öğesini seçin. korelasyon analiziözellikle Pearson korelasyon katsayısı kullanılarak hipotezin test edilmesi ve t-testi kullanılarak anlamlılığın daha ileri test edilmesi.

Anlamlılık düzeyi α Χ 2'nin herhangi bir değeri için MS Excel fonksiyonu kullanılarak bulunabilir: =HI2OBR(α;serbestlik derecesi)

n-1	.995	.990	.975	.950	.900	.750	.500	.250	.100	.050	.025	.010	.005
1	0.00004	0.00016	0.00098	0.00393	0.01579	0.10153	0.45494	1.32330	2.70554	3.84146	5.02389	6.63490	7.87944
2	0.01003	0.02010	0.05064	0.10259	0.21072	0.57536	1.38629	2.77259	4.60517	5.99146	7.37776	9.21034	10.59663
3	0.07172	0.11483	0.21580	0.35185	0.58437	1.21253	2.36597	4.10834	6.25139	7.81473	9.34840	11.34487	12.83816
4	0.20699	0.29711	0.48442	0.71072	1.06362	1.92256	3.35669	5.38527	7.77944	9.48773	11.14329	13.27670	14.86026
5	0.41174	0.55430	0.83121	1.14548	1.61031	2.67460	4.35146	6.62568	9.23636	11.07050	12.83250	15.08627	16.74960
6	0.67573	0.87209	1.23734	1.63538	2.20413	3.45460	5.34812	7.84080	10.64464	12.59159	14.44938	16.81189	18.54758
7	0.98926	1.23904	1.68987	2.16735	2.83311	4.25485	6.34581	9.03715	12.01704	14.06714	16.01276	18.47531	20.27774
8	1.34441	1.64650	2.17973	2.73264	3.48954	5.07064	7.34412	10.21885	13.36157	15.50731	17.53455	20.09024	21.95495
9	1.73493	2.08790	2.70039	3.32511	4.16816	5.89883	8.34283	11.38875	14.68366	16.91898	19.02277	21.66599	23.58935
10	2.15586	2.55821	3.24697	3.94030	4.86518	6.73720	9.34182	12.54886	15.98718	18.30704	20.48318	23.20925	25.18818
11	2.60322	3.05348	3.81575	4.57481	5.57778	7.58414	10.34100	13.70069	17.27501	19.67514	21.92005	24.72497	26.75685
12	3.07382	3.57057	4.40379	5.22603	6.30380	8.43842	11.34032	14.84540	18.54935	21.02607	23.33666	26.21697	28.29952
13	3.56503	4.10692	5.00875	5.89186	7.04150	9.29907	12.33976	15.98391	19.81193	22.36203	24.73560	27.68825	29.81947
14	4.07467	4.66043	5.62873	6.57063	7.78953	10.16531	13.33927	17.11693	21.06414	23.68479	26.11895	29.14124	31.31935
15	4.60092	5.22935	6.26214	7.26094	8.54676	11.03654	14.33886	18.24509	22.30713	24.99579	27.48839	30.57791	32.80132
16	5.14221	5.81221	6.90766	7.96165	9.31224	11.91222	15.33850	19.36886	23.54183	26.29623	28.84535	31.99993	34.26719
17	5.69722	6.40776	7.56419	8.67176	10.08519	12.79193	16.33818	20.48868	24.76904	27.58711	30.19101	33.40866	35.71847
18	6.26480	7.01491	8.23075	9.39046	10.86494	13.67529	17.33790	21.60489	25.98942	28.86930	31.52638	34.80531	37.15645
19	6.84397	7.63273	8.90652	10.11701	11.65091	14.56200	18.33765	22.71781	27.20357	30.14353	32.85233	36.19087	38.58226
20	7.43384	8.26040	9.59078	10.85081	12.44261	15.45177	19.33743	23.82769	28.41198	31.41043	34.16961	37.56623	39.99685
21	8.03365	8.89720	10.28290	11.59131	13.23960	16.34438	20.33723	24.93478	29.61509	32.67057	35.47888	38.93217	41.40106
22	8.64272	9.54249	10.98232	12.33801	14.04149	17.23962	21.33704	26.03927	30.81328	33.92444	36.78071	40.28936	42.79565
23	9.26042	10.19572	11.68855	13.09051	14.84796	18.13730	22.33688	27.14134	32.00690	35.17246	38.07563	41.63840	44.18128
24	9.88623	10.85636	12.40115	13.84843	15.65868	19.03725	23.33673	28.24115	33.19624	36.41503	39.36408	42.97982	45.55851
25	10.51965	11.52398	13.11972	14.61141	16.47341	19.93934	24.33659	29.33885	34.38159	37.65248	40.64647	44.31410	46.92789
26	11.16024	12.19815	13.84390	15.37916	17.29188	20.84343	25.33646	30.43457	35.56317	38.88514	41.92317	45.64168	48.28988
27	11.80759	12.87850	14.57338	16.15140	18.11390	21.74940	26.33634	31.52841	36.74122	40.11327	43.19451	46.96294	49.64492
28	12.46134	13.56471	15.30786	16.92788	18.93924	22.65716	27.33623	32.62049	37.91592	41.33714	44.46079	48.27824	50.99338
29	13.12115	14.25645	16.04707	17.70837	19.76774	23.56659	28.33613	33.71091	39.08747	42.55697	45.72229	49.58788	52.33562
30	13.78672	14.95346	16.79077	18.49266	20.59923	24.47761	29.33603	34.79974	40.25602	43.77297	46.97924	50.89218	53.67196

Serbestlik derecesi sayısı k	Önem düzeyi a
Serbestlik derecesi sayısı k	0,01	0,025	0.05	0,95	0,975	0.99
1	6.6	5.0	3.8	0.0039	0.00098	0.00016
2	9.2	7.4	6.0	0.103	0.051	0.020
3	11.3	9.4	7.8	0.352	0.216	0.115
4	13.3	11.1	9.5	0.711	0.484	0.297
5	15.1	12.8	11.1	1.15	0.831	0.554
6	16.8	14.4	12.6	1.64	1.24	0.872
7	18.5	16.0	14.1	2.17	1.69	1.24
8	20.1	17.5	15.5	2.73	2.18	1.65
9	21.7	19.0	16.9	3.33	2.70	2.09
10	23.2	20.5	18.3	3.94	3.25	2.56
11	24.7	21.9	19.7	4.57	3.82	3.05
12	26.2	23.3	21 .0	5.23	4.40	3.57
13	27.7	24.7	22.4	5.89	5.01	4.11
14	29.1	26.1	23.7	6.57	5.63	4.66
15	30.6	27.5	25.0	7.26	6.26	5.23
16	32.0	28.8	26.3	7.96	6.91	5.81
17	33.4	30.2	27.6	8.67	7.56	6.41
18	34.8	31.5	28.9	9.39	8.23	7.01
19	36.2	32.9	30.1	10.1	8.91	7.63
20	37.6	34.2	31.4	10.9	9.59	8.26
21	38.9	35.5	32.7	11.6	10.3	8.90
22	40.3	36.8	33.9	12.3	11.0	9.54
23	41.6	38.1	35.2	13.1	11.7	10.2
24	43.0	39.4	36.4	13.8	12.4	10.9
25	44.3	40.6	37.7	14.6	13.1	11.5
26	45.6	41.9	38.9	15.4	13.8	12.2
27	47.0	43.2	40.1	16.2	14.6	12.9
28	48.3	44.5	41.3	16.9	15.3	13.6
29	49.6	45.7	42.6	17.7	16.0	14.3
30	50.9	47.0	43.8	18.5	16.8	15.0

Pearson (ki-kare), Öğrenci ve Fisher dağılımları

Normal dağılım kullanılarak, istatistiksel veri işlemede artık sıklıkla kullanılan üç dağılım tanımlanır. Bu dağılımlar kitabın ilerleyen bölümlerinde birçok kez karşımıza çıkıyor.

Pearson dağılımı (ki - kare) - rastgele bir değişkenin dağılımı

Nerede rastgele değişkenler X 1 , X 2 ,…, Xn bağımsız ve aynı dağılıma sahip N(0,1). Bu durumda terim sayısı, yani. N ki-kare dağılımının “serbestlik derecesi sayısı” olarak adlandırılır.

Ki-kare dağılımı, varyansı tahmin ederken (bir güven aralığı kullanarak), öncelikle sınırlı sayıda değer alan niteliksel (kategorize edilmiş) değişkenler için anlaşma, homojenlik, bağımsızlık hipotezlerini test ederken ve diğer birçok görevde kullanılır. istatistiksel analiz veri

Dağıtım TÖğrenci t'si rastgele bir değişkenin dağılımıdır

rastgele değişkenler nerede sen Ve X bağımsız, sen standart bir normal dağılıma sahiptir N(0.1) ve X– chi dağılımı – kare c N serbestlik dereceleri. Aynı zamanda NÖğrenci dağılımının “serbestlik derecesi sayısı” denir.

Öğrenci dağılımı 1908 yılında bir bira fabrikasında çalışan İngiliz istatistikçi W. Gosset tarafından tanıtıldı. Bu fabrikada ekonomik ve teknik kararların alınmasında olasılıksal ve istatistiksel yöntemler kullanıldı, bu nedenle yönetim V. Gosset'in kendi adı altında bilimsel makaleler yayınlamasını yasakladı. Bu sayede V. Gosset'in geliştirdiği olasılıksal ve istatistiksel yöntemler biçimindeki ticari sırlar ve “know-how” korundu. Ancak "Öğrenci" takma adıyla yayın yapma fırsatı buldu. Gosset-Student hikayesi, yüz yıl önce bile İngiliz yöneticilerin büyük gelişmelerin farkında olduklarını gösteriyor. ekonomik verimlilik

Günümüzde Öğrenci dağılımı gerçek verilerin analizinde kullanılan en iyi bilinen dağılımlardan biridir. Güven aralıklarını kullanarak matematiksel beklentiyi, tahmin edilen değeri ve diğer özellikleri tahmin ederken, matematiksel beklentilerin değerleri, regresyon katsayıları, numune homojenliği hipotezleri vb. ile ilgili hipotezleri test ederken kullanılır. .

Fisher dağılımı rastgele bir değişkenin dağılımıdır

rastgele değişkenler nerede X 1 Ve X 2 bağımsızdırlar ve serbestlik derecesi sayısıyla birlikte ki-kare dağılımlarına sahiptirler k 1 Ve k 2 sırasıyla. Aynı zamanda çift (k 1 , k 2 ) – Fisher dağılımının bir çift “serbestlik derecesi”, yani, k 1 payın serbestlik derecesi sayısıdır ve k 2 – paydanın serbestlik derecesi sayısı. Rastgele bir değişkenin dağılımı F Adını çalışmalarında aktif olarak kullanan büyük İngiliz istatistikçi R. Fisher'dan (1890-1962) almıştır.

Fisher dağılımı, regresyon analizinde, varyansların eşitliğinde ve uygulamalı istatistiğin diğer problemlerinde modelin yeterliliğine ilişkin hipotezleri test ederken kullanılır.

Ki-kare, Öğrenci ve Fisher dağılım fonksiyonlarına ilişkin ifadeler, bunların yoğunlukları ve özellikleri ile pratik kullanımları için gerekli tablolar özel literatürde bulunabilir (örneğin bkz.).

23. Ki-kare kavramı ve Öğrenci dağılımı ve grafiksel görünüm

1) N serbestlik derecesine sahip bir dağılım (ki-kare), n bağımsız standart normal rastgele değişkenin karelerinin toplamının dağılımıdır.

Dağılım (ki-kare)– rastgele bir değişkenin dağılımı (ve her birinin matematiksel beklentisi 0 ve standart sapması 1'dir)

rastgele değişkenler nerede bağımsızdır ve aynı dağılıma sahiptir. Bu durumda terim sayısı, yani. ki-kare dağılımının "serbestlik derecesi sayısı" olarak adlandırılır. Ki-kare sayısı bir parametreyle, yani serbestlik derecesi sayısıyla belirlenir. Serbestlik derecesi sayısı arttıkça dağılım yavaş yavaş normale yaklaşır.

O zaman bunların kareleri toplamı

k = n serbestlik derecesine sahip ki-kare yasasına göre dağıtılan rastgele bir değişkendir; terimler bir ilişkiyle ilişkiliyse (örneğin,), o zaman serbestlik derecesi sayısı k = n – 1.

Bu dağılımın yoğunluğu

İşte gama fonksiyonu; özellikle Г(n + 1) = n! .

Bu nedenle, ki-kare dağılımı bir parametreyle belirlenir - serbestlik derecesi sayısı k.

Açıklama 1. Serbestlik derecesi sayısı arttıkça ki-kare dağılımı giderek normale yaklaşır.

Açıklama 2. Ki-kare dağılımını kullanarak pratikte karşılaşılan diğer birçok dağılım belirlenir; örneğin, rastgele bir değişkenin dağılımı - rastgele bir vektörün uzunluğu (X1, X2,..., Xn), koordinatları bağımsızdır ve normal kanuna göre dağıtılır.

χ2 dağılımı ilk olarak R. Helmert (1876) ve K. Pearson (1900) tarafından değerlendirildi.

Math.beklenti.=n; D=2n

2) Öğrenci dağılımı

İki bağımsız rastgele değişkeni düşünün: Normal dağılıma sahip ve normalleştirilmiş Z (yani, M(Z) = 0, σ(Z) = 1) ve ki-kare yasasına göre k ile dağıtılan V. serbestlik dereceleri. Daha sonra değer

t-dağılımı veya k serbestlik derecesine sahip Öğrenci dağılımı adı verilen bir dağılıma sahiptir. Bu durumda k'ya Öğrenci dağılımının “serbestlik derecesi sayısı” denir.

Serbestlik derecesi sayısı arttıkça Öğrenci dağılımı hızla normale yaklaşır.

Bu dağılım 1908 yılında bir bira fabrikasında çalışan İngiliz istatistikçi W. Gosset tarafından ortaya atılmıştır. Bu fabrikada ekonomik ve teknik kararların alınmasında olasılıksal ve istatistiksel yöntemler kullanıldı, bu nedenle yönetim V. Gosset'in kendi adı altında bilimsel makaleler yayınlamasını yasakladı. Bu sayede V. Gosset'in geliştirdiği olasılıksal ve istatistiksel yöntemler biçimindeki ticari sırlar ve “know-how” korundu. Ancak "Öğrenci" takma adıyla yayın yapma imkanı buldu. Gosset-Student hikayesi, yüz yıl önce bile Birleşik Krallık yöneticilerinin olasılıksal ve istatistiksel karar verme yöntemlerinin daha yüksek ekonomik verimliliğinin farkında olduklarını gösteriyor.