Pearson dağılımı (ki-kare dağılımı). Klasik istatistik yöntemleri: ki-kare testi Ksi-kare dağılımı

Ki-kare dağılımı istatistiksel hipotezleri test etmek için istatistikte en yaygın kullanılanlardan biridir. Ki-kare dağılımına dayanarak, en güçlü uyum iyiliği testlerinden biri olan Pearson ki-kare testi oluşturulmuştur.

Anlaşma kriteri, bilinmeyen bir dağılımın varsayılan yasası hakkındaki hipotezi test etme kriteridir.

χ2 (ki-kare) testi farklı dağılım hipotezini test etmek için kullanılır. Bu onun onuru.

Kriterin hesaplama formülü eşittir

burada m ve m' sırasıyla ampirik ve teorik frekanslardır

Söz konusu dağıtım;

n serbestlik derecesinin sayısıdır.

Kontrol etmek için ampirik (gözlenen) ve teorik (normal dağılım varsayımı altında hesaplanan) frekansları karşılaştırmamız gerekir.

Ampirik frekanslar, hesaplanan veya beklenen frekanslarla tamamen örtüşüyorsa, S (E – T) = 0 ve χ2 kriteri de şu şekilde olacaktır: sıfıra eşit. S (E – T) sıfıra eşit değilse, bu, hesaplanan frekanslar ile serinin ampirik frekansları arasında bir tutarsızlık olduğunu gösterecektir. Bu gibi durumlarda teorik olarak sıfırdan sonsuza kadar değişebilen χ2 kriterinin anlamlılığının değerlendirilmesi gerekmektedir. Bu, χ2ф'nin gerçekte elde edilen değerini kritik değeriyle (χ2st) karşılaştırarak yapılır. Boş hipotez, yani ampirik ve teorik veya beklenen frekanslar arasındaki tutarsızlığın rastgele olduğu varsayımı, χ2ф'nin χ2st'ye eşit veya daha büyük olması durumunda çürütülür. kabul edilen anlamlılık düzeyi (a) ve serbestlik derecesi sayısı (n) için.

Rastgele değişken χ2'nin olası değerlerinin dağılımı sürekli ve asimetriktir. Serbestlik derecesi sayısına (n) bağlıdır ve gözlem sayısı arttıkça normal dağılıma yaklaşır. Bu nedenle χ2 kriterinin değerlendirmeye uygulanması ayrık dağılımlarözellikle küçük örneklerde değerini etkileyen bazı hatalarla ilişkilidir. Daha doğru tahminler elde etmek için bir örnek şu şekilde dağıtılır: varyasyon serisi, en az 50 seçeneğe sahip olmalıdır. χ2 kriterinin doğru uygulanması aynı zamanda uç sınıflardaki değişkenlerin frekanslarının 5'ten az olmamasını da gerektirir; 5'ten az ise komşu sınıfların frekansları ile birleştirilir, böylece toplam miktar 5'ten büyük veya eşit olur. Frekansların birleşimine göre sınıf sayısı (N) azalır. Serbestlik derecesi sayısı, varyasyon özgürlüğü üzerindeki kısıtlamaların sayısı dikkate alınarak ikincil sınıf sayısına göre belirlenir.



χ2 kriterini belirlemenin doğruluğu büyük ölçüde teorik frekansların (T) hesaplanmasının doğruluğuna bağlı olduğundan, ampirik ve hesaplanan frekanslar arasındaki farkı elde etmek için yuvarlatılmamış teorik frekanslar kullanılmalıdır.

Örnek olarak, kullanımına adanmış bir web sitesinde yayınlanan bir çalışmayı ele alalım. istatistiksel yöntemler beşeri bilimlerde.

Ki-kare testi, normal dağılıp dağılmadığına bakılmaksızın frekans dağılımlarını karşılaştırmanıza olanak tanır.

Sıklık, bir olayın gerçekleşme sayısını ifade eder. Genellikle olayların meydana gelme sıklığı, değişkenler bir isim ölçeğinde ölçüldüğünde ve bunların sıklığın yanı sıra diğer özelliklerinin seçilmesi imkansız veya sorunlu olduğunda ele alınır. Başka bir deyişle, bir değişken niteliksel özelliklere sahip olduğunda. Ayrıca birçok araştırmacı, test puanlarını seviyelere (yüksek, orta, düşük) dönüştürme ve bu seviyelerdeki kişi sayısını bulmak için puan dağılım tabloları oluşturma eğilimindedir. Seviyelerden birinde (kategorilerden birinde) kişi sayısının gerçekten daha fazla (daha az) olduğunu kanıtlamak için Ki-kare katsayısı da kullanılır.

En basit örneğe bakalım.

Benlik saygısını belirlemek için genç ergenler arasında bir test yapıldı. Test puanları üç seviyeye dönüştürüldü: yüksek, orta ve düşük. Frekanslar şu şekilde dağıtıldı:

Yüksek (B) 27 kişi.

Ortalama (C) 12 kişi.

Düşük (L) 11 kişi

Çocukların çoğunluğunun özgüveninin yüksek olduğu açıktır ancak bunun istatistiksel olarak kanıtlanması gerekmektedir. Bunu yapmak için Ki-kare testini kullanıyoruz.

Görevimiz, elde edilen ampirik verilerin teorik olarak eşit olasılıklı olanlardan farklı olup olmadığını kontrol etmektir. Bunu yapmak için teorik frekansları bulmanız gerekir. Bizim durumumuzda teorik frekanslar, tüm frekansların toplanıp kategori sayısına bölünmesiyle bulunan eşit olasılıklı frekanslardır.

Bizim durumumuzda:

(B + C + H)/3 = (27+12+11)/3 = 16,6

Ki-kare testini hesaplamak için formül:

χ2 = ∑(E - T)I / T

Masayı oluşturuyoruz:

Son sütunun toplamını bulun:

Şimdi kritik değerler tablosunu kullanarak kriterin kritik değerini bulmanız gerekiyor (Ekteki Tablo 1). Bunu yapmak için serbestlik derecesi sayısına (n) ihtiyacımız var.

n = (R - 1) * (C - 1)

burada R, tablodaki satır sayısıdır, C ise sütun sayısıdır.

Bizim durumumuzda yalnızca bir sütun (orijinal ampirik frekanslar anlamına gelir) ve üç satır (kategoriler) vardır, dolayısıyla formül değişir; sütunları hariç tutarız.

n = (R - 1) = 3-1 = 2

Hata olasılığı p≤0,05 ve n = 2 için kritik değer χ2 = 5,99'dur.

Elde edilen ampirik değer kritik değerden daha büyüktür; frekanslardaki farklar önemlidir (χ2= 9,64; p≤0,05).

Gördüğünüz gibi kriterin hesaplanması çok basit ve fazla zaman almıyor. Pratik değer Ki-kare testi çok büyük. Bu yöntem, anketlere verilen yanıtları analiz ederken çok değerlidir.


Daha karmaşık bir örneğe bakalım.

Örneğin bir psikolog, öğretmenlerin kızlara göre erkeklere karşı daha önyargılı olduğunun doğru olup olmadığını bilmek istiyor. Onlar. kızları övme olasılıkları daha yüksektir. Bunu yapmak için psikolog, öğretmenler tarafından yazılan öğrencilerin özelliklerini üç kelimenin görülme sıklığı açısından analiz etti: "aktif", "çalışkan", "disiplinli" ve bu kelimelerin eşanlamlıları da sayıldı. Kelimelerin görülme sıklığına ilişkin veriler tabloya girildi:

Elde edilen verileri işlemek için ki-kare testini kullanıyoruz.

Bunu yapmak için ampirik frekansların dağılım tablosunu oluşturacağız, yani. gözlemlediğimiz frekanslar:

Teorik olarak frekansların eşit şekilde dağıtılmasını bekliyoruz. sıklık kız ve erkek çocuklar arasında orantılı olarak dağıtılacaktır. Teorik frekanslardan oluşan bir tablo oluşturalım. Bunu yapmak için satır toplamını sütun toplamıyla çarpın ve elde edilen sayıyı toplam toplam (lar) a bölün.

Hesaplamalar için son tablo şöyle görünecektir:

χ2 = ∑(E - T)I / T

n = (R - 1), burada R, tablodaki satır sayısıdır.

Bizim durumumuzda ki-kare = 4,21; n = 2.

Kriterin kritik değerleri tablosunu kullanarak şunları buluyoruz: n = 2 ve 0,05 hata seviyesi ile kritik değer χ2 = 5,99'dur.

Ortaya çıkan değer kritik değerden küçüktür, bu da sıfır hipotezinin kabul edildiği anlamına gelir.

Sonuç: Öğretmenler çocuğun özelliklerini yazarken çocuğun cinsiyetine önem vermemektedir.


Çözüm.

K. Pearson geliştirmeye önemli katkılarda bulundu matematiksel istatistik(çok sayıda temel kavram). Pearson'un ana felsefi konumu şu şekilde formüle edilmiştir: Bilimin kavramları yapay yapılardır, duyusal deneyimi tanımlama ve düzenleme araçlarıdır; bunları bilimsel cümlelere bağlamanın kuralları, bilim felsefesi olan bilimin grameri tarafından izole edilmiştir. Evrensel disiplin - uygulamalı istatistik - Pearson'a göre öznel olsa da, farklı kavram ve olguları birbirine bağlamamıza olanak tanır.

K. Pearson'un yapılarının çoğu doğrudan ilişkilidir veya antropolojik malzemeler kullanılarak geliştirilmiştir. Bilimin her alanında kullanılan çok sayıda sayısal sınıflandırma yöntemi ve istatistiksel kriter geliştirdi.


Edebiyat.

1. Bogolyubov A. N. Matematik. Mekanik. Biyografik referans kitabı. - Kiev: Naukova Dumka, 1983.

2. Kolmogorov A.N., Yushkevich A.P. (ed.). 19. yüzyılın matematiği. - M.: Bilim. -T.I.

3. 3. Borovkov A.A. Matematiksel istatistik. M.: Nauka, 1994.

4. 8. Feller V. Olasılık teorisine giriş ve uygulamaları. - M.: Mir, T.2, 1984.

5. 9. Harman G., Modern faktör analizi. - M .: İstatistikler, 1972.

İle XIX sonu yüzyılda normal dağılım, verilerdeki evrensel değişim yasası olarak kabul edildi. Ancak K. Pearson ampirik frekansların normal dağılımdan büyük ölçüde farklı olabileceğini kaydetti. Bunun nasıl kanıtlanacağı sorusu ortaya çıktı. Yalnızca subjektif olan grafiksel bir karşılaştırma değil, aynı zamanda katı bir niceliksel gerekçelendirme de gerekliydi.

Kriter böyle icat edildi χ2(ki kare) ampirik (gözlenen) ve teorik (beklenen) frekanslar arasındaki tutarsızlığın önemini test eder. Bu 1900'de oldu, ancak kriter bugün hala kullanılıyor. Üstelik çok çeşitli sorunları çözmek için uyarlanmıştır. Her şeyden önce bu, kategorik verilerin analizidir, yani. miktarla değil, bir kategoriye ait olarak ifade edilenler. Örneğin arabanın sınıfı, deney katılımcısının cinsiyeti, bitki türü vb. Bu tür verilere toplama, çarpma gibi matematiksel işlemler uygulanamaz; yalnızca bunlar için frekanslar hesaplanabilir.

Gözlemlenen frekansları belirtiyoruz Hakkında (Gözlemlendi), beklenen - E (Beklenen). Örnek olarak bir zarın 60 kez atılmasının sonucunu ele alalım. Simetrik ve düzgün ise herhangi bir tarafın gelme olasılığı 1/6 ve dolayısıyla her bir tarafın beklenen sayısı 10'dur (1/6∙60). Gözlemlenen ve beklenen frekansları bir tabloya yazıp histogramı çiziyoruz.

Boş hipotez, frekansların tutarlı olduğu, yani gerçek verilerin beklenen verilerle çelişmediği yönündedir. Alternatif bir hipotez ise frekanslardaki sapmaların rastgele dalgalanmaların ötesine geçtiği, farklılıkların istatistiksel olarak anlamlı olduğu yönündedir. Kesin bir sonuca varmak için buna ihtiyacımız var.

  1. Gözlemlenen ve beklenen frekanslar arasındaki tutarsızlığın özet ölçüsü.
  2. Bu ölçümün dağılımı eğer fark yoktur hipotezi doğrudur.

Frekanslar arasındaki mesafeyle başlayalım. Eğer sadece farkı alırsan O-E o zaman böyle bir ölçüm verinin ölçeğine (frekanslar) bağlı olacaktır. Örneğin, 20 - 5 = 15 ve 1020 - 1005 = 15. Her iki durumda da fark 15'tir. Ancak ilk durumda beklenen frekanslar gözlemlenenlerden 3 kat daha azdır ve ikinci durumda - yalnızca 1,5 %. Ölçeğe bağlı olmayan göreceli bir ölçüme ihtiyacımız var.

Aşağıdaki gerçeklere dikkat edelim. Genel olarak, frekansların ölçüldüğü kategorilerin sayısı çok daha fazla olabilir, dolayısıyla tek bir gözlemin şu veya bu kategoriye girme olasılığı oldukça düşüktür. Eğer öyleyse, böyle bir rastgele değişkenin dağılımı, nadir olaylar yasasına uyacaktır. Poisson yasası. Poisson yasasında bilindiği gibi matematiksel beklenti ve varyansın değeri çakışmaktadır (parametre λ ). Bu, nominal değişkenin bazı kategorileri için beklenen frekansın E ben eşzamanlı olacak ve dağılacaktır. Ayrıca Poisson yasası çok sayıda gözlemle normale dönme eğilimindedir. Bu iki gerçeği birleştirerek, gözlemlenen ve beklenen frekanslar arasındaki uyum hakkındaki hipotez doğruysa şunu elde ederiz: çok sayıda gözlemle, ifade

Normalliğin yalnızca yeterince yüksek frekanslarda ortaya çıkacağını unutmamak önemlidir. İstatistikte genel olarak toplam gözlem sayısının (frekansların toplamının) en az 50 olması ve her geçişte beklenen frekansın en az 5 olması gerektiği kabul edilmektedir. Ancak bu durumda yukarıda gösterilen değer standart normal dağılıma sahiptir. . Bu şartın sağlandığını varsayalım.

Standart normal dağılım hemen hemen tüm değerlere ±3 (üç sigma kuralı) dahilinde sahiptir. Böylece, bir derecelendirme için frekanslardaki göreceli farkı elde ettik. Genelleştirilebilir bir ölçüme ihtiyacımız var. Tüm sapmaları toplayamazsınız - 0 elde ederiz (nedenini tahmin edin). Pearson bu sapmaların karelerinin toplanmasını önerdi.

Bu işaret Ki-kare testi Pearson. Frekanslar gerçekten beklenenlere karşılık geliyorsa, o zaman kriterin değeri nispeten küçük olacaktır (çünkü sapmaların çoğu sıfır civarındadır). Ancak kriterin büyük çıkması, frekanslar arasında önemli farklılıklar olduğunu gösterir.

Pearson kriteri, böyle bir değerin veya daha da büyük bir değerin ortaya çıkmasının olası olmadığı durumlarda “büyük” hale gelir. Ve böyle bir olasılığı hesaplamak için, deney birçok kez tekrarlandığında, frekans uyumu hipotezinin doğru olduğu durumlarda kriterin dağılımını bilmek gerekir.

Görüldüğü gibi ki-kare değeri aynı zamanda terim sayısına da bağlıdır. Ne kadar çok olursa, kriterin değeri de o kadar büyük olmalıdır, çünkü her terim toplama katkıda bulunacaktır. Bu nedenle her miktar için bağımsızşartlara göre kendi dağıtımı olacaktır. Görünüşe göre χ2 bütün bir dağıtım ailesidir.

Ve burada hassas bir ana geliyoruz. Sayı nedir bağımsızşartlar? Görünüşe göre herhangi bir terim (yani sapma) bağımsızdır. K. Pearson da öyle düşünüyordu ama yanıldığı ortaya çıktı. Aslında bağımsız terimlerin sayısı, nominal değişkenin derecelendirme sayısından bir eksik olacaktır. N. Neden? Çünkü eğer frekansların toplamı önceden hesaplanmış bir örneğimiz varsa, o zaman frekanslardan biri her zaman toplam sayı ile diğerlerinin toplamı arasındaki fark olarak belirlenebilir. Dolayısıyla farklılık biraz daha az olacaktır. Ronald Fisher bu gerçeği Pearson'un kriterini geliştirmesinden 20 yıl sonra fark etti. Tabloların bile yeniden yapılması gerekiyordu.

Bu vesileyle Fisher istatistiğe yeni bir kavram getirdi: özgürlük derecesi(serbestlik derecesi), toplamdaki bağımsız terimlerin sayısını temsil eder. Serbestlik derecesi kavramının matematiksel bir açıklaması vardır ve yalnızca normalle ilişkili dağılımlarda (Student's, Fisher-Snedecor ve ki-karenin kendisi) ortaya çıkar.

Serbestlik derecelerinin anlamını daha iyi kavramak için fiziksel bir analoga dönelim. Uzayda serbestçe hareket eden bir nokta hayal edelim. 3 serbestlik derecesine sahiptir çünkü üç boyutlu uzayda her yöne hareket edebilir. Bir nokta herhangi bir yüzey boyunca hareket ediyorsa, o zaman üç boyutlu uzayda olmaya devam etmesine rağmen zaten iki serbestlik derecesine sahiptir (ileri geri, sol ve sağ). Bir yay boyunca hareket eden bir nokta yine üç boyutlu uzaydadır ancak yalnızca bir serbestlik derecesine sahiptir, çünkü ileri veya geri hareket edebilir. Gördüğünüz gibi nesnenin bulunduğu alan her zaman gerçek hareket özgürlüğüne karşılık gelmiyor.

Yaklaşık olarak aynı şekilde, istatistiksel bir kriterin dağılımı, onu hesaplamak için gereken terimlerden daha az sayıda öğeye bağlı olabilir. Genel olarak serbestlik derecesinin sayısı, mevcut bağımlılıkların sayısına göre gözlem sayısından daha azdır.

Böylece ki kare dağılımı ( χ2), her biri serbestlik derecesi parametresine bağlı olan bir dağılım ailesidir. Ki-kare testinin resmi tanımı ise aşağıdaki gibidir. Dağıtım χ2(ki-kare) s k serbestlik derecesi kareler toplamının dağılımıdır k bağımsız standart normal rastgele değişkenler.

Daha sonra ki-kare dağılım fonksiyonunun hesaplandığı formülün kendisine geçebiliriz, ancak neyse ki her şey bizim için uzun zamandır hesaplandı. İlgi olasılığını elde etmek için uygun istatistiksel tabloyu veya Excel'deki hazır bir işlevi kullanabilirsiniz.

Serbestlik derecesi sayısına bağlı olarak ki-kare dağılımının şeklinin nasıl değiştiğini görmek ilginçtir.

Serbestlik derecesi arttıkça ki-kare dağılımı normal olma eğilimindedir. Bu, çok sayıda bağımsız rastgele değişkenin toplamının normal bir dağılıma sahip olduğunu söyleyen merkezi limit teoreminin etkisi ile açıklanmaktadır. Kareler hakkında hiçbir şey söylemiyor)).

Pearson ki-kare testi kullanılarak hipotezin test edilmesi

Şimdi ki-kare yöntemini kullanarak hipotezleri test etmeye geldik. Genel olarak teknoloji kalır. Boş hipotez, gözlemlenen frekansların beklenen frekanslara karşılık geldiğidir (yani aynı popülasyondan alındıkları için aralarında hiçbir fark yoktur). Eğer durum böyleyse, dağılım rastgele dalgalanmaların sınırları dahilinde nispeten küçük olacaktır. Dağılımın ölçüsü ki-kare testi kullanılarak belirlenir. Daha sonra, ya kriterin kendisi kritik değerle karşılaştırılır (karşılık gelen anlamlılık düzeyi ve serbestlik dereceleri için) ya da daha doğru olanı, gözlemlenen p-değeri hesaplanır; sıfır hipotezi doğruysa aynı veya daha büyük kriter değerini elde etme olasılığı.

Çünkü frekansların uyumuyla ilgileniyorsak, kriter kritik seviyeden büyük olduğunda hipotez reddedilecektir. Onlar. Kriter tek taraflıdır. Ancak bazen (bazen) sol hipotezi test etmek gerekir. Örneğin ampirik veriler teorik verilere çok benzer olduğunda. O zaman kriter beklenmedik bir bölgeye düşebilir, ancak solda. Gerçek şu ki, doğal koşullar altında pratik olarak teorik olanlarla örtüşen frekansların elde edilmesi pek mümkün değildir. Her zaman hata veren bir rastgelelik vardır. Ancak böyle bir hata yoksa, o zaman belki de veriler tahrif edilmiştir. Ancak yine de sağ yönlü hipotez genellikle test edilir.

Zar problemine dönelim. Mevcut verileri kullanarak ki-kare testinin değerini hesaplayalım.

Şimdi 5 serbestlik derecesindeki kritik değeri bulalım ( k) ve anlamlılık düzeyi 0,05 ( α ) ki kare dağılımının kritik değerleri tablosuna göre.

Yani 0,05'lik dilim, 5 serbestlik derecesine sahip bir ki-kare dağılımıdır (sağ kuyruk). χ 2 0,05; 5 = 11,1.

Gerçek ve tablolaştırılmış değerleri karşılaştıralım. 3,4 ( χ2) < 11,1 (χ 2 0,05; 5). Hesaplanan kriterin daha küçük olduğu ortaya çıktı, bu da frekansların eşitliği (anlaşma) hipotezinin reddedilmediği anlamına geliyor. Şekilde durum şu şekilde görünüyor.

Hesaplanan değer kritik bölge içinde kalırsa sıfır hipotezi reddedilir.

P değerini de hesaplamak daha doğru olacaktır. Bunu yapmak için, belirli sayıda serbestlik derecesi için tabloda en yakın değeri bulmanız ve karşılık gelen önem düzeyine bakmanız gerekir. Ama bu geçen yüzyıl. Bir bilgisayar, özellikle MS Excel kullanacağız. Excel'in ki-kare ile ilgili çeşitli işlevleri vardır.

Aşağıda bunların kısa bir açıklaması bulunmaktadır.

CH2.OBR– soldaki belirli bir olasılıktaki kriterin kritik değeri (istatistiksel tablolarda olduğu gibi)

CH2.OBR.PH– sağdaki belirli bir olasılık için kriterin kritik değeri. İşlev esasen öncekinin kopyasıdır. Ancak burada seviyeyi hemen belirtebilirsiniz α 1'den çıkarmak yerine. Bu daha uygundur çünkü çoğu durumda ihtiyaç duyulan şey dağıtımın sağ kuyruğudur.

CH2.DAĞ– soldaki p değeri (yoğunluk hesaplanabilir).

CH2.DAĞ.PH– sağdaki p değeri.

CHI2.TEST– iki frekans aralığı için hemen bir ki-kare testi gerçekleştirir. Serbestlik derecesi sayısı, sütundaki frekans sayısından bir eksik olarak alınır (olması gerektiği gibi) ve bir p değeri döndürülür.

Deneyimiz için 5 serbestlik derecesi ve alfa 0,05 için kritik (tablo) değeri hesaplayalım. Excel formülü şöyle görünecek:

CH2.OBR(0,95;5)

CH2.OBR.PH(0,05;5)

Sonuç aynı olacaktır - 11.0705. Bu tabloda gördüğümüz değerdir (1 ondalık basamağa yuvarlanmış).

Son olarak 5 serbestlik derecesi kriteri için p değerini hesaplayalım. χ2= 3.4. Sağda bir olasılığa ihtiyacımız var, bu yüzden HH'nin (sağ kuyruk) eklenmesiyle bir fonksiyon alıyoruz

CH2.DAĞ.PH(3,4;5) = 0,63857

Bu, 5 serbestlik derecesi ile kriter değerini elde etme olasılığının şu olduğu anlamına gelir: χ2= 3,4 ve üzeri neredeyse %64'e eşittir. Doğal olarak hipotez reddedilmiyor (p değeri %5'ten büyük), frekanslar çok iyi uyum gösteriyor.

Şimdi ki-kare testini ve CHI2.TEST Excel fonksiyonunu kullanarak frekansların uyumu hakkındaki hipotezi kontrol edelim.

Tablo yok, hantal hesaplamalar yok. Gözlemlenen ve beklenen frekansları içeren sütunları fonksiyon argümanları olarak belirterek, hemen p değerini elde ederiz. Güzellik.

Şimdi şüpheli bir adamla zar oynadığınızı hayal edin. 1'den 5'e kadar puanların dağılımı aynı kalır, ancak 26 altı atar (toplam atış sayısı 78 olur).

Bu durumda p değeri 0,003 olarak ortaya çıkıyor ve bu da 0,05'ten çok daha düşük. Zarların geçerliliğinden şüphe etmek için iyi nedenler var. İşte bu olasılığın ki-kare dağılım grafiğinde nasıl göründüğü.

Ki-kare kriterinin kendisi burada 17.8 olarak ortaya çıkıyor ve bu da doğal olarak tablodakinden (11.1) daha büyük.

Umarım anlaşma kriterinin ne olduğunu açıklayabilmişimdir χ2(Pearson ki-kare) ve bunun istatistiksel hipotezleri test etmek için nasıl kullanılabileceği.

Son olarak bir kez daha önemli bir durum hakkında! Ki-kare testi yalnızca tüm frekansların sayısı 50'yi aştığında ve her derecelendirme için beklenen minimum değer 5'ten az olmadığında düzgün çalışır. Herhangi bir kategoride beklenen frekans 5'ten azsa ancak tüm frekansların toplamı şunu aşıyorsa: 50 ise, bu durumda kategori en yakın olanla birleştirilir ve böylece toplam frekansları 5'i geçer. Bu mümkün değilse veya frekansların toplamı 50'den azsa, daha doğru hipotez testi yöntemleri kullanılmalıdır. Bunları başka zaman konuşuruz.

Aşağıda ki-kare testi kullanılarak Excel'de bir hipotezin nasıl test edileceğine ilişkin bir video bulunmaktadır.

U 1 , U 2 , ..,U k bağımsız standart olsun normal değerler. Rastgele değişken K = U 1 2 +U 2 2 + .. + U k 2'nin dağılımına ki-kare dağılımı denir. k serbestlik derecesi (K~χ 2 (k) yazın). Bu, pozitif çarpıklığa ve aşağıdaki özelliklere sahip tek modlu bir dağılımdır: mod M=k-2 matematiksel beklenti m=k dispersiyonu D=2k (Şek.). Yeterli olduğunda büyük önem parametre k dağılım χ 2 (k) parametrelerle yaklaşık olarak normal bir dağılıma sahiptir

Matematiksel istatistik problemlerini çözerken, verilen olasılığa ve serbestlik derecesi sayısına bağlı olarak kritik noktalar χ 2 (k) kullanılır. k(Ek 2). Kritik nokta Χ 2 kr = Χ 2 (k; α), dağılım yoğunluk eğrisinin altındaki alanın %100- α'sının sağında yer aldığı bölgenin sınırıdır. Test sırasında rastgele değişken K~χ 2 (k) değerinin χ 2 (k) noktasının sağına düşme olasılığı α P(K≥χ 2 kp)≤ α)'yı aşmaz. Örneğin, K~χ 2 (20) rastgele değişkeni için olasılığı α=0,05 olarak belirledik. Tabloya göre kritik noktalar Ki-kare dağılımında (tablolarda) χ 2 kp = χ 2 (20;0,05) = 31,4'ü buluyoruz. Bu, bu rastgele değişkenin olasılığının k 31,4'ten büyük, 0,05'ten küçük bir değeri kabul edin (Şek.).

Pirinç. Serbestlik derecesi sayısının farklı değerleri için dağılım yoğunluğu grafiği χ 2 (k) k

Kritik noktalar χ 2 (k) aşağıdaki hesap makinelerinde kullanılır:

  1. Çoklu bağlantının varlığının kontrol edilmesi (çoklu bağlantı hakkında).
Ki-kare kullanarak bir hipotezi test etmek yalnızca “bir ilişki var mı?” sorusuna cevap verecektir, ilişkinin yönünü test etmek için daha fazla araştırmaya ihtiyaç vardır. Ayrıca, Ki-kare testi düşük frekanslı verilerle çalışırken belirli bir hataya sahiptir.

Bu nedenle iletişimin yönünü kontrol etmek için öğesini seçin. korelasyon analiziözellikle Pearson korelasyon katsayısı kullanılarak hipotezin test edilmesi ve t-testi kullanılarak anlamlılığın daha ileri test edilmesi.

Anlamlılık düzeyi α Χ 2'nin herhangi bir değeri için MS Excel fonksiyonu kullanılarak bulunabilir: =HI2OBR(α;serbestlik derecesi)

n-1 .995 .990 .975 .950 .900 .750 .500 .250 .100 .050 .025 .010 .005
1 0.00004 0.00016 0.00098 0.00393 0.01579 0.10153 0.45494 1.32330 2.70554 3.84146 5.02389 6.63490 7.87944
2 0.01003 0.02010 0.05064 0.10259 0.21072 0.57536 1.38629 2.77259 4.60517 5.99146 7.37776 9.21034 10.59663
3 0.07172 0.11483 0.21580 0.35185 0.58437 1.21253 2.36597 4.10834 6.25139 7.81473 9.34840 11.34487 12.83816
4 0.20699 0.29711 0.48442 0.71072 1.06362 1.92256 3.35669 5.38527 7.77944 9.48773 11.14329 13.27670 14.86026
5 0.41174 0.55430 0.83121 1.14548 1.61031 2.67460 4.35146 6.62568 9.23636 11.07050 12.83250 15.08627 16.74960
6 0.67573 0.87209 1.23734 1.63538 2.20413 3.45460 5.34812 7.84080 10.64464 12.59159 14.44938 16.81189 18.54758
7 0.98926 1.23904 1.68987 2.16735 2.83311 4.25485 6.34581 9.03715 12.01704 14.06714 16.01276 18.47531 20.27774
8 1.34441 1.64650 2.17973 2.73264 3.48954 5.07064 7.34412 10.21885 13.36157 15.50731 17.53455 20.09024 21.95495
9 1.73493 2.08790 2.70039 3.32511 4.16816 5.89883 8.34283 11.38875 14.68366 16.91898 19.02277 21.66599 23.58935
10 2.15586 2.55821 3.24697 3.94030 4.86518 6.73720 9.34182 12.54886 15.98718 18.30704 20.48318 23.20925 25.18818
11 2.60322 3.05348 3.81575 4.57481 5.57778 7.58414 10.34100 13.70069 17.27501 19.67514 21.92005 24.72497 26.75685
12 3.07382 3.57057 4.40379 5.22603 6.30380 8.43842 11.34032 14.84540 18.54935 21.02607 23.33666 26.21697 28.29952
13 3.56503 4.10692 5.00875 5.89186 7.04150 9.29907 12.33976 15.98391 19.81193 22.36203 24.73560 27.68825 29.81947
14 4.07467 4.66043 5.62873 6.57063 7.78953 10.16531 13.33927 17.11693 21.06414 23.68479 26.11895 29.14124 31.31935
15 4.60092 5.22935 6.26214 7.26094 8.54676 11.03654 14.33886 18.24509 22.30713 24.99579 27.48839 30.57791 32.80132
16 5.14221 5.81221 6.90766 7.96165 9.31224 11.91222 15.33850 19.36886 23.54183 26.29623 28.84535 31.99993 34.26719
17 5.69722 6.40776 7.56419 8.67176 10.08519 12.79193 16.33818 20.48868 24.76904 27.58711 30.19101 33.40866 35.71847
18 6.26480 7.01491 8.23075 9.39046 10.86494 13.67529 17.33790 21.60489 25.98942 28.86930 31.52638 34.80531 37.15645
19 6.84397 7.63273 8.90652 10.11701 11.65091 14.56200 18.33765 22.71781 27.20357 30.14353 32.85233 36.19087 38.58226
20 7.43384 8.26040 9.59078 10.85081 12.44261 15.45177 19.33743 23.82769 28.41198 31.41043 34.16961 37.56623 39.99685
21 8.03365 8.89720 10.28290 11.59131 13.23960 16.34438 20.33723 24.93478 29.61509 32.67057 35.47888 38.93217 41.40106
22 8.64272 9.54249 10.98232 12.33801 14.04149 17.23962 21.33704 26.03927 30.81328 33.92444 36.78071 40.28936 42.79565
23 9.26042 10.19572 11.68855 13.09051 14.84796 18.13730 22.33688 27.14134 32.00690 35.17246 38.07563 41.63840 44.18128
24 9.88623 10.85636 12.40115 13.84843 15.65868 19.03725 23.33673 28.24115 33.19624 36.41503 39.36408 42.97982 45.55851
25 10.51965 11.52398 13.11972 14.61141 16.47341 19.93934 24.33659 29.33885 34.38159 37.65248 40.64647 44.31410 46.92789
26 11.16024 12.19815 13.84390 15.37916 17.29188 20.84343 25.33646 30.43457 35.56317 38.88514 41.92317 45.64168 48.28988
27 11.80759 12.87850 14.57338 16.15140 18.11390 21.74940 26.33634 31.52841 36.74122 40.11327 43.19451 46.96294 49.64492
28 12.46134 13.56471 15.30786 16.92788 18.93924 22.65716 27.33623 32.62049 37.91592 41.33714 44.46079 48.27824 50.99338
29 13.12115 14.25645 16.04707 17.70837 19.76774 23.56659 28.33613 33.71091 39.08747 42.55697 45.72229 49.58788 52.33562
30 13.78672 14.95346 16.79077 18.49266 20.59923 24.47761 29.33603 34.79974 40.25602 43.77297 46.97924 50.89218 53.67196
Serbestlik derecesi sayısı k Önem düzeyi a
0,01 0,025 0.05 0,95 0,975 0.99
1 6.6 5.0 3.8 0.0039 0.00098 0.00016
2 9.2 7.4 6.0 0.103 0.051 0.020
3 11.3 9.4 7.8 0.352 0.216 0.115
4 13.3 11.1 9.5 0.711 0.484 0.297
5 15.1 12.8 11.1 1.15 0.831 0.554
6 16.8 14.4 12.6 1.64 1.24 0.872
7 18.5 16.0 14.1 2.17 1.69 1.24
8 20.1 17.5 15.5 2.73 2.18 1.65
9 21.7 19.0 16.9 3.33 2.70 2.09
10 23.2 20.5 18.3 3.94 3.25 2.56
11 24.7 21.9 19.7 4.57 3.82 3.05
12 26.2 23.3 21 .0 5.23 4.40 3.57
13 27.7 24.7 22.4 5.89 5.01 4.11
14 29.1 26.1 23.7 6.57 5.63 4.66
15 30.6 27.5 25.0 7.26 6.26 5.23
16 32.0 28.8 26.3 7.96 6.91 5.81
17 33.4 30.2 27.6 8.67 7.56 6.41
18 34.8 31.5 28.9 9.39 8.23 7.01
19 36.2 32.9 30.1 10.1 8.91 7.63
20 37.6 34.2 31.4 10.9 9.59 8.26
21 38.9 35.5 32.7 11.6 10.3 8.90
22 40.3 36.8 33.9 12.3 11.0 9.54
23 41.6 38.1 35.2 13.1 11.7 10.2
24 43.0 39.4 36.4 13.8 12.4 10.9
25 44.3 40.6 37.7 14.6 13.1 11.5
26 45.6 41.9 38.9 15.4 13.8 12.2
27 47.0 43.2 40.1 16.2 14.6 12.9
28 48.3 44.5 41.3 16.9 15.3 13.6
29 49.6 45.7 42.6 17.7 16.0 14.3
30 50.9 47.0 43.8 18.5 16.8 15.0

Pearson (ki-kare), Öğrenci ve Fisher dağılımları

Normal dağılım kullanılarak, istatistiksel veri işlemede artık sıklıkla kullanılan üç dağılım tanımlanır. Bu dağılımlar kitabın ilerleyen bölümlerinde birçok kez karşımıza çıkıyor.

Pearson dağılımı (ki - kare) - rastgele bir değişkenin dağılımı

Nerede rastgele değişkenler X 1 , X 2 ,…, Xn bağımsız ve aynı dağılıma sahip N(0,1). Bu durumda terim sayısı, yani. N ki-kare dağılımının “serbestlik derecesi sayısı” olarak adlandırılır.

Ki-kare dağılımı, varyansı tahmin ederken (bir güven aralığı kullanarak), öncelikle sınırlı sayıda değer alan niteliksel (kategorize edilmiş) değişkenler için anlaşma, homojenlik, bağımsızlık hipotezlerini test ederken ve diğer birçok görevde kullanılır. istatistiksel analiz veri

Dağıtım TÖğrenci t'si rastgele bir değişkenin dağılımıdır

rastgele değişkenler nerede sen Ve X bağımsız, sen standart bir normal dağılıma sahiptir N(0.1) ve X– chi dağılımı – kare c N serbestlik dereceleri. Aynı zamanda NÖğrenci dağılımının “serbestlik derecesi sayısı” denir.

Öğrenci dağılımı 1908 yılında bir bira fabrikasında çalışan İngiliz istatistikçi W. Gosset tarafından tanıtıldı. Bu fabrikada ekonomik ve teknik kararların alınmasında olasılıksal ve istatistiksel yöntemler kullanıldı, bu nedenle yönetim V. Gosset'in kendi adı altında bilimsel makaleler yayınlamasını yasakladı. Bu sayede V. Gosset'in geliştirdiği olasılıksal ve istatistiksel yöntemler biçimindeki ticari sırlar ve “know-how” korundu. Ancak "Öğrenci" takma adıyla yayın yapma fırsatı buldu. Gosset-Student hikayesi, yüz yıl önce bile İngiliz yöneticilerin büyük gelişmelerin farkında olduklarını gösteriyor. ekonomik verimlilik

Günümüzde Öğrenci dağılımı gerçek verilerin analizinde kullanılan en iyi bilinen dağılımlardan biridir. Güven aralıklarını kullanarak matematiksel beklentiyi, tahmin edilen değeri ve diğer özellikleri tahmin ederken, matematiksel beklentilerin değerleri, regresyon katsayıları, numune homojenliği hipotezleri vb. ile ilgili hipotezleri test ederken kullanılır. .

Fisher dağılımı rastgele bir değişkenin dağılımıdır

rastgele değişkenler nerede X 1 Ve X 2 bağımsızdırlar ve serbestlik derecesi sayısıyla birlikte ki-kare dağılımlarına sahiptirler k 1 Ve k 2 sırasıyla. Aynı zamanda çift (k 1 , k 2 ) – Fisher dağılımının bir çift “serbestlik derecesi”, yani, k 1 payın serbestlik derecesi sayısıdır ve k 2 – paydanın serbestlik derecesi sayısı. Rastgele bir değişkenin dağılımı F Adını çalışmalarında aktif olarak kullanan büyük İngiliz istatistikçi R. Fisher'dan (1890-1962) almıştır.

Fisher dağılımı, regresyon analizinde, varyansların eşitliğinde ve uygulamalı istatistiğin diğer problemlerinde modelin yeterliliğine ilişkin hipotezleri test ederken kullanılır.

Ki-kare, Öğrenci ve Fisher dağılım fonksiyonlarına ilişkin ifadeler, bunların yoğunlukları ve özellikleri ile pratik kullanımları için gerekli tablolar özel literatürde bulunabilir (örneğin bkz.).

23. Ki-kare kavramı ve Öğrenci dağılımı ve grafiksel görünüm

1) N serbestlik derecesine sahip bir dağılım (ki-kare), n bağımsız standart normal rastgele değişkenin karelerinin toplamının dağılımıdır.

Dağılım (ki-kare)– rastgele bir değişkenin dağılımı (ve her birinin matematiksel beklentisi 0 ve standart sapması 1'dir)

rastgele değişkenler nerede bağımsızdır ve aynı dağılıma sahiptir. Bu durumda terim sayısı, yani. ki-kare dağılımının "serbestlik derecesi sayısı" olarak adlandırılır. Ki-kare sayısı bir parametreyle, yani serbestlik derecesi sayısıyla belirlenir. Serbestlik derecesi sayısı arttıkça dağılım yavaş yavaş normale yaklaşır.

O zaman bunların kareleri toplamı

k = n serbestlik derecesine sahip ki-kare yasasına göre dağıtılan rastgele bir değişkendir; terimler bir ilişkiyle ilişkiliyse (örneğin,), o zaman serbestlik derecesi sayısı k = n – 1.

Bu dağılımın yoğunluğu

İşte gama fonksiyonu; özellikle Г(n + 1) = n! .

Bu nedenle, ki-kare dağılımı bir parametreyle belirlenir - serbestlik derecesi sayısı k.

Açıklama 1. Serbestlik derecesi sayısı arttıkça ki-kare dağılımı giderek normale yaklaşır.

Açıklama 2. Ki-kare dağılımını kullanarak pratikte karşılaşılan diğer birçok dağılım belirlenir; örneğin, rastgele bir değişkenin dağılımı - rastgele bir vektörün uzunluğu (X1, X2,..., Xn), koordinatları bağımsızdır ve normal kanuna göre dağıtılır.

χ2 dağılımı ilk olarak R. Helmert (1876) ve K. Pearson (1900) tarafından değerlendirildi.

Math.beklenti.=n; D=2n

2) Öğrenci dağılımı

İki bağımsız rastgele değişkeni düşünün: Normal dağılıma sahip ve normalleştirilmiş Z (yani, M(Z) = 0, σ(Z) = 1) ve ki-kare yasasına göre k ile dağıtılan V. serbestlik dereceleri. Daha sonra değer

t-dağılımı veya k serbestlik derecesine sahip Öğrenci dağılımı adı verilen bir dağılıma sahiptir. Bu durumda k'ya Öğrenci dağılımının “serbestlik derecesi sayısı” denir.

Serbestlik derecesi sayısı arttıkça Öğrenci dağılımı hızla normale yaklaşır.

Bu dağılım 1908 yılında bir bira fabrikasında çalışan İngiliz istatistikçi W. Gosset tarafından ortaya atılmıştır. Bu fabrikada ekonomik ve teknik kararların alınmasında olasılıksal ve istatistiksel yöntemler kullanıldı, bu nedenle yönetim V. Gosset'in kendi adı altında bilimsel makaleler yayınlamasını yasakladı. Bu sayede V. Gosset'in geliştirdiği olasılıksal ve istatistiksel yöntemler biçimindeki ticari sırlar ve “know-how” korundu. Ancak "Öğrenci" takma adıyla yayın yapma imkanı buldu. Gosset-Student hikayesi, yüz yıl önce bile Birleşik Krallık yöneticilerinin olasılıksal ve istatistiksel karar verme yöntemlerinin daha yüksek ekonomik verimliliğinin farkında olduklarını gösteriyor.

Arkadaşlarınızla paylaşın veya kendinize kaydedin:

Yükleniyor...