Ma'lumotlarni guruhlash va tarqatish seriyasini qurish. Variatsion qatorlarni statistik o'rganish va o'rtacha qiymatlarni hisoblash Statistikada variatsion qatorlarni qanday topish mumkin

Vaziyat:

Ishchilarning yosh tarkibi (yillari) bo'yicha ma'lumotlar mavjud: 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. Intervalli taqsimot qatorini tuzing.
    2. Seriyaning grafik tasvirini tuzing.
    3. Rejim va medianani grafik tarzda aniqlang.

Yechim:

1) Sturgess formulasiga ko'ra, aholini 1 + 3,322 lg 30 = 6 guruhga bo'lish kerak.

Maksimal yosh - 38, minimal - 18.

Intervalning kengligi Intervallarning uchlari butun son bo'lishi kerakligi sababli, biz aholini 5 guruhga ajratamiz. Intervalning kengligi - 4.

Hisob-kitoblarni osonlashtirish uchun biz ma'lumotlarni o'sish tartibida joylashtiramiz: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29, 29, 30, 30, 31, 32, 32, 33, 34, 35, 38, 38.

Ishchilarning yosh taqsimoti

Grafik jihatdan ketma-ketlikni gistogramma yoki poligon sifatida tasvirlash mumkin. Gistogramma - chiziqli diagramma. Ustunning asosi intervalning kengligi hisoblanadi. Ustunning balandligi chastotaga teng.

Ko'pburchak (yoki tarqatish poligoni) - chastota grafigi. Uni gistogramma yordamida qurish uchun biz to'rtburchaklar yuqori tomonlarining o'rta nuqtalarini bog'laymiz. Ox o'qi ustidagi ko'pburchakni x ning ekstremal qiymatlari oralig'ining yarmiga teng masofada yopamiz.

Rejim (Mo) - o'rganilayotgan xarakteristikaning ma'lum bir populyatsiyada eng ko'p uchraydigan qiymati.

Gistogrammadan rejimni aniqlash uchun siz eng yuqori to'rtburchakni tanlashingiz kerak, bu to'rtburchakning o'ng cho'qqisidan oldingi to'rtburchakning yuqori o'ng burchagiga chiziq chizishingiz va modal to'rtburchakning chap uchidan chiziq chizishingiz kerak. keyingi to'rtburchakning chap uchi. Ushbu chiziqlar kesishmasidan x o'qiga perpendikulyar chizamiz. Abscissa moda bo'ladi. Mo ≈ 27,5. Bu shuni anglatadiki, ushbu populyatsiyada eng ko'p uchraydigan yosh 27-28 yoshdir.

Median (Me) - o'rganilayotgan xarakteristikaning tartiblangan variatsiya qatorining o'rtasida joylashgan qiymati.

Kumulyat yordamida medianani topamiz. Kumulatlar - to'plangan chastotalar grafigi. Abscissalar qatorning variantlari. Ordinatlar to'plangan chastotalardir.

Kumulyat ustidagi medianani aniqlash uchun biz ordinata o'qi bo'ylab to'plangan chastotalarning 50% ga to'g'ri keladigan nuqtani topamiz (bizning holatda, 15), u orqali Ox o'qiga parallel va nuqtadan to'g'ri chiziq chizamiz. uning kumulyativ bilan kesishishi, x o'qiga perpendikulyar chizilgan. Abtsissa mediana hisoblanadi. Men ≈ 25,9. Bu shuni anglatadiki, ushbu aholi tarkibidagi ishchilarning yarmi 26 yoshgacha.

Statistik atamalarning lug'ati

Umumiy statistika savollari

TIBBIY STATISTIKA NIMALAR?

Statistika - hodisalar, hodisalar, ob'ektlarning miqdoriy tavsifi va o'lchovidir. U amaliy faoliyatning bir tarmog'i (ommaviy hodisalar to'g'risidagi ma'lumotlarni to'plash, qayta ishlash va tahlil qilish), bilim sohasi sifatida tushuniladi, ya'ni. maxsus ilmiy intizom va ijtimoiy hodisalarning har qanday sohasini tavsiflash uchun yig'ilgan yakuniy raqamli ko'rsatkichlar to'plami sifatida.

Statistika - ko'rsatkichlarni umumlashtirish usuli yordamida ommaviy hodisalarning qonuniyatlarini o'rganadigan fan.

Tibbiy statistika - mustaqil ijtimoiy fan, o'qish ommaviy ijtimoiy hodisalarning miqdoriy tomoni ularning sifat tomoni bilan uzviy bog‘lanib, imkon beradi ko'rsatkichlarni umumlashtirish usuli ushbu hodisalarning qonuniyatlarini, iqtisodiy sohadagi eng muhim jarayonlarni o'rganish, ijtimoiy hayot jamiyat, uning salomatligi, aholiga tibbiy yordam ko'rsatishni tashkil etish tizimi.

Statistik usullar - ommaviy kuzatish materiallarini qayta ishlash usullari to'plami bo'lib, ular quyidagilarni o'z ichiga oladi: guruhlash, umumlashtirish, ko'rsatkichlarni olish, ularni statistik tahlil qilish va boshqalar.

Tibbiyotda statistik usullar quyidagilar uchun qo'llaniladi:

  1. holatni o'rganish jamoat salomatligi aholi soni va tarkibi, uni ko‘paytirish bo‘yicha statistik ma’lumotlarni to‘plash va tahlil qilish yo‘li bilan butun aholi va uning asosiy guruhlari; jismoniy rivojlanish, turli kasalliklarning tarqalishi va davomiyligi va boshqalar;
  2. aloqalarni aniqlash va o'rnatish umumiy daraja turli omillar bilan har qanday individual kasalliklardan kasallanish va o'lim muhit;
  3. sog'liqni saqlash faoliyatini rejalashtirish uchun tibbiyot muassasalari tarmog'i, ularning faoliyati va xodimlari to'g'risidagi raqamli ma'lumotlarni to'plash va o'rganish, tarmoqni rivojlantirish rejalari va sog'liqni saqlash muassasalari faoliyatini monitoring qilish va alohida tibbiyot muassasalari ish sifatini baholash;
  4. kasalliklarning oldini olish va davolash bo'yicha chora-tadbirlar samaradorligini baholash;
  5. klinikada va eksperimentda tadqiqot natijalarining statistik ahamiyatini aniqlash.

Tibbiy statistika bo'limlari:

  • umumiy nazariy va uslubiy asoslar statistika,
  • aholi salomatligi statistikasi,
  • sog'liqni saqlash statistikasi.

MS EXCEL DASTURIDA MA'LUMOTLAR BAZASINI YARATISH

Ma'lumotlar bazasi keyingi qayta ishlash uchun qulay bo'lishi uchun oddiy tamoyillarga amal qilish kerak:

1) Ma'lumotlar bazasini yaratish uchun optimal dastur MS Excel hisoblanadi. Exceldan olingan ma'lumotlar keyinchalik murakkabroq manipulyatsiyalar uchun Statistica, SPSS va boshqalar kabi boshqa maxsus statistik paketlarga osongina o'tkazilishi mumkin. Biroq, hisob-kitoblarning 80-90% gacha bo'lgan qismini Excelning o'zida Ma'lumotlarni tahlil qilish plaginidan foydalangan holda qulay bajarish mumkin.

2) Ma'lumotlar bazasi bilan jadvalning yuqori qatori sarlavha sifatida yaratilgan bo'lib, unda ushbu ustunda hisobga olingan ko'rsatkichlarning nomlari kiritiladi. Hujayralarni birlashtirishdan foydalanish istalmagan (bu talab odatda butun ma'lumotlar bazasiga tegishli), chunki bu ko'plab operatsiyalarni bekor qiladi. Bundan tashqari, siz "ikki qavatli" sarlavha yaratmasligingiz kerak, unda yuqori chiziq bir hil ko'rsatkichlar guruhining nomini, pastki qator esa aniq ko'rsatkichlarni ko'rsatadi. Bir hil ko'rsatkichlarni guruhlash uchun ularni bitta rangli plomba bilan belgilash yoki ularning nomidagi qavslar ichida guruhlash xususiyatini kiritish yaxshiroqdir.

Masalan, unday emas:

UMUMIY QON TAHLILI
ER LEU TR
ER(UAC) LEU(UAC) TR(UAC)

oxirgi versiyada ham "bir qavatli" sarlavha, ham ma'lumotlarning vizual bir xilligi ta'minlanadi (ularning barchasi UAC ko'rsatkichlariga tegishli).

3) Birinchi ustunda ushbu ma'lumotlar bazasidagi bemorning seriya raqami, uni o'rganilayotgan ko'rsatkichlarning birortasiga bog'lamasdan bo'lishi kerak. Bu sizga har qanday bosqichda, hatto ro'yxatni ko'p saralashdan keyin ham bemorlarning asl tartibiga osongina qaytishni ta'minlashga imkon beradi.

4) Ikkinchi ustun odatda bemorlarning familiyalari (yoki to'liq ismlari) bilan to'ldiriladi.

5) Miqdoriy ko'rsatkichlar (raqamlar bilan o'lchanadiganlar, masalan - bo'y, vazn, qon bosimi, yurak urish tezligi va boshqalar) raqamli formatda jadvalga kiritiladi. Bu allaqachon tushunarli bo'lib tuyuladi, lekin esda tutingki, Excelda 2007 versiyasidan boshlab kasr qiymatlari nuqta bilan belgilanadi: 4.5. Agar siz raqamni vergul bilan ajratsangiz, u matn sifatida qabul qilinadi va bu ustunlar qayta yozilishi kerak bo'ladi.

6) Sifat ko'rsatkichlari bilan qiyinroq. Ularning ikkita ma'no variantiga ega bo'lganlari (iklik deb ataladigan qiymatlar: Ha-Yo'q, Hozirgi-Yo'q, Erkak-Ayol) yaxshiroq tarjima qilingan. ikkilik tizim: 0 va 1. 1 qiymati odatda ijobiy qiymatga (Ha, hozir), 0 salbiy qiymatga (Yo'q, Yo'q) tayinlanadi.

7) Bir nechta qiymatlarga ega bo'lgan, zo'ravonlik darajasi, hodisa darajasi (Zaif-O'rta-Kuchli; Sovuq-Iliq-Issiq) bo'yicha farqlanadigan sifat ko'rsatkichlarini tartiblash va shunga mos ravishda raqamlarga ham tarjima qilish mumkin. Hodisaning eng past darajasiga eng past daraja beriladi - 0 yoki 1, quyidagi darajalar tartibdagi darajalar qiymatlari bilan ko'rsatilgan. Masalan: Kasallik yo'q - 0, engil daraja - 1, o'rtacha daraja - 2, og'ir daraja - 3.

8) Ba'zida bir nechta qiymatlar bitta sifat ko'rsatkichiga to'g'ri keladi. Masalan, "Birgalikda tashxis" ustunida, agar bir nechta kasalliklar mavjud bo'lsa, biz ularni vergul bilan ajratib ko'rsatishni xohlaymiz. Buni qilmaslik kerak, chunki bunday ma'lumotlarni qayta ishlash juda qiyin va uni avtomatlashtirish mumkin emas. Shuning uchun ma'lum kasalliklar guruhlari ("yurak-qon tomir tizimi kasalliklari", "oshqozon-ichak trakti kasalliklari" va boshqalar) yoki ma'lum nozologiyalar ("surunkali gastrit", "IHD" va boshqalar) bilan bir nechta ustunlar qilish yaxshiroqdir. , unda biz ma'lumotlarni ikkilik, ikkilik shaklga kiritamiz: 1 (bu "Bu kasallik mavjud" degan ma'noni anglatadi) - 0 ("Bu kasallik mavjud emas").

9) Ko'rsatkichlarning alohida guruhlarini farqlash uchun siz rangdan faol foydalanishingiz mumkin: masalan, UAC ko'rsatkichlari bo'lgan ustunlar qizil rangda, OAM ma'lumotlari sariq rangda va hokazo.

10) Har bir bemor stolning bir qatoriga mos kelishi kerak.

Ma'lumotlar bazasining bunday dizayni nafaqat uni statistik qayta ishlash jarayonini sezilarli darajada soddalashtirishga, balki materialni yig'ish bosqichida uni to'ldirishni osonlashtirishga imkon beradi.

STATISTIK TAHLILI UCHUN QAYSI USULNI TANLASH MUMKIN?

Barcha ma'lumotlar to'plangandan so'ng, har bir tadqiqotchi statistik ishlov berishning eng mos usulini tanlash masalasiga duch keladi. Va bu ajablanarli emas: zamonaviy statistika juda ko'p sonli turli xil mezonlar va usullarni birlashtiradi. Ularning barchasi o'ziga xos xususiyatlarga ega va ikkita o'xshash vaziyatga mos kelishi yoki mos kelmasligi mumkin. Ushbu maqolada biz barcha asosiy, eng keng tarqalgan usullarni tizimlashtirishga harakat qilamiz statistik tahlil maqsadlariga ko'ra.

Biroq, birinchi navbatda, qanday statistik ma'lumotlar mavjudligi haqida bir necha so'z, chunki bu eng mos tahlil usulini tanlashni belgilaydi.

O'lchov shkalasi

Tadqiqot o'tkazishda har bir kuzatish birligining qiymatlari aniqlanadi turli belgilar. Ular o'lchanadigan o'lchovga qarab, barcha belgilar bo'linadi miqdoriy Va sifat. Tadqiqotlarda sifat ko'rsatkichlari deb ataladiganlarga ko'ra taqsimlanadi nominal masshtab. Bundan tashqari, ko'rsatkichlar bo'yicha taqdim etilishi mumkin daraja masshtab.

Masalan, sportchilar va harakatsiz hayot tarzi bilan shug'ullanadigan odamlarning yurak faoliyatini taqqoslash mumkin.

Bunday holda, sub'ektlarda quyidagi belgilar aniqlandi:

  • qavat- bu nominal ikkita qiymatni qabul qiluvchi ko'rsatkich - erkak yoki ayol.
  • yoshi - miqdoriy indeks,
  • sport - nominal ikki ma'noni anglatuvchi ko'rsatkich: shug'ullangan yoki shug'ullanmagan,
  • yurak urish tezligi - miqdoriy indeks,
  • sistolik qon bosimi - miqdoriy indeks,
  • ko'krak qafasidagi og'riqlar shikoyatlarining mavjudligi- bu yuqori sifatli qiymatlari ikkala tomonidan aniqlanishi mumkin bo'lgan ko'rsatkich nominal(shikoyat bor - shikoyatlar yo'q) va shunga ko'ra daraja chastotaga qarab shkala (masalan, agar og'riq kuniga bir necha marta paydo bo'lsa - indikator 3-darajali, oyiga bir necha marta - 2-darajali, yiliga bir necha marta - 1-darajali, agar ko'krak qafasidagi og'riqlar haqida shikoyat bo'lmasa - 0-darajali. ).

Taqqoslangan populyatsiyalar soni

Statistik usulni tanlashda e'tiborga olinishi kerak bo'lgan navbatdagi masala tadqiqot doirasida taqqoslanadigan populyatsiyalar sonidir.

  • Ko'pgina hollarda, klinik sinovlarda biz bemorlarning ikki guruhi bilan shug'ullanamiz - Asosiy Va boshqaruv. Asosiy, yoki tajribali, odatda o'rganilayotgan tashxis yoki davolash usuli qo'llanilgan yoki bemorlar ushbu tadqiqot mavzusi bo'lgan kasallikdan aziyat chekadigan guruh deb hisoblanadi. Sinov guruh, aksincha, odatdagi parvarish, platsebo yoki o'rganilayotgan kasallikka ega bo'lmagan bemorlardan iborat. Turli bemorlar tomonidan ifodalangan bunday populyatsiyalar deyiladi bog'liq bo'lmagan.
    Hali ham bor bog'liq, yoki ikki barobar ortadi, agregatlar, biz bir xil odamlar haqida gapirganda, lekin olingan ba'zi xususiyatlarning qiymatlari taqqoslanadi. oldin va keyin tadqiqot. Taqqoslangan populyatsiyalar soni ham 2 ga teng, ammo ularga aloqador bo'lmaganlarga qaraganda turli xil usullar qo'llaniladi.
  • Yana bir variant - tavsiflash bitta Umuman olganda, har qanday tadqiqotning asosini tan olish kerak. Ishning asosiy maqsadi ikki yoki undan ortiq guruhlarni taqqoslash bo'lsa ham, birinchi navbatda ularning har biri tavsiflanishi kerak. Buning uchun qo'llaniladigan usullar tavsiflovchi statistika. Bundan tashqari, bitta populyatsiya uchun usullar qo'llanilishi mumkin korrelyatsiya tahlili , oʻrganilayotgan ikki yoki undan ortiq belgilar oʻrtasidagi munosabatni topish uchun ishlatiladi (masalan, boʻyning tana vazniga bogʻliqligi yoki yurak urish tezligining tana haroratiga bogʻliqligi).
  • Nihoyat, bir nechta populyatsiyalar solishtirilishi mumkin. Bu tibbiy tadqiqotlarda juda keng tarqalgan. Bemorlarni turli dorilarni qo'llashga qarab guruhlarga bo'lish mumkin (masalan, antihipertenziv dorilarning samaradorligini solishtirganda: 1 guruh - ACE inhibitörleri, 2 - beta-blokerlar, 3 - markaziy ta'sir qiluvchi dorilar), kasallikning og'irligiga qarab ( 1-guruh - engil, 2 - o'rtacha, 3 - og'ir) va boshqalar.

So'rash ham muhimdir tarqalish normalligi populyatsiyalar o'rganilmoqda. Bu usullarni qo'llash mumkinligini aniqlaydi parametrik tahlil yoki shunchaki parametrik bo'lmagan. Oddiy taqsimlangan populyatsiyalarda bajarilishi kerak bo'lgan shartlar:

  1. arifmetik o'rtacha, rejim va mediana qiymatlarining maksimal yaqinligi yoki tengligi;
  2. “uch sigma” qoidasiga rioya qilish (kamida 68,3% variant M±1s oralig‘ida, kamida 95,5% variant M±2s oralig‘ida, kamida 99,7% variant M±3s oralig‘ida);
  3. ko'rsatkichlar miqdoriy shkala bo'yicha o'lchanadi;
  4. maxsus mezonlardan foydalangan holda taqsimotning normalligi uchun testning ijobiy natijalari - Kolmogorov-Smirnov yoki Shapiro-Wilk.

O'rganilayotgan populyatsiyalar uchun biz ko'rsatgan barcha xususiyatlarni aniqlab bo'lgach, statistik tahlilning eng maqbul usulini tanlash uchun quyidagi jadvaldan foydalanishni taklif qilamiz.

Usul Ko'rsatkich o'lchov shkalasi Taqqoslangan populyatsiyalar soni Qayta ishlash maqsadi Ma'lumotlarni tarqatish
Talabaning t-testi miqdoriy 2 normal
Bonferroni tuzatish bilan talabaning t-testi miqdoriy 3 yoki undan ko'p taqqoslash yo'q bog'liq to'plamlar normal
Juftlangan talabalarning t-testi miqdoriy 2 normal
Bir tomonlama dispersiya tahlili (ANOVA) miqdoriy 3 yoki undan ko'p bir-biriga bog'liq bo'lmagan populyatsiyalarni taqqoslash normal
Takroriy o'lchovlar bilan bir tomonlama dispersiya tahlili (ANOVA). miqdoriy 3 yoki undan ko'p qarindosh populyatsiyalarni solishtirish normal
Mann-Whitney U testi miqdoriy, darajali 2 bir-biriga bog'liq bo'lmagan populyatsiyalarni taqqoslash har qanday
Rosenbaumning Q testi miqdoriy, darajali 2 bir-biriga bog'liq bo'lmagan populyatsiyalarni taqqoslash har qanday
Kruskal-Uollis testi miqdoriy 3 yoki undan ko'p bir-biriga bog'liq bo'lmagan populyatsiyalarni taqqoslash har qanday
Wilcoxon testi miqdoriy, darajali 2 qarindosh populyatsiyalarni solishtirish har qanday
G belgisi testi miqdoriy, darajali 2 qarindosh populyatsiyalarni solishtirish har qanday
Fridman mezoni miqdoriy, darajali 3 yoki undan ko'p qarindosh populyatsiyalarni solishtirish har qanday
Pearsonning ch2 testi nominal 2 yoki undan ortiq bir-biriga bog'liq bo'lmagan populyatsiyalarni taqqoslash har qanday
Fisherning aniq testi nominal 2 bir-biriga bog'liq bo'lmagan populyatsiyalarni taqqoslash har qanday
McNemar testi nominal 2 qarindosh populyatsiyalarni solishtirish har qanday
Kokranning Q testi nominal 3 yoki undan ko'p qarindosh populyatsiyalarni solishtirish har qanday
Nisbiy xavf (risk nisbati, RR) nominal 2 kohort tadqiqotlarida bir-biriga bog'liq bo'lmagan populyatsiyalarni taqqoslash har qanday
Oran nisbati (OR) nominal 2 vaziyatni nazorat qilish bo'yicha tadqiqotlarda bir-biriga bog'liq bo'lmagan populyatsiyalarni taqqoslash har qanday
Pearson korrelyatsiya koeffitsienti miqdoriy 2 qator o'lchovlar normal
Spearmanning darajali korrelyatsiya koeffitsienti miqdoriy, darajali 2 qator o'lchovlar belgilar orasidagi aloqalarni aniqlash har qanday
Kendall korrelyatsiya koeffitsienti miqdoriy, darajali 2 qator o'lchovlar belgilar orasidagi aloqalarni aniqlash har qanday
Kendallning muvofiqlik koeffitsienti miqdoriy, darajali 3 yoki undan ortiq o'lchov qatorlari belgilar orasidagi aloqalarni aniqlash har qanday
O'rtacha qiymatlarni (M) va o'rtacha xatolarni (m) hisoblash miqdoriy 1 tavsiflovchi statistika har qanday
Medianlarni (Me) va foizlarni (kvartillarni) hisoblash daraja 1 tavsiflovchi statistika har qanday
Nisbiy qiymatlarni (P) va o'rtacha xatolarni (m) hisoblash nominal 1 tavsiflovchi statistika har qanday
Shapiro-Wilk testi miqdoriy 1 tarqatish tahlili har qanday
Kolmogorov-Smirnov mezoni miqdoriy 1 tarqatish tahlili har qanday
Smirnov-Kramer-von Mizes mezoni ō 2 miqdoriy 1 tarqatish tahlili har qanday
Kaplan-Mayer usuli har qanday 1 omon qolish tahlili har qanday
Kox proportsional xavf modeli har qanday 1 omon qolish tahlili har qanday

Buyuk statistiklar

Karl Pearson (1857 yil 27 mart - 1936 yil 27 aprel)

Buyuk ingliz matematigi, statistik, biolog va faylasuf Karl Pirson 1857-yil 27-martda tug‘ilgan; asoschisi matematik statistika, biometrika asoschilaridan biri.

27 yoshida professor lavozimini egallagan amaliy matematika London Universitet kollejida Karl Pirson umumiy ilmiy vosita sifatida qabul qilingan statistikani o'rganishni boshladi, bu talabalarga keng dunyoqarashni ta'minlash zarurligi haqidagi umuman qabul qilinmagan fikrlariga mos keladi.

Pirsonning statistika sohasidagi asosiy yutuqlari qatoriga xususiyatlarning korrelyatsiyasi va tasodifiyligi nazariyasi asoslarini ishlab chiqish, empirik taqsimotlarni tavsiflash uchun "Pirson egri chiziqlari" ni joriy etish va o'ta muhim x-kvadrat mezonini kiritish kiradi. ko'p sonli statistik jadvallar. Pirson statistik usulni va ayniqsa, korrelyatsiya nazariyasini fanning ko'plab sohalarida qo'llagan.

Mana, uning so'zlaridan biri: "Zamonaviy statistik usullarning havaskorlar tomonidan o'rnatilgan fanga birinchi marta kiritilishi odatiy nafrat bilan qarshilik ko'rsatadi. Lekin men ularning ko'plari dastlab qoralagan usullarni yashirincha qo'llashni boshlagan paytni ko'rdim."

Va allaqachon 1920 yilda Pirson eslatma yozdi, unda u biometrik maktabning maqsadi "statistikani amaliy matematikaning bir tarmog'iga aylantirish, eski siyosiy va ijtimoiy statistika maktabining noaniq usullarini umumlashtirish, rad etish yoki oqlash" ekanligini aytdi. , va umuman olganda, statistikani oʻyin maydonidan havaskorlar va bahschilarga aylantirib, jiddiy fan sohasiga aylantirish.Tibbiyot, antropologiya, kraniometriya, psixologiya, kriminologiya, biologiya, sotsiologiya va boshqa sohalardagi nomukammal va koʻpincha notoʻgʻri usullarni tanqid qilish zarur edi. Bu fanlarni yangi va kuchliroq vositalar bilan ta’minlash maqsadida.. Jang qariyb yigirma yil davom etdi, lekin ko‘pchilik eski jangovar harakatlar ortda qolib, yangi usullar umume’tirof etilganidan dalolat berdi”.

Karl Pirsonning qiziqishlari juda xilma-xil edi: u Geydelbergda fizikani o'rgangan, dinning ijtimoiy va iqtisodiy roli bilan qiziqgan, hatto Kembrij va Londonda nemis tarixi va adabiyotidan ma'ruzalar o'qigan.

Kam ma'lum bo'lgan haqiqat shundaki, Karl Pirson 28 yoshida "ayollar savoli" bo'yicha ma'ruza o'qigan va hatto 1889 yilgacha mavjud bo'lgan Erkaklar va Ayollar klubiga asos solgan, unda ayollar bilan bog'liq hamma narsa, shu jumladan jinslar o'rtasidagi munosabatlar ham mavjud edi. erkin va cheksiz muhokama qilinadi.

Klub teng miqdordagi erkaklar va ayollardan, asosan o'rta sinf liberallaridan, sotsialistlar va feministlardan iborat edi.

Klub muhokamalarining mavzusi keng ko'lamli masalalar bo'ldi: qadimgi yunon Afinadagi jinsiy aloqadan tortib buddist rohibalarning ahvoligacha, nikohga bo'lgan munosabatdan fohishalik muammolarigacha. Aslini olganda, Erkaklar va Ayollar klubi uzoq vaqtdan beri o'rnatilgan erkak va ayol o'zaro munosabatlarining me'yorlariga, shuningdek, "to'g'ri" jinsiy aloqa haqidagi g'oyalarga qarshi chiqdi. Viktoriya davridagi Angliyada, ko'pchilik jinsiy hayotni "tayanch" va "hayvon" deb hisoblagan va jinsiy ta'lim haqida jaholat keng tarqalgan bo'lib, bunday masalalarni muhokama qilish haqiqatan ham radikal edi.

1898 yilda Pirson Qirollik jamiyati tomonidan Darvin medali bilan taqdirlandi, u mukofotlarni "yoshlarni rag'batlantirish uchun berish kerak" deb hisoblab, rad etdi.

Florens Nightingale (1820 yil 12 may - 1910 yil 13 avgust)

Florens Nightingale (1820-1910) - Buyuk Britaniyadagi hamshira va jamoat arbobi, biz bugun tug'ilgan kunida Xalqaro hamshiralar kunini nishonlaymiz.

U Florensiyada badavlat zodagon oilasida tug‘ilgan, mukammal ta’lim olgan va olti tilni bilgan. BILAN yoshlar rahm-shafqat singlisi bo'lishni orzu qilar edi, 1853 yilda u Kayzervertdagi Pastor Flenderning opa-singillar jamoasida hamshiralik ta'limini oldi va Londondagi kichik xususiy shifoxonaning menejeri bo'ldi.

1854 yil oktyabr oyida, davomida Qrim urushi, Florensiya 38 nafar yordamchi bilan birga Qrimdagi dala kasalxonalariga bordi. Yaradorlarga yordam ko'rsatishni tashkil qilishda u sanitariya va gigiena tamoyillarini izchil amalga oshirdi. Natijada, olti oydan kamroq vaqt ichida shifoxonalarda o'lim 42 dan 2,2% gacha kamaydi!

Armiyada tibbiy xizmatni isloh qilish vazifasini o'z oldiga qo'ygan Nightingale kasalxonalarni shamollatish va kanalizatsiya tizimlari bilan jihozlashni ta'minladi; shifoxona xodimlari o'tishlari kerak edi zarur tayyorgarlik. Harbiy tibbiyot bilim yurti tashkil etilib, askar va ofitserlar o‘rtasida kasalliklarning oldini olishning ahamiyati haqida tushuntirish ishlari olib borildi.

Florens Nightingalening tibbiy statistikaga qo'shgan ulkan hissasi!

  • Uning 800 sahifalik kitobi "Britaniya armiyasi gospitallarining salomatligi, samaradorligi va boshqaruviga ta'sir qiluvchi omillar haqida eslatmalar" (1858) statistik ma'lumotlarga bag'ishlangan va diagrammalar bilan tasvirlangan butun bo'limni o'z ichiga olgan.
  • Nightingale statistikada grafik tasvirlardan foydalanishda innovator edi. U dumaloq diagrammalarni ixtiro qildi, ularni "xo'roz uyasi" deb atagan va o'limning tuzilishini tasvirlash uchun ishlatgan. Uning ko'plab jadvallari armiyadagi sog'liqni saqlash muammolari bo'yicha komissiyaning hisobotiga kiritilgan va bu armiya tibbiyotini isloh qilish to'g'risida qaror qabul qilishga olib keldi.
  • U shifoxonalarda statistik ma'lumotlarni yig'ishning birinchi shaklini ishlab chiqdi, bu shifoxona faoliyati to'g'risida zamonaviy hisobot shakllarining salafidir.

1859 yilda u Qirollik Statistika Jamiyatining a'zosi etib saylandi va keyinchalik Amerika Statistika Assotsiatsiyasining faxriy a'zosi bo'ldi.

Iogann Karl Fridrix Gauss (1777 yil 30 aprel - 1855 yil 23 fevral)

1777-yil 30-aprelda buyuk nemis matematigi, mexanigi, fizigi, astronomi, geodezik va statistik Iogann Karl Fridrix Gauss Braunshveyg shahrida tug‘ilgan.

U barcha davrlarning eng buyuk matematiklaridan biri, "matematiklar qiroli" hisoblanadi. Kopli medali laureati (1838), Shvetsiya (1821) va Rossiya (1824) Fanlar akademiyalari va Angliya Qirollik jamiyatining xorijiy a'zosi.

Karl uch yoshida o'qish va yozishni bilgan, hatto otasining hisob-kitob xatolarini tuzatgan. Afsonaga ko'ra, maktab matematika o'qituvchisi bolalarni uzoq vaqt band qilish uchun ulardan 1 dan 100 gacha bo'lgan raqamlar yig'indisini sanashni so'ragan. Yosh Gauss qarama-qarshi tomonlardan juftlik yig'indilari bir xil ekanligini payqagan: 1+100= 101, 2+99=101, va hokazo va shu zahotiyoq natijaga erishdi: 50×101=5050. Keksalik yoshiga qadar u ko'p hisob-kitoblarni boshida bajarishga odatlangan edi.

Karl Gaussning statistikadagi asosiy ilmiy yutuqlari regressiya tahlilining asosini tashkil etuvchi eng kichik kvadratlar usulini yaratishdir.

U, shuningdek, tabiatda keng tarqalgan normal taqsimot qonunini batafsil o'rganib chiqdi, shundan beri uning grafigi ko'pincha Gauss deb ataladi. Oddiy taqsimotni tavsiflovchi "uch sigma" qoidasi (Gauss qoidasi) keng tarqalgan.

Lev Semyonovich Kaminskiy (1889-1962)

Buyuk G'alabaning 75 yilligi munosabati bilan Vatan urushi Men ajoyib olim, SSSRda harbiy tibbiy-sanitariya statistikasining asoschilaridan biri - Lev Semenovich Kaminskiyni (1889-1962) eslab, ular haqida gapirmoqchiman.

U 1889 yil 27 mayda Kievda tug'ilgan. 1918 yilda Petrograd universitetining tibbiyot fakultetini imtiyozli diplom bilan tugatgandan so'ng, Kaminskiy Qizil Armiya safida edi, 1919 yil apreldan 1920 yil oxirigacha u janubiy 136-konsolidatsiyalangan evakuatsiya kasalxonasining bosh shifokori lavozimida ishlagan. Sharqiy front.

1922 yildan Lev Semyonovich Shimoliy-G'arbiy temir yo'lning tibbiy-sanitariya xizmatining sanitariya-epidemiologiya bo'limiga rahbarlik qildi. Shu yillarda u boshlandi ilmiy faoliyat Kaminskiy rahbarligida prof. S.A.Novoselskiy. Ularning “O‘tmishdagi urushlardagi yo‘qotishlar” nomli qo‘shma fundamental ishlarida 1756-1918 yillardagi dunyoning turli qo‘shinlarining urushlaridagi insoniy yo‘qotishlar to‘g‘risidagi statistik material tahlil qilindi. Keyingi asarlarida Kaminskiy harbiylarning yangi, aniqroq tasnifini ishlab chiqdi va asoslab berdi. yo'qotishlar.

“Milliy oziqlanish va aholi salomatligi” (1929) monografiyasida urushlarning aholi salomatligiga ta’sirining sanitariya-gigiyena jihatlari, shuningdek, urush davrida aholi va armiyaga tibbiy yordam ko‘rsatishni tashkil etish masalalari atroflicha o‘rganildi.

1935 yildan 1943 yilgacha Lev Semenovich SSSR Sog'liqni saqlash xalq komissarligining sanitariya (1942 yildan - tibbiy) statistikasi bo'limini boshqargan. 1943 yil oktyabr oyidan professor Kaminskiy nomidagi Harbiy tibbiyot akademiyasining harbiy tibbiy statistika kafedrasi mudiri bo'ldi. S.M.Kirov, 1956 yildan esa Leningrad davlat universitetining statistika va buxgalteriya hisobi kafedrasi professori lavozimida ishlagan.

Lev Semyonovich keng miqyosda amalga oshirish tarafdori edi miqdoriy usullar sanitariya va tibbiy statistika amaliyotiga. 1959 yilda uning muallifligida nashr etilgan Qo'llanma Ko'p yillar davomida tibbiy statistika bo'yicha eng yaxshi mahalliy darsliklardan biriga aylangan "Laboratoriya va klinik ma'lumotlarni statistik qayta ishlash: statistik ma'lumotlarni shifokorning ilmiy va amaliy faoliyatida qo'llash". Muqaddimada L.S.Kaminskiy qayd etadi:
“... Davolovchi shifokorlar qanday qilib biznesga kirishish va taqqoslash va taqqoslash uchun mos bo‘lgan to‘g‘ri raqamlarni to‘plash va qayta ishlashni bilishlari muhim ko‘rinadi”.

Mezon va usullar

MUSTAQIL AHOLILAR UCHUN TALABA t-MEZONI

Student's t-test - talabalar taqsimotiga asoslangan gipotezalarni (statistik testlar) statistik tekshirish usullari sinfining umumiy nomi. T-testning eng keng tarqalgan qo'llanilishi ikkita namunadagi vositalarning tengligini tekshirishni o'z ichiga oladi.

Ushbu mezon ishlab chiqilgan Uilyam Seeley Gossett

2. Student's t-test nima uchun ishlatiladi?

O'rtacha farqlarning statistik ahamiyatini aniqlash uchun Student t testi qo'llaniladi. U mustaqil namunalarni (masalan, qandli diabet bilan og'rigan bemorlar guruhi va sog'lom odamlar guruhi) taqqoslashda ham, tegishli populyatsiyalarni solishtirishda ham (masalan, qabul qilishdan oldin va keyin bir xil bemorlarda o'rtacha yurak urish tezligi) foydalanish mumkin. antiaritmik dori). Ikkinchi holda, juftlashtirilgan Student t-testi hisoblanadi

3. Talabaning t-testidan qanday hollarda foydalanish mumkin?

Student t-testini qo'llash uchun dastlabki ma'lumotlar normal taqsimotga ega bo'lishi kerak. Taqqoslangan guruhlarning dispersiyalari (tarqalishi) tengligi (homosedastiklik) ham muhim ahamiyatga ega. Teng bo'lmagan dispersiyalar uchun Welch tomonidan o'zgartirilgan t-testi (Welch's t) qo'llaniladi.

Yo'qligi bilan normal taqsimot Taqqoslangan namunalar, Student t-testi o'rniga, parametrik bo'lmagan statistikaning o'xshash usullari qo'llaniladi, ular orasida eng mashhuri Mann-Whitney U testi.

4. Studentning t-testi qanday hisoblanadi?

O'rtacha qiymatlarni solishtirish uchun Student's t-test yordamida hisoblab chiqiladi quyidagi formula:

Qayerda M 1- birinchi taqqoslangan aholining (guruhning) o'rtacha arifmetik qiymati; M 2- ikkinchi taqqoslangan aholining (guruhning) o'rtacha arifmetik qiymati; m 1- birinchi arifmetik o'rtachaning o'rtacha xatosi, m 2- ikkinchi arifmetik o'rtachaning o'rtacha xatosi.

Olingan Studentning t-test qiymati to'g'ri talqin qilinishi kerak. Buning uchun har bir guruhdagi mavzular sonini bilishimiz kerak (n 1 va n 2). Erkinlik darajalari sonini topish f quyidagi formula bo'yicha:

F = (n 1 + n 2) - 2

Shundan so'ng biz talab qilinadigan ahamiyat darajasi (masalan, p = 0,05) va ma'lum miqdordagi erkinlik darajasi uchun Student t-testining kritik qiymatini aniqlaymiz. f jadvalga muvofiq (pastga qarang).

  • Agar Talabaning t-testining hisoblangan qiymati jadvalda topilgan kritik qiymatga teng yoki undan katta bo'lsa, taqqoslangan qiymatlar orasidagi farqlar statistik ahamiyatga ega degan xulosaga kelamiz.
  • Agar hisoblangan Student t-testining qiymati jadval qiymatidan kichik bo'lsa, solishtirilgan qiymatlar orasidagi farqlar statistik ahamiyatga ega emas.

Yangi temir preparatining samaradorligini o'rganish uchun anemiya bilan og'rigan bemorlarning ikki guruhi tanlangan. Birinchi guruhda bemorlar ikki hafta davomida yangi dori-darmonlarni qabul qilishdi, ikkinchi guruhda esa platsebo qabul qilishdi. Shundan so'ng periferik qondagi gemoglobin miqdori o'lchanadi. Birinchi guruhda gemoglobinning o'rtacha darajasi 115,4±1,2 g/l, ikkinchi guruhda - 103,7±2,3 g/l (ma'lumotlar M±m formatida keltirilgan), taqqoslangan populyatsiyalar normal taqsimotga ega. Birinchi guruhdagilar soni 34 nafar, ikkinchisida esa 40 nafar bemor. Olingan farqlarning statistik ahamiyati va yangi temir preparatining samaradorligi haqida xulosa chiqarish kerak.

Yechim: Farqlarning ahamiyatini baholash uchun biz o'rtacha qiymatlardagi farq kvadrat xatolar yig'indisiga bo'lingan holda hisoblangan Student t-testidan foydalanamiz:

Hisob-kitoblarni amalga oshirgandan so'ng, t-test qiymati 4,51 bo'lib chiqdi. Biz erkinlik darajalari sonini (34 + 40) - 2 = 72 deb topamiz. Olingan 4.51 Studentning t-test qiymatini jadvalda ko'rsatilgan p = 0.05 kritik qiymat bilan taqqoslaymiz: 1.993. Mezonning hisoblangan qiymati kritik qiymatdan kattaroq bo'lgani uchun biz kuzatilgan farqlar statistik ahamiyatga ega degan xulosaga kelamiz (muhimlik darajasi p<0,05).


Juftlangan talaba t-TEST

Juftlangan Studentning t-testi Student usulining modifikatsiyalaridan biri boʻlib, juftlashgan (takroriy) oʻlchovlardagi farqlarning statistik ahamiyatini aniqlash uchun qoʻllaniladi.

1. T-testning rivojlanish tarixi

t-testi ishlab chiqilgan Uilyam Gossett Ginnes kompaniyasida pivo sifatini baholash. Tijorat sirlarini oshkor etmaslik bo'yicha kompaniya oldidagi majburiyatlari tufayli Gossetning maqolasi 1908 yilda "Talaba" taxallusi bilan "Biometrics" jurnalida nashr etilgan.

2. Juftlangan Student t testi nima uchun ishlatiladi?

Juftlangan Student t-testi ikkita qaram (juftlangan) namunalarni solishtirish uchun ishlatiladi. Bog'liq o'lchovlar bir xil bemorlarda, lekin turli vaqtlarda, masalan, antihipertenziv preparatni qabul qilishdan oldin va keyin gipertenziv bemorlarda qon bosimi. Nol gipoteza taqqoslanayotgan namunalar o'rtasida farqlar yo'qligini, muqobil gipotezada statistik jihatdan muhim farqlar mavjudligini bildiradi.

3. Juftlangan Student t testidan qanday hollarda foydalanish mumkin?

Asosiy shart - bu namunalarning bog'liqligi, ya'ni taqqoslanadigan qiymatlar bir xil bemorlarda bitta parametrning takroriy o'lchovlaridan olinishi kerak.

Mustaqil namunalarni taqqoslashda bo'lgani kabi, juftlashtirilgan t-testidan foydalanish uchun dastlabki ma'lumotlar normal taqsimlanishi kerak. Agar bu shart bajarilmasa, namunaviy vositalarni solishtirish uchun parametrik bo'lmagan statistik usullardan foydalanish kerak, masalan G belgisi testi yoki Wilcoxon T-testi.

Juftlangan t testidan faqat ikkita namunani solishtirganda foydalanish mumkin. Agar uch yoki undan ortiq takroriy o'lchovlarni solishtirish kerak bo'lsa, siz foydalanishingiz kerak takroriy o'lchovlar uchun bir tomonlama dispersiya tahlili (ANOVA)..

4. Juftlangan Student t testini qanday hisoblash mumkin?

Juftlangan Studentning t-testi quyidagi formula yordamida hisoblanadi:

Qayerda M d- oldin va keyin o'lchangan ko'rsatkichlar orasidagi farqlarning arifmetik o'rtacha qiymati; s d- ko'rsatkichlardagi farqlarning standart og'ishi; n- o'rganilgan fanlar soni.

5. Studentning t-test qiymati qanday izohlanadi?

Olingan juftlashtirilgan Studentning t-test qiymatining talqini bog'liq bo'lmagan populyatsiyalar uchun t-testini baholashdan farq qilmaydi. Avvalo, siz erkinlik darajalari sonini topishingiz kerak f quyidagi formula bo'yicha:

F = n - 1

Shundan so'ng biz talab qilinadigan ahamiyat darajasi uchun Student t-testining kritik qiymatini aniqlaymiz (masalan, p<0,05) и при данном числе степеней свободы f jadvalga muvofiq (pastga qarang).

Biz mezonning kritik va hisoblangan qiymatlarini solishtiramiz:

  • Agar juftlashtirilgan Student t-testining hisoblangan qiymati jadvalda topilgan kritik qiymatga teng yoki undan katta bo'lsa, taqqoslangan qiymatlar orasidagi farqlar statistik ahamiyatga ega degan xulosaga kelamiz.
  • Agar hisoblangan juftlashtirilgan Student t-testining qiymati jadval qiymatidan past bo'lsa, solishtirilgan qiymatlar orasidagi farqlar statistik ahamiyatga ega emas.

6. Student t-testini hisoblash misoli

Yangi gipoglikemik vositaning samaradorligini baholash uchun qandli diabet bilan og'rigan bemorlarda preparatni qabul qilishdan oldin va keyin qondagi glyukoza miqdori o'lchandi. Natijada quyidagi ma'lumotlar olindi:

Yechim:

1. Har bir juft qiymatning farqini hisoblang (d):

Bemor N Qon glyukoza darajasi, mmol/l Farq (d)
preparatni qabul qilishdan oldin preparatni qabul qilgandan keyin
1 9.6 5.7 3.9
2 8.1 5.4 2.7
3 8.8 6.4 2.4
4 7.9 5.5 2.4
5 9.2 5.3 3.9
6 8.0 5.2 2.8
7 8.4 5.1 3.3
8 10.1 6.9 3.2
9 7.8 7.5 2.3
10 8.1 5.0 3.1

2. Formula yordamida farqlarning o‘rtacha arifmetik qiymatini toping:

3. Formuladan foydalanib, o'rtachadan farqlarning standart og'ishini toping:

4. Juftlangan Student t-testini hisoblang:

5. Talabaning t-testi 8.6 ning olingan qiymatini f erkinlik darajalari soni 10 - 1 = 9 ga teng va ahamiyatlilik darajasi p = 0,05 bilan 2,262 ga teng bo'lgan jadval qiymati bilan taqqoslaylik. Olingan qiymat kritik qiymatdan kattaroq bo'lganligi sababli, yangi preparatni qabul qilishdan oldin va keyin qondagi glyukoza darajasida statistik jihatdan sezilarli farqlar mavjud degan xulosaga keldik.

Student t-testining kritik qiymatlari jadvalini ko'rsating

MANN-WHITNEY U-MEZON

Mann-Whitney U testi miqdoriy o'lchangan belgi darajasi bo'yicha ikkita mustaqil namunani solishtirish uchun ishlatiladigan parametrik bo'lmagan statistik testdir. Usul ikkita variatsiya seriyasi (birinchi namunadagi parametr qiymatlarining tartiblangan qatori va ikkinchi namunadagi bir xil) o'rtasidagi kesishgan qiymatlar zonasi etarlicha kichik yoki yo'qligini aniqlashga asoslangan. Mezon qiymati qanchalik past bo'lsa, namunalardagi parametr qiymatlari orasidagi farqlar ishonchli bo'lishi ehtimoli shunchalik yuqori bo'ladi.

1. U-kriteriyasining rivojlanish tarixi

Namunalar orasidagi farqni aniqlashning bu usuli 1945 yilda amerikalik kimyogar va statistik tomonidan taklif qilingan. Frenk Uilkoxon.
1947 yilda u matematiklar tomonidan sezilarli darajada qayta ko'rib chiqildi va kengaytirildi H.B. Mann(H.B. Mann) va D.R. Uitni(D.R. Uitni), bugungi kunda u odatda nomlari bilan ataladi.

2. Mann-Whitney U testi nima uchun ishlatiladi?

Mann-Whitney U testi har qanday miqdoriy xarakteristikalar darajasi bo'yicha ikkita mustaqil namuna o'rtasidagi farqlarni baholash uchun ishlatiladi.

3. Mann-Whitney U testidan qanday hollarda foydalanish mumkin?

Mann-Whitney U testi parametrik bo'lmagan testdir, shuning uchun farqli o'laroq Talabaning t-testi

U-testi kichik namunalarni solishtirish uchun javob beradi: har bir namuna kamida 3 ta xarakteristikaga ega bo'lishi kerak. Bitta namunada 2 ta qiymat bo'lishiga ruxsat beriladi, ammo ikkinchisida kamida beshta bo'lishi kerak.

Mann-Whitney U testini qo'llash sharti - taqqoslangan guruhlarda mos keladigan atribut qiymatlarining yo'qligi (barcha raqamlar boshqacha) yoki bunday mosliklarning juda oz soni.

Uch yoki undan ortiq guruhlarni solishtirish uchun Mann-Whitney U testining analogi Kruskal-Uollis testi.

4. Mann-Whitney U testini qanday hisoblash mumkin?

Birinchidan, har ikkala taqqoslangan namunalardan, a yagona reyting seriyasi, kuzatuv birliklarini ortib borayotgan atribut darajasiga ko'ra tartibga solish va kichikroq qiymatga pastki darajani belgilash orqali. Bir nechta birliklar uchun xarakteristikaning qiymatlari teng bo'lsa, ularning har biriga ketma-ket daraja qiymatlarining o'rtacha arifmetik qiymati beriladi.

Masalan, bitta reyting qatorida 2 va 3-o'rinlarni (darajali) egallagan ikkita birlik bir xil qiymatlarga ega. Shuning uchun ularning har biriga (3 + 2) / 2 = 2,5 ga teng daraja beriladi.

Tuzilgan yagona tartibli seriyada darajalarning umumiy soni quyidagilarga teng bo'ladi:

N = n 1 + n 2

Bu yerda n 1 birinchi namunadagi elementlar soni, n 2 esa ikkinchi namunadagi elementlar soni.

Keyinchalik, biz har bir birlik uchun daraja qiymatlarini eslab, birinchi va ikkinchi namunalar birliklaridan iborat bo'lgan yagona tartibli seriyani yana ikkiga ajratamiz. Biz birinchi namunadagi elementlar ulushiga to'g'ri keladigan darajalar yig'indisini alohida hisoblaymiz va alohida - ikkinchi namunadagi elementlarning ulushi bo'yicha. Biz n x elementli namunaga mos keladigan ikkita darajali yig'indining (T x) kattasini aniqlaymiz.

Nihoyat, formuladan foydalanib, Mann-Whitney U testining qiymatini topamiz:

5. Mann-Whitney U testining qiymati qanday izohlanadi?

Tanlangan statistik ahamiyatga ega (p=0,05 yoki p=0,01) jadval yordamida U-testining natijaviy qiymatini taqqoslangan namunalar soni uchun U ning kritik qiymati bilan solishtiramiz:

  • Agar natijada qiymat U bo'lsa Ozroq jadvalli yoki teng u, keyin ko'rib chiqilayotgan namunalardagi belgi darajalari orasidagi farqlarning statistik ahamiyati e'tirof etiladi (muqobil gipoteza qabul qilinadi). U qiymati qanchalik kichik bo'lsa, farqlarning ishonchliligi shunchalik yuqori bo'ladi.
  • Agar natijada qiymat U bo'lsa Ko'proq jadvalli, nol gipoteza qabul qilinadi.
Mann-Whitney U testining kritik qiymatlari jadvalini p = 0,05 da ko'rsating

WILCOxon MEZON

Tegishli namunalar uchun Wilcoxon testi (shuningdek, Wilcoxon T-testi, Wilcoxon testi, Wilcoxon imzolangan daraja testi, Wilcoxon rank sum testi deb ham ataladi) parametrik bo'lmagan statistik test bo'lib, o'lchangan har qanday miqdoriy xarakteristikalar darajasi bo'yicha ikkita bog'langan (juftlangan) namunalarni solishtirish uchun ishlatiladi. uzluksiz yoki tartibli miqyosda.

Usulning mohiyati shundaki, u yoki bu yo'nalishdagi siljishlar og'irligining mutlaq qiymatlari taqqoslanadi. Buning uchun birinchi navbatda siljishlarning barcha mutlaq qiymatlari tartiblanadi, so'ngra darajalar umumlashtiriladi. Agar u yoki bu yo'nalishdagi siljishlar tasodifiy sodir bo'lsa, unda ularning darajalari yig'indisi taxminan teng bo'ladi. Agar bir yo'nalishdagi siljishlarning intensivligi kattaroq bo'lsa, qarama-qarshi yo'nalishdagi siljishlarning mutlaq qiymatlari yig'indisi tasodifiy o'zgarishlarga qaraganda ancha past bo'ladi.

1. Tegishli namunalar uchun Wilcoxon testining rivojlanish tarixi

Sinov birinchi marta 1945 yilda amerikalik statistik va kimyogar Frenk Uilkoxon (1892-1965) tomonidan taklif qilingan. Xuddi shu ilmiy ishida muallif mustaqil namunalarni solishtirishda qo'llaniladigan yana bir mezonni tasvirlab berdi.

2. Vilkoxon testi nima uchun ishlatiladi?

Wilcoxon T testi bir xil populyatsiyada, lekin turli sharoitlarda yoki turli vaqtlarda olingan ikkita o'lchov to'plami o'rtasidagi farqlarni baholash uchun ishlatiladi. Ushbu test o'zgarishlarning yo'nalishi va jiddiyligini aniqlashi mumkin - ya'ni ko'rsatkichlar boshqasiga qaraganda bir yo'nalishda ko'proq siljiydimi.

Tegishli populyatsiyalar uchun Wilcoxon T-testidan foydalanish mumkin bo'lgan vaziyatning klassik misoli davolanishdan oldin va keyin ballarni taqqoslaydigan oldin-keyin tadqiqotidir. Masalan, antihipertenziv dori samaradorligini o'rganayotganda, qon bosimi preparatni qabul qilishdan oldin va keyin solishtiriladi.

3. Wilcoxon T-testidan foydalanish shartlari va cheklovlari

  1. Wilcoxon testi parametrik bo'lmagan testdir, shuning uchun farqli o'laroq Juftlangan Student t-testi, solishtirilayotgan populyatsiyalarning normal taqsimlanishini talab qilmaydi.
  2. Wilcoxon T-testidan foydalanganda sub'ektlar soni kamida 5 ta bo'lishi kerak.
  3. O'rganilayotgan belgi miqdoriy uzluksiz shkalada (qon bosimi, yurak urishi tezligi, 1 ml qondagi leykotsitlar miqdori) va tartibli shkalada (ballar soni, kasallikning og'irligi, mikroorganizmlar bilan ifloslanish darajasi) o'lchanishi mumkin.
  4. Ushbu mezon faqat ikkita o'lchov seriyasini solishtirganda qo'llaniladi. Uch yoki undan ortiq qarindosh populyatsiyalarni solishtirish uchun Wilcoxon T-testining analogi Fridman mezoni.

4. Tegishli namunalar uchun Wilcoxon T-testini qanday hisoblash mumkin?

  1. Har bir mavzu uchun juftlashtirilgan o'lchovlar qiymatlari o'rtasidagi farqni hisoblang. Nolinchi siljishlar bundan keyin hisobga olinmaydi.
  2. Farqlarning qaysi biri tipik ekanligini aniqlang, ya'ni chastotada ustun bo'lgan ko'rsatkichning o'zgarish yo'nalishiga mos keladi.
  3. Juftlarning farqlarini ularning mutlaq qiymatlari bo'yicha (ya'ni, belgini hisobga olmagan holda) o'sish tartibida tartiblang. Farqning kichikroq mutlaq qiymatiga past daraja beriladi.
  4. Atipik siljishlarga mos keladigan darajalar yig'indisini hisoblang.

Shunday qilib, tegishli namunalar uchun Wilcoxon T-testi quyidagi formula yordamida hisoblanadi:

bu yerda SRr - indikatordagi atipik o'zgarishlarga mos keladigan darajalar yig'indisi.

5. Vilkoxon testining qiymati qanday izohlanadi?

Wilcoxon T-testining natijaviy qiymati tanlangan statistik ahamiyat darajasi uchun jadvalga muvofiq kritik qiymat bilan taqqoslanadi ( p=0,05 yoki p=0,01) solishtirilgan namunalar soni uchun n:

  • Agar T emning hisoblangan (empirik) qiymati. jadvaldagi T cr dan kamroq. yoki unga teng bo'lsa, u holda ko'rsatkichning tipik yo'nalishdagi o'zgarishining statistik ahamiyati tan olinadi (muqobil gipoteza qabul qilinadi). T qiymati qanchalik past bo'lsa, farqlarning ishonchliligi shunchalik yuqori bo'ladi.
  • Agar T emp. ko'proq T cr. , ko'rsatkichdagi o'zgarishlarning statistik ahamiyati yo'qligi haqidagi nol gipoteza qabul qilinadi.

Tegishli namunalar uchun Wilcoxon testini hisoblash misoli

Farmatsevtika kompaniyasi steroid bo'lmagan yallig'lanishga qarshi dorilar guruhidan yangi preparatni tadqiq qilmoqda. Shu maqsadda gipertermiya bilan ARVI bilan og'rigan 10 nafar ko'ngillilar guruhi tanlangan. Ularning tana harorati yangi preparatni qabul qilishdan oldin va 30 daqiqadan keyin o'lchandi. Preparatni qabul qilish natijasida tana haroratining pasayishining ahamiyati haqida xulosa chiqarish kerak.

  1. Manba ma'lumotlari quyidagi jadvalda keltirilgan:
  2. Wilcoxon T-testini hisoblash uchun biz juftlashgan ko'rsatkichlar orasidagi farqlarni hisoblaymiz va ularning mutlaq qiymatlarini tartiblaymiz. Bunday holda, biz atipik darajalarni qizil rang bilan ajratamiz:
    N Familiya preparatni qabul qilishdan oldin tana t preparatni qabul qilgandan keyin t tanasi Ko'rsatkichlarning farqi, d |d| Daraja
    1. Ivanov 39.0 37.6 -1.4 1.4 7
    2. Petrov 39.5 38.7 -0.8 0.8 5
    3. Sidorov 38.6 38.7 0.1 0.1 1.5
    4. Popov 39.1 38.5 -0.6 0.6 4
    5. Nikolaev 40.1 38.6 -1.5 1.5 8
    6. Kozlov 39.3 37.5 -1.8 1.8 9
    7. Ignatiyev 38.9 38.8 -0.1 0.1 1.5
    8. Semenov 39.2 38.0 -1.2 1.2 6
    9. Egorov 39.8 39.8 0
    10. Alekseev 38.8 39.3 0.5 0.5 3
    Ko'rib turganimizdek, odatiy siljish indikator - uning pasayishi, 10 ta holatdan 7 tasida qayd etilgan. Bir holatda (bemor Egorovda) preparatni qabul qilgandan keyin harorat o'zgarmagan va shuning uchun bu holat keyingi tahlillarda qo'llanilmagan. Ikki holatda (bemorlarda Sidorov va Alekseevda) qayd etilgan atipik siljish harorat ko'tariladi. Atipik siljishga mos keladigan darajalar 1,5 va 3 ni tashkil qiladi.
  3. Keling, indikatorning atipik siljishiga mos keladigan darajalar yig'indisiga teng bo'lgan Wilcoxon T-testini hisoblaymiz:

    T = SRr = 3 + 1,5 = 4,5

  4. Keling, T empni taqqoslaylik. T cr bilan. , bu muhimlik darajasida p=0,05 va n=9 ga teng 8. Shuning uchun T emp.
  5. Xulosa qilamiz: yangi preparatni qabul qilish natijasida ARVI bilan og'rigan bemorlarda tana haroratining pasayishi statistik ahamiyatga ega (p.<0.05).
Wilcoxon T-testining kritik qiymatlari jadvalini ko'rsating

PIARSON CHI-Kvadrat mezoni

Pearsonning ch 2 testi parametrik bo'lmagan usul bo'lib, har bir toifaga kiruvchi namunaning haqiqiy (oshkor qilingan) natijalari yoki sifat ko'rsatkichlari o'rtasidagi farqlarning ahamiyatini va agar o'rganilayotgan guruhlarda kutilishi mumkin bo'lgan nazariy sonni baholashga imkon beradi. nol gipoteza haqiqatdir. Oddiy qilib aytganda, usul ikki yoki undan ortiq nisbiy ko'rsatkichlar (chastotalar, nisbatlar) o'rtasidagi farqlarning statistik ahamiyatini baholash imkonini beradi.

1. ch 2 mezonining rivojlanish tarixi

Favqulodda vaziyatlar jadvallarini tahlil qilish uchun chi-kvadrat testi 1900 yilda ingliz matematiki, statistik, biolog va faylasuf, matematik statistika asoschisi va biometrikaning asoschilaridan biri tomonidan ishlab chiqilgan va taklif qilingan. Karl Pearson(1857-1936).

2. Nima uchun Pirson ch 2 testidan foydalaniladi?

Tahlilda chi-kvadrat testidan foydalanish mumkin favqulodda vaziyatlar jadvallari xavf omilining mavjudligiga qarab natijalarning chastotasi haqida ma'lumotni o'z ichiga oladi. Masalan, to'rtta maydonli favqulodda vaziyatlar jadvali quyidagicha ko'rinadi:

Natija bor (1) Natija yo'q (0) Jami
Xavf omili mavjud (1) A B A+B
Xavf omili yo'q (0) C D C+D
Jami A+C B+D A+B+C+D

Bunday favqulodda vaziyatlar jadvalini qanday to'ldirish kerak? Keling, kichik bir misolni ko'rib chiqaylik.

Chekishning arterial gipertenziya rivojlanish xavfiga ta'siri bo'yicha tadqiqot olib borilmoqda. Shu maqsadda sub'ektlarning ikkita guruhi tanlab olindi - birinchisiga kuniga kamida 1 quti sigaret chekadigan 70 kishi, ikkinchisiga o'sha yoshdagi 80 ta chekmaydiganlar kiradi. Birinchi guruhda 40 kishi yuqori qon bosimiga ega edi. Ikkinchisida 32 kishida arterial gipertenziya kuzatilgan. Shunga ko'ra, chekuvchilar guruhida normal qon bosimi 30 kishida (70 - 40 = 30) va chekmaydiganlar guruhida - 48 (80 - 32 = 48) edi.

Biz to'rtta maydonli favqulodda vaziyatlar jadvalini dastlabki ma'lumotlar bilan to'ldiramiz:

Olingan favqulodda vaziyatlar jadvalida har bir satr ma'lum bir sub'ektlar guruhiga mos keladi. Ustunlarda arterial gipertenziya yoki normal qon bosimi bo'lgan odamlarning soni ko'rsatilgan.

Tadqiqotchi oldiga qo'yilgan vazifa: chekuvchilar va chekmaydiganlar orasida qon bosimi bo'lgan odamlarning chastotasi o'rtasida statistik jihatdan sezilarli farqlar bormi? Bu savolga Pearson chi-kvadrat testini hisoblash va natijada olingan qiymatni kritik bilan solishtirish orqali javob berish mumkin.

  1. Taqqoslanadigan ko'rsatkichlar nominal shkala bo'yicha (masalan, bemorning jinsi erkak yoki ayol) yoki tartibli shkalada (masalan, arterial gipertenziya darajasi, 0 dan 3 gacha) o'lchanishi kerak.
  2. Ushbu usul nafaqat to'rtta maydonli jadvallarni tahlil qilish imkonini beradi, agar omil ham, natija ham ikkilik o'zgaruvchilar bo'lsa, ya'ni ular faqat ikkita mumkin bo'lgan qiymatga ega (masalan, erkak yoki ayol jinsi, mavjudligi yoki yo'qligi). anamnezda ma'lum kasallik...). Pearson chi-kvadrat testi omil va (yoki) natija uch yoki undan ortiq qiymatlarni qabul qilganda, ko'p maydonli jadvallarni tahlil qilishda ham qo'llanilishi mumkin.
  3. Taqqoslanayotgan guruhlar mustaqil bo'lishi kerak, ya'ni kuzatuvdan oldingi va keyingi kuzatuvlarni solishtirganda chi-kvadrat testidan foydalanmaslik kerak. McNemar testi(ikki bog'liq populyatsiyani solishtirganda) yoki hisoblangan Kokranning Q testi(uch yoki undan ortiq guruhlarni taqqoslaganda).
  4. To'rt maydonli jadvallarni tahlil qilishda kutilgan qiymatlar Har bir katakda kamida 10 ta bo'lishi kerak. Agar kamida bitta katakda kutilgan hodisa 5 dan 9 gacha bo'lgan qiymatga ega bo'lsa, chi-kvadrat testini hisoblash kerak. Yatesning tuzatishi bilan. Agar kamida bitta hujayrada kutilgan hodisa 5 dan kam bo'lsa, unda tahlildan foydalanish kerak Fisherning aniq testi.
  5. Ko'p maydonli jadvallarni tahlil qilishda kutilayotgan kuzatishlar soni 20% dan ortiq kataklarda 5 tadan kam bo'lmasligi kerak.

4. Pearson chi-kvadrat testini qanday hisoblash mumkin?

Ki-kvadrat testini hisoblash uchun sizga kerak bo'ladi:

Ushbu algoritm to'rt maydonli va ko'p maydonli jadvallar uchun ham amal qiladi.

5. Pirson chi-kvadrat testining qiymati qanday izohlanadi?

Agar ch 2 mezonining olingan qiymati kritik qiymatdan katta bo'lsa, biz o'rganilayotgan xavf omili va tegishli ahamiyatga ega bo'lgan natija o'rtasida statistik bog'liqlik bor degan xulosaga kelamiz.

6. Pearson chi-kvadrat testini hisoblash misoli

Yuqorida ko'rib chiqilgan jadvaldan foydalanib, chekish omilining arterial gipertenziya bilan kasallanishiga ta'sirining statistik ahamiyatini aniqlaylik:

  1. Biz har bir hujayra uchun kutilgan qiymatlarni hisoblaymiz:
  2. Pearson chi-kvadrat testining qiymatini toping:

    ch 2 = (40-33,6) 2 /33,6 + (30-36,4) 2 /36,4 + (32-38,4) 2 /38,4 + (48-41,6) 2 /41,6 = 4,396.

  3. Erkinlik darajalari soni f = (2-1)*(2-1) = 1. Jadvaldan foydalanib, biz Pirson chi-kvadrat testining kritik qiymatini topamiz, bu muhimlik darajasida p=0,05 va soni erkinlik darajasi 1 3,841 ga teng.
  4. Biz chi-kvadrat testining olingan qiymatini kritik qiymat bilan taqqoslaymiz: 4.396 > 3.841, shuning uchun arterial gipertenziya bilan kasallanishning chekish mavjudligiga bog'liqligi statistik ahamiyatga ega. Bu munosabatlarning ahamiyatlilik darajasi p ga to'g'ri keladi<0.05.
Pearsonning chi-kvadrat testining kritik qiymatlari jadvalini ko'rsating

FISCHERNING ANIQ MEZONI

Fisherning aniq testi - bu ikkita qiymatga ega bo'lgan ma'lum bir xarakteristikaning chastotasini tavsiflovchi ikkita nisbiy ko'rsatkichni solishtirish uchun ishlatiladigan test. Fisherning aniq testini hisoblash uchun dastlabki ma'lumotlar odatda to'rtta maydonli jadval shaklida guruhlangan.

1. Mezonning rivojlanish tarixi

Birinchi mezon taklif qilingan Ronald Fisher"Tajribalarni loyihalash" kitobida. Bu 1935 yilda sodir bo'lgan. Fisherning o'zi Muriel Bristol uni bu fikrga undaganini ta'kidladi. 1920-yillarning boshlarida Ronald, Muriel va Uilyam Rouch Angliyada qishloq xo'jaligi tajriba stantsiyasida joylashgan edi. Murielning ta'kidlashicha, u choy va sutni stakaniga quyish tartibini aniqlay oladi. O‘shanda uning gapi to‘g‘riligini tekshirishning imkoni bo‘lmagan.

Bu Fisherning "nol gipoteza" g'oyasini keltirib chiqardi. Maqsad Murielning turlicha tayyorlangan choylarni farqlay olishini isbotlash emas edi. Ayol tasodifan tanlov qiladi degan gipotezani rad etishga qaror qilindi. Nol gipotezani isbotlash ham, oqlash ham mumkin emasligi aniqlandi. Ammo tajribalar paytida buni rad etish mumkin.

8 stakan tayyorlandi. Birinchi to'rtta birinchi navbatda sut, qolgan to'rttasi choy bilan to'ldiriladi. Kuboklar aralashtirildi. Bristol choyni tatib ko'rishni va choyni tayyorlash usuliga ko'ra stakanlarni ajratishni taklif qildi. Natijada ikkita guruh bo'lishi kerak edi. Tarix shuni ko'rsatadiki, tajriba muvaffaqiyatli bo'lgan.

Fisher testi tufayli Bristolning intuitiv harakat qilish ehtimoli 0,01428 ga kamaydi. Ya'ni, 70 ta holatdan bittasida kubokni to'g'ri aniqlash mumkin edi. Ammo baribir, Madam tasodifan aniqlagan imkoniyatlarni nolga tushirishning iloji yo'q. Agar siz stakan sonini ko'paytirsangiz ham.

Bu hikoya "nol gipoteza" ning rivojlanishiga turtki berdi. Shu bilan birga, Fisherning aniq mezoni taklif qilindi, uning mohiyati qaram va mustaqil o'zgaruvchilarning barcha mumkin bo'lgan kombinatsiyalarini sanab o'tishdir.

2. Fisherning aniq testi nima uchun ishlatiladi?

Fisherning aniq testi asosan kichik namunalarni solishtirish uchun ishlatiladi. Buning ikkita yaxshi sababi bor. Birinchidan, mezonni hisoblash juda og'ir va uzoq vaqt talab qilishi yoki kuchli hisoblash resurslarini talab qilishi mumkin. Ikkinchidan, mezon juda to'g'ri (bu hatto uning nomida ham o'z aksini topgan), bu uni oz miqdordagi kuzatuvlar bilan tadqiqotlarda qo'llash imkonini beradi.

Tibbiyotda Fisherning aniq testi alohida o'rin tutadi. Bu tibbiy ma'lumotlarni qayta ishlashning muhim usuli bo'lib, ko'plab ilmiy tadqiqotlarda qo'llanilishini topdi. Uning yordamida ma'lum omillar va natijalar o'rtasidagi bog'liqlikni o'rganish, ikki guruh sub'ektlari o'rtasidagi patologik holatlarning chastotasini solishtirish va boshqalar mumkin.

3. Fisherning aniq testidan qanday hollarda foydalanish mumkin?

  1. Taqqoslanayotgan o'zgaruvchilar nominal shkalada o'lchanishi va faqat ikkita qiymatga ega bo'lishi kerak, masalan, qon bosimi normal yoki ko'tarilgan, natija ijobiy yoki noqulay, operatsiyadan keyingi asoratlar mavjud yoki yo'q.
  2. Fisherning aniq testi ikkita mustaqil guruhni omillarga bo'lingan holda solishtirish uchun mo'ljallangan. Shunga ko'ra, omil ham faqat ikkita mumkin bo'lgan qiymatga ega bo'lishi kerak.
  3. Mezon juda kichik namunalarni solishtirish uchun javob beradi: Fisherning aniq testi kutilgan hodisaning qiymatlari 5 dan kam bo'lgan taqdirda to'rtta to'liq jadvalni tahlil qilish uchun ishlatilishi mumkin, bu qo'llash uchun cheklovdir. Pearson chi-kvadrat testi, hatto Yates tuzatishini hisobga olgan holda.
  4. Fisherning aniq testi bir tomonlama yoki ikki tomonlama bo'lishi mumkin. Bir tomonlama variant bilan ko'rsatkichlardan biri qayerda og'ishi aniq ma'lum. Misol uchun, tadqiqot nazorat guruhiga nisbatan qancha bemor tuzalganini taqqoslaydi. Terapiya bemorlarning ahvolini yomonlashtira olmaydi, faqat uni davolaydi yoki yo'q deb taxmin qilinadi.
    Ikki dumli test ikki yo'nalishdagi chastota farqlarini baholaydi. Ya'ni, nazorat guruhiga nisbatan eksperimental guruhdagi hodisaning yuqori va past chastotasi ehtimoli baholanadi.

Fisherning aniq testining analogi Pearson chi-kvadrat testi, Fisherning aniq testi, ayniqsa, kichik namunalarni solishtirganda yuqori kuchga ega va shuning uchun bu holatda afzalliklarga ega.

4. Fisherning aniq testini qanday hisoblash mumkin?

Aytaylik, biz tug'ma nuqsonli bolalarning tug'ilish chastotasining homiladorlik davrida onaning chekishiga bog'liqligini o'rganmoqdamiz. Buning uchun homilador ayollarning ikkita guruhi tanlab olindi, ulardan biri eksperimental guruh bo'lib, homiladorlikning birinchi trimestrida chekadigan 80 nafar ayol, ikkinchisi esa taqqoslash guruhi bo'lib, 90 nafar ayol homiladorlik davrida sog'lom turmush tarzini olib bordi. Eksperimental guruhda homila tug'ma nuqsonlari soni 10 tani, taqqoslash guruhida 2 tani tashkil etdi.

Birinchidan, biz to'rtta maydonli favqulodda vaziyatlar jadvalini yaratamiz:

Fisherning aniq testi quyidagi formula bo'yicha hisoblanadi:

bu erda N - ikki guruhdagi fanlarning umumiy soni; ! - faktorial, ya'ni raqam va raqamlar ketma-ketligining ko'paytmasi bo'lib, ularning har biri oldingisidan 1 ga kichik (masalan, 4! = 4 3 2 1).

Hisob-kitoblar natijasida biz P = 0,0137 ekanligini aniqlaymiz.

5. Fisherning aniq testining qiymati qanday izohlanadi?

Usulning afzalligi shundaki, natijada olingan mezon p ahamiyatlilik darajasining aniq qiymatiga mos keladi. Ya'ni, bizning misolimizda olingan 0,0137 qiymati homilaning tug'ma nuqsonlari rivojlanish chastotasidagi taqqoslangan guruhlar o'rtasidagi farqlarning ahamiyatlilik darajasidir. Bu raqamni faqat tibbiy tadqiqotlarda odatda 0,05 sifatida qabul qilingan muhim ahamiyatga ega bo'lgan kritik daraja bilan solishtirish kerak.

  • Agar Fisherning aniq testining qiymati kritik qiymatdan katta bo'lsa, nol gipoteza qabul qilinadi va xavf omilining mavjudligiga qarab, natijaning chastotasida statistik jihatdan muhim farqlar yo'qligi haqida xulosa chiqariladi.
  • Agar Fisherning aniq testining qiymati kritik qiymatdan past bo'lsa, muqobil gipoteza qabul qilinadi va xavf omilining ta'siriga qarab, natijaning chastotasida statistik jihatdan muhim farqlar mavjudligi haqida xulosa chiqariladi.

Bizning misolimizda P< 0,05, в связи с чем делаем вывод о наличии прямой взаимосвязи курения и вероятности развития ВПР плода. Частота возникновения врожденной патологии у детей курящих женщин статистически значимо выше, чем у некурящих.


ODDS NISBATI

Odds koeffitsienti - statistik ko'rsatkich (rus tilida uning nomi odatda OR deb qisqartiriladi, ingliz tilida esa - "Odds nisbati" dan OR), ma'lum bir natijaning yo'qligi yoki mavjudligi qanchalik ko'p ekanligini raqamli jihatdan tavsiflashning asosiy usullaridan biri. ma'lum bir statistik guruhda ma'lum bir omilning mavjudligi yoki yo'qligi bilan bog'liq.

1. Odds koeffitsienti indikatorining rivojlanish tarixi

"Imkoniyat" atamasi qimor o'yinlari nazariyasidan kelib chiqqan bo'lib, bu kontseptsiya g'alaba qozongan o'rinlarni yutqazganlarga nisbatini bildirish uchun ishlatilgan. Ilmiy tibbiy adabiyotlarda odds koeffitsienti ko'rsatkichi birinchi marta 1951 yilda J. Kornfildning ishida qayd etilgan. Keyinchalik, ushbu tadqiqotchi 95% ishonch oralig'ini hisoblash zarurligini ta'kidlagan maqolalarni nashr etdi. (Kornfild, J. Klinik ma'lumotlardan qiyosiy ko'rsatkichlarni baholash usuli. O'pka, ko'krak va bachadon bo'yni saratoniga qo'llanilishi // Milliy saraton instituti jurnali, 1951. - N.11. - P.1269–1275.)

2. Odds nisbati nima uchun ishlatiladi?

Odds nisbati ma'lum bir natija va xavf omili o'rtasidagi bog'liqlikni baholaydi.

Odds nisbati ma'lum bir xavf omilini aniqlash chastotasiga ko'ra o'rganish guruhlarini solishtirish imkonini beradi. Muhimi, koeffitsientni qo'llash natijasi nafaqat omil va natija o'rtasidagi bog'liqlikning statistik ahamiyatini aniqlash, balki uning miqdoriy bahosi hamdir.

3. Odds koeffitsientlaridan foydalanish shartlari va cheklovlari

  1. Natija va omil ko'rsatkichlari nominal shkala bo'yicha o'lchanishi kerak. Masalan, samarali belgi - homilada tug'ma nuqsonning mavjudligi yoki yo'qligi, o'rganilayotgan omil - onaning chekishi (chekadi yoki chekmaydi).
  2. Ushbu usul faqat to'rtta maydonli jadvallarni tahlil qilish imkonini beradi, agar omil ham, natija ham ikkilik o'zgaruvchilar bo'lsa, ya'ni ular faqat ikkita mumkin bo'lgan qiymatga ega (masalan, jins - erkak yoki ayol, arterial gipertenziya - mavjudligi yoki yo'qligi, kasallikning natijasi - yaxshilangan yoki yaxshilanmagan ...).
  3. Taqqoslanayotgan guruhlar mustaqil bo'lishi kerak, ya'ni odds nisbati oldingi va keyin taqqoslash uchun mos emas.
  4. Odds nisbati indikatori holatlarni nazorat qilish tadqiqotlarida qo'llaniladi (masalan, birinchi guruh gipertoniya bilan og'rigan bemorlar, ikkinchisi nisbatan sog'lom odamlar). Istiqbolli tadqiqotlar uchun guruhlar xavf omilining mavjudligi yoki yo'qligi asosida tuzilganda (masalan, birinchi guruh chekuvchilar, ikkinchi guruh chekmaydiganlar), uni ham hisoblash mumkin. nisbiy xavf.

4. Odds nisbati qanday hisoblanadi?

Koeffitsient - bu kasrning qiymati bo'lib, unda birinchi guruh uchun hisoblagich ma'lum bir hodisaning koeffitsientini o'z ichiga oladi va maxraj ikkinchi guruh uchun bir xil hodisaning koeffitsientini o'z ichiga oladi.

Imkoniyat ma'lum bir xususiyatga (natija yoki omil) ega bo'lgan sub'ektlar sonining ushbu xususiyatga ega bo'lmagan sub'ektlar soniga nisbati.

Masalan, pankreatik nekrozga qarshi operatsiya qilingan bemorlar guruhi tanlab olindi, ularning soni 100 kishini tashkil etdi. 5 yil o'tgach, ularning 80 tasi tirik edi. Shunga ko'ra, omon qolish imkoniyati 80 dan 20 gacha yoki 4 ga teng edi.

2x2 jadvaldagi ma'lumotlarni umumlashtirib, koeffitsientlar nisbatini hisoblash qulay usuldir:

Natija bor (1) Natija yo'q (0) Jami
Xavf omili mavjud (1) A B A+B
Xavf omili yo'q (0) C D C+D
Jami A+C B+D A+B+C+D

Ushbu jadval uchun imkoniyat nisbati quyidagi formula bo'yicha hisoblanadi:

Natija va xavf omili o'rtasidagi aniqlangan bog'lanishning statistik ahamiyatini baholash juda muhimdir. Buning sababi shundaki, koeffitsientlar nisbatining past qiymatlari bilan, birlikka yaqin bo'lsa ham, munosabatlar sezilarli bo'lib chiqishi mumkin va statistik xulosalarda hisobga olinishi kerak. Aksincha, katta OR qiymatlari bilan ko'rsatkich statistik jihatdan ahamiyatsiz bo'lib chiqadi va shuning uchun aniqlangan munosabatlarni e'tiborsiz qoldirish mumkin.

Odds nisbatining ahamiyatini baholash uchun 95% ishonch oralig'ining chegaralari hisoblab chiqiladi (inglizcha "ishonch oralig'i" dan 95% CI yoki 95% CI qisqartmasi ishlatiladi). 95% CI ning yuqori chegara qiymatini topish formulasi:

95% CI pastki chegarasi qiymatini topish formulasi:

5. Odds nisbati qiymati qanday izohlanadi?

  • Agar imkoniyat koeffitsienti 1 dan katta bo'lsa, bu natija mavjud bo'lgan guruhda xavf omilini topish ehtimoli kattaroq ekanligini anglatadi. Bular. omilning natijaning yuzaga kelish ehtimoli bilan bevosita bog'liqligi bor.
  • 1 dan kam koeffitsientlar ikkinchi guruhda xavf omilini aniqlash imkoniyati yuqori ekanligini ko'rsatadi. Bular. omil natijaning yuzaga kelish ehtimoli bilan teskari munosabatga ega.
  • Koeffitsient birga teng bo'lsa, taqqoslangan guruhlarda xavf omilini aniqlash imkoniyati bir xil bo'ladi. Shunga ko'ra, omil natija ehtimoliga hech qanday ta'sir ko'rsatmaydi.

Bundan tashqari, har bir holatda, ehtimollik nisbatining statistik ahamiyati, albatta, 95% ishonch oralig'i qiymatlari asosida baholanadi.

  • Agar ishonch oralig'i 1 ni o'z ichiga olmasa, ya'ni. chegaralarning ikkala qiymati 1 dan yuqori yoki past bo'lsa, omil va natija o'rtasidagi aniqlangan bog'liqlikning statistik ahamiyati to'g'risida xulosa chiqariladi p ahamiyatlilik darajasida<0,05.
  • Agar ishonch oralig'i 1 ni o'z ichiga olsa, ya'ni. uning yuqori chegarasi 1 dan katta, pastki chegarasi esa 1 dan kichik bo'lsa, p>0,05 ahamiyatlilik darajasida omil va natija o'rtasidagi bog'liqlikning statistik ahamiyati yo'q degan xulosaga keladi.
  • Ishonch oralig'ining kattaligi omil va natija o'rtasidagi munosabatlarning ahamiyatlilik darajasiga teskari proportsionaldir, ya'ni. 95% CI qanchalik kichik bo'lsa, aniqlangan munosabatlar shunchalik muhim bo'ladi.

6. Odds nisbati indikatorini hisoblash misoli

Keling, ikkita guruhni tasavvur qilaylik: birinchisi, homilaning tug'ma nuqsoni (Exodus+) tashxisi qo'yilgan 200 nafar ayoldan iborat edi. Ulardan 50 nafari homiladorlik davrida chekishgan (Faktor+) (A), chekmaydiganlar edi (Faktor-) - 150 kishi (BILAN).

Ikkinchi guruh homilaning tug'ma nuqsoni belgilari bo'lmagan 100 ta ayoldan iborat (Natija -), ular orasida 10 kishi homiladorlik paytida chekishgan (Faktor+) (B), chekmagan (Faktor-) - 90 kishi (D).

1. To'rtta maydonli favqulodda vaziyatlar jadvalini tuzamiz:

2. Odds nisbati qiymatini hisoblang:

YOKI = (A * D) / (B * C) = (50 * 90) / (150 * 10) = 3.

3. 95% CI chegaralarini toping. Yuqoridagi formula yordamida hisoblangan pastki chegaraning qiymati 1,45, yuqori chegarasi esa 6,21 ni tashkil etdi.

Shunday qilib, tadqiqot homilaning tug'ma nuqsoni tashxisi qo'yilgan bemorlar orasida chekuvchi ayol bilan uchrashish ehtimoli homilaning tug'ma nuqsoni belgilari bo'lmagan ayollarga qaraganda 3 baravar yuqori ekanligini ko'rsatdi. Kuzatilgan bog'liqlik statistik ahamiyatga ega, chunki 95% CI 1 ni o'z ichiga olmaydi, uning pastki va yuqori chegaralari qiymatlari 1 dan katta.


Nisbiy XAVF

Xavf - bu kasallik yoki shikastlanish kabi ma'lum bir natijaning yuzaga kelish ehtimoli. Xavf 0 dan (natija yuzaga kelish ehtimoli yo'q) 1 ga (barcha holatlarda noxush natija kutiladi) qiymatlarni olishi mumkin. Tibbiy statistikada, qoida tariqasida, biron bir omilga qarab, natija xavfining o'zgarishi o'rganiladi. Bemorlar shartli ravishda 2 guruhga bo'linadi, ulardan biriga omil ta'sir qiladi, ikkinchisi esa yo'q.

Nisbiy xavf - o'rganilayotgan omil ta'sir ko'rsatgan sub'ektlar o'rtasidagi natijalar chastotasining ushbu omil ta'sirida bo'lmagan sub'ektlar orasidagi natijalar chastotasiga nisbati. Ilmiy adabiyotlarda indikatorning qisqartirilgan nomi tez-tez ishlatiladi - RR yoki RR (inglizcha "nisbiy xavf" dan).

1. Nisbiy xavf ko'rsatkichining rivojlanish tarixi

Nisbiy xavfni hisoblash iqtisodiyotdan tibbiy statistika tomonidan olingan. Siyosiy, iqtisodiy va ijtimoiy omillarning mahsulot yoki xizmatga bo'lgan talabga ta'sirini to'g'ri baholash muvaffaqiyatga olib kelishi mumkin, bu omillarni etarlicha baholamaslik esa korxonaning moliyaviy muvaffaqiyatsizligiga va bankrot bo'lishiga olib keladi.

2. Nisbiy risk nima uchun ishlatiladi?

Nisbiy xavf xavf omilining mavjudligiga qarab natija ehtimolini solishtirish uchun ishlatiladi. Masalan, chekishning gipertoniya kasalligiga ta'sirini baholashda, ko'krak bezi saratoni bilan kasallanishning og'iz orqali kontratseptivlarni qo'llashga bog'liqligini o'rganishda va hokazo. Nisbiy xavf muayyan davolash usullarini belgilashda yoki tadqiqot o'tkazishda eng muhim ko'rsatkichdir. mumkin bo'lgan nojo'ya ta'sirlar.

3. Nisbiy riskni qo'llash shartlari va cheklovlari

  1. Faktor va natija ko'rsatkichlari nominal shkala bo'yicha o'lchanishi kerak (masalan, bemorning jinsi - erkak yoki ayol, arterial gipertenziya - mavjud yoki yo'q).
  2. Ushbu usul faqat to'rtta maydonli jadvallarni tahlil qilish imkonini beradi, agar omil ham, natija ham inar o'zgaruvchi bo'lsa, ya'ni ular faqat ikkita mumkin bo'lgan qiymatga ega (masalan, yosh yoki 50 yoshdan katta, mavjudligi yoki anamnezda ma'lum bir kasallikning yo'qligi).
  3. Nisbiy xavf istiqbolli tadqiqotlarda, xavf omilining mavjudligi yoki yo'qligi asosida o'rganish guruhlari tuzilganda qo'llaniladi. Vaziyatni nazorat qilish bo'yicha tadqiqotlar o'rniga nisbiy xavfdan foydalanish kerak koeffitsientlar.

4. Nisbiy xavfni qanday hisoblash mumkin?

Nisbiy xavfni hisoblash uchun sizga kerak bo'ladi:

5. Nisbiy xavf qiymati qanday izohlanadi?

Omil va natija o'rtasidagi bog'liqlik xususiyatini aniqlash uchun nisbiy xavf ko'rsatkichi 1 bilan taqqoslanadi:

  • Agar RR 1 ga teng bo'lsa, biz o'rganilayotgan omil natijaning ehtimoliga ta'sir qilmaydi degan xulosaga kelishimiz mumkin (omil va natija o'rtasidagi bog'liqlik yo'q).
  • 1 dan katta qiymatlar uchun omil natijalarning chastotasini oshiradi degan xulosaga keladi (to'g'ridan-to'g'ri munosabat).
  • 1 dan kichik qiymatlar uchun bu omil ta'sirida natija ehtimolining pasayishini ko'rsatadi ( qayta aloqa).

95% ishonch oralig'i chegaralarining qiymatlari ham majburiy ravishda baholanadi. Agar ikkala qiymat ham - pastki va yuqori chegara - 1 ning bir tomonida bo'lsa yoki boshqacha qilib aytganda, ishonch oralig'i 1 ni o'z ichiga olmasa, u holda aniqlangan munosabatlarning statistik ahamiyati to'g'risida xulosa chiqariladi. omil va p xato ehtimoli bilan natija<0,05.

Agar 95% CI ning pastki chegarasi 1 dan kichik bo'lsa va yuqori chegarasi katta bo'lsa, natijaning qiymatidan qat'i nazar, omilning natija chastotasiga ta'sirining statistik ahamiyati yo'q degan xulosaga keladi. RR (p>0,05).

6. Nisbiy xavf ko'rsatkichini hisoblash misoli

1999 yilda Oklaxomada erkaklarda oshqozon yarasi bilan kasallanish holatlari bo'yicha tadqiqot o'tkazildi. Ta'sir etuvchi omil sifatida tez ovqatlanishni muntazam iste'mol qilish tanlangan. Birinchi guruhda doimiy ravishda tez ovqat iste'mol qiladigan 500 ta erkak bor edi, ular orasida 96 kishida oshqozon yarasi tashxisi qo'yilgan. Ikkinchi guruhga sog'lom ovqatlanish tarafdorlarining 500 nafari kirdi, ular orasida 31 holatda oshqozon yarasi tashxisi qo'yilgan. Olingan ma'lumotlarga asoslanib, quyidagi favqulodda vaziyatlar jadvali tuzildi:


PIRSON korrelyatsion mezoni

Pearson korrelyatsiya testi parametrik statistika usuli bo'lib, ikkita miqdoriy ko'rsatkich o'rtasida chiziqli bog'liqlik mavjudligini yoki yo'qligini aniqlashga, shuningdek uning yaqinligi va statistik ahamiyatini baholashga imkon beradi. Boshqacha qilib aytadigan bo'lsak, Pearson korrelyatsiya testi bir ko'rsatkich boshqasining o'zgarishiga javoban o'zgarishini (ko'payishi yoki kamayishini) aniqlash imkonini beradi? Statistik hisob-kitoblarda va xulosalarda korrelyatsiya koeffitsienti odatda r xy yoki R xy sifatida belgilanadi.

1. Korrelyatsiya mezonining rivojlanish tarixi

Pearson korrelyatsiya testi boshchiligidagi britaniyalik olimlar jamoasi tomonidan ishlab chiqilgan Karl Pearson(1857-1936) 19-asrning 90-yillarida ikkita tasodifiy miqdorning kovariatsiyasini tahlil qilishni soddalashtirish. Karl Pirsondan tashqari, odamlar ham Pearson korrelyatsiya mezoni ustida ishladilar Frensis Edgeworth Va Rafael Ueldon.

2.Pirson korrelyatsiya testi nima uchun ishlatiladi?

Pearson korrelyatsiya testi miqdoriy shkala bo'yicha o'lchanadigan ikkita ko'rsatkich o'rtasidagi bog'liqlikning yaqinligini (yoki kuchini) aniqlash imkonini beradi. Qo'shimcha hisob-kitoblardan foydalanib, aniqlangan munosabatlar qanchalik statistik ahamiyatga ega ekanligini ham aniqlashingiz mumkin.

Masalan, Pearson korrelyatsiya mezonidan foydalanib, siz o'tkir respiratorli infektsiyalar paytida tana harorati va qondagi leykotsitlar miqdori, bemorning bo'yi va vazni, ftorid miqdori o'rtasida bog'liqlik bormi degan savolga javob berishingiz mumkin. ichimlik suvi va aholida tish kariyesi bilan kasallanish holatlari.

3. Pearson chi-kvadrat testini qo'llash shartlari va cheklovlari

  1. Taqqoslanadigan ko'rsatkichlar miqdoriy shkala bo'yicha o'lchanishi kerak (masalan, yurak urishi tezligi, tana harorati, 1 ml qonga oq qon hujayralari soni, sistolik qon bosimi).
  2. Pearson korrelyatsiya mezonidan foydalanib, siz faqat miqdorlar orasidagi chiziqli bog'lanishning mavjudligi va kuchini aniqlashingiz mumkin. Aloqaning boshqa xususiyatlari, shu jumladan yo'nalishi (to'g'ridan-to'g'ri yoki teskari), o'zgarishlarning tabiati (to'g'ri chiziqli yoki egri chiziqli), shuningdek bir o'zgaruvchining boshqasiga bog'liqligi mavjudligi. regressiya tahlili.
  3. Taqqoslangan miqdorlar soni ikkitaga teng bo'lishi kerak. Uch yoki undan ortiq parametrlarning munosabatlarini tahlil qilishda siz usuldan foydalanishingiz kerak omil tahlili.
  4. Pearson korrelyatsiya mezoni parametrikdir va shuning uchun uni qo'llash sharti taqqoslanadigan o'zgaruvchilarning har birining normal taqsimlanishi hisoblanadi. Agar taqsimlanishi odatdagidan farq qiladigan ko'rsatkichlarning korrelyatsiya tahlilini o'tkazish zarur bo'lsa, shu jumladan tartibli shkala bo'yicha o'lchanadigan ko'rsatkichlardan foydalaning. Spearmanning darajali korrelyatsiya koeffitsienti.
  5. Bog'liqlik va korrelyatsiya tushunchalarini aniq ajratish kerak. Miqdorlarning bog'liqligi ular o'rtasida korrelyatsiya mavjudligini aniqlaydi, lekin aksincha emas.

Masalan, bolaning bo'yi uning yoshiga bog'liq, ya'ni bola qanchalik katta bo'lsa, u qanchalik baland bo'lsa. Agar biz turli yoshdagi ikkita bolani oladigan bo'lsak, unda katta ehtimollik bilan katta bolaning o'sishi kichigidan kattaroq bo'ladi. Bu hodisa ko'rsatkichlar o'rtasidagi sabab-natija munosabatlarini nazarda tutuvchi qaramlik deb ataladi. Albatta, ular o'rtasida korrelyatsiya ham mavjud, ya'ni bir ko'rsatkichning o'zgarishi boshqa ko'rsatkichning o'zgarishi bilan birga keladi.

Boshqa holatda, bolaning balandligi va yurak urishi (HR) o'rtasidagi munosabatni ko'rib chiqing. Ma'lumki, bu ikkala qiymat ham to'g'ridan-to'g'ri yoshga bog'liq, shuning uchun ko'p hollarda katta bo'yli (va shuning uchun katta yoshdagi) bolalarda yurak urish tezligi past bo'ladi. Ya'ni, korrelyatsiya kuzatiladi va juda yaqin bo'lishi mumkin. Ammo, agar biz bir xil yoshdagi, lekin turli balandlikdagi bolalarni oladigan bo'lsak, unda, ehtimol, ularning yurak urish tezligi sezilarli darajada farq qiladi va shuning uchun yurak urish tezligi balandlikdan mustaqil degan xulosaga kelishimiz mumkin.

Yuqoridagi misol to'g'ri xulosalar chiqarish uchun statistikada fundamental bo'lgan ko'rsatkichlarning bog'liqligi va bog'liqligi tushunchalarini farqlash qanchalik muhimligini ko'rsatadi.

4.Pirson korrelyatsiya koeffitsienti qanday hisoblanadi?

Pearson korrelyatsiya koeffitsienti quyidagi formula bo'yicha hisoblanadi:

5.Pirson korrelyatsiya koeffitsienti qiymati qanday izohlanadi?

Pearson korrelyatsiya koeffitsienti qiymatlari ularning mutlaq qiymatlari asosida talqin qilinadi. Korrelyatsiya koeffitsientining mumkin bo'lgan qiymatlari 0 dan ± 1 gacha o'zgarib turadi. r xy ning mutlaq qiymati qanchalik katta bo'lsa, ikkita kattalik o'rtasidagi munosabatlarning yaqinligi shunchalik yuqori bo'ladi. r xy = 0 aloqaning to'liq etishmasligini ko'rsatadi. r xy = 1 - mutlaq (funktsional) ulanish mavjudligini ko'rsatadi. Agar Pearson korrelyatsiya mezonining qiymati 1 dan katta yoki -1 dan kichik bo'lsa, hisob-kitoblarda xatolik yuz berdi.

Korrelyatsiyaning mustahkamligini yoki mustahkamligini baholash uchun odatda umumiy qabul qilingan mezonlar qo'llaniladi, ularga ko'ra r xy ning mutlaq qiymatlari.< 0.3 свидетельствуют о zaif ulanish, r xy qiymatlari 0,3 dan 0,7 gacha - ulanish haqida o'rtacha zichlik, r xy qiymatlari > 0,7 - o kuchli kommunikatsiyalar.

Korrelyatsiya kuchini aniqroq baholashni Chaddock jadvali yordamida olish mumkin:

r xy korrelyatsiya koeffitsientining statistik ahamiyati quyidagi formula bo'yicha hisoblangan t-testi yordamida baholanadi:

Olingan t r qiymati ma'lum bir muhimlik darajasidagi kritik qiymat va n-2 erkinlik darajalari soni bilan taqqoslanadi. Agar t r t kritdan oshsa, u holda aniqlangan korrelyatsiyaning statistik ahamiyati haqida xulosa chiqariladi.

6. Pearson korrelyatsiya koeffitsientini hisoblash misoli

Tadqiqotning maqsadi ikkita miqdoriy ko'rsatkich: qondagi testosteron darajasi (X) va tanadagi mushak massasining foizi (Y) o'rtasidagi bog'liqlikni aniqlash, yaqinligi va statistik ahamiyatini aniqlash edi. 5 ta sub'ektdan (n = 5) tashkil topgan namuna uchun dastlabki ma'lumotlar jadvalda jamlangan:


SPEARMAN MEZONI

Spearmanning darajali korrelyatsiya koeffitsienti noparametrik usul bo'lib, hodisalar o'rtasidagi bog'liqlikni statistik o'rganish uchun qo'llaniladi. Bunday holda, o'rganilayotgan xususiyatlarning ikkita miqdoriy qatori orasidagi haqiqiy parallellik darajasi aniqlanadi va miqdoriy ifodalangan koeffitsient yordamida o'rnatilgan bog'lanishning yaqinligiga baho beriladi.

1. Darajali korrelyatsiya koeffitsientining rivojlanish tarixi

Ushbu mezon 1904 yilda ishlab chiqilgan va korrelyatsiya tahlili uchun taklif qilingan Charlz Edvard Spirman, ingliz psixologi, London va Chesterfild universitetlari professori.

2. Spirman koeffitsienti nima uchun ishlatiladi?

Spirmanning darajali korrelyatsiya koeffitsienti ikki qator taqqoslanadigan miqdoriy ko'rsatkichlar o'rtasidagi bog'liqlikning yaqinligini aniqlash va baholash uchun ishlatiladi. Agar ko'rsatkichlarning o'sish yoki pasayish darajasi bo'yicha tartiblangan darajalari ko'p hollarda mos kelsa (bir ko'rsatkichning katta qiymati boshqa ko'rsatkichning katta qiymatiga to'g'ri keladi - masalan, bemorning bo'yi va uning tana vaznini taqqoslaganda), xulosa. mavjudligi haqida tuzilgan Streyt korrelyatsiya aloqasi. Agar ko'rsatkichlar darajalari teskari yo'nalishga ega bo'lsa (bir ko'rsatkichning yuqori qiymati boshqasining past qiymatiga to'g'ri keladi - masalan, yosh va yurak urish tezligini taqqoslaganda), ular haqida gapirishadi teskari ko'rsatkichlar o'rtasidagi bog'liqlik.

    Spearman korrelyatsiya koeffitsienti quyidagi xususiyatlarga ega:
  1. Korrelyatsiya koeffitsienti minus birdan birgacha qiymatlarni olishi mumkin va rs=1 bilan qat'iy to'g'ridan-to'g'ri bog'liqlik, rs= -1 bilan esa qat'iy qayta aloqa aloqasi mavjud.
  2. Agar korrelyatsiya koeffitsienti manfiy bo'lsa, u holda teskari aloqa, agar u ijobiy bo'lsa, to'g'ridan-to'g'ri bog'liqlik mavjud.
  3. Agar korrelyatsiya koeffitsienti nolga teng bo'lsa, u holda miqdorlar o'rtasida deyarli hech qanday bog'liqlik yo'q.
  4. Korrelyatsiya koeffitsientining moduli birlikka qanchalik yaqin bo'lsa, o'lchangan miqdorlar o'rtasidagi munosabatlar shunchalik kuchli bo'ladi.

3. Spirmen koeffitsienti qanday hollarda ishlatilishi mumkin?

Koeffitsient parametrik bo'lmagan tahlil usuli bo'lganligi sababli, taqsimotning normalligini tekshirish talab qilinmaydi.

Taqqoslanadigan ko'rsatkichlarni doimiy shkalada (masalan, 1 mkl qondagi qizil qon tanachalari soni) va tartibli shkalada (masalan, ball) o'lchash mumkin. ekspert baholash 1 dan 5 gacha).

Agar o'lchangan miqdorlarning har xil qiymatlari orasidagi farq etarlicha katta bo'lsa, Spearman baholashining samaradorligi va sifati pasayadi. Agar o'lchangan miqdor qiymatlarining notekis taqsimlanishi bo'lsa, Spearman koeffitsientidan foydalanish tavsiya etilmaydi.

4. Spearman koeffitsienti qanday hisoblanadi?

Spearman darajasining korrelyatsiya koeffitsientini hisoblash quyidagi bosqichlarni o'z ichiga oladi:

5. Spearman koeffitsienti qiymati qanday izohlanadi?

Darajali korrelyatsiya koeffitsientidan foydalanganda xususiyatlar o'rtasidagi bog'liqlikning yaqinligi shartli ravishda baholanadi, koeffitsient qiymatlari 0,3 dan kam bo'lsa, zaif bog'liqlik belgisi hisoblanadi; 0,3 dan katta, lekin 0,7 dan kichik qiymatlar ulanishning o'rtacha yaqinligining belgisidir va 0,7 va undan yuqori qiymatlar ulanishning yuqori yaqinligining belgisidir.

U ulanishning zichligini baholash uchun ham ishlatilishi mumkin. Chaddok shkalasi.

Olingan koeffitsientning statistik ahamiyati Student t-testi yordamida baholanadi. Agar hisoblangan t-test qiymati ma'lum miqdordagi erkinlik darajasi uchun jadval qiymatidan kam bo'lsa, kuzatilgan munosabatlar statistik ahamiyatga ega emas. Agar u kattaroq bo'lsa, u holda korrelyatsiya statistik jihatdan ahamiyatli hisoblanadi.


KOLMOGOROV-SMIRNOV USULI

Kolmogorov-Smirnov testi parametrik bo'lmagan moslik testi bo'lib, klassik ma'noda tahlil qilingan namunaning ma'lum bo'lgan taqsimot qonuniga tegishli ekanligi haqidagi oddiy farazlarni tekshirish uchun mo'ljallangan. Ushbu mezonning eng mashhur qo'llanilishi o'rganilayotgan populyatsiyalarni taqsimlanishning normalligini tekshirishdir.

1. Kolmogorov-Smirnov mezonining rivojlanish tarixi

Kolmogorov-Smirnov mezoni sovet matematiklari tomonidan ishlab chiqilgan Andrey Nikolaevich Kolmogorov Va Nikolay Vasilevich Smirnov.
Kolmogorov A.N. (1903-1987) - Sotsialistik Mehnat Qahramoni, Moskva professori davlat universiteti, SSSR Fanlar akademiyasining akademigi - 20-asrning eng buyuk matematigi, asoschilaridan biri zamonaviy nazariya ehtimolliklar.
Smirnov N.V. (1900-1966) - SSSR Fanlar akademiyasining muxbir a'zosi, matematik statistikaning parametrik bo'lmagan usullarini va tartibli statistikaning chegaraviy taqsimotlari nazariyasini yaratuvchilardan biri.

Keyinchalik, Kolmogorov-Smirnov moslik testi amerikalik statistik, Jorj Vashington universiteti professori tomonidan populyatsiyalarning normal taqsimlanishini tekshirish uchun o'zgartirildi. Hubert Lillifors(Hubert Whitman Lilliefors, 1928-2008). Professor Lilliefors foydalanish bo'yicha kashshoflardan biri edi kompyuter uskunalari statistik hisob-kitoblarda.

Hubert Lillifors

2. Nima uchun Kolmogorov-Smirnov mezoni qo'llaniladi?

Ushbu mezon ikkita namunaning taqsimoti o'rtasidagi farqlarning ahamiyatini, shu jumladan o'rganilayotgan namunaning taqsimlanishining normal taqsimot qonuniga muvofiqligini baholash uchun foydalanish imkoniyatini baholashga imkon beradi.

3. Kolmogorov-Smirnov mezonidan qanday hollarda foydalanish mumkin?

Kolmogorov-Smirnov testi miqdoriy ma'lumotlar to'plamining normal taqsimlanishini tekshirish uchun mo'ljallangan.

Olingan ma'lumotlarning ishonchliligi uchun ko'rib chiqilayotgan namunalarning hajmlari etarlicha katta bo'lishi kerak: n ≥ 50. Hisoblangan populyatsiyaning hajmi 25 dan 50 elementgacha bo'lganida, Bolshev tuzatishidan foydalanish tavsiya etiladi.

4. Kolmogorov-Smirnov mezonini qanday hisoblash mumkin?

Kolmogorov-Smirnov mezoni maxsus statistik dasturlar yordamida hisoblanadi. U shaklning statistik ma'lumotlariga asoslanadi:

Qayerda sup S- S to'plamining yuqori qismi, Fn- o'rganilayotgan aholining taqsimlanish funktsiyasi; F(x)- normal taqsimot funksiyasi

Xulosa qilingan ehtimollik qiymatlari normal taqsimotning o'rtacha va standart og'ishi apriori ma'lum va ma'lumotlardan hisoblanmaydi degan taxminga asoslanadi.

Biroq, amalda, odatda, parametrlar to'g'ridan-to'g'ri ma'lumotlardan hisoblanadi. Bunday holda, normallik testi kompozit gipotezani o'z ichiga oladi ("ma'lumotlardan hisoblangan o'rtacha va standart og'ishlarga qarab, bu yoki undan kattaroq ahamiyatga ega bo'lgan D statistikasini olish qanchalik ehtimol") va Lilliefors ehtimolliklari berilgan (Lilliefors, 1967). ).

5. Kolmogorov-Smirnov testining qiymati qanday izohlanadi?

Agar D Kolmogorov-Smirnov statistikasi muhim bo'lsa (s<0,05), то гипотеза о том, что соответствующее распределение нормально, должна быть отвергнута.


ROSSIYA FEDERATSIYASI PREZIDENTI huzuridagi ROSSIYA XALQ IQTISODIYoTI VA DAVLAT XIZMATI AKADEMİYASI

ORYOL FILIALI

Menejmentda matematika va matematik usullar kafedrasi

Mustaqil ish

Matematika

“Variatsion qatorlar va uning xususiyatlari” mavzusida

Iqtisodiyot va menejment fakultetining kunduzgi bo'limi talabalari uchun

"Inson resurslarini boshqarish" ta'lim yo'nalishlari


Ishning maqsadi: Matematik statistika tushunchalari va birlamchi ma'lumotlarni qayta ishlash usullarini o'zlashtirish.

Oddiy muammolarni echishga misol.

Vazifa 1.

So'rov orqali quyidagi ma'lumotlar olingan ():

1 2 3 2 2 4 3 3 5 1 0 2 4 3 2 2 3 3 1 3 2 4 2 4 3 3 3 2 0 6

3 3 1 1 2 3 1 4 3 1 7 4 3 4 2 3 2 3 3 1 4 3 1 4 5 3 4 2 4 5

3 6 4 1 3 2 4 1 3 1 0 0 4 6 4 7 4 1 3 5

Kerakli:

1) Variatsion qatorni tuzing (namunaning statistik taqsimoti), oldindan tartiblangan diskret variantlar seriyasini yozib qo'ying.

2) chastotali ko‘pburchakni tuzing va to‘plang.

3) Nisbiy chastotalar (chastotalar) taqsimoti seriyasini tuzing.

4) Variatsion qatorning asosiy sonli xarakteristikalarini toping (ularni topish uchun soddalashtirilgan formulalardan foydalaning): a) o‘rtacha arifmetik, b) mediana. Meh va moda Mo, c) dispersiya s 2, d) standart og'ish s, e) o'zgaruvchanlik koeffitsienti V.

5) Olingan natijalarning ma'nosini tushuntiring.

Yechim.

1) Kompilyatsiya qilish uchun diskret variantlar qatorini tartiblangan Keling, so'rov ma'lumotlarini hajmi bo'yicha saralaymiz va ularni o'sish tartibida joylashtiramiz

0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2

3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

5 5 5 5 6 6 6 7 7.

Jadvalning birinchi qatoriga kuzatilgan qiymatlarni (variantlarni) va ikkinchi qatorga mos keladigan chastotalarni yozish orqali variatsiya qatorini tuzamiz (1-jadval).

1-jadval.

2) Chastotali ko'pburchak - bu nuqtalarni bog'laydigan siniq chiziq ( x i; n i), i=1, 2,…, m, Qayerda m X.

Variatsion qator chastotalar poligonini tasvirlaymiz (1-rasm).

1-rasm. Chastotali poligon

Diskret oʻzgaruvchanlik qatori uchun yigʻma egri chiziq (kumulyativ) nuqtalarni bogʻlovchi siniq chiziqni ifodalaydi. x i; n i nak), i=1, 2,…, m.

Keling, to'plangan chastotalarni topamiz n i nak(to'plangan chastota xarakterli qiymat kamroq bo'lgan nechta variant kuzatilganligini ko'rsatadi X). Topilgan qiymatlarni 1-jadvalning uchinchi qatoriga kiritamiz.



Keling, kumulyativ tuzamiz (2-rasm).

2-rasm. Kumulatlar

3) Nisbiy chastotalarni (chastotalarni) topamiz, bu erda , qayerda m– har xil xarakterli qiymatlar soni X, biz teng aniqlik bilan hisoblaymiz.

Nisbiy chastotalarning (chastotalarning) taqsimot qatorini 2-jadval shaklida yozamiz

jadval 2

4) Variatsion qatorning asosiy sonli xarakteristikalarini topamiz:

a) O'rtacha arifmetikni soddalashtirilgan formuladan foydalanib toping:

,

shartli variantlar qayerda

Keling, qo'ying Bilan= 3 (o'rtacha kuzatilgan qiymatlardan biri), k= 1 (ikki qo'shni variant o'rtasidagi farq) va hisoblash jadvalini tuzing (3-jadval).

3-jadval.

x i n i u men u i n i u i 2 n i
-3 -12
-2 -26
-1 -14
so'm -11

Keyin o'rtacha arifmetik

b) median Meh variatsion qator - kuzatuvlarning tartiblangan qatorining o'rtasiga tushadigan xarakteristikaning qiymati. Ushbu diskret o'zgarishlar qatori juft sonli atamalarni o'z ichiga oladi ( n=80), bu median ikki o'rta variant yig'indisining yarmiga teng ekanligini anglatadi.

Moda Mo variatsion qator eng yuqori chastotaga mos keladigan variant deb ataladi. Berilgan variatsiya seriyasi uchun eng yuqori chastota n max = 24 variantga mos keladi X= 3, modani bildiradi Mo=3.

c) Farqlanish s 2, bu indikatorning mumkin bo'lgan qiymatlarining tarqalishining o'lchovidir X uning o'rtacha qiymati atrofida, biz uni soddalashtirilgan formuladan foydalanib topamiz:

, Qayerda u men- shartli variantlar

3-jadvalga oraliq hisob-kitoblarni ham kiritamiz.

Keyin farq

d) standart og'ish s formuladan foydalanib topamiz:

.

e) o'zgaruvchanlik koeffitsienti V: (),

O'zgaruvchanlik koeffitsienti o'lchovsiz kattalikdir, shuning uchun u tarqalishni solishtirish uchun mos keladi. variatsion qator, variantlari turli o'lchamlarga ega.

O'zgaruvchanlik koeffitsienti

.

5) Olingan natijalarning ma'nosi shundaki, qiymat xarakteristikaning o'rtacha qiymatini tavsiflaydi X ko'rib chiqilayotgan namuna doirasida, ya'ni o'rtacha qiymat 2,86 ni tashkil etdi. Standart og'ish s indikator qiymatlarining mutlaq tarqalishini tavsiflaydi X va bu holda ga teng s≈ 1,55. O'zgaruvchanlik koeffitsienti V ko'rsatkichning nisbiy o'zgaruvchanligini tavsiflaydi X, ya'ni nisbiy tarqalishi uning o'rtacha qiymati atrofida va bu holda .

Javob: ; ; ; .

Vazifa 2.

Markaziy Rossiyadagi 40 ta eng yirik banklarning o'z kapitali to'g'risida quyidagi ma'lumotlar mavjud:

12,0 49,4 22,4 39,3 90,5 15,2 75,0 73,0 62,3 25,2
70,4 50,3 72,0 71,6 43,7 68,3 28,3 44,9 86,6 61,0
41,0 70,9 27,3 22,9 88,6 42,5 41,9 55,0 56,9 68,1
120,8 52,4 42,0 119,3 49,6 110,6 54,5 99,3 111,5 26,1

Kerakli:

1) Intervalli variatsion qatorni tuzing.

2) O'rtacha tanlamani va tanlov dispersiyasini hisoblang

3) Standart og'ish va o'zgarish koeffitsientini toping.

4) Chastotalar taqsimotining gistogrammasini tuzing.

Yechim.

1) Keling, ixtiyoriy oraliq sonini tanlaymiz, masalan, 8. U holda intervalning kengligi:

.

Keling, hisoblash jadvalini tuzamiz:

Intervalli variant, x k –x k +1 Chastotasi, n i Intervalning o'rtasida x i Shartli variant, va men va men n i va men 2 n i (va i+ 1) 2 n i
10 – 25 17,5 – 3 – 12
25 – 40 32,5 – 2 – 10
40 – 55 47,5 – 1 – 11
55 – 70 62,5
70 – 85 77,5
85 – 100 92,5
100 – 115 107,5
115 – 130 122,5
so'm – 5

Nol sifatida tanlangan qiymat c= 62.5 (bu variant taxminan variatsiya seriyasining o'rtasida joylashgan) .

Shartli variantlar formula bilan aniqlanadi

Zamonaviy ilmiy ishlanmalarni amalga oshirishda ayniqsa muhim bo'lgan katta hajmdagi ma'lumotlarni qayta ishlashda tadqiqotchi oldida manba ma'lumotlarini to'g'ri guruhlash bo'yicha jiddiy vazifa turibdi. Agar ma'lumotlar diskret xarakterga ega bo'lsa, biz ko'rganimizdek, hech qanday muammo tug'ilmaydi - faqat har bir xususiyatning chastotasini hisoblashingiz kerak. Agar o'rganilayotgan xususiyat mavjud bo'lsa davomiy tabiat (bu amalda keng tarqalgan), keyin xususiyatlarni guruhlash intervallarining optimal sonini tanlash hech qanday ahamiyatsiz vazifa emas.

Uzluksiz tasodifiy o'zgaruvchilarni guruhlash uchun xarakteristikaning butun variatsion diapazoni ma'lum miqdordagi intervallarga bo'linadi. Kimga.

Guruhlangan interval (davomiy) variatsion qator atributning () qiymati bo'yicha tartiblangan intervallar deb ataladi, bu erda r"-chi intervalga tushadigan kuzatuvlar soni yoki nisbiy chastotalar () mos keladigan chastotalar () bilan birga ko'rsatiladi:

Xarakterli qiymat intervallari

mi chastota

ustunli diagramma Va yig'ish (ogiva), Biz tomonidan allaqachon batafsil muhokama qilingan, ma'lumotlarni vizualizatsiya qilishning ajoyib vositasi bo'lib, sizga ma'lumotlar tuzilishi haqida asosiy tasavvurga ega bo'lishga imkon beradi. Bunday grafiklar (1.15-rasm) uzluksiz ma'lumotlar uchun diskret ma'lumotlarga o'xshash tarzda tuziladi, faqat uzluksiz ma'lumotlar har qanday qiymatlarni qabul qilib, ularning mumkin bo'lgan qiymatlari mintaqasini to'liq to'ldirishini hisobga oladi.

Guruch. 1.15.

Shunung uchun gistogramma va kümülatdagi ustunlar bir-biriga tegishi va atribut qiymatlari barcha mumkin bo'lgan chegaralarga to'g'ri kelmaydigan joylarga ega bo'lmasligi kerak.(ya'ni, gistogramma va kümülatlarda abscissa o'qi bo'ylab "teshiklar" bo'lmasligi kerak, ular o'rganilayotgan o'zgaruvchining qiymatlarini o'z ichiga olmaydi, 1.16-rasm). Barning balandligi chastotaga mos keladi - ma'lum bir oraliqda joylashgan kuzatuvlar soni yoki nisbiy chastota - kuzatuvlar nisbati. Intervallar kesishmasligi kerak va odatda bir xil kenglikda.

Guruch. 1.16.

Gistogramma va ko'pburchak ehtimollik zichligi egri chizig'ining taxminiy ko'rsatkichlari (differensial funktsiya) f(x) ehtimollar nazariyasi kursida ko'rib chiqiladigan nazariy taqsimot. Shuning uchun ularning konstruktsiyasi miqdoriy uzluksiz ma'lumotlarni birlamchi statistik qayta ishlashda juda muhimdir - ularning ko'rinishi bo'yicha gipotetik taqsimot qonunini hukm qilish mumkin.

Kümülat - intervalli o'zgarishlar qatorining to'plangan chastotalari (chastotalari) egri chizig'i. Kumulyativ taqsimot funksiyasining grafigi yig‘indisi bilan solishtiriladi F(x), ehtimollik nazariyasi kursida ham muhokama qilingan.

Asosan, gistogramma va kumulyat tushunchalari uzluksiz ma'lumotlar va ularning intervalli o'zgaruvchan qatorlari bilan bog'liq, chunki ularning grafiklari mos ravishda ehtimollik zichligi funktsiyasi va taqsimot funktsiyasining empirik bahosidir.

Intervalli variatsion qatorni qurish intervallar sonini aniqlashdan boshlanadi k. Va bu vazifa, ehtimol, o'rganilayotgan masalada eng qiyin, muhim va bahsli.

Intervallar soni juda kichik bo'lmasligi kerak, chunki bu gistogrammani juda silliq qiladi ( haddan tashqari tekislangan), asl ma'lumotlarning o'zgaruvchanligining barcha xususiyatlarini yo'qotadi - rasmda. 1.17-rasmda siz bir xil ma'lumotlarning qanday grafiklarga ega ekanligini ko'rishingiz mumkin. 1.15, kichikroq intervalli gistogramma yaratish uchun ishlatiladi (chap grafik).

Shu bilan birga, intervallar soni juda katta bo'lmasligi kerak - aks holda biz o'rganilayotgan ma'lumotlarning raqamli o'q bo'ylab tarqalish zichligini taxmin qila olmaymiz: gistogramma etarli darajada silliq bo'lmaydi. (kam tekislangan), bo'sh intervallar bilan, notekis (1.17-rasmga qarang, o'ngdagi grafik).

Guruch. 1.17.

Intervallarning eng maqbul sonini qanday aniqlash mumkin?

1926 yilda Gerbert Sturges o'rganilayotgan xarakteristikaning dastlabki qiymatlarini bo'lish kerak bo'lgan oraliqlar sonini hisoblash formulasini taklif qildi. Ushbu formula haqiqatan ham juda mashhur bo'ldi - ko'pgina statistik darsliklar uni taklif qiladi va ko'plab statistik paketlar sukut bo'yicha undan foydalanadi. Bu qanchalik asosli va barcha holatlarda juda jiddiy savol.

Xo'sh, Sturges formulasi nimaga asoslangan?

binomial taqsimotni ko'rib chiqing)

Do'stlaringizga ulashing yoki o'zingiz uchun saqlang:

Yuklanmoqda...