توزیع پیرسون (توزیع مجذور کای). روش های کلاسیک آمار: آزمون کای دو توزیع Ksi مربع
توزیع کای دو یکی از پرکاربردترین توزیعها در آمار برای آزمون فرضیههای آماری است. بر اساس توزیع مجذور کای، یکی از قویترین تستهای برازش مناسب ساخته شده است - آزمون کایدو پیرسون.
معیار توافق، معیاری برای آزمون فرضیه در مورد قانون مفروض توزیع مجهول است.
آزمون χ2 (خی دو) برای آزمون فرضیه توزیع های مختلف استفاده می شود. این شأن اوست.
فرمول محاسبه معیار برابر است با
که در آن m و m به ترتیب فرکانس های تجربی و نظری هستند
توزیع مورد نظر؛
n تعداد درجات آزادی است.
برای بررسی، باید فرکانس های تجربی (مشاهده شده) و نظری (محاسبه شده با فرض توزیع نرمال) را با هم مقایسه کنیم.
اگر فرکانس های تجربی کاملاً با فرکانس های محاسبه شده یا مورد انتظار منطبق باشند، S (E – T) = 0 و معیار χ2 نیز برابر با صفر خواهد بود. اگر S (E – T) برابر با صفر نباشد، این نشان دهنده اختلاف بین فرکانس های محاسبه شده و فرکانس های تجربی سری است. در چنین مواردی، ارزیابی اهمیت معیار χ2 ضروری است که از نظر تئوری می تواند از صفر تا بی نهایت متغیر باشد. این با مقایسه مقدار واقعی به دست آمده χ2ф با مقدار بحرانی آن (χ2st) انجام می شود.فرضیه صفر، یعنی این فرض که اختلاف بین فرکانس های تجربی و نظری یا مورد انتظار تصادفی است، اگر χ2ф بزرگتر یا مساوی باشد، رد می شود. χ2 برای سطح معناداری پذیرفته شده (a) و تعداد درجات آزادی (n).
توزیع مقادیر احتمالی متغیر تصادفی χ2 پیوسته و نامتقارن است. به تعداد درجات آزادی (n) بستگی دارد و با افزایش تعداد مشاهدات به توزیع نرمال نزدیک می شود. بنابراین، استفاده از معیار χ2 در ارزیابی توزیع های گسستهبا برخی از خطاها همراه است که بر ارزش آن تأثیر می گذارد، به ویژه در نمونه های کوچک. برای به دست آوردن تخمین های دقیق تر، نمونه ای در سری تغییرات، باید حداقل 50 گزینه داشته باشد. استفاده صحیح از معیار χ2 همچنین مستلزم آن است که فرکانس انواع در کلاس های شدید نباید کمتر از 5 باشد. اگر تعداد آنها کمتر از 5 باشد، آنگاه با فرکانس های کلاس های همسایه ترکیب می شوند تا مقدار کل بزرگتر یا مساوی 5 باشد. با توجه به ترکیب فرکانس ها، تعداد کلاس ها (N) کاهش می یابد. تعداد درجات آزادی با در نظر گرفتن تعداد محدودیتهای آزادی تنوع توسط تعداد ثانویه کلاسها تعیین میشود.
از آنجایی که دقت تعیین معیار χ2 تا حد زیادی به دقت محاسبه فرکانس های نظری (T) بستگی دارد، باید از فرکانس های نظری نامحدود برای به دست آوردن تفاوت بین فرکانس های تجربی و محاسبه شده استفاده شود.
به عنوان مثال، اجازه دهید یک مطالعه منتشر شده در یک وب سایت اختصاص داده شده به استفاده از روش های آماریدر علوم انسانی
آزمون Chi-square به شما امکان می دهد تا توزیع های فرکانس را بدون توجه به اینکه آیا آنها به طور معمول توزیع شده اند یا نه، مقایسه کنید.
فرکانس به تعداد وقوع یک رویداد اشاره دارد. معمولاً زمانی به فراوانی وقوع رویدادها پرداخته میشود که متغیرها در مقیاسی از نامها اندازهگیری میشوند و سایر ویژگیهای آنها علاوه بر فراوانی، غیرممکن یا مشکلساز است. به عبارت دیگر زمانی که یک متغیر دارای ویژگی های کیفی باشد. همچنین، بسیاری از محققان تمایل دارند نمرات آزمون را به سطوح (بالا، متوسط، پایین) تبدیل کنند و جداول توزیع نمره را برای یافتن تعداد افراد در این سطوح بسازند. برای اثبات اینکه در یکی از سطوح (در یکی از دسته ها) تعداد افراد واقعا بیشتر (کمتر) است از ضریب کای دو نیز استفاده می شود.
بیایید ساده ترین مثال را بررسی کنیم.
آزمونی در بین نوجوانان جوانتر برای شناسایی عزت نفس انجام شد. نمرات آزمون به سه سطح بالا، متوسط، پایین تبدیل شد. فرکانس ها به شرح زیر توزیع شدند:
بالا (B) 27 نفر.
میانگین (C) 12 نفر.
کم (L) 11 نفر
بدیهی است که اکثریت کودکان عزت نفس بالایی دارند، اما این نیاز به اثبات آماری دارد. برای این کار از آزمون Chi-square استفاده می کنیم.
وظیفه ما بررسی این است که آیا داده های تجربی به دست آمده با داده های نظری به همان اندازه محتمل متفاوت است یا خیر. برای این کار باید فرکانس های نظری را پیدا کنید. در مورد ما، فرکانس های نظری فرکانس های احتمالی یکسانی هستند که با جمع کردن همه فرکانس ها و تقسیم بر تعداد دسته ها پیدا می شوند.
در مورد ما:
(B + C + H)/3 = (27+12+11)/3 = 16.6
فرمول محاسبه آزمون کای اسکوئر:
χ2 = ∑(E - T)I / T
جدول را می سازیم:
جمع آخرین ستون را پیدا کنید:
اکنون باید مقدار بحرانی معیار را با استفاده از جدول مقادیر بحرانی (جدول 1 در پیوست) پیدا کنید. برای این کار به تعداد درجات آزادی (n) نیاز داریم.
n = (R - 1) * (C - 1)
که در آن R تعداد سطرهای جدول، C تعداد ستون ها است.
در مورد ما، تنها یک ستون (به معنی فرکانس های تجربی اصلی) و سه ردیف (دسته ها) وجود دارد، بنابراین فرمول تغییر می کند - ما ستون ها را حذف می کنیم.
n = (R - 1) = 3-1 = 2
برای احتمال خطا p≤0.05 و n = 2، مقدار بحرانی χ2 = 5.99 است.
مقدار تجربی بهدستآمده بیشتر از مقدار بحرانی است - تفاوتها در فرکانسها معنیدار هستند (9.64=χ2؛ 05/0p≤).
همانطور که می بینید، محاسبه معیار بسیار ساده است و زمان زیادی نمی برد. ارزش عملی آزمون کای اسکوئر بسیار زیاد است. این روش هنگام تجزیه و تحلیل پاسخ به پرسشنامه ها بیشترین ارزش را دارد.
بیایید به یک مثال پیچیده تر نگاه کنیم.
به عنوان مثال، یک روانشناس می خواهد بداند که آیا این درست است که معلمان نسبت به پسران بیشتر از دختران تعصب دارند؟ آن ها بیشتر احتمال دارد از دختران تمجید کند. برای انجام این کار، روانشناس خصوصیات دانش آموزان نوشته شده توسط معلمان را برای فراوانی وقوع سه کلمه "فعال"، "کوشا"، "منضبط" تجزیه و تحلیل کرد و مترادف کلمات نیز شمارش شد. داده های مربوط به فراوانی وقوع کلمات در جدول وارد شد:
برای پردازش داده های به دست آمده از آزمون کای اسکوئر استفاده می کنیم.
برای انجام این کار، جدولی از توزیع فرکانس های تجربی می سازیم. فرکانس هایی که مشاهده می کنیم:
از نظر تئوری، ما انتظار داریم که فرکانس ها به طور مساوی توزیع شوند، یعنی. فرکانس به طور متناسب بین پسران و دختران توزیع خواهد شد. بیایید جدولی از فرکانس های نظری بسازیم. برای انجام این کار، مجموع ردیف را در مجموع ستون ضرب کنید و عدد حاصل را بر مجموع کل (s) تقسیم کنید.
جدول نهایی برای محاسبات به صورت زیر خواهد بود:
χ2 = ∑(E - T)I / T
n = (R - 1)، که در آن R تعداد ردیف های جدول است.
در مورد ما، خی دو = 4.21; n = 2.
با استفاده از جدول مقادیر بحرانی معیار، متوجه می شویم: با n = 2 و سطح خطای 0.05، مقدار بحرانی χ2 = 5.99 است.
مقدار به دست آمده کمتر از مقدار بحرانی است، به این معنی که فرضیه صفر پذیرفته شده است.
نتیجه گیری: معلمان هنگام نوشتن ویژگی های کودک به جنسیت کودک اهمیت نمی دهند.
نتیجه.
K. Pearson سهم قابل توجهی در توسعه داشت آمار ریاضی(تعداد زیادی از مفاهیم اساسی). موضع اصلی فلسفی پیرسون به این صورت است که: مفاهیم علم، ساخت های مصنوعی، ابزاری برای توصیف و نظم دادن به تجربه حسی هستند. قواعد اتصال آنها به جملات علمی توسط دستور زبان علم، که فلسفه علم است، جدا شده است. رشته جهانی - آمار کاربردی - به ما امکان می دهد مفاهیم و پدیده های متفاوت را به هم متصل کنیم، اگرچه به گفته پیرسون این موضوع ذهنی است.
بسیاری از سازه های کی پیرسون مستقیماً مرتبط هستند یا با استفاده از مواد مردم شناسی توسعه یافته اند. او روشهای متعددی برای طبقهبندی عددی و معیارهای آماری مورد استفاده در همه حوزههای علم ایجاد کرد.
ادبیات.
1. Bogolyubov A. N. ریاضیات. مکانیک. کتاب مرجع بیوگرافی. - کیف: ناوکوا دومکا، 1983.
2. Kolmogorov A. N., Yushkevich A. P. (ویراستار). ریاضیات قرن نوزدهم. - م.: علم. - تی آی.
3. 3. Borovkov A.A. آمار ریاضی M.: Nauka، 1994.
4. 8. فلر V. مقدمه ای بر نظریه احتمال و کاربردهای آن. - م.: میر، ت.2، 1984.
5. 9. هارمن جی، تحلیل عاملی مدرن. - م.: آمار، 1972.
قبل از اواخر نوزدهمقرن، توزیع نرمال قانون جهانی تنوع در داده ها در نظر گرفته شد. با این حال، K. Pearson اشاره کرد که فرکانس های تجربی می توانند تا حد زیادی با توزیع نرمال متفاوت باشند. این سوال مطرح شد که چگونه می توان این را ثابت کرد. نه تنها یک مقایسه گرافیکی، که ذهنی است، لازم بود، بلکه یک توجیه کمی دقیق نیز لازم بود.
اینگونه معیار اختراع شد χ 2(کای مربع)، که اهمیت اختلاف بین فرکانس های تجربی (مشاهده شده) و نظری (مورد انتظار) را آزمایش می کند. این در سال 1900 اتفاق افتاد، اما این معیار هنوز در حال استفاده است. علاوه بر این، برای حل طیف گسترده ای از مشکلات سازگار شده است. اول از همه، این تجزیه و تحلیل داده های طبقه بندی است، یعنی. آنهایی که نه با کمیت، بلکه با تعلق به دسته ای بیان می شوند. به عنوان مثال، کلاس ماشین، جنسیت شرکت کننده آزمایش، نوع گیاه و غیره. عملیات ریاضی مانند جمع و ضرب را نمی توان برای چنین داده هایی اعمال کرد، فرکانس ها را فقط می توان برای آنها محاسبه کرد.
فرکانس های مشاهده شده را نشان می دهیم درباره (مشاهده شده)، انتظار می رود - E (مورد انتظار). به عنوان مثال، نتیجه 60 بار چرخاندن قالب را در نظر می گیریم. اگر متقارن و یکنواخت باشد، احتمال گرفتن هر ضلع 1/6 است و بنابراین تعداد مورد انتظار گرفتن هر ضلع 10 (1/6∙60) است. فرکانس های مشاهده شده و مورد انتظار را در جدول می نویسیم و هیستوگرام رسم می کنیم.
فرضیه صفر این است که فرکانس ها سازگار هستند، یعنی داده های واقعی با داده های مورد انتظار مغایرت ندارند. یک فرضیه جایگزین این است که انحرافات در فرکانس ها فراتر از نوسانات تصادفی است، اختلافات از نظر آماری معنی دار هستند. برای نتیجه گیری دقیق، ما نیاز داریم.
- اندازه گیری خلاصه ای از اختلاف بین فرکانس های مشاهده شده و مورد انتظار.
- توزیع این اندازه گیری در صورتی که فرضیه عدم وجود تفاوت درست باشد.
بیایید با فاصله بین فرکانس ها شروع کنیم. اگر فقط تفاوت را در نظر بگیرید O - E، پس چنین اندازه گیری به مقیاس داده ها (فرکانس ها) بستگی دارد. به عنوان مثال، 20 - 5 = 15 و 1020 - 1005 = 15. در هر دو مورد، تفاوت 15 است. اما در حالت اول، فرکانس های مورد انتظار 3 برابر کمتر از موارد مشاهده شده و در حالت دوم - فقط 1.5 است. ٪. ما به یک معیار نسبی نیاز داریم که به مقیاس بستگی نداشته باشد.
اجازه دهید به حقایق زیر توجه کنیم. به طور کلی، تعداد دستههایی که فرکانسها در آنها اندازهگیری میشوند، میتواند بسیار بیشتر باشد، بنابراین احتمال اینکه یک مشاهده منفرد در یک دسته یا دسته دیگر قرار گیرد بسیار کم است. اگر چنین است، پس توزیع چنین متغیر تصادفی از قانون رویدادهای نادر، معروف به قانون پواسون. در قانون پواسون، همانطور که مشخص است، مقدار انتظارات ریاضی و واریانس بر هم منطبق هستند (پارامتر λ ). این بدان معنی است که فرکانس مورد انتظار برای برخی از دسته های متغیر اسمی است E iهمزمان و پراکندگی آن خواهد بود. علاوه بر این، قانون پواسون با تعداد زیادی مشاهدات به حالت عادی گرایش دارد. با ترکیب این دو واقعیت، به این نتیجه می رسیم که اگر فرضیه تطابق بین فرکانس های مشاهده شده و مورد انتظار درست باشد، آنگاه، با تعداد زیادی مشاهدات، اصطلاح
مهم است که به یاد داشته باشید که نرمال بودن فقط در فرکانس های به اندازه کافی بالا ظاهر می شود. در آمار، به طور کلی پذیرفته شده است که تعداد کل مشاهدات (مجموع فرکانس ها) باید حداقل 50 باشد و فرکانس مورد انتظار در هر درجه بندی باید حداقل 5 باشد. فقط در این مورد، مقدار نشان داده شده در بالا دارای توزیع نرمال استاندارد است. . فرض کنیم این شرط برقرار است.
توزیع نرمال استاندارد تقریباً همه مقادیر را در 3± (قاعده سه سیگما) دارد. بنابراین، ما تفاوت نسبی در فرکانس ها را برای یک درجه بندی به دست آوردیم. ما به یک معیار قابل تعمیم نیاز داریم. شما نمی توانید فقط تمام انحرافات را جمع کنید - ما 0 را دریافت می کنیم (حدس بزنید چرا). پیرسون پیشنهاد کرد مجذورهای این انحرافات را جمع کنید.
این نشانه است آزمون Chi-Square پیرسون. اگر فرکانسها واقعاً با فرکانسهای مورد انتظار مطابقت داشته باشند، ارزش معیار نسبتاً کوچک خواهد بود (زیرا اکثر انحرافات در حدود صفر هستند). اما اگر معیار بزرگ باشد، این نشان دهنده تفاوت قابل توجهی بین فرکانس ها است.
معیار پیرسون زمانی "بزرگ" می شود که وقوع چنین یا حتی بیشتر از آن بعید باشد. و برای محاسبه چنین احتمالی، لازم است که توزیع معیار را زمانی که آزمایش بارها تکرار می شود، زمانی که فرضیه توافق فرکانس صحیح است، دانست.
همانطور که به راحتی قابل مشاهده است، مقدار خی دو به تعداد عبارت ها نیز بستگی دارد. هرچه تعداد آنها بیشتر باشد، ارزش معیار باید بیشتر باشد، زیرا هر عبارت به کل کمک می کند. بنابراین، برای هر مقدار مستقلشرایط، توزیع خود را وجود خواهد داشت. معلوم می شود که χ 2یک خانواده کامل از توزیع ها است.
و در اینجا به یک لحظه حساس می رسیم. عدد چیست مستقلمقررات؟ به نظر می رسد هر اصطلاحی (یعنی انحراف) مستقل است. کی پیرسون نیز چنین فکر می کرد، اما معلوم شد که اشتباه می کند. در واقع تعداد عبارت های مستقل یک کمتر از تعداد درجه بندی های متغیر اسمی خواهد بود n. چرا؟ زیرا اگر نمونهای داشته باشیم که مجموع فرکانسها قبلاً محاسبه شده باشد، همیشه میتوان یکی از فرکانسها را به عنوان تفاوت بین تعداد کل و مجموع همه فرکانسها تعیین کرد. از این رو این تنوع تا حدودی کمتر خواهد بود. رونالد فیشر 20 سال پس از آنکه پیرسون معیار خود را توسعه داد متوجه این واقعیت شد. حتی میزها باید دوباره درست می شدند.
به همین مناسبت، فیشر مفهوم جدیدی را وارد آمار کرد - میزان آزادی(درجات آزادی)، که نشان دهنده تعداد اصطلاحات مستقل در مجموع است. مفهوم درجات آزادی توضیحی ریاضی دارد و فقط در توزیع های مرتبط با نرمال ظاهر می شود (Student's، Fisher-Snedecor و خود chi-square).
برای درک بهتر معنای درجات آزادی، اجازه دهید به یک آنالوگ فیزیکی بپردازیم. بیایید یک نقطه را تصور کنیم که آزادانه در فضا حرکت می کند. 3 درجه آزادی دارد، زیرا می تواند در هر جهت در فضای سه بعدی حرکت کند. اگر نقطه ای در امتداد هر سطحی حرکت کند، آنگاه دو درجه آزادی (جلو و عقب، چپ و راست) دارد، اگرچه همچنان در فضای سه بعدی قرار دارد. نقطه ای که در امتداد چشمه حرکت می کند دوباره در فضای سه بعدی قرار دارد، اما تنها یک درجه آزادی دارد، زیرا می تواند به جلو یا عقب حرکت کند. همانطور که می بینید، فضایی که جسم در آن قرار دارد همیشه با آزادی حرکت واقعی مطابقت ندارد.
تقریباً به همین ترتیب، توزیع یک معیار آماری ممکن است به تعداد عناصر کمتری نسبت به شرایط مورد نیاز برای محاسبه آن بستگی داشته باشد. به طور کلی، تعداد درجات آزادی کمتر از تعداد مشاهدات بر اساس تعداد وابستگی های موجود است.
بنابراین، توزیع کای دو ( χ 2) خانواده ای از توزیع ها است که هر کدام به پارامتر درجه آزادی بستگی دارد. و تعریف رسمی آزمون کای اسکوئر به شرح زیر است. توزیع χ 2(chi-square) s کدرجه آزادی توزیع مجموع مربعات است کمتغیرهای تصادفی عادی استاندارد مستقل
در مرحله بعد، میتوانیم به خود فرمول برویم که تابع توزیع کایدو محاسبه میشود، اما خوشبختانه، همه چیز برای ما مدتهاست محاسبه شده است. برای به دست آوردن احتمال علاقه، می توانید از جدول آماری مناسب یا یک تابع آماده در اکسل استفاده کنید.
جالب است ببینید که چگونه شکل توزیع کای دو بسته به تعداد درجات آزادی تغییر می کند.
با افزایش درجات آزادی، توزیع کای دو نرمال است. این با عمل قضیه حد مرکزی توضیح داده می شود که بر اساس آن مجموع تعداد زیادی از متغیرهای تصادفی مستقل دارای توزیع نرمال است. در مورد مربع چیزی نمی گوید)).
آزمون فرضیه با استفاده از آزمون کای اسکوئر پیرسون
حال به آزمون فرضیه ها با استفاده از روش کای دو می رسیم. به طور کلی، فناوری باقی می ماند. فرضیه صفر این است که فرکانس های مشاهده شده با فرکانس های مورد انتظار مطابقت دارند (یعنی هیچ تفاوتی بین آنها وجود ندارد زیرا آنها از یک جمعیت گرفته شده اند). اگر اینطور باشد، پراکندگی نسبتاً کوچک و در محدوده نوسانات تصادفی خواهد بود. اندازه گیری پراکندگی با استفاده از آزمون کای دو تعیین می شود. سپس، یا خود معیار با مقدار بحرانی مقایسه می شود (برای سطح معنی داری و درجات آزادی متناظر)، یا درست تر، مقدار p مشاهده شده محاسبه می شود، یعنی. احتمال به دست آوردن مقدار معیار یکسان یا حتی بیشتر در صورت صحت فرضیه صفر.
زیرا ما علاقه مند به توافق فرکانس ها هستیم، در این صورت زمانی که معیار بزرگتر از سطح بحرانی باشد، این فرضیه رد می شود. آن ها معیار یک طرفه است با این حال، گاهی (گاهی) لازم است که فرضیه سمت چپ را آزمایش کنیم. به عنوان مثال، زمانی که داده های تجربی بسیار شبیه به داده های نظری هستند. سپس معیار ممکن است در یک منطقه بعید باشد، اما در سمت چپ. واقعیت این است که در شرایط طبیعی، بعید است که فرکانس هایی را به دست آوریم که عملاً با فرکانس های نظری منطبق باشد. همیشه یک مقدار تصادفی وجود دارد که خطا می دهد. اما اگر چنین خطایی وجود نداشته باشد، احتمالاً داده ها جعل شده اند. اما با این حال، فرضیه سمت راست معمولاً آزمایش می شود.
بیایید به مسئله تاس برگردیم. اجازه دهید با استفاده از داده های موجود، مقدار آزمون کای دو را محاسبه کنیم.
حالا بیایید مقدار بحرانی را در 5 درجه آزادی پیدا کنیم ( ک) و سطح معنی داری 0.05 ( α با توجه به جدول مقادیر بحرانی توزیع کای دو.
یعنی کمیک 0.05 یک توزیع مجذور کای (دم سمت راست) با 5 درجه آزادی است. χ 2 0.05; 5 = 11,1.
بیایید مقادیر واقعی و جدول بندی شده را با هم مقایسه کنیم. 3.4 ( χ 2) < 11,1 (χ 2 0.05; 5). معیار محاسبه شده کوچکتر است، به این معنی که فرضیه برابری (توافق) فرکانس ها رد نمی شود. در شکل، وضعیت به این صورت است.
اگر مقدار محاسبه شده در ناحیه بحرانی باشد، فرض صفر رد می شود.
درست تر است که مقدار p را نیز محاسبه کنیم. برای انجام این کار، باید نزدیکترین مقدار را در جدول برای تعداد معینی از درجه آزادی پیدا کنید و به سطح اهمیت مربوطه نگاه کنید. اما این قرن آخر. ما از یک کامپیوتر، به ویژه MS Excel استفاده خواهیم کرد. اکسل چندین توابع مرتبط با مربع کای دارد.
در زیر شرح مختصری از آنها آورده شده است.
CH2.OBR- مقدار بحرانی معیار در یک احتمال معین در سمت چپ (مانند جداول آماری)
CH2.OBR.PH- ارزش بحرانی معیار برای یک احتمال معین در سمت راست. تابع اساساً تابع قبلی را کپی می کند. اما در اینجا می توانید بلافاصله سطح را نشان دهید α ، به جای کم کردن آن از 1. این راحت تر است، زیرا در بیشتر موارد، این دم سمت راست توزیع است که مورد نیاز است.
CH2.DIST- مقدار p در سمت چپ (چگالی قابل محاسبه است).
CH2.DIST.PH– p-value در سمت راست.
CHI2.TEST– فوراً آزمایش کای دو را برای دو محدوده فرکانس انجام می دهد. تعداد درجات آزادی یک کمتر از تعداد فرکانسهای ستون (همانطور که باید باشد) در نظر گرفته میشود و یک مقدار p برمیگرداند.
بیایید برای آزمایش خود مقدار بحرانی (جدولی) را برای 5 درجه آزادی و آلفا 0.05 محاسبه کنیم. فرمول اکسل به شکل زیر خواهد بود:
CH2.OBR(0.95;5)
CH2.OBR.PH(0.05;5)
نتیجه یکسان خواهد بود - 11.0705. این مقداری است که در جدول می بینیم (به 1 رقم اعشار گرد شده است).
اجازه دهید در نهایت مقدار p را برای معیار 5 درجه آزادی محاسبه کنیم χ 2= 3.4. ما به احتمال سمت راست نیاز داریم، بنابراین تابع را با اضافه کردن HH (دم سمت راست) می گیریم.
CH2.DIST.PH(3.4;5) = 0.63857
یعنی با 5 درجه آزادی احتمال به دست آوردن مقدار معیار است χ 2= 3.4 و بیشتر برابر با 64٪ است. به طور طبیعی، فرضیه رد نمی شود (p-value بیشتر از 5٪ است، فرکانس ها مطابقت بسیار خوبی دارند.
حال بیایید با استفاده از آزمون مجذور کای و تابع اکسل CHI2.TEST، فرضیه توافق فرکانس ها را بررسی کنیم.
بدون جدول، بدون محاسبات دست و پا گیر. با تعیین ستون هایی با فرکانس های مشاهده شده و مورد انتظار به عنوان آرگومان های تابع، بلافاصله مقدار p را بدست می آوریم. زیبایی
حالا تصور کنید که با یک مرد مشکوک تاس بازی می کنید. توزیع امتیازات از 1 تا 5 ثابت می ماند، اما او 26 عدد شش می زند (تعداد کل پرتاب ها 78 می شود).
مقدار p در این مورد 0.003 است که بسیار کمتر از 0.05 است. دلایل خوبی برای شک در اعتبار تاس وجود دارد. در اینجا این احتمال در نمودار توزیع خی دو به نظر می رسد.
خود معیار کای اسکوئر در اینجا 17.8 است که طبیعتاً از جدول یک (11.1) بزرگتر است.
امیدوارم تونسته باشم توضیح بدم که ملاک توافق چیه χ 2(Pearson chi-square) و اینکه چگونه می توان از آن برای آزمون فرضیه های آماری استفاده کرد.
در نهایت یک بار دیگر در مورد یک شرط مهم! تست کای اسکوئر فقط زمانی درست کار می کند که تعداد همه فرکانس ها از 50 بیشتر شود و حداقل مقدار مورد انتظار برای هر درجه بندی کمتر از 5 نباشد. اگر در هر دسته ای فرکانس مورد انتظار کمتر از 5 باشد، اما مجموع همه فرکانس ها بیشتر از آن باشد. در صورت عدم امکان یا مجموع فرکانس ها کمتر از 50، باید از روش های دقیق تری برای آزمون فرضیه ها استفاده کرد. در مورد آنها یک بار دیگر صحبت خواهیم کرد.
در زیر ویدیویی در مورد نحوه آزمایش فرضیه در اکسل با استفاده از آزمون کای دو وجود دارد.
اجازه دهید U 1 , U 2 , ..,U k استاندارد مستقل باشند مقادیر نرمال. توزیع متغیر تصادفی K = U 1 2 +U 2 2 + .. + U k 2 را توزیع کای دو با کدرجه آزادی (K~χ 2 (k) را بنویسید). این یک توزیع تک وجهی با چولگی مثبت و ویژگی های زیر است: حالت M=k-2 ارزش مورد انتظار m=k پراکندگی D=2k (شکل). با مقدار کافی از پارامتر کتوزیع χ 2 (k) دارای توزیع تقریباً نرمال با پارامترها است
هنگام حل مسائل آمار ریاضی، بسته به احتمال داده شده α و تعداد درجات آزادی، از نقاط بحرانی χ 2 (k) استفاده می شود. ک(پیوست 2). نقطه بحرانی Χ 2 kr = Χ 2 (k; α) مرز ناحیه ای است که در سمت راست آن 100- α % از سطح زیر منحنی چگالی توزیع قرار دارد. احتمال اینکه مقدار متغیر تصادفی K~χ 2 (k) در طول آزمایش به سمت راست نقطه χ 2 (k) بیفتد از α P(K≥χ 2 kp)≤ α تجاوز نمی کند. به عنوان مثال، برای متغیر تصادفی K~χ 2 (20) ما احتمال α=0.05 را تعیین می کنیم. با استفاده از جدول نقاط بحرانی توزیع کای دو (جدول)، χ 2 kp = χ 2 (20; 0.05) = 31.4 را پیدا می کنیم. این به این معنی است که احتمال این متغیر تصادفی است کمقدار بزرگتر از 31.4، کمتر از 0.05 را بپذیرید (شکل).
برنج. نمودار چگالی توزیع χ 2 (k) برای مقادیر مختلف تعداد درجات آزادی ک
نقاط بحرانی χ 2 (k) در ماشین حساب های زیر استفاده می شود:
- بررسی وجود چند خطی (در مورد چند خطی).
بنابراین، برای بررسی جهت ارتباط، انتخاب کنید تجزیه و تحلیل همبستگیبه ویژه، آزمون فرضیه با استفاده از ضریب همبستگی پیرسون با آزمون بیشتر معناداری با استفاده از آزمون t.
برای هر مقدار از سطح اهمیت α Χ 2 را می توان با استفاده از تابع MS Excel پیدا کرد: =HI2OBR(α؛ درجه آزادی)
n-1 | .995 | .990 | .975 | .950 | .900 | .750 | .500 | .250 | .100 | .050 | .025 | .010 | .005 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 0.00004 | 0.00016 | 0.00098 | 0.00393 | 0.01579 | 0.10153 | 0.45494 | 1.32330 | 2.70554 | 3.84146 | 5.02389 | 6.63490 | 7.87944 |
2 | 0.01003 | 0.02010 | 0.05064 | 0.10259 | 0.21072 | 0.57536 | 1.38629 | 2.77259 | 4.60517 | 5.99146 | 7.37776 | 9.21034 | 10.59663 |
3 | 0.07172 | 0.11483 | 0.21580 | 0.35185 | 0.58437 | 1.21253 | 2.36597 | 4.10834 | 6.25139 | 7.81473 | 9.34840 | 11.34487 | 12.83816 |
4 | 0.20699 | 0.29711 | 0.48442 | 0.71072 | 1.06362 | 1.92256 | 3.35669 | 5.38527 | 7.77944 | 9.48773 | 11.14329 | 13.27670 | 14.86026 |
5 | 0.41174 | 0.55430 | 0.83121 | 1.14548 | 1.61031 | 2.67460 | 4.35146 | 6.62568 | 9.23636 | 11.07050 | 12.83250 | 15.08627 | 16.74960 |
6 | 0.67573 | 0.87209 | 1.23734 | 1.63538 | 2.20413 | 3.45460 | 5.34812 | 7.84080 | 10.64464 | 12.59159 | 14.44938 | 16.81189 | 18.54758 |
7 | 0.98926 | 1.23904 | 1.68987 | 2.16735 | 2.83311 | 4.25485 | 6.34581 | 9.03715 | 12.01704 | 14.06714 | 16.01276 | 18.47531 | 20.27774 |
8 | 1.34441 | 1.64650 | 2.17973 | 2.73264 | 3.48954 | 5.07064 | 7.34412 | 10.21885 | 13.36157 | 15.50731 | 17.53455 | 20.09024 | 21.95495 |
9 | 1.73493 | 2.08790 | 2.70039 | 3.32511 | 4.16816 | 5.89883 | 8.34283 | 11.38875 | 14.68366 | 16.91898 | 19.02277 | 21.66599 | 23.58935 |
10 | 2.15586 | 2.55821 | 3.24697 | 3.94030 | 4.86518 | 6.73720 | 9.34182 | 12.54886 | 15.98718 | 18.30704 | 20.48318 | 23.20925 | 25.18818 |
11 | 2.60322 | 3.05348 | 3.81575 | 4.57481 | 5.57778 | 7.58414 | 10.34100 | 13.70069 | 17.27501 | 19.67514 | 21.92005 | 24.72497 | 26.75685 |
12 | 3.07382 | 3.57057 | 4.40379 | 5.22603 | 6.30380 | 8.43842 | 11.34032 | 14.84540 | 18.54935 | 21.02607 | 23.33666 | 26.21697 | 28.29952 |
13 | 3.56503 | 4.10692 | 5.00875 | 5.89186 | 7.04150 | 9.29907 | 12.33976 | 15.98391 | 19.81193 | 22.36203 | 24.73560 | 27.68825 | 29.81947 |
14 | 4.07467 | 4.66043 | 5.62873 | 6.57063 | 7.78953 | 10.16531 | 13.33927 | 17.11693 | 21.06414 | 23.68479 | 26.11895 | 29.14124 | 31.31935 |
15 | 4.60092 | 5.22935 | 6.26214 | 7.26094 | 8.54676 | 11.03654 | 14.33886 | 18.24509 | 22.30713 | 24.99579 | 27.48839 | 30.57791 | 32.80132 |
16 | 5.14221 | 5.81221 | 6.90766 | 7.96165 | 9.31224 | 11.91222 | 15.33850 | 19.36886 | 23.54183 | 26.29623 | 28.84535 | 31.99993 | 34.26719 |
17 | 5.69722 | 6.40776 | 7.56419 | 8.67176 | 10.08519 | 12.79193 | 16.33818 | 20.48868 | 24.76904 | 27.58711 | 30.19101 | 33.40866 | 35.71847 |
18 | 6.26480 | 7.01491 | 8.23075 | 9.39046 | 10.86494 | 13.67529 | 17.33790 | 21.60489 | 25.98942 | 28.86930 | 31.52638 | 34.80531 | 37.15645 |
19 | 6.84397 | 7.63273 | 8.90652 | 10.11701 | 11.65091 | 14.56200 | 18.33765 | 22.71781 | 27.20357 | 30.14353 | 32.85233 | 36.19087 | 38.58226 |
20 | 7.43384 | 8.26040 | 9.59078 | 10.85081 | 12.44261 | 15.45177 | 19.33743 | 23.82769 | 28.41198 | 31.41043 | 34.16961 | 37.56623 | 39.99685 |
21 | 8.03365 | 8.89720 | 10.28290 | 11.59131 | 13.23960 | 16.34438 | 20.33723 | 24.93478 | 29.61509 | 32.67057 | 35.47888 | 38.93217 | 41.40106 |
22 | 8.64272 | 9.54249 | 10.98232 | 12.33801 | 14.04149 | 17.23962 | 21.33704 | 26.03927 | 30.81328 | 33.92444 | 36.78071 | 40.28936 | 42.79565 |
23 | 9.26042 | 10.19572 | 11.68855 | 13.09051 | 14.84796 | 18.13730 | 22.33688 | 27.14134 | 32.00690 | 35.17246 | 38.07563 | 41.63840 | 44.18128 |
24 | 9.88623 | 10.85636 | 12.40115 | 13.84843 | 15.65868 | 19.03725 | 23.33673 | 28.24115 | 33.19624 | 36.41503 | 39.36408 | 42.97982 | 45.55851 |
25 | 10.51965 | 11.52398 | 13.11972 | 14.61141 | 16.47341 | 19.93934 | 24.33659 | 29.33885 | 34.38159 | 37.65248 | 40.64647 | 44.31410 | 46.92789 |
26 | 11.16024 | 12.19815 | 13.84390 | 15.37916 | 17.29188 | 20.84343 | 25.33646 | 30.43457 | 35.56317 | 38.88514 | 41.92317 | 45.64168 | 48.28988 |
27 | 11.80759 | 12.87850 | 14.57338 | 16.15140 | 18.11390 | 21.74940 | 26.33634 | 31.52841 | 36.74122 | 40.11327 | 43.19451 | 46.96294 | 49.64492 |
28 | 12.46134 | 13.56471 | 15.30786 | 16.92788 | 18.93924 | 22.65716 | 27.33623 | 32.62049 | 37.91592 | 41.33714 | 44.46079 | 48.27824 | 50.99338 |
29 | 13.12115 | 14.25645 | 16.04707 | 17.70837 | 19.76774 | 23.56659 | 28.33613 | 33.71091 | 39.08747 | 42.55697 | 45.72229 | 49.58788 | 52.33562 |
30 | 13.78672 | 14.95346 | 16.79077 | 18.49266 | 20.59923 | 24.47761 | 29.33603 | 34.79974 | 40.25602 | 43.77297 | 46.97924 | 50.89218 | 53.67196 |
تعداد درجات آزادی ک | سطح اهمیت الف | |||||
0,01 | 0,025 | 0.05 | 0,95 | 0,975 | 0.99 | |
1 | 6.6 | 5.0 | 3.8 | 0.0039 | 0.00098 | 0.00016 |
2 | 9.2 | 7.4 | 6.0 | 0.103 | 0.051 | 0.020 |
3 | 11.3 | 9.4 | 7.8 | 0.352 | 0.216 | 0.115 |
4 | 13.3 | 11.1 | 9.5 | 0.711 | 0.484 | 0.297 |
5 | 15.1 | 12.8 | 11.1 | 1.15 | 0.831 | 0.554 |
6 | 16.8 | 14.4 | 12.6 | 1.64 | 1.24 | 0.872 |
7 | 18.5 | 16.0 | 14.1 | 2.17 | 1.69 | 1.24 |
8 | 20.1 | 17.5 | 15.5 | 2.73 | 2.18 | 1.65 |
9 | 21.7 | 19.0 | 16.9 | 3.33 | 2.70 | 2.09 |
10 | 23.2 | 20.5 | 18.3 | 3.94 | 3.25 | 2.56 |
11 | 24.7 | 21.9 | 19.7 | 4.57 | 3.82 | 3.05 |
12 | 26.2 | 23.3 | 21 .0 | 5.23 | 4.40 | 3.57 |
13 | 27.7 | 24.7 | 22.4 | 5.89 | 5.01 | 4.11 |
14 | 29.1 | 26.1 | 23.7 | 6.57 | 5.63 | 4.66 |
15 | 30.6 | 27.5 | 25.0 | 7.26 | 6.26 | 5.23 |
16 | 32.0 | 28.8 | 26.3 | 7.96 | 6.91 | 5.81 |
17 | 33.4 | 30.2 | 27.6 | 8.67 | 7.56 | 6.41 |
18 | 34.8 | 31.5 | 28.9 | 9.39 | 8.23 | 7.01 |
19 | 36.2 | 32.9 | 30.1 | 10.1 | 8.91 | 7.63 |
20 | 37.6 | 34.2 | 31.4 | 10.9 | 9.59 | 8.26 |
21 | 38.9 | 35.5 | 32.7 | 11.6 | 10.3 | 8.90 |
22 | 40.3 | 36.8 | 33.9 | 12.3 | 11.0 | 9.54 |
23 | 41.6 | 38.1 | 35.2 | 13.1 | 11.7 | 10.2 |
24 | 43.0 | 39.4 | 36.4 | 13.8 | 12.4 | 10.9 |
25 | 44.3 | 40.6 | 37.7 | 14.6 | 13.1 | 11.5 |
26 | 45.6 | 41.9 | 38.9 | 15.4 | 13.8 | 12.2 |
27 | 47.0 | 43.2 | 40.1 | 16.2 | 14.6 | 12.9 |
28 | 48.3 | 44.5 | 41.3 | 16.9 | 15.3 | 13.6 |
29 | 49.6 | 45.7 | 42.6 | 17.7 | 16.0 | 14.3 |
30 | 50.9 | 47.0 | 43.8 | 18.5 | 16.8 | 15.0 |
توزیع پیرسون (خی دو)، دانشجو و فیشر
با استفاده از توزیع نرمال، سه توزیع تعریف شده است که در حال حاضر اغلب در پردازش داده های آماری استفاده می شود. این توزیعها بارها در بخشهای بعدی کتاب ظاهر میشوند.
توزیع پیرسون (کی - مربع) - توزیع یک متغیر تصادفی
جایی که متغیرهای تصادفی ایکس 1 , ایکس 2 ,…, X nمستقل و دارای توزیع یکسانی هستند ن(0،1). در این مورد، تعداد اصطلاحات، یعنی. n، "تعداد درجات آزادی" توزیع کای اسکوئر نامیده می شود.
توزیع خی دو هنگام تخمین واریانس (با استفاده از فاصله اطمینان)، هنگام آزمایش فرضیه های توافق، همگنی، استقلال، در درجه اول برای متغیرهای کیفی (دسته بندی شده) که تعداد محدودی از مقادیر را می گیرند و در بسیاری از وظایف دیگر استفاده می شود. تحلیل آماریداده ها
توزیع تی t Student توزیع یک متغیر تصادفی است
متغیرهای تصادفی کجا هستند Uو ایکسمستقل، Uدارای توزیع نرمال استاندارد است ن(0.1) و ایکس– توزیع چی – مربع c nدرجه آزادی. که در آن n"تعداد درجات آزادی" توزیع دانشجو نامیده می شود.
توزیع دانشجو در سال 1908 توسط آماردان انگلیسی W. Gosset که در یک کارخانه آبجو کار می کرد، معرفی شد. برای تصمیم گیری های اقتصادی و فنی در این کارخانه از روش های احتمالی و آماری استفاده می شد، بنابراین مدیریت آن V. Gosset را از انتشار مقالات علمی به نام خود منع کرد. به این ترتیب، اسرار تجاری و "دانش" در قالب روش های احتمالی و آماری توسعه یافته توسط V. Gosset محافظت شد. با این حال او این فرصت را پیدا کرد که با نام مستعار «دانشجو» منتشر کند. داستان Gosset-Student نشان می دهد که حتی صد سال پیش، مدیران بریتانیایی از بزرگان آگاه بودند بهره وری اقتصادیروش های احتمالی-آماری
در حال حاضر توزیع Student یکی از شناخته شده ترین توزیع هایی است که در تجزیه و تحلیل داده های واقعی استفاده می شود. هنگام تخمین انتظارات ریاضی، ارزش پیشبینی و سایر ویژگیها با استفاده از فواصل اطمینان، آزمون فرضیههای مربوط به مقادیر انتظارات ریاضی، ضرایب رگرسیون، فرضیههای همگنی نمونه و غیره استفاده میشود. .
توزیع فیشر توزیع یک متغیر تصادفی است
متغیرهای تصادفی کجا هستند X 1و X 2مستقل هستند و دارای توزیع کای دو با تعداد درجات آزادی هستند ک 1 و ک 2 به ترتیب. در همان زمان، زن و شوهر (ک 1 , ک 2 ) - یک جفت "درجات آزادی" از توزیع فیشر، یعنی ک 1 تعداد درجات آزادی صورتگر است و ک 2 - تعداد درجات آزادی مخرج. توزیع یک متغیر تصادفی افبه نام آماردان بزرگ انگلیسی R. Fisher (1890-1962) که به طور فعال از آن در آثار خود استفاده کرد.
توزیع فیشر هنگام آزمون فرضیههای مربوط به کفایت مدل در تحلیل رگرسیون، برابری واریانسها و سایر مسائل آمار کاربردی استفاده میشود.
عبارات مربوط به توابع توزیع کای اسکوئر، دانشجو و فیشر، چگالی و ویژگی های آنها، و همچنین جداول لازم برای استفاده عملی آنها را می توان در ادبیات تخصصی یافت (برای مثال، را ببینید).
23. مفهوم کای اسکوئر و توزیع دانشجویی و نمای گرافیکی
1) توزیع (خی دو) با n درجه آزادی، توزیع مجموع مجذورهای n متغیر تصادفی استاندارد مستقل است.
توزیع (chi-square)- توزیع یک متغیر تصادفی (و انتظار ریاضی هر یک از آنها 0 و انحراف معیار 1 است)
متغیرهای تصادفی کجا هستند مستقل هستند و توزیع یکسانی دارند. در این مورد، تعداد اصطلاحات، یعنی. ، "تعداد درجات آزادی" توزیع کای اسکوئر نامیده می شود. عدد خی دو با یک پارامتر یعنی تعداد درجات آزادی تعیین می شود. با افزایش تعداد درجات آزادی، توزیع به آرامی به حالت عادی نزدیک می شود.
سپس مجموع مربع های آنها
یک متغیر تصادفی است که بر اساس قانون chi-square با k = n درجه آزادی توزیع شده است. اگر اصطلاحات با یک رابطه مرتبط باشند (مثلاً)، تعداد درجات آزادی k = n - 1.
چگالی این توزیع
در اینجا تابع گاما است. به طور خاص، Г(n + 1) = n! .
بنابراین، توزیع کای دو با یک پارامتر تعیین می شود - تعداد درجات آزادی k.
نکته 1. با افزایش تعداد درجات آزادی، توزیع کای دو به تدریج به نرمال نزدیک می شود.
نکته 2. با استفاده از توزیع کای دو، بسیاری از توزیع های دیگر که در عمل با آن مواجه می شوند، تعیین می شوند، به عنوان مثال، توزیع یک متغیر تصادفی - طول یک بردار تصادفی (X1، X2،...، Xn)، مختصات که مستقل هستند و طبق قانون عادی توزیع می شوند.
توزیع χ2 برای اولین بار توسط R. Helmert (1876) و K. Pearson (1900) در نظر گرفته شد.
Math.expect.=n; D=2n
2) توزیع دانش آموزی
دو متغیر تصادفی مستقل را در نظر بگیرید: Z که دارای توزیع نرمال و نرمال شده است (یعنی M(Z) = 0، σ(Z) = 1) و V که بر اساس قانون کای دو با k توزیع شده است. درجه آزادی. سپس مقدار
توزیعی به نام توزیع t یا توزیع دانشجویی با k درجه آزادی دارد. در این مورد، k "تعداد درجات آزادی" توزیع Student نامیده می شود.
با افزایش تعداد درجات آزادی، توزیع دانشجو به سرعت به حالت عادی نزدیک می شود.
این توزیع در سال 1908 توسط آماردان انگلیسی W. Gosset که در یک کارخانه آبجو کار می کرد، معرفی شد. برای تصمیم گیری های اقتصادی و فنی در این کارخانه از روش های احتمالی و آماری استفاده می شد، بنابراین مدیریت آن V. Gosset را از انتشار مقالات علمی به نام خود منع کرد. به این ترتیب، اسرار تجاری و "دانش" در قالب روش های احتمالی و آماری توسعه یافته توسط V. Gosset محافظت شد. با این حال او این فرصت را پیدا کرد که با نام مستعار «دانشجو» منتشر کند. داستان Gosset-Student نشان می دهد که حتی صد سال پیش، مدیران بریتانیا از کارایی اقتصادی بیشتر روش های احتمالی و آماری تصمیم گیری آگاه بودند.