دانش آموزان و دانش آموزان - کمک در تحصیل. مفهوم یک سری تغییرات. انواع سری های واریاسیون سری های تنوع داده شده

روش گروه بندی همچنین به شما امکان اندازه گیری را می دهد تغییر(تغییرپذیری، نوسان) علائم. هنگامی که تعداد واحدهای یک جمعیت نسبتاً کم است، تنوع بر اساس تعداد رتبه‌بندی واحدهایی که جمعیت را تشکیل می‌دهند اندازه‌گیری می‌شود. سریال نام دارد رتبه بندی شده،اگر واحدها به ترتیب صعودی (نزولی) مشخصه مرتب شوند.

با این حال، سری های رتبه بندی شده کاملاً نشان دهنده زمانی هستند که یک ویژگی مقایسه ای از تغییرات مورد نیاز باشد. علاوه بر این، در بسیاری از موارد باید با جمعیت های آماری متشکل از تعداد زیادی واحد سروکار داشته باشیم که عملاً نمایش آنها در قالب یک سری خاص دشوار است. در این راستا، برای آشنایی اولیه اولیه با داده های آماری و به ویژه برای تسهیل در مطالعه تنوع در ویژگی ها، معمولاً پدیده ها و فرآیندهای مورد مطالعه در گروه ها ترکیب می شوند و نتایج گروه بندی در قالب جداول گروهی ارائه می شود.

اگر یک جدول گروهی فقط دو ستون داشته باشد - گروه ها با توجه به یک مشخصه انتخاب شده (گزینه ها) و تعداد گروه ها (فرکانس یا فرکانس)، نامیده می شود. نزدیک توزیع

محدوده توزیع -ساده ترین نوع گروه بندی ساختاری بر اساس یک مشخصه، که در یک جدول گروهی با دو ستون حاوی انواع و فرکانس های مشخصه نمایش داده می شود. در بسیاری از موارد، با چنین گروه بندی ساختاری، i.e. با تدوین سری های توزیع، مطالعه مواد اولیه آماری آغاز می شود.

یک گروه بندی ساختاری در قالب یک سری توزیع می تواند به یک گروه بندی ساختاری واقعی تبدیل شود اگر گروه های انتخاب شده نه تنها با فرکانس ها، بلکه توسط سایر شاخص های آماری نیز مشخص شوند. هدف اصلی از سری های توزیع، بررسی تنوع ویژگی ها است. تئوری سری های توزیع به طور مفصل توسط آمار ریاضی توسعه یافته است.

سری های توزیع به دو دسته تقسیم می شوند نسبتی(گروه بندی بر اساس ویژگی های اسنادی، به عنوان مثال، تقسیم جمعیت بر اساس جنسیت، ملیت، وضعیت تأهل و غیره) و متغیر(گروه بندی بر اساس ویژگی های کمی).

سری واریاسیونیک جدول گروهی است که شامل دو ستون است: گروه بندی واحدها بر اساس یک مشخصه کمی و تعداد واحدهای هر گروه. فواصل در سری تغییرات معمولاً مساوی و بسته تشکیل می شوند. سری تغییرات گروه بندی زیر از جمعیت روسیه بر اساس درآمد سرانه متوسط ​​پولی است (جدول 3.10).

جدول 3.10

توزیع جمعیت روسیه بر اساس درآمد سرانه متوسط ​​در 2004-2009.

گروه های جمعیت بر اساس میانگین درآمد نقدی سرانه، روبل/ماه

جمعیت در گروه، % از کل

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

بیش از 25000.0

کل جمعیت

سری های تنوع به نوبه خود به گسسته و فاصله ای تقسیم می شوند. گسستهسری‌های تنوع، انواع ویژگی‌های گسسته را ترکیب می‌کنند که در محدوده‌های باریک متفاوت هستند. نمونه ای از یک سری تغییرات گسسته، توزیع خانواده های روسی بر اساس تعداد فرزندان آنها است.

فاصلهسری‌های تنوع، انواعی از ویژگی‌های پیوسته یا ویژگی‌های گسسته را ترکیب می‌کنند که در محدوده وسیعی متفاوت هستند. فاصله سری تغییرات توزیع جمعیت روسیه بر اساس درآمد سرانه متوسط ​​پولی است.

سری تغییرات گسسته اغلب در عمل استفاده نمی شود. در همین حال، تدوین آنها دشوار نیست، زیرا ترکیب گروه ها توسط انواع خاصی که ویژگی های گروه بندی مورد مطالعه در واقع دارند تعیین می شود.

سری های تغییرات بازه ای گسترده تر هستند. هنگام جمع آوری آنها، یک سوال دشوار در مورد تعداد گروه ها و همچنین اندازه فواصل زمانی که باید ایجاد شود مطرح می شود.

اصول حل این مسئله در فصل روش شناسی ساخت گروه بندی های آماری تنظیم شده است (به بند 3.3 مراجعه کنید).

سری‌های تنوع وسیله‌ای برای جمع‌کردن یا فشرده‌سازی اطلاعات متنوع به شکل فشرده هستند؛ از روی آنها می‌توان قضاوت نسبتاً روشنی در مورد ماهیت تنوع انجام داد و تفاوت‌های ویژگی‌های پدیده‌های موجود در مجموعه مورد مطالعه را مطالعه کرد. اما مهم‌ترین اهمیت سری‌های تغییرات این است که بر اساس آنها ویژگی‌های تعمیم‌دهنده ویژه تغییرات محاسبه می‌شوند (به فصل 7 مراجعه کنید).

گروه بندی- این تقسیم یک جمعیت به گروه هایی است که بر اساس برخی ویژگی ها همگن هستند.

هدف از خدمات. با استفاده از ماشین حساب آنلاین می توانید:

  • ساخت یک سری تغییرات، یک هیستوگرام و چند ضلعی بسازید.
  • یافتن شاخص های تغییرات (میانگین، حالت (از جمله گرافیک)، میانه، دامنه تغییرات، چارک ها، دهک ها، ضریب تمایز چارک، ضریب تغییرات و سایر شاخص ها).

دستورالعمل ها. برای گروه بندی یک سری، باید نوع سری تغییرات به دست آمده (گسسته یا بازه ای) را انتخاب کنید و مقدار داده ها (تعداد ردیف ها) را مشخص کنید. راه حل به دست آمده در یک فایل Word ذخیره می شود (نمونه ای از گروه بندی داده های آماری را ببینید).

اگر گروه بندی قبلا انجام شده باشد و سری تغییرات گسستهیا سری بازه ای، سپس باید از ماشین حساب آنلاین Variation Indices استفاده کنید. آزمون فرضیه در مورد نوع توزیعبا استفاده از سرویس مطالعه فرم توزیع انجام می شود.

انواع گروه بندی های آماری

سری واریاسیون. در مورد مشاهدات یک متغیر تصادفی گسسته، یک مقدار را می توان چندین بار مشاهده کرد. چنین مقادیر x i یک متغیر تصادفی ثبت می شود که نشان می دهد n i تعداد دفعاتی که در n مشاهده ظاهر می شود، این فرکانس این مقدار است.
در مورد متغیر تصادفی پیوسته، در عمل از گروه بندی استفاده می شود.
  1. گروه بندی تیپولوژیک- این تقسیم جمعیت کیفی ناهمگن مورد مطالعه به طبقات، انواع اجتماعی-اقتصادی، گروه های همگن واحدها است. برای ساخت این گروه بندی، از پارامتر سری تغییرات گسسته استفاده کنید.
  2. یک گروه بندی ساختاری نامیده می شود، که در آن یک جمعیت همگن به گروه هایی تقسیم می شود که ساختار آن را با توجه به برخی ویژگی های متفاوت مشخص می کند. برای ساخت این گروه بندی، از پارامتر سری Interval استفاده کنید.
  3. گروه بندی که روابط بین پدیده های مورد مطالعه و ویژگی های آنها را آشکار می کند نامیده می شود گروه تحلیلی(به گروه بندی تحلیلی سری ها مراجعه کنید).

مثال شماره 1. بر اساس داده های جدول 2، مجموعه های توزیع را برای 40 بانک تجاری فدراسیون روسیه بسازید. با استفاده از سری توزیع حاصل، تعیین کنید: سود به طور متوسط ​​برای هر بانک تجاری، سرمایه گذاری اعتباری به طور متوسط ​​به ازای هر بانک تجاری، مقدار معین و متوسط ​​سود. چارک، دهک، دامنه تغییرات، میانگین انحراف خطی، انحراف معیار، ضریب تغییرات.

راه حل:
در فصل "نوع سری های آماری"سری گسسته را انتخاب کنید. روی Insert from Excel کلیک کنید. تعداد گروه ها: طبق فرمول استرجس

اصول ساخت گروه های آماری

مجموعه ای از مشاهدات مرتب شده به ترتیب صعودی نامیده می شود سری تغییرات . قابلیت گروه بندیمشخصه ای است که بر اساس آن یک جمعیت به گروه های جداگانه تقسیم می شود. به آن اساس گروه می گویند. گروه بندی می تواند بر اساس ویژگی های کمی و کیفی باشد.
پس از تعیین مبنای گروه بندی، باید در مورد تعداد گروه هایی که جمعیت مورد مطالعه باید به آنها تقسیم شود، تصمیم گیری شود.

هنگام استفاده از رایانه های شخصی برای پردازش داده های آماری، گروه بندی واحدهای شی با استفاده از روش های استاندارد انجام می شود.
یکی از این روش ها بر اساس استفاده از فرمول استرجس برای تعیین تعداد بهینه گروه ها است:

k = 1+3.322*log(N)

در جایی که k تعداد گروه ها است، N تعداد واحدهای جمعیت است.

طول بازه های جزئی به صورت h=(x max -xmin)/k محاسبه می شود

سپس تعداد مشاهداتی که در این فواصل قرار می گیرند شمارش می شود که به عنوان فرکانس n i در نظر گرفته می شوند. تعداد کمی فرکانس که مقادیر آنها کمتر از 5 باشد (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
مقادیر میانی فواصل x i =(c i-1 +c i)/2 به عنوان مقادیر جدید در نظر گرفته می شوند.

مثال شماره 3. در نتیجه یک نمونه تصادفی 5 درصد، توزیع زیر محصولات بر اساس میزان رطوبت به دست آمد. محاسبه: 1) میانگین درصد رطوبت. 2) شاخص هایی که تغییرات رطوبت را مشخص می کنند.
راه حل با استفاده از ماشین حساب به دست آمد: مثال شماره 1

یک سری تغییرات بسازید. بر اساس سری یافت شده، یک چند ضلعی توزیع، هیستوگرام و تجمع بسازید. حالت و میانه را تعیین کنید.
دانلود راه حل

مثال. با توجه به نتایج مشاهده نمونه (نمونه الف، پیوست):
الف) یک سری تغییرات ایجاد کنید.
ب) فرکانس های نسبی و فرکانس های نسبی انباشته را محاسبه کنید.
ج) یک چند ضلعی بسازید.
د) یک تابع توزیع تجربی ایجاد کنید.
ه) تابع توزیع تجربی را رسم کنید.
و) مشخصه های عددی را محاسبه کنید: میانگین حسابی، پراکندگی، انحراف معیار. راه حل

بر اساس داده های ارائه شده در جدول 4 (پیوست 1) و مطابق با گزینه شما، انجام دهید:

  1. بر اساس گروه بندی ساختاری، فرکانس تغییرات و سری توزیع تجمعی را با استفاده از فواصل بسته مساوی و تعداد گروه ها را برابر 6 بسازید. نتایج را به صورت جدول ارائه و به صورت گرافیکی نمایش دهید.
  2. سری تغییرات توزیع را با محاسبه تجزیه و تحلیل کنید:
    • مقدار میانگین حسابی مشخصه؛
    • حالت، میانه، چارک اول، دهک اول و نهم.
    • انحراف معیار؛
    • ضریب تغییرات
  3. نتیجه گیری کن.

مورد نیاز: رتبه بندی سری ها، ساخت یک سری توزیع بازه ای، محاسبه مقدار میانگین، تغییرپذیری مقدار متوسط، حالت و میانه برای سری های رتبه بندی شده و بازه ای.

بر اساس داده های اولیه، یک سری تغییرات گسسته بسازید. آن را در قالب جدول آماری و نمودارهای آماری ارائه دهید. 2). بر اساس داده های اولیه، یک سری تغییرات بازه ای با فواصل مساوی بسازید. تعداد فواصل را خودتان انتخاب کنید و این انتخاب را توضیح دهید. سری تغییرات حاصل را در قالب یک جدول آماری و نمودارهای آماری ارائه دهید. انواع جداول و نمودارهای مورد استفاده را مشخص کنید.

به منظور تعیین میانگین مدت خدمت به مشتریان در یک صندوق بازنشستگی که تعداد مشتریان آن بسیار زیاد است، با استفاده از طرح نمونه گیری تصادفی غیر تکراری، نظرسنجی از 100 مشتری انجام شد. نتایج نظرسنجی در جدول ارائه شده است. پیدا کردن:
الف) مرزهایی که با احتمال 0.9946 میانگین زمان خدمت کلیه مشتریان صندوق بازنشستگی در آن قرار دارد.
ب) احتمال اینکه سهم همه مشتریان صندوق با مدت خدمت کمتر از 6 دقیقه با سهم این مشتریان در نمونه بیش از 10٪ (به مقدار مطلق) تفاوت نداشته باشد.
ج) حجم نمونه گیری مکرر که در آن با احتمال 0.9907 می توان بیان کرد که سهم کلیه مشتریان صندوق با مدت زمان خدمت کمتر از 6 دقیقه با سهم چنین مشتریانی در نمونه بیش از 10 تفاوت ندارد. % (به مقدار مطلق).
2. با توجه به تکلیف 1، با استفاده از آزمون X2 پیرسون، در سطح معناداری 0.05 = α، این فرضیه را آزمون کنید. مقدار تصادفی X - زمان خدمات مشتری - طبق یک قانون عادی توزیع می شود. یک هیستوگرام از توزیع تجربی و منحنی نرمال مربوطه را در یک نقشه بسازید.
دانلود راه حل

نمونه ای از 100 عنصر داده شده است. لازم:

  1. یک سری تغییرات رتبه بندی شده بسازید.
  2. حداکثر و حداقل شرایط سری را بیابید.
  3. محدوده تغییرات و تعداد بازه های بهینه برای ساخت یک سری بازه ای را بیابید. طول بازه سری فاصله را بیابید.
  4. یک سری فاصله بسازید. فرکانس عناصر نمونه را که در فواصل ترکیب شده قرار می گیرند، بیابید. نقاط میانی هر بازه را پیدا کنید.
  5. یک هیستوگرام و چند ضلعی فرکانس بسازید. مقایسه با توزیع نرمال(تحلیلی و گرافیکی)؛
  6. تابع توزیع تجربی را رسم کنید.
  7. محاسبه مشخصات عددی نمونه: میانگین نمونه و گشتاور نمونه مرکزی.
  8. مقادیر تقریبی انحراف معیار، چولگی و کشیدگی را محاسبه کنید (با استفاده از بسته تحلیلی MS Excel). مقادیر تقریبی محاسبه شده را با مقادیر دقیق (محاسبه شده با استفاده از فرمول های MS Excel) مقایسه کنید.
  9. ویژگی های گرافیکی انتخاب شده را با ویژگی های نظری مربوطه مقایسه کنید.
دانلود راه حل

داده های نمونه زیر (10٪ نمونه، مکانیکی) در مورد خروجی محصول و میزان سود، میلیون روبل موجود است. طبق داده های اولیه:
وظیفه 13.1.
13.1.1. یک سری آماری از توزیع شرکت ها بر اساس میزان سود ایجاد کنید و پنج گروه را با فواصل مساوی تشکیل دهید. ساخت نمودارهای سری توزیع
13.1.2. مشخصه های عددی سری توزیع شرکت ها را با مقدار سود محاسبه کنید: میانگین حسابی، انحراف معیار، پراکندگی، ضریب تغییرات V. نتیجه گیری کنید.
وظیفه 13.2.
13.2.1. مرزهایی را تعیین کنید که با احتمال 0.997 مقدار سود یک بنگاه در جمعیت عمومی در آن قرار دارد.
13.2.2. با استفاده از آزمون x2 پیرسون، در سطح معناداری α، این فرضیه را آزمایش کنید که متغیر تصادفی X - مقدار سود - طبق یک قانون عادی توزیع شده است.
وظیفه 13.3.
13.3.1. ضرایب معادله رگرسیون نمونه را تعیین کنید.
13.3.2. وجود و ماهیت همبستگی بین هزینه محصولات تولیدی (X) و مقدار سود هر شرکت (Y) را تعیین کنید. یک خط پراکندگی و رگرسیون بسازید.
13.3.3. ضریب همبستگی خطی را محاسبه کنید. با استفاده از آزمون t استیودنت، معناداری ضریب همبستگی را آزمایش کنید. با استفاده از مقیاس چادوک در مورد رابطه نزدیک بین عوامل X و Y نتیجه گیری کنید.
رهنمودها . وظیفه 13.3 با استفاده از این سرویس انجام می شود.
دانلود راه حل

وظیفه. داده های زیر نشان دهنده زمان صرف شده توسط مشتریان برای انعقاد قرارداد است. یک سری تغییرات بازه ای از داده های ارائه شده، یک هیستوگرام بسازید، یک تخمین بی طرفانه پیدا کنید انتظارات ریاضی، برآوردگر واریانس بایاس و بی طرف.

مثال. مطابق جدول 2:
1) ساخت سری توزیع برای 40 بانک تجاری فدراسیون روسیه:
الف) از نظر سود؛
ب) به میزان سرمایه گذاری اعتباری.
2) با استفاده از سری توزیع به دست آمده، تعیین کنید:
الف) متوسط ​​سود هر بانک تجاری؛
ب) سرمایه گذاری اعتباری به طور متوسط ​​به ازای هر بانک تجاری.
ج) ارزش معین و متوسط ​​سود؛ چارک، دهک;
د) ارزش معین و متوسط ​​سرمایه گذاری های اعتباری.
3) با استفاده از ردیف های توزیع به دست آمده در مرحله 1، محاسبه کنید:
الف) دامنه تغییرات؛
ب) انحراف خطی متوسط؛
ج) انحراف معیار؛
د) ضریب تغییرات.
محاسبات لازم را به صورت جدول انجام دهید. نتایج را تجزیه و تحلیل کنید. نتیجه گیری کن.
نمودارهای رسم سری توزیع حاصل. حالت و میانه را به صورت گرافیکی تعیین کنید.

راه حل:
برای ساختن یک گروه بندی با فواصل مساوی، از سرویس Grouping Statistical Data استفاده می کنیم.

شکل 1 - وارد کردن پارامترها

شرح پارامترها
تعداد خطوط: تعداد داده های ورودی اگر اندازه ردیف کوچک است، مقدار آن را نشان دهید. اگر انتخاب به اندازه کافی بزرگ است، روی دکمه Insert from Excel کلیک کنید.
تعداد گروه ها: 0 – تعداد گروه ها با فرمول استرجس تعیین می شود.
اگر تعداد مشخصی از گروه ها مشخص شده است، آن را مشخص کنید (مثلاً 5).
نوع سریال: سری گسسته.
سطح اهمیت: برای مثال 0.954. این پارامتر برای تعیین فاصله اطمینان میانگین تنظیم شده است.
نمونه: به عنوان مثال 10 درصد نمونه برداری مکانیکی انجام شد. عدد 10 را نشان می دهیم. برای داده های ما 100 را نشان می دهیم.

به مجموعه ای از اشیاء یا پدیده هایی که توسط یک ویژگی یا ویژگی مشترک با ماهیت کمی یا کیفی متحد شده اند، گفته می شود. موضوع مشاهده .

هر موضوع مشاهدات آماری از عناصر منفرد تشکیل شده است - واحدهای مشاهده .

نتایج مشاهدات آماری نشان دهنده اطلاعات عددی است - داده ها . داده های آماری - این اطلاعاتی در مورد ارزش هایی است که مشخصه مورد علاقه محقق در جامعه آماری گرفته شده است.

اگر مقادیر یک مشخصه با اعداد بیان شود، مشخصه نامیده می شود کمی .

اگر علامتی مشخص کننده خاصیت یا حالتی از عناصر یک جمعیت باشد، آن علامت نامیده می شود کیفیت بالا .

اگر همه عناصر یک جامعه مورد مطالعه (مشاهده مستمر) باشند، جامعه آماری نامیده می شود. عمومی

اگر بخشی از عناصر جامعه عمومی مورد تحقیق قرار گیرد، جامعه آماری نامیده می شود انتخابی (نمونه گیری) . نمونه ای از یک جامعه به طور تصادفی ترسیم می شود به طوری که هر یک از n عنصر در نمونه شانس مساوی برای انتخاب شدن داشته باشد.

مقادیر یک مشخصه هنگام جابجایی از یک عنصر جمعیت به عنصر دیگر تغییر می کند (متغیر است) بنابراین در آمار مقادیر مختلف یک مشخصه نیز نامیده می شود. گزینه ها . گزینه ها معمولا با حروف کوچک لاتین x، y، z نشان داده می شوند.

شماره سریال گزینه (مقدار مشخصه) نامیده می شود رتبه . x 1 - گزینه اول (مقدار اول ویژگی)، x 2 - گزینه دوم (مقدار دوم ویژگی)، x i - گزینه i-ام (مقدار i-امامضا کردن).

مجموعه ای از مقادیر مشخصه (گزینه ها) که به ترتیب صعودی یا نزولی با وزن متناظر آنها مرتب شده اند نامیده می شود. سری تنوع (سری توزیع).

مانند ترازو فرکانس ها یا فرکانس ها ظاهر می شوند.

فرکانس(m i) نشان می دهد که چند بار این یا آن گزینه (مقدار ویژگی) در جامعه آماری رخ می دهد.

فرکانس یا فرکانس نسبی(w i) نشان می دهد که چه بخشی از واحدهای جمعیت دارای یک یا آن گزینه است. فرکانس به عنوان نسبت فرکانس یک گزینه خاص به مجموع تمام فرکانس های سری محاسبه می شود.

. (6.1)

مجموع همه فرکانس ها 1 است.

. (6.2)

سری های تنوع گسسته و فاصله ای هستند.

سری تغییرات گسستهآنها معمولاً در صورتی ساخته می شوند که مقادیر مشخصه مورد مطالعه ممکن است کمتر از مقدار محدود معینی با یکدیگر متفاوت باشند.

در سری تغییرات گسسته، مقادیر نقطه ای مشخصه مشخص می شود.

نمای کلی سری تغییرات گسسته در جدول 6.1 نشان داده شده است.

جدول 6.1

جایی که i = 1، 2، … ل

در سری تغییرات بازه ای، در هر بازه مرزهای بالایی و پایینی بازه مشخص می شود.

تفاوت بین مرزهای بالا و پایین بازه نامیده می شود اختلاف فاصله یا طول (مقدار) بازه .

مقدار اولین فاصله k 1 با فرمول تعیین می شود:

k 1 = a 2 - a 1;

دوم: k 2 = a 3 - a 2; ...

آخرین: k l = a l - a l -1 .

به طور کلی اختلاف فاصله k i با فرمول محاسبه می شود:

k i = x i (حداکثر) - x i (دقیقه) . (6.3)

اگر بازه ای هر دو مرز را داشته باشد، نامیده می شود بسته .

فواصل اول و آخر می تواند باشد باز کن ، یعنی فقط یک مرز دارند

به عنوان مثال، اولین فاصله را می توان به عنوان "تا 100"، دوم - "100-110"، ...، دوم تا آخرین - "190-200"، آخرین - "200 و بیشتر" تنظیم کرد. بدیهی است که فاصله اول مرز پایینی ندارد و آخرین بازه مرز بالایی ندارد؛ هر دوی آنها باز هستند.

اغلب فواصل باز باید به صورت مشروط بسته شوند. برای انجام این کار، معمولاً مقدار فاصله اول برابر با مقدار دوم و مقدار آخرین - به مقدار ماقبل آخر در نظر گرفته می شود. در مثال ما، مقدار بازه دوم 110-100=10 است، بنابراین، حد پایین بازه اول به طور مشروط 100-10=90 خواهد بود. مقدار فاصله ماقبل آخر 200-190=10 است، بنابراین حد بالایی آخرین بازه به صورت مشروط 200+10=210 خواهد بود.

علاوه بر این، در یک سری تغییرات بازه ای ممکن است فواصل با طول های مختلف وجود داشته باشد. اگر بازه های یک سری تغییرات دارای طول یکسان باشند (تفاوت بازه)، آنها نامیده می شوند از نظر اندازه مساوی ، در غیر این صورت - از نظر اندازه نابرابر

هنگام ساخت یک سری تغییرات بازه ای، مشکل انتخاب اندازه فواصل (تفاوت بازه) اغلب ایجاد می شود.

برای تعیین اندازه بهینه فواصل (در صورتی که یک سری با فواصل مساوی ساخته شود)، استفاده کنید فرمول استرجس:

, (6.4)

که در آن n تعداد واحدهای جمعیت است،

x (حداکثر) و x (min) - بزرگترین و کوچکترین مقادیر گزینه های سری.

برای مشخص کردن سری تغییرات، همراه با فرکانس ها و فرکانس ها، از فرکانس ها و فرکانس های انباشته استفاده می شود.

فرکانس های انباشته شده (فرکانس ها)نشان می دهد که چند واحد از جمعیت (کدام قسمت از آنها) از مقدار معین (متغیر) x تجاوز نمی کند.

فرکانس های انباشته شده ( v i) بر اساس داده های سری گسسته می توان با استفاده از فرمول زیر:

. (6.5)

برای یک سری تغییرات بازه‌ای، این مجموع فرکانس‌ها (فرکانس‌ها) همه بازه‌هایی است که از این یک تجاوز نمی‌کند.

یک سری تغییرات گسسته را می توان به صورت گرافیکی با استفاده از نمایش داد چند ضلعی یا فرکانس های توزیع فرکانس.

هنگام ساخت یک چند ضلعی توزیع، مقادیر مشخصه (انواع) در امتداد محور آبسیسا و فرکانس ها یا فرکانس ها در امتداد محور ارتین رسم می شوند. در تقاطع مقادیر مشخصه و فرکانس های مربوطه (فرکانس ها) نقاطی گذاشته می شود که به نوبه خود توسط بخش هایی به هم متصل می شوند. خط شکسته حاصل، چندضلعی توزیع فرکانس (فرکانس) نامیده می شود.

x k
x 2
x 1 x i


برنج. 6.1.

سری تغییرات بازه ای را می توان به صورت گرافیکی با استفاده از نمایش داد هیستوگرام ها، یعنی نمودار میله ای.

هنگام ساخت یک هیستوگرام، مقادیر مشخصه مورد مطالعه (مرزهای فاصله) در امتداد محور آبسیسا رسم می شود.

در صورتی که فواصل به یک اندازه باشند، فرکانس ها یا فرکانس ها را می توان در امتداد محور ارتین رسم کرد.

اگر فواصل اندازه های متفاوتی داشته باشند، مقادیر چگالی توزیع مطلق یا نسبی باید در امتداد محور ارتین رسم شوند.

چگالی مطلق- نسبت فرکانس بازه به اندازه بازه:

; (6.6)

که در آن: f(a) i - چگالی مطلق بازه i-ام.

m i - فرکانس بازه i-ام.

k i - مقدار فاصله i ام (تفاوت بازه).

تراکم مطلق نشان می دهد که در هر بازه واحد چند واحد جمعیت وجود دارد.

چگالی نسبی- نسبت فرکانس بازه به اندازه بازه:

; (6.7)

که در آن: f(о) i - چگالی نسبی بازه i-ام.

w i - فرکانس بازه i-ام.

تراکم نسبی نشان می دهد که چه بخشی از واحدهای جمعیت بر روی واحد بازه قرار می گیرد.

یک ل
a 1 x i
یک 2

هر دو سری تغییرات گسسته و بازه‌ای را می‌توان به صورت گرافیکی در قالب انباشته‌ها و ogives نشان داد.

هنگام ساخت انباشته می شودبا توجه به داده های یک سری گسسته، مقادیر مشخصه (تغییرها) در امتداد محور x رسم می شود و فرکانس ها یا فرکانس های انباشته شده در امتداد محور ارتین رسم می شوند. در تقاطع مقادیر مشخصه (انواع) و فرکانس های انباشته شده مربوطه (فرکانس ها) نقاطی ساخته می شوند که به نوبه خود توسط بخش ها یا منحنی به هم متصل می شوند. خط شکسته (منحنی) حاصل را تجمعی (منحنی تجمعی) می نامند.

هنگام ساخت انباشته ها بر اساس داده های یک سری بازه ای، مرزهای فواصل در امتداد محور آبسیسا رسم می شوند. ابسیسا نقاط، مرزهای بالایی فواصل هستند. مختصات فرکانس های انباشته شده (فرکانس) فواصل مربوطه را تشکیل می دهند. غالباً یک نقطه دیگر اضافه می شود که آبسیس آن مرز پایینی فاصله اول است و مختصات آن صفر است. با اتصال نقاط با پاره ها یا منحنی، یک تجمع به دست می آوریم.

اوگیوابه طور مشابه یک انباشته ساخته می شود با تنها تفاوت این که نقاط مربوط به فرکانس های انباشته شده (فرکانس ها) روی محور آبسیسا رسم می شوند و مقادیر مشخصه (تغییرها) روی محور اردیته رسم می شوند.

  • درس مقدماتی رایگان;
  • عدد بزرگمعلمان با تجربه (بومی و روسی زبان)؛
  • دوره ها برای یک دوره خاص (ماه، شش ماه، سال) نیستند، بلکه برای تعداد خاصی از درس ها (5، 10، 20، 50) هستند.
  • بیش از 10000 مشتری راضی
  • هزینه یک درس با معلم روسی زبان می باشد از 600 روبلبا یک زبان مادری - از 1500 روبل

مفهوم یک سری تغییرات.اولین گام در نظام مند کردن مواد مشاهده آماری، شمارش تعداد واحدهایی است که دارای یک ویژگی خاص هستند. با مرتب کردن واحدها به ترتیب صعودی یا نزولی مشخصه کمی آنها و شمارش تعداد واحدها با مقدار مشخص مشخصه، یک سری تغییرات بدست می آوریم. یک سری تغییرات، توزیع واحدهای یک جامعه آماری خاص را بر اساس برخی مشخصه های کمی مشخص می کند.

سری تغییرات از دو ستون تشکیل شده است، ستون سمت چپ حاوی مقادیر مشخصه های متغیر است که متغیر نامیده می شود و (x) نشان داده می شود، و ستون سمت راست حاوی اعداد مطلق است که نشان می دهد هر گونه چند بار رخ می دهد. نشانگرهای این ستون فرکانس نامیده می شوند و با (f) مشخص می شوند.

سری تغییرات را می توان به صورت شماتیک در قالب جدول 5.1 ارائه کرد:

جدول 5.1

نوع سری تغییرات

گزینه های (x)

فرکانس ها (f)

در ستون سمت راست می توان از شاخص های نسبی نیز استفاده کرد که سهم فراوانی گزینه های فردی را در مجموع فرکانس ها مشخص می کند. این شاخص‌های نسبی فرکانس نامیده می‌شوند و به طور معمول با نشان داده می‌شوند، i.e. . مجموع همه فرکانس ها برابر با یک است. فرکانس ها را می توان به صورت درصد نیز بیان کرد و سپس مجموع آنها برابر با 100٪ خواهد بود.

علائم مختلف ممکن است ماهیت متفاوتی داشته باشند. انواع برخی از ویژگی ها به اعداد صحیح بیان می شوند، به عنوان مثال، تعداد اتاق های یک آپارتمان، تعداد کتاب های منتشر شده و غیره. این علائم را ناپیوسته یا گسسته می نامند. انواع دیگر ویژگی ها می توانند هر ارزشی را در محدوده های معینی به خود بگیرند، مانند انجام وظایف برنامه ریزی شده، دستمزدها و غیره. به این ویژگی ها پیوسته می گویند.

سری تغییرات گسسته.اگر واریانت های سری تغییرات به شکل بیان شده باشند مقادیر گسسته، سپس چنین سری تغییراتی گسسته نامیده می شود که ظاهر آن در جدول ارائه شده است. 5.2:

جدول 5.2

توزیع دانش آموزان بر اساس نمرات امتحانی

رتبه بندی (x)

تعداد دانش آموزان (f)

در درصد از کل ()

ماهیت توزیع در سری های گسسته به صورت گرافیکی در قالب یک چندضلعی توزیع نشان داده شده است، شکل 5.1.

برنج. 5.1. توزیع دانش آموزان بر اساس نمرات کسب شده در آزمون.

سری تغییرات فاصله.برای مشخصه‌های پیوسته، سری‌های تغییرات به صورت فاصله‌ای ساخته می‌شوند، یعنی. مقادیر مشخصه در آنها به صورت فواصل "از و به" بیان می شود. در این حالت، حداقل مقدار مشخصه در چنین بازه ای را حد پایین بازه، و حداکثر را حد بالایی بازه می گویند.

سری‌های تغییرات بازه‌ای هم برای ویژگی‌های ناپیوسته (گسسته) و هم برای آنهایی که در یک محدوده بزرگ تغییر می‌کنند ساخته می‌شوند. ردیف های فاصله می توانند با فواصل مساوی یا نامساوی باشند. در عمل اقتصادی، بیشتر فواصل نابرابر استفاده می شود که به تدریج افزایش یا کاهش می یابد. این نیاز به ویژه در مواردی که نوسان یک مشخصه به طور ناموزون و در محدوده زیاد اتفاق می افتد، به وجود می آید.

بیایید نوع سری فاصله با فواصل مساوی جدول را در نظر بگیریم. 5.3:

جدول 5.3

توزیع کارگران بر اساس تولید

خروجی، t.r. (ایکس)

تعداد کارگران (f)

فرکانس تجمعی (f´)

سری توزیع بازه ای به صورت گرافیکی در قالب یک هیستوگرام نشان داده شده است، شکل 5.2.

شکل 5.2. توزیع کارگران بر اساس تولید

فرکانس انباشته شده (انباشته).در عمل، نیاز به تبدیل سری های توزیع به سری تجمعی،با توجه به فرکانس های انباشته شده ساخته شده است. با کمک آنها می توانید میانگین های ساختاری را تعیین کنید که تجزیه و تحلیل داده های سری توزیع را تسهیل می کند.

فرکانس‌های تجمعی با افزودن متوالی به فرکانس‌ها (یا فرکانس‌های) گروه اول این شاخص‌های گروه‌های بعدی سری توزیع تعیین می‌شوند. انباشته ها و ogives برای نشان دادن سری های توزیع استفاده می شوند. برای ساخت آنها، مقادیر مشخصه گسسته (یا انتهای فواصل) روی محور آبسیسا، و مجموع تجمعی فرکانس ها (انباشته ها) روی محور ارتین مشخص شده اند، شکل 5.3.

برنج. 5.3. توزیع تجمعی کارگران بر اساس تولید

اگر مقیاس فرکانس ها و گزینه ها معکوس شود، به عنوان مثال. محور آبسیسا فرکانس‌های انباشته‌شده را منعکس می‌کند، و محور مختصات مقادیر متغیرها را نشان می‌دهد، سپس منحنی مشخص‌کننده تغییر فرکانس‌ها از گروهی به گروه دیگر، توزیع توزیع نامیده می‌شود، شکل 5.4.

برنج. 5.4. Ogiva توزیع کارگران بر اساس تولید

سری تغییرات با فواصل مساوی یکی از مهمترین الزامات سری های توزیع آماری را فراهم می کند و از مقایسه زمانی و مکانی آنها اطمینان می یابد.

چگالی توزیعبا این حال، فرکانس فواصل نابرابر فردی در سری نام‌گذاری شده مستقیماً قابل مقایسه نیستند. در چنین مواردی، برای اطمینان از مقایسه لازم، چگالی توزیع محاسبه می شود، یعنی. تعیین کنید که در هر گروه چند واحد در واحد مقدار فاصله وجود دارد.

هنگام ساخت نموداری از توزیع یک سری تغییرات با فواصل نابرابر، ارتفاع مستطیل ها متناسب با فرکانس ها، بلکه با شاخص های چگالی توزیع مقادیر مشخصه مورد مطالعه در موارد مربوطه تعیین می شود. فواصل

ترسیم یک سری تغییرات و نمایش گرافیکی آن اولین گام در پردازش داده های اولیه و اولین مرحله در تجزیه و تحلیل جامعه مورد مطالعه است. گام بعدی در تجزیه و تحلیل سری تغییرات، تعیین شاخص های کلی اصلی است که ویژگی های سری نامیده می شود. این ویژگی ها باید تصوری از میانگین ارزش مشخصه در بین واحدهای جمعیتی ارائه دهد.

مقدار متوسط. مقدار متوسط ​​یک مشخصه تعمیم یافته مشخصه مورد مطالعه در جمعیت مورد مطالعه است که نشان دهنده سطح معمول آن در هر واحد جمعیت در شرایط خاص مکان و زمان است.

مقدار متوسط ​​همیشه نامگذاری می شود و دارای ابعادی مشابه با ویژگی واحدهای فردی جمعیت است.

قبل از محاسبه مقادیر متوسط، لازم است واحدهای جمعیت مورد مطالعه را با شناسایی گروه های کیفی همگن گروه بندی کنیم.

میانگین محاسبه شده برای کل جمعیت را میانگین کلی و برای هر گروه - میانگین گروهی می نامند.

دو نوع میانگین وجود دارد: توان (میانگین حسابی، میانگین هارمونیک، میانگین هندسی، میانگین درجه دوم). ساختاری (حالت، میانه، چارک، دهک).

انتخاب میانگین برای محاسبه بستگی به هدف دارد.

انواع میانگین توان و روشهای محاسبه آنها.در عمل پردازش آماری مطالب جمع آوری شده، مشکلات مختلفی به وجود می آید که حل آنها به میانگین های متفاوتی نیاز دارد.

آمار ریاضی میانگین های مختلفی را از فرمول های میانگین توان استخراج می کند:

مقدار متوسط ​​کجاست x - گزینه های فردی (مقادیر ویژگی)؛ z - توان (با z = 1 - میانگین حسابی، z = 0 میانگین هندسی، z = - 1 - میانگین هارمونیک، z = 2 - میانگین مربع).

با این حال، این سوال که چه نوع میانگینی باید در هر مورد جداگانه اعمال شود توسط حل می شود تجزیه و تحلیل خاصجمعیت مورد مطالعه

رایج ترین نوع میانگین در آمار است میانگین حسابی. در مواردی محاسبه می شود که حجم مشخصه میانگین به عنوان مجموع مقادیر آن برای واحدهای فردی از جامعه آماری مورد مطالعه تشکیل می شود.

بسته به ماهیت داده های منبع، میانگین حسابی به روش های مختلفی تعیین می شود:

اگر داده ها گروه بندی نشده باشند، محاسبه با استفاده از فرمول متوسط ​​ساده انجام می شود

محاسبه میانگین حسابی در یک سری گسستهمطابق فرمول 3.4 رخ می دهد.

محاسبه میانگین حسابی در یک سری بازه ای.در یک سری تغییرات بازه ای، که در آن مقدار یک مشخصه در هر گروه به طور معمول وسط بازه در نظر گرفته می شود، میانگین حسابی ممکن است با میانگین محاسبه شده از داده های گروه بندی نشده متفاوت باشد. علاوه بر این، هر چه فاصله زمانی در گروه ها بیشتر باشد، انحرافات احتمالی میانگین محاسبه شده از داده های گروه بندی شده از میانگین محاسبه شده از داده های گروه بندی نشده بیشتر است.

هنگام محاسبه میانگین در یک سری تغییرات بازه ای، برای انجام محاسبات لازم، فرد از فواصل به نقاط میانی آنها حرکت می کند. و سپس میانگین با استفاده از فرمول میانگین حسابی وزنی محاسبه می شود.

ویژگی های میانگین حسابیمیانگین حسابی ویژگی هایی دارد که محاسبات را ساده می کند؛ بیایید آنها را در نظر بگیریم.

1. میانگین حسابی اعداد ثابت برابر با این عدد ثابت است.

اگر x = a. سپس .

2. اگر وزن همه گزینه ها به تناسب تغییر کند، i.e. به همان تعداد بار افزایش یا کاهش می یابد، آنگاه میانگین حسابی سری جدید تغییر نخواهد کرد.

اگر تمام اوزان f را k بار کاهش دهیم، آنگاه .

3. مجموع انحرافات مثبت و منفی گزینه های فردی از میانگین ضرب در اوزان برابر با صفر است، یعنی.

اگر پس از آن. از اینجا.

اگر همه گزینه ها به هر عددی کاهش یا افزایش پیدا کنند، میانگین حسابی سری جدید به همان مقدار کاهش یا افزایش می یابد.

بیایید همه گزینه ها را کاهش دهیم ایکسبر آ، یعنی ایکس´ = ایکسآ.

سپس

میانگین حسابی سری اصلی را می توان با افزودن به میانگین کاهش یافته عددی که قبلاً از گزینه ها کم کرده بود به دست آورد. آ، یعنی .

5. اگر همه گزینه ها کاهش یا افزایش یابد کبار، سپس میانگین حسابی سری جدید به همان مقدار کاهش یا افزایش می یابد، یعنی. V کیک بار.

بگذار آن وقت باشد .

از این رو، یعنی برای به دست آوردن میانگین سری اصلی، میانگین حسابی سری جدید (با گزینه های کاهش یافته) باید افزایش یابد. کیک بار.

میانگین هارمونیکمیانگین هارمونیک متقابل میانگین حسابی است. زمانی استفاده می شود اطلاعات آماریدارای فرکانس برای انواع مختلف جمعیت نیست، اما به عنوان محصول آنها ارائه می شود (M = xf). میانگین هارمونیک با استفاده از فرمول 3.5 محاسبه خواهد شد

کاربرد عملی میانگین هارمونیک برای محاسبه برخی از شاخص ها به ویژه شاخص قیمت است.

میانگین هندسی.هنگام استفاده از میانگین هندسی، مقادیر فردی یک مشخصه، به عنوان یک قاعده، مقادیر نسبی دینامیک هستند که به شکل مقادیر زنجیره ای ساخته می شوند، به عنوان نسبتی به سطح قبلی هر سطح در یک سری از دینامیک. بنابراین میانگین میانگین نرخ رشد را مشخص می کند.

مقدار میانگین هندسی نیز برای تعیین مقدار مساوی از مقادیر حداکثر و حداقل مشخصه استفاده می شود. مثلا، شرکت بیمهقراردادهایی را برای ارائه خدمات بیمه خودرو منعقد می کند. بسته به رویداد بیمه شده خاص، پرداخت بیمه می تواند از 10000 تا 100000 دلار در سال متغیر باشد. میانگین مبلغ پرداختی بیمه دلار آمریکا خواهد بود.

میانگین هندسی کمیتی است که به‌عنوان میانگین نسبت‌ها یا در سری‌های توزیع استفاده می‌شود که به شکل یک تصاعد هندسی در زمانی که z = 0 ارائه می‌شود. این میانگین زمانی مناسب است که به تفاوت‌های مطلق توجه شود، بلکه به نسبت‌های دو توجه شود. شماره.

فرمول های محاسبه به شرح زیر است

متغیرهای مشخصه میانگین کجا هستند. - محصول گزینه ها؛ f- فراوانی گزینه ها

میانگین هندسی در محاسبات میانگین نرخ رشد سالانه استفاده می شود.

مربع متوسطفرمول میانگین مربع برای اندازه گیری درجه نوسان مقادیر فردی یک مشخصه حول میانگین حسابی در سری توزیع استفاده می شود. بنابراین، هنگام محاسبه شاخص های تغییرات، میانگین از مجذور انحراف مقادیر فردی یک مشخصه از میانگین حسابی محاسبه می شود.

ریشه میانگین ارزش مربع با استفاده از فرمول محاسبه می شود

که در تحقیقات اقتصادیمیانگین مربع در شکل اصلاح شده به طور گسترده ای در محاسبه شاخص های تغییرات یک مشخصه مانند پراکندگی، انحراف معیار استفاده می شود.

حکومت اکثریترابطه زیر بین میانگین توان وجود دارد - هر چه توان بزرگتر باشد، مقدار میانگین بیشتر است، جدول 5.4:

جدول 5.4

رابطه بین میانگین ها

مقدار z

رابطه بین میانگین ها

این رابطه را قاعده بزرگی می نامند.

میانگین های ساختاریبرای توصیف ساختار جمعیت از شاخص های خاصی استفاده می شود که می توان آن را میانگین های ساختاری نامید. این شاخص ها شامل حالت، میانه، چارک و دهک است.

روش.حالت (Mo) رایج ترین مقدار یک مشخصه در بین واحدهای جمعیت است. مد مقدار مشخصه ای است که با حداکثر نقطه منحنی توزیع نظری مطابقت دارد.

مد به طور گسترده در عمل تجاری هنگام مطالعه تقاضای مصرف کننده (هنگام تعیین اندازه لباس ها و کفش هایی که تقاضای زیادی دارند) و ثبت قیمت ها استفاده می شود. ممکن است در کل چندین مد وجود داشته باشد.

محاسبه حالت در یک سری گسسته.در یک سری گسسته، حالت نوع با بالاترین فرکانس است. بیایید پیدا کردن یک حالت در یک سری گسسته را در نظر بگیریم.

محاسبه حالت در یک سری فاصله.در یک سری تغییرات بازه ای، حالت تقریباً به عنوان نوع مرکزی بازه مدال در نظر گرفته می شود، یعنی. بازه ای که بیشترین فرکانس (فرکانس) را دارد. در این بازه، باید مقدار ویژگی که mode است را پیدا کنید. برای یک سری فاصله، حالت با فرمول تعیین می شود

حد پایین بازه مودال کجاست. - مقدار فاصله مودال؛ - فرکانس مربوط به فاصله مودال؛ - فرکانس قبل از فاصله مودال؛ - فرکانس بازه بعد از حالت مودال.

میانه.میانه () مقدار ویژگی واحد میانی سری رتبه‌بندی شده است. سری های رتبه بندی شده سری هایی هستند که در آن مقادیر ویژگی ها به ترتیب صعودی یا نزولی نوشته می شوند. یا میانه مقداری است که تعداد یک سری تغییرات مرتب شده را به دو قسمت مساوی تقسیم می کند: یک قسمت دارای مقدار مشخصه متغیر است که کمتر از گزینه متوسط ​​است و دیگری دارای مقداری است که بیشتر است.

برای یافتن میانه ابتدا عدد ترتیبی آن را مشخص کنید. برای این کار، اگر تعداد واحدها فرد باشد، یک به مجموع همه فرکانس ها اضافه می شود و همه چیز بر دو تقسیم می شود. با تعداد واحدهای زوج، میانه به عنوان مقدار ویژگی یک واحد یافت می شود که شماره سریال آن با مجموع مجموع فرکانس ها تقسیم بر دو تعیین می شود. با دانستن شماره سریال میانه، به راحتی می توان مقدار آن را با استفاده از فرکانس های انباشته پیدا کرد.

محاسبه میانه در یک سری گسسته.بر اساس بررسی نمونه، داده های مربوط به توزیع خانواده ها بر حسب تعداد فرزندان، جدول به دست آمد. 5.5. برای تعیین میانه ابتدا عدد ترتیبی آن را مشخص می کنیم

=

سپس یک سری فرکانس های انباشته را می سازیم ( با استفاده از شماره سریال و فرکانس انباشته میانه را پیدا می کنیم. فراوانی انباشته شده 33 نشان می دهد که در 33 خانواده تعداد فرزندان از 1 فرزند تجاوز نمی کند، اما از آنجایی که تعداد میانه 50 است، میانه در محدوده 34 تا 55 خانواده خواهد بود.

جدول 5.5

توزیع تعداد خانواده ها بر اساس تعداد فرزندان

تعداد فرزندان خانواده

تعداد خانواده ها - مقدار فاصله متوسط

همه اشکال در نظر گرفته شده از میانگین های توان دارای یک ویژگی مهم هستند (برخلاف میانگین های ساختاری) - فرمول تعیین میانگین شامل تمام مقادیر سری است، به عنوان مثال. اندازه میانگین تحت تأثیر ارزش هر گزینه است.

از یک طرف، این یک ویژگی بسیار مثبت است زیرا در این مورد، تأثیر همه علل مؤثر بر همه واحدهای جمعیت مورد مطالعه در نظر گرفته می شود. از سوی دیگر، حتی یک مشاهده که به طور تصادفی در داده های منبع گنجانده شده است، می تواند به طور قابل توجهی ایده سطح توسعه صفت مورد مطالعه در جمعیت مورد بررسی (به ویژه در سری های کوتاه) را مخدوش کند.

ربع ها و دهک ها.با قیاس با یافتن میانه در سری تغییرات، می توانید مقدار یک مشخصه را برای هر واحد از سری رتبه بندی شده پیدا کنید. بنابراین، به طور خاص، می توانید مقدار ویژگی را برای واحدهایی که یک سری را به 4 قسمت مساوی، به 10 و غیره تقسیم می کنند، بیابید.

یک چهارم.گزینه هایی که سری های رتبه بندی شده را به چهار قسمت مساوی تقسیم می کنند، چارک نامیده می شوند.

در این مورد، آنها متمایز می کنند: چارک پایین (یا اول) (Q1) - مقدار ویژگی برای یک واحد سری رتبه بندی شده، تقسیم جمعیت به نسبت ¼ به ¾ و چارک بالایی (یا سوم) ( Q3) - مقدار ویژگی برای واحد سری رتبه بندی شده، تقسیم جمعیت به نسبت ¾ به ¼.

چارک دوم میانه Q2 = Me است. چارک پایین و بالایی در یک سری بازه ای با استفاده از فرمولی شبیه به میانه محاسبه می شود.

حد پایین بازه ای که به ترتیب شامل چارک های پایین و بالایی است کجاست.

- فرکانس انباشته فاصله قبل از بازه حاوی چارک پایین یا بالایی.

- فرکانس فواصل چارک (پایین و بالا)

فواصل حاوی Q1 و Q3 توسط فرکانس های انباشته شده (یا فرکانس ها) تعیین می شوند.

دهک هاعلاوه بر چارک ها، دهک ها نیز محاسبه می شوند - گزینه هایی که سری های رتبه بندی شده را به 10 قسمت مساوی تقسیم می کنند.

آنها با D تعیین می شوند ، دهک اول D1 سری را به نسبت 1/10 و 9/10 تقسیم می کند ، D2 دوم - 2/10 و 8/10 و غیره. آنها طبق طرحی مشابه میانه و چارک محاسبه می شوند.

هر دو میانه، چارک و دهک به آمار به اصطلاح ترتیبی تعلق دارند که به عنوان گزینه ای شناخته می شود که جایگاه ترتیبی خاصی را در سری های رتبه بندی شده اشغال می کند.

آکادمی اقتصاد ملی و خدمات عمومی روسیه زیر نظر رئیس فدراسیون روسیه

شعبه اوریول

گروه ریاضی و روش های ریاضیدر مدیریت

کار مستقل

ریاضیات

با موضوع "سریال تنوع و ویژگی های آن"

برای دانش آموزان بخش تمام وقتدانشکده اقتصاد و مدیریت

زمینه های آموزشی "مدیریت منابع انسانی"


هدف کار:تسلط بر مفاهیم آمار ریاضیو روش های پردازش داده های اولیه

نمونه ای از حل مسائل معمولی.

وظیفه 1.

داده های زیر از طریق نظرسنجی به دست آمد ():

1 2 3 2 2 4 3 3 5 1 0 2 4 3 2 2 3 3 1 3 2 4 2 4 3 3 3 2 0 6

3 3 1 1 2 3 1 4 3 1 7 4 3 4 2 3 2 3 3 1 4 3 1 4 5 3 4 2 4 5

3 6 4 1 3 2 4 1 3 1 0 0 4 6 4 7 4 1 3 5

لازم:

1) یک سری تغییرات بنویسید ( توزیع آمارینمونه)، که قبلاً یک سری گسسته رتبه بندی شده از گزینه ها را یادداشت کرده بودید.

2) یک چند ضلعی فرکانس بسازید و انباشته کنید.

3) مجموعه ای از توزیع های فرکانس های نسبی (فرکانس ها) را تدوین کنید.

4) مشخصه های عددی اصلی سری تغییرات را بیابید (از فرمول های ساده شده برای پیدا کردن آنها استفاده کنید): الف) میانگین حسابی، ب) میانه مهو مد مو، ج) پراکندگی s 2، د) انحراف معیار س، ه) ضریب تغییرات V.

5) معنای نتایج به دست آمده را توضیح دهید.

راه حل.

1) برای کامپایل کردن سری گسسته از گزینه ها رتبه بندی شده است بیایید داده های نظرسنجی را بر اساس اندازه مرتب کنیم و آنها را به ترتیب صعودی مرتب کنیم

0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2

3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

5 5 5 5 6 6 6 7 7.

بیایید با نوشتن مقادیر مشاهده شده (تغییرها) در ردیف اول جدول، و فرکانس های مربوطه در ردیف دوم (جدول 1) یک سری تغییرات بسازیم.

میز 1.

2) چند ضلعی فرکانس یک خط شکسته است که نقاط اتصال ( x i; n من), من=1, 2,…, متر، جایی که متر ایکس.

اجازه دهید چند ضلعی فرکانس های سری تغییرات را به تصویر بکشیم (شکل 1).

عکس. 1. چند ضلعی فرکانس

منحنی تجمعی (انباشته) برای یک سری تغییرات گسسته نشان دهنده یک خط شکسته است که نقاط را به هم متصل می کند ( x i; n i nak), من=1, 2,…, متر.

بیایید فرکانس های انباشته شده را پیدا کنیم n i nak(فرکانس انباشته شده نشان می دهد که چند نوع با مقدار مشخصه کمتر مشاهده شده است ایکس). مقادیر یافت شده را در ردیف سوم جدول 1 وارد می کنیم.



بیایید یک انباشته بسازیم (شکل 2).

شکل 2. تجمع می کند

3) بیایید فرکانس های نسبی (فرکانس ها) را پیدا کنیم، کجا، کجا متر- تعداد مقادیر مختلف مشخصه ایکس، که با دقت یکسان محاسبه خواهیم کرد.

اجازه دهید سری توزیع فرکانس های نسبی (فرکانس ها) را در قالب جدول 2 بنویسیم.

جدول 2

4) بیایید ویژگی های عددی اصلی سری تغییرات را پیدا کنیم:

الف) میانگین حسابی را با استفاده از یک فرمول ساده پیدا کنید:

,

گزینه های مشروط کجا هستند

بگذاریم با= 3 (یکی از مقادیر متوسط ​​مشاهده شده)، ک= 1 (تفاوت بین دو گزینه همسایه) و یک جدول محاسبه (جدول 3) ترسیم کنید.

جدول 3.

x i nمن تو من u i n i u i 2 n i
-3 -12
-2 -26
-1 -14
مجموع -11

سپس میانگین حسابی

ب) میانه مهسری تغییرات مقدار مشخصه ای است که در وسط سری رتبه بندی مشاهدات قرار می گیرد. این سری تغییرات گسسته شامل تعداد زوج عبارت ( n=80)، یعنی میانه برابر با نصف مجموع دو گزینه میانی است.

روش موسری تغییرات به گزینه ای گفته می شود که با بالاترین فرکانس مطابقت دارد. برای یک سری تغییرات معین، بالاترین فرکانس nحداکثر = 24 مربوط به گزینه است ایکس= 3 به معنی مد است مو=3.

ج) واریانس s 2، که معیاری برای پراکندگی مقادیر احتمالی نشانگر است ایکسدر اطراف مقدار متوسط ​​آن، با استفاده از یک فرمول ساده شده آن را پیدا می کنیم:

، جایی که تو من- گزینه های مشروط

همچنین محاسبات میانی را در جدول 3 قرار خواهیم داد.

سپس واریانس

د) انحراف معیار سما آن را با استفاده از فرمول پیدا می کنیم:

.

ه) ضریب تغییرات V: (),

ضریب تغییرات یک کمیت غیرقابل اندازه گیری است، بنابراین برای مقایسه پراکندگی سری های تغییرات که واریانت های آن ابعاد متفاوتی دارند، مناسب است.

ضریب تغییرات

.

5) معنای نتایج به‌دست‌آمده این است که مقدار، مقدار میانگین مشخصه را مشخص می‌کند ایکسدر نمونه مورد بررسی، یعنی مقدار متوسط ​​2.86 بود. انحراف معیار سگسترش مطلق مقادیر شاخص را توصیف می کند ایکسو در در این موردمقدار س≈ 1.55. ضریب تغییرات Vمتغیر بودن نسبی شاخص را مشخص می کند ایکسیعنی اسپرد نسبی حول مقدار متوسط ​​آن و در این حالت .

پاسخ: ; ; ; .

وظیفه 2.

داده های زیر در مورد سرمایه 40 بانک بزرگ در روسیه مرکزی موجود است:

12,0 49,4 22,4 39,3 90,5 15,2 75,0 73,0 62,3 25,2
70,4 50,3 72,0 71,6 43,7 68,3 28,3 44,9 86,6 61,0
41,0 70,9 27,3 22,9 88,6 42,5 41,9 55,0 56,9 68,1
120,8 52,4 42,0 119,3 49,6 110,6 54,5 99,3 111,5 26,1

لازم:

1) یک سری تغییرات بازه ای بسازید.

2) میانگین نمونه و واریانس نمونه را محاسبه کنید

3) انحراف معیار و ضریب تغییرات را بیابید.

4) هیستوگرام توزیع فرکانس بسازید.

راه حل.

1) بیایید یک تعداد دلخواه از بازه ها را انتخاب کنیم، به عنوان مثال، 8. سپس عرض فاصله:

.

بیایید یک جدول محاسبه ایجاد کنیم:

گزینه فاصله، x k –x k +1 فرکانس، n من وسط فاصله x i گزینه مشروط، و من و من n i و من 2 n من (و i+ 1) 2 n من
10 – 25 17,5 – 3 – 12
25 – 40 32,5 – 2 – 10
40 – 55 47,5 – 1 – 11
55 – 70 62,5
70 – 85 77,5
85 – 100 92,5
100 – 115 107,5
115 – 130 122,5
مجموع – 5

مقدار انتخاب شده به عنوان صفر نادرست است c= 62.5 (این گزینه تقریباً در وسط سری تغییرات قرار دارد) .

گزینه های شرطی با فرمول تعیین می شوند

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...