Студентам и школьникам - помощь в учебе. Понятие вариационного ряда. Виды вариационных рядов Дан вариационный ряд

Метод группировок позволяет также измерить вариацию (изменчивость, колеблемость) признаков. При относительно малом числе единиц совокупности вариация измеряется на основе ранжированного ряда единиц, образующих совокупность. Ряд называется ранжированным, если единицы расположены по возрастанию (убыванию) признака.

Однако ранжированные ряды довольно малопоказательны тогда, когда необходима сравнительная характеристика вариации. Кроме того, во многих случаях приходится иметь дело со статистическими совокупностями, состоящими из большого числа единиц, которые практически трудно представить в виде конкретного ряда. В связи с этим для первоначального общего ознакомления со статистическими данными и особенно для облегчения изучения вариации признаков исследуемые явления и процессы обычно объединяют в группы, а результаты группировки оформляют в виде групповых таблиц.

Если в групповой таблице имеется всего две графы - группы по выделенному признаку (варианты) и численности групп (частоты или частости), она называется рядом распределения.

Ряд распределения - простейшая разновидность структурной группировки по одному признаку, отображенная в групповой таблице с двумя графами, в которых содержатся варианты и частоты признака. Во многих случаях с такой структурной группировки, т.е. с составления рядов распределения, начинается изучение исходного статистического материала.

Структурная группировка в виде ряда распределения может быть превращена в подлинную структурную группировку, если выделенные группы будут охарактеризованы не только частотами, но и другими статистическими показателями. Главное предназначение рядов распределения - изучение вариации признаков. Теорию рядов распределения подробно разрабатывает математическая статистика.

Ряды распределения делят на атрибутивные (группировка по атрибутивным признакам, например деление населения по полу, национальности, семейному положению и т.д.) и вариационные (группировка по количественным признакам).

Вариационный ряд представляет собой групповую таблицу, которая содержит две графы: группировку единиц по одному количественному признаку и численность единиц в каждой группе. Интервалы в вариационном ряду образуются обычно равные и закрытые. Вариационным рядом является следующая группировка населения России по величине среднедушевых денежных доходов (табл. 3.10).

Таблица 3.10

Распределение численности населения России по величине среднедушевых доходов в 2004-2009 гг.

Группы населения по величине среднедушевых денежных доходов, руб./мес

Численность населения в группе, в % к итогу

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Свыше 25 000,0

Все население

Вариационные ряды в свою очередь подразделяются на дискретные и интервальные. Дискретные вариационные ряды объединяют варианты дискретных признаков, изменяющихся в узких пределах. Примером дискретного вариационного ряда может служить распределение российских семей по числу имеющихся детей.

Интервальные вариационные ряды объединяют варианты либо непрерывных признаков, либо изменяющихся в широких пределах дискретных признаков. Интервальным является вариационный ряд распределения населения России по величине среднедушевых денежных доходов.

Дискретные вариационные ряды на практике применяются не слишком часто. Между тем составление их несложно, поскольку состав групп определяется конкретными вариантами, которыми реально обладают изучаемые группировочные признаки.

Более широко распространены интервальные вариационные ряды. При их составлении возникает сложный вопрос о количестве групп, а также о величине интервалов, которые должны быть установлены.

Принципы решения этого вопроса изложены в главе о методологии построения статистических группировок (см. параграф 3.3).

Вариационные ряды представляют собой средство свертывания или сжатия многообразной информации в компактную форму, по ним можно составить достаточно ясное суждение о характере вариации, изучить различия признаков явлений, входящих в исследуемую совокупность. Но важнейшее значение вариационных рядов состоит в том, что на их основе исчисляются особые обобщающие характеристики вариации (см. главу 7).

Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку.

Назначение сервиса . С помощью онлайн-калькулятора Вы сможете:

  • построить вариационный ряд , построить гистограмму и полигон;
  • найти показатели вариации (среднюю, моду (в т.ч. и графическим способом), медиану, размах вариации, квартили, децили, квартильный коэффициент дифференциации, коэффициент вариации и другие показатели);

Инструкция . Для группировки ряда необходимо выбрать вид получаемого вариационного ряда (дискретный или интервальный) и указать количество данных (количество строк). Полученное решение сохраняется в файле Word (см. пример группировки статистических данных).

Если группировка уже осуществлена и заданы дискретный вариационный ряд или интервальный ряд , то необходимо воспользоваться онлайн-калькулятором Показатели вариации . Проверка гипотезы о виде распределения производится с помощью сервиса Изучение формы распределения .

Виды статистических группировок

Вариационный ряд . В случае наблюдений дискретной случайной величины одно и то же значение можно встретить несколько раз. Такие значения x i случайной величины записывают с указанием n i числа раз его появления в n наблюдениях, это и есть частота данного значения.
В случае непрерывной случайной величины на практике применяют группировку.
  1. Типологическая группировка – это разделение исследуемой качественно разнородной совокупности на классы, социально–экономические типы, однородные группы единиц. Для построения данной группировки используйте параметр Дискретный вариационный ряд.
  2. Структурной называется группировка , в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому–либо варьирующему признаку. Для построения данной группировки используйте параметр Интервальный ряд.
  3. Группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками, называется аналитической группировкой (см. аналитическая группировка ряда).

Пример №1 . По данным таблицы 2 постройте ряды распределения по 40 коммерческим банкам РФ. По полученным рядам распределения определите: прибыль в среднем на один коммерческий банк, кредитные вложения в среднем на один коммерческий банк, модальное и медианное значение прибыли; квартили, децили, размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, коэффициент вариации.

Решение :
В разделе «Вид статистического ряда» выбираем Дискретный ряд. Нажимаем Вставить из Excel . Количество групп: по формуле Стэрджесса

Принципы построения статистических группировок

Ряд наблюдений, упорядоченных по возрастанию, называется вариационным рядом . Группировочным признаком называется признак, по которому производится разбивка совокупности на отдельные группы. Его называют основанием группировки. В основание группировки могут быть положены как количественные, так и качественные признаки.
После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность.

При использовании персональных компьютеров для обработки статистических данных группировка единиц объекта производится с помощью стандартных процедур.
Одна из таких процедур основана на использовании формулы Стерджесса для определения оптимального числа групп:

k = 1+3,322*lg(N)

Где k – число групп, N – число единиц совокупности.

Длину частичных интервалов вычисляют как h=(x max -x min)/k

Затем подсчитывают числа попаданий наблюдений в эти интервалы, которые принимают за частоты n i . Малочисленные частоты, значения которых меньше 5 (n i < 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
В качестве новых значений вариант берут середины интервалов x i =(c i-1 +c i)/2.

Пример №3 . В результате 5%-ной собственно-случайной выборки получено следующее распределение изделий по содержанию влаги. Рассчитайте: 1) средний процент влажности; 2) показатели, характеризующие вариацию влажности.
Решение получено с помощью калькулятора : Пример №1

Построить вариационный ряд. По найденному ряду построить полигон распределения, гистограмму, кумуляту. Определить моду и медиану.
Скачать решение

Пример . По результатам выборочного наблюдения (выборка А приложение):
а) составьте вариационный ряд;
б) вычислите относительные частоты и накопленные относительные частоты;
в) постройте полигон;
г) составьте эмпирическую функцию распределения;
д) постройте график эмпирической функции распределения;
е) вычислите числовые характеристики: среднее арифметическое, дисперсию, среднее квадратическое отклонение. Решение

На основе данных, приведенных в Таблице 4 (Приложение 1) и соответствующих Вашему варианту, выполнить:

  1. На основе структурной группировки построить вариационный частотный и кумулятивный ряды распределения, используя равные закрытые интервалы, приняв число групп равным 6. Результаты представить в виде таблицы и изобразить графически.
  2. Проанализировать вариационный ряд распределения, вычислив:
    • среднее арифметическое значение признака;
    • моду, медиану, 1-ый квартиль, 1-ый и 9-тый дециль;
    • среднее квадратичное отклонение;
    • коэффициент вариации.
  3. Сделать выводы.

Требуется: ранжировать ряд, построить интервальный ряд распределения, вычислить среднее значение, колеблемость среднего значения, моду и медиану для ранжированного и интервального рядов.

На основе исходных данных построить дискретный вариационный ряд ; представить его в виде статистической таблицы и статистических графиков. 2). На основе исходных данных построить интервальный вариационный ряд с равными интервалами. Число интервалов выбрать самостоятельно и объяснить этот выбор. Представить полученный вариационный ряд в виде статистической таблицы и статистических графиков. Указать виды примененных таблиц и графиков.

С целью определения средней продолжительности обслуживания клиентов в пенсионном фонде, число клиентов которого очень велико, по схеме собственно-случайной бесповторной выборки проведено обследование 100 клиентов. Результаты обследования представлены в таблице. Найти:
а) границы, в которых с вероятностью 0.9946 заключено среднее время обслуживания всех клиентов пенсионного фонда;
б) вероятность того, что доля всех клиентов фонда с продолжительностью обслуживания менее 6 минут отличается от доли таких клиентов в выборке не более чем на 10% (по абсолютной величине);
в) объем повторной выборки, при котором с вероятностью 0.9907 можно утверждать, что доля всех клиентов фонда с продолжительностью обслуживания менее 6 минут отличается от доли таких клиентов в выборке не более чем на 10% (по абсолютной величине).
2. По данным задачи 1, используя X 2 критерий Пирсона, на уровне значимости α = 0,05 проверить гипотезу о том, что случайная величина Х – время обслуживания клиентов – распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
Скачать решение

Дана выборка из 100 элементов. Необходимо:

  1. Построить ранжированный вариационный ряд;
  2. Найти максимальный и минимальный члены ряда;
  3. Найти размах вариации и количество оптимальных промежутков для построения интервального ряда. Найти длину промежутка интервального ряда;
  4. Построить интервальный ряд. Найти частоты попадания элементов выборки в составленные промежутки. Найти средние точки каждого промежутка;
  5. Построить гистограмму и полигон частот. Сравнить с нормальным распределением (аналитически и графически);
  6. Построить график эмпирической функции распределения;
  7. Рассчитать выборочные числовые характеристики: выборочное среднее и центральный выборочный момент;
  8. Рассчитать приближенные значения среднего квадратического отклонения, асимметрии и эксцесса (пользуясь пакетом анализа MS Excel). Сравнить приближенные расчетные значения с точными (рассчитанные по формулам MS Excel);
  9. Сравнить выборочные графические характеристики с соответствующими теоретическими.
Скачать решение

Имеются следующие выборочные данные (выборка 10%-ная, механическая) о выпуске продукции и сумме прибыли, млн. руб. По исходным данным:
Задание 13.1.
13.1.1. Постройте статистический ряд распределения предприятий по сумме прибыли, образовав пять групп с равными интервалами. Постройте графики ряда распределения.
13.1.2. Рассчитайте числовые характеристики ряда распределения предприятий по сумме прибыли: среднюю арифметическую, среднее квадратическое отклонение, дисперсию, коэффициент вариации V. Сделайте выводы.
Задание 13.2.
13.2.1. Определите границы, в которых с вероятностью 0.997 заключена сумма прибыли одного предприятия в генеральной совокупности.
13.2.2. Используя x2-критерий Пирсона , при уровне значимости α проверить гипотезу о том, что случайная величина X – сумма прибыли – распределена по нормальному закону.
Задание 13.3.
13.3.1. Определите коэффициенты выборочного уравнения регрессии.
13.3.2. Установите наличие и характер корреляционной связи между стоимостью произведённой продукции (X) и суммой прибыли на одно предприятие (Y). Постройте диаграмму рассеяния и линию регрессии.
13.3.3. Рассчитайте линейный коэффициент корреляции. Используя t-критерий Стьюдента, проверьте значимость коэффициента корреляции. Сделайте вывод о тесноте связи между факторами X и Y, используя шкалу Чеддока .
Методические рекомендации . Задание 13.3 выполняется с помощью этого сервиса .
Скачать решение

Задача . Следующие данные представляют собой затраты времени клиентов на заключение договоров. Построить интервальный вариационный ряд представленных данных, гистограмму, найти несмещенную оценку математического ожидания, смещенную и несмещенную оценку дисперсии.

Пример . По данным таблицы 2:
1) Постройте ряды распределения по 40 коммерческим банкам РФ:
А) по величине прибыли;
Б) по величине кредитных вложений.
2) По полученным рядам распределения определите:
А) прибыль в среднем на один коммерческий банк;
Б) кредитные вложения в среднем на один коммерческий банк;
В) модальное и медианное значение прибыли; квартили, децили;
Г) модальное и медианное значение кредитных вложений.
3) По полученным в п. 1 рядам распределения рассчитайте:
а) размах вариации;
б) среднее линейное отклонение;
в) среднее квадратическое отклонение;
г) коэффициент вариации.
Необходимые расчеты оформите в табличной форме. Результаты проанализируйте. Сделайте выводы.
Постройте графики полученных рядов распределения. Графически определите моду и медиану.

Решение:
Для построения группировка с равными интервалами воспользуемся сервисом Группировка статистических данных .

Рисунок 1 – Ввод параметров

Описание параметров
Количество строк : количество исходных данных. Если размерность ряда небольшая, укажите его количество. Если выборка достаточно объемная, то нажмите кнопку Вставить из Excel .
Количество групп : 0 – число групп будет определяться по формуле Стэрджесса.
Если задано конкретное число групп, укажите его (например, 5).
Вид ряда : Дискретный ряд.
Уровень значимости : например, 0.954 . Этот параметр задается для определения доверительного интервала среднего значения.
Выборка : Например, проведена 10% -ная механическая выборка. Указываем число 10 . Для наших данных указываем 100 .

Совокупность предметов или явлений, объединенных каким-либо общим признаком или свойством качественного или количественного характера, называется объектом наблюдения .

Всякий объект статистического наблюдения состоит из отдельных элементов - единиц наблюдения .

Результаты статистического наблюдения представляют собой числовую информацию - данные . Статистические данные - это сведения о том, какие значения принял интересующий исследователя признак в статистической совокупности.

Если значения признака выражаются числами, то признак называется количественным .

Если признак характеризует некоторое свойство или состояние элементов совокупности, то признак называется качественным .

Если исследованию подлежат все элементы совокупности (сплошное наблюдение), то статистическую совокупность называют генеральной.

Если исследованию подлежит часть элементов генеральной совокупности, то статистическую совокупность называют выборочной (выборкой) . Выборка из генеральной совокупности извлекается случайно, так чтобы каждый из n элементов выборки имел равные шансы быть отобранным.

Значения признака при переходе от одного элемента совокупности к другому изменяются (варьируют), поэтому в статистике различные значения признака также называют вариантами . Варианты обычно обозначаются малыми латинскими буквами x, y, z.

Порядковый номер варианта (значения признака) называется рангом . x 1 - 1-й вариант (1-е значение признака), x 2 - 2-й вариант (2-е значение признака), x i - i-й вариант (i-е значение признака).

Упорядоченный в порядке возрастания или убывания ряд значений признака (вариантов) с соответствующими им весами называется вариационным рядом (рядом распределения).

В качестве весов выступают частоты или частости.

Частота (m i) показывает сколько раз встречается тот или иной вариант (значение признака) в статистической совокупности.

Частость или относительная частота (w i) показывает, какая часть единиц совокупности имеет тот или иной вариант. Частость рассчитывается как отношение частоты того или иного варианта к сумме всех частот ряда.

. (6.1)

Сумма всех частостей равна 1.

. (6.2)

Вариационные ряды бывают дискретными и интервальными.

Дискретные вариационные ряды строят обычно в том случае, если значения изучаемого признака могут отличаться друг от друга не менее чем на некоторую конечную величину.

В дискретных вариационных рядах задаются точечные значения признака.

Общий вид дискретного вариационного ряда указан в таблице 6.1.

Таблица 6.1

где i = 1, 2, … , l.

В интервальных вариационных рядах в каждом интервале выделяют верхнюю и нижнюю границы интервала.

Разность между верхней и нижней границами интервала называют интервальной разностью или длиной (величиной) интервала .

Величина первого интервала k 1 определяется по формуле:

k 1 = а 2 - а 1 ;

второго: k 2 = а 3 - а 2 ; …

последнего: k l = a l - a l -1 .

В общем виде интервальная разность k i рассчитывается по формуле:

k i = x i (max) - x i (min) . (6.3)

Если интервал имеет обе границы, то его называют закрытым .

Первый и последний интервалы могут быть открытыми , т.е. иметь только одну границу.

Например, первый интервал может быть задан как "до 100", второй - "100-110", … , предпоследний - "190-200", последний - "200 и более". Очевидно, что первый интервал не имеет нижней границы, а последний - верхней, оба они - открытые.

Часто открытые интервалы приходится условно закрывать. Для этого обычно величину первого интервала принимают равной величине второго, а величину последнего - величине предпоследнего. В нашем примере величина второго интервала равна 110-100=10, следовательно, нижняя граница первого интервала условно составит 100-10=90; величина предпоследнего интервала равна 200-190=10, следовательно, верхняя граница последнего интервала условно составит 200+10=210.

Кроме этого, в интервальном вариационном ряде могут встречаются интервалы разной длины. Если интервалы в вариационном ряде имеют одинаковую длину (интервальную разность), их называют равновеликими , в противном случае - неравновеликими.

При построении интервального вариационного ряда часто встает проблема выбора величины интервалов (интервальной разности).

Для определения оптимальной величины интервалов (в том случае, если строится ряд с равными интервалами) применяют формулу Стэрджесса:

, (6.4)

где n - число единиц совокупности,

x (max) и x (min) - наибольшее и наименьшее значения вариантов ряда.

Для характеристики вариационного ряда наряду с частотами и частостями используются накопленные частоты и частости.

Накопленные частоты (частости) показывают сколько единиц совокупности (какая их часть) не превышают заданного значения (варианта) х.

Накопленные частоты (v i ) по данным дискретного ряда можно рассчитать по следующей формуле:

. (6.5)

Для интервального вариационного ряда - это сумма частот (частостей) всех интервалов, не превышающих данный.

Дискретный вариационный ряд графически можно представить с помощьюполигона распределения частот или частостей .

При построении полигона распределения по оси абсцисс откладываются значения признака (варианты), а по оси ординат - частоты или частости. На пересечении значений признака и соответствующих им частот (частостей) откладываются точки, которые, в свою очередь, соединяются отрезками. Получающаяся таким образом ломаная называется полигоном распределения частот (частостей).

x k
x 2
x 1 x i


Рис. 6.1.

Интервальные вариационные ряды графически можно представить с помощью гистограммы , т.е. столбчатой диаграммы.

При построении гистограммы по оси абсцисс откладываются значения изучаемого признака (границы интервалов).

В том случае, если интервалы - одинаковой величины, по оси ординат можно откладывать частоты или частости.

Если же интервалы имеют разную величину, по оси ординат необходимо откладывать значения абсолютной или относительной плотности распределения.

Абсолютная плотность - отношение частоты интервала к величине интервала:

; (6.6)

где: f(a) i - абсолютная плотность i-го интервала;

m i - частота i-го интервала;

k i - величина i-го интервала (интервальная разность).

Абсолютная плотность показывает, сколько единиц совокупности приходится на единицу интервала.

Относительная плотность - отношение частости интервала к величине интервала:

; (6.7)

где: f(о) i - относительная плотность i-го интервала;

w i - частость i-го интервала.

Относительная плотность показывает, какая часть единиц совокупности приходится на единицу интервала.

a l
a 1 x i
a 2

И дискретные и интервальные вариационные ряды графически можно представить в виде кумуляты и огивы.

При построении кумуляты по данным дискретного ряда по оси абсцисс откладываются значения признака (варианты), а по оси ординат - накопленные частоты или частости. На пересечении значений признака (вариантов) и соответствующих им накопленных частот (частостей) строятся точки, которые, в свою очередь, соединяются отрезками или кривой. Получающаяся таким образом ломаная (кривая) называется кумулятой (кумулятивной кривой).

При построении кумуляты по данным интервального ряда по оси абсцисс откладываются границы интервалов. Абсциссами точек являются верхние границы интервалов. Ординаты образуют накопленные частоты (частости) соответствующих интервалов. Часто добавляют еще одну точку, абсциссой которой является нижняя граница первого интервала, а ордината равна нулю. Соединяя точки отрезками или кривой, получим кумуляту.

Огива строится аналогично кумуляте с той лишь разницей, что на оси абсцисс наносятся точки, соответствующие накопленным частотам (частостям), а по оси ординат - значения признака (варианты).

  • Вводный урок бесплатно ;
  • Большое число опытных преподавателей (нейтивов и русскоязычных);
  • Курсы НЕ на определенный срок (месяц, полгода, год), а на конкретное количество занятий (5, 10, 20, 50);
  • Более 10 000 довольных клиентов.
  • Стоимость одного занятия с русскоязычным преподавателем - от 600 рублей , с носителем языка - от 1500 рублей

Понятие вариационного ряда. Первым шагом систематизации материалов статистического наблюдения является подсчет числа единиц, обладающих тем или иным признаком. Расположив единицы в порядке возрастания или убывания их количественного признака и подсчитав число единиц с конкретным значением признака, получаем вариационный ряд. Вариационный ряд характеризует распределение единиц определенной статистической совокупности по какому–либо количественному признаку.

Вариационный ряд представляет собой две колонки, в левой колонке приводятся значения варьирующего признака, именуемые вариантами и обозначаемые (x), а в правой – абсолютные числа, показывающие, сколько раз встречается каждый вариант. Показатели этой колонки называются частотами и обозначаются (f).

Схематично вариационный ряд можно представить в виде табл.5.1:

Таблица 5.1

Вид вариационного ряда

Варианты (x)

Частоты (f)

В правой колонке могут использоваться и относительные показатели, характеризующие долю частоты отдельных вариантов в общей сумме частот. Эти относительные показатели именуют частостями и условно обозначают через , т.е. . Сумма всех частостей равна единице. Частости могут быть выражены и в процентах, и тогда их сумма будет равна 100%.

Варьирующие признаки могут носить разный характер. Варианты одних признаков выражаются в целых числах, например, число комнат в квартире, число изданных книг и т.д. Эти признаки именуют прерывными, или дискретными. Варианты других признаков могут принимать любые значения в определенных пределах, как, например, выполнение плановых заданий, заработная плата и др. Эти признаки называют непрерывными.

Дискретный вариационный ряд. Если варианты вариационного ряда выражены в виде дискретных величин, то такой вариационный ряд называют дискретным, его внешний вид представлен в табл. 5.2:

Таблица 5.2

Распределение студентов по оценкам, полученным на экзамене

Оценки (х)

Количество студентов (f)

В % к итогу ()

Характер распределения в дискретных рядах изображается графически в виде полигона распределения, рис.5.1.

Рис. 5.1. Распределение студентов по оценкам, полученным на экзамене.

Интервальный вариационный ряд. Для непрерывных признаков вариационные ряды строятся интервальные, т.е. значения признака в них выражаются в виде интервалов «от и до». При этом минимальное значение признака в таком интервале именуют нижней границей интервала, а максимальное – верхней границей интервала.

Интервальные вариационные ряды строят как для прерывных признаков (дискретных), так и для варьирующих в большом диапазоне. Интервальные ряды могут быть с равными и неравными интервалами. В экономической практике в большинстве своем применяются неравные интервалы, прогрессивно возрастающие или убывающие. Такая необходимость возникает особенно в тех случаях, когда колеблемость признака осуществляется неравномерно и в больших пределах.

Рассмотрим вид интервального ряда с равными интервалами, табл. 5.3:

Таблица 5.3

Распределение рабочих по выработке

Выработка, т.р. (х)

Число рабочих (f)

Кумулятивная частота (f´)

Интервальный ряд распределения графически изображается в виде гистограммы, рис.5.2.

Рис.5.2. Распределение рабочих по выработке

Накопленная (кумулятивная) частота. В практике возникает потребность в преобразовании рядов распределения в кумулятивные ряды, строящиеся по накопленным частотам. С их помощью можно определить структурные средние, которые облегчают анализ данных ряда распределения.

Накопленные частоты определяются путем последовательного прибавления к частотам (или частостям) первой группы этих показателей последующих групп ряда распределения. Для иллюстрации рядов распределения используются кумуляты и огивы. Для их построения на оси абсцисс отмечаются значения дискретного признака (или концы интервалов), а на оси ординат – нарастающие итоги частот (кумулята), рис.5.3.

Рис. 5.3. Кумулята распределения рабочих по выработке

Если шкалы частот и вариантов поменять местами, т.е. на оси абсцисс отражать накопленные частоты, а на оси ординат – значения вариантов, то кривая, характеризующая изменение частот от группы к группе, будет носит название огивы распределения, рис.5.4.

Рис. 5.4. Огива распределения рабочих по выработке

Вариационные ряды с равными интервалами обеспечивают одно из важнейших требований, предъявляемых к статистическим рядам распределения, обеспечение сравнимости их во времени и пространстве.

Плотность распределения. Однако частоты отдельных неравных интервалов в названных рядах непосредственно не сопоставимы. В подобных случаях для обеспечения необходимой сравнимости исчисляют плотность распределения, т.е. определяют, сколько единиц в каждой группе приходится на единицу величины интервала.

При построении графика распределения вариационного ряда с неравными интервалами высоту прямоугольников определяют пропорционально не частотам, а показателям плотности распределения значений изучаемого признака в соответствующих интервалах.

Составление вариационного ряда и его графическое изображение является первым шагом обработки исходных данных и первой ступенью анализа изучаемой совокупности. Следующим шагом в анализе вариационных рядов является определение основных обобщающих показателей, именуемых характеристиками ряда. Эти характеристики должны дать представление о среднем значении признака у единиц совокупности.

Средняя величина . Средняя величина представляет собой обобщенную характеристику изучаемого признака в исследуемой совокупности, отражающая ее типический уровень в расчете на единицу совокупности в конкретных условиях места и времени.

Средняя величина всегда именованная, имеет ту же размерность, что и признак у отдельных единиц совокупности.

Перед вычислением средних величин необходимо произвести группировку единиц исследуемой совокупности, выделив качественно однородные группы.

Средняя, рассчитанная по совокупности в целом называется общей средней, а для каждой группы – групповыми средними.

Существуют две разновидности средних величин: степенные (средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая); структурные (мода, медиана, квартили, децили).

Выбор средней для расчета зависит от цели.

Виды степенных средних и методы их расчета. В практике статистической обработки собранного материала возникают различные задачи, для решения которых требуются различные средние.

Математическая статистика выводит различные средние из формул степенной средней:

где средняя величина; x – отдельные варианты (значения признаков); z – показатель степени (при z = 1 – средняя арифметическая, z = 0 средняя геометрическая, z = - 1 – средняя гармоническая, z = 2 – средняя квадратическая).

Однако вопрос о том, какой вид средней необходимо применить в каждом отдельном случае, разрешается путем конкретного анализа изучаемой совокупности.

Наиболее часто встречающимся в статистике видом средних величин является средняя арифметическая . Она исчисляется в тех случаях, когда объем осредняемого признака образуется как сумма его значений у отдельных единиц изучаемой статистической совокупности.

В зависимости от характера исходных данных средняя арифметическая определяется различными способами:

Если данные несгруппированные, то расчет ведется по формуле простой средней величины

Расчет средней арифметической в дискретном ряду происходит по формуле 3.4.

Расчет средней арифметической в интервальном ряду. В интервальном вариационном ряду, где за величину признака в каждой группе условно принимается середина интервала, средняя арифметическая может отличаться от средней, рассчитанной по несгруппированным данным. Причем, чем больше величина интервала в группах, тем больше возможные отклонения средней, вычисленной по сгруппированным данным, от средней, рассчитанной по несгруппированным данным.

При расчете средней по интервальному вариационному ряду для выполнения необходимых вычислений от интервалов переходят к их серединам. А затем рассчитывают среднюю величину по формуле средней арифметической взвешенной.

Свойства средней арифметической. Средняя арифметическая обладает некоторыми свойствами, которые позволяют упрощать вычисления, рассмотрим их.

1. Средняя арифметическая из постоянных чисел равна этому постоянному числу.

Если х = а. Тогда .

2. Если веса всех вариантов пропорционально изменить, т.е. увеличить или уменьшить в одно и то же число раз, то средняя арифметическая нового ряда от этого не изменится.

Если все веса f уменьшить в k раз, то .

3. Сумма положительных и отрицательных отклонений отдельных вариантов от средней, умноженных на веса, равна нулю, т.е.

Если , то . Отсюда .

Если все варианты уменьшить или увеличить на какое- либо число, то средняя арифметическая нового ряда уменьшится или увеличится на столько же.

Уменьшим все варианты x на a , т.е. x ´ = x a.

Тогда

Среднюю арифметическую первоначального ряда можно получить, прибавляя к уменьшенной средней ранее вычтенное из вариантов числа a , т.е. .

5. Если все варианты уменьшить или увеличить в k раз, то средняя арифметическая нового ряда уменьшится или увеличится во столько же, т.е. в k раз.

Пусть , тогда .

Отсюда , т.е. для получения средней первоначального ряда среднюю арифметическую нового ряда (с уменьшенными вариантами) надо увеличить в k раз.

Средняя гармоническая. Средняя гармоническая это величина обратная средней арифметической. Ее используют, когда статистическая информация не содержит частот по отдельным вариантам совокупности, а представлена как их произведение (М= xf). Средняя гармоническая будет рассчитываться по формуле 3.5

Практическое применение средней гармонической – для расчета некоторых индексов, в частности, индекса цен.

Средняя геометрическая. При применении средней геометрической индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста.

Средняя геометрическая величина используется также для определения равноудаленной величины от максимального и минимального значений признака. Например, страховая компания заключает договоры на оказание услуг автострахования. В зависимости конкретного страхового случая страховая выплата может колебаться от 10000 до 100000 долл. в год. Средняя сумма выплат по страховке составит долл.

Средняя геометрическая это величина, используемая как средняя из отношений или в рядах распределения, представленных в виде геометрической прогрессии, когда z = 0. Этой средней удобно пользоваться, когда уделяется внимание не абсолютным разностям, а отношениям двух чисел.

Формулы для расчета следующие

где – варианты осредняемого признака; – произведение вариантов; f – частота вариантов.

Средняя геометрическая используется в расчетах среднегодовых темпов роста.

Средняя квадратическая. Формула средней квадратической используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения. Так, при расчете показателей вариации среднюю вычисляют из квадратов отклонений индивидуальных значений признака от средней арифметической величины.

Средняя квадратическая величина рассчитывается по формуле

В экономических исследованиях средняя квадратическая в измененном виде широко используется при расчете показателей вариации признака, таких как дисперсия, среднее квадратическое отклонение.

Правило мажорантности. Между степенными средними существует следующая зависимость – чем больше показатель степени, тем больше значение средней, табл.5.4:

Таблица 5.4

Соотношение между средними величинами

Значение z

Соотношение между средними

Это соотношение называется правилом мажорантности.

Структурные средние величины. Для характеристики структуры совокупности применяются особые показатели, которые можно назвать структурными средними. К таким показателям относятся мода, медиана, квартили и децили.

Мода. Модой (Мо) называется наиболее часто встречающееся значение признака у единиц совокупности. Модой называется то значение признака, которое соответствует максимальной точке теоретической кривой распределения.

Мода широко используется в коммерческой практике при изучении покупательского спроса (при определении размеров одежды и обуви, которые пользуются широким спросом), регистрации цен. Мод в совокупности может быть несколько.

Расчет моды в дискретном ряду. В дискретном ряду мода – это варианта с наибольшей частотой. Рассмотрим нахождение моды в дискретном ряду.

Расчет моды в интервальном ряду. В интервальном вариационном ряду модой приближенно считают центральный вариант модального интервала, т.е. того интервала, который имеет наибольшую частоту (частость). В пределах интервала надо найти то значение признака, которое является модой. Для интервального ряда мода будет определяться формулой

где – нижняя граница модального интервала; – величина модального интервала; – частота, соответствующая модальному интервалу; – частота, предшествующая модальному интервалу; – частота интервала, следующего за модальным.

Медиана. Медианой () называется значение признака у средней единицы ранжированного ряда. Ранжированный ряд – это ряд, у которого значения признака записаны в порядке возрастания или убывания. Или медиана это величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значение варьирующего признака меньшие, чем средний вариант, а другая – большие.

Чтобы найти медиану, сначала определяется ее порядковый номер. Для этого при нечетном числе единиц к сумме всех частот прибавляется единица и все делится на два. При четном числе единиц медиана отыскивается как значение признака у единицы, порядковый номер который определяется по общей сумме частот, деленной на два. Зная порядковый номер медианы, легко по накопленным частотам найти ее значение.

Расчет медианы в дискретном ряду. По данным выборочного обследования получены данные о распределении семей по числу детей, табл. 5.5. Для определения медианы сначала определим ее порядковый номер

=

Затем построим ряд накопленных частот (, по порядковому номеру и накопленной частоте найдем медиану. Накопленная частота 33 показывает, что в 33 семьях количество детей не превышает 1 ребенка, но так как номермедианы 50, то медиана будет находится в промежутке с 34 по 55 семью.

Таблица 5.5

Распределение числа семей от количества детей

Число детей в семье

Количество семей, –величина медианного интервала;

Все рассмотренные формы степенной средней обладают важным свойством (в отличие от структурных средних) – в формулу определения средней входят все значения ряда т.е. на размеры средней оказывают влияние значение каждого варианта.

С одной стороны, это весьма положительное свойство т.к. в этом случае учитывается действие всех причин, воздействующих на все единицы изучаемой совокупности. С другой стороны, даже одно наблюдение, попавшее в исходные данные случайно, может существенным образом исказить представление об уровне развития изучаемого признака в рассматриваемой совокупности (особенно в коротких рядах).

Квартили и децили. По аналогии с нахождением медианы в вариационных рядах можно отыскать значение признака у любой по порядку единицы ранжированного ряда. Так, в частности, можно найти значение признака у единиц, делящих ряд на 4 равные части, на 10 и т.п.

Квартили. Варианты, которые делят ранжированный ряд на четыре равные части, называют квартилями.

При этом различают: нижний (или первый) квартиль (Q1) – значение признака у единицы ранжированного ряда, делящей совокупность в соотношении ¼ к ¾ и верхний (или третий) квартиль(Q3) – значение признака у единицы ранжированного ряда, делящий совокупность в соотношении ¾ к ¼.

Второй квартиль, есть медиана Q2 = Ме. Нижний и верхний квартили в интервальном ряду рассчитываются по формуле аналогично медиане.

где – нижняя граница интервала, содержащего соответственно нижний и верхний квартиль;

– накопленная частота интервала, предшествующего интервалу, содержащему нижний или верхний квартиль;

– частоты квартильных интервалов (нижнего и верхнего)

Интервалы, в которых содержатся Q1 и Q3 определяют по накопленным частотам (или частостям).

Децили. Кроме квартилей рассчитывают децили – варианты, делящие ранжированный ряд на 10 равных частей.

Обозначаются они через D, первый дециль D1 делит ряд в соотношении 1/10 и 9/10, второй D2 – 2/10 и 8/10 и т.д. Вычисляются они по той же схеме, что и медиана и квартили.

И медиана, и квартили, и децили принадлежат к так называемым порядковым статистикам, под которым понимают вариант, занимающий определенное порядковое место в ранжированном ряду.

РОССИЙСКАЯ АКАДЕМИЯ НАРОДНОГО ХОЗЯЙСТВА И ГОСУДАРСТВЕННОЙ СЛУЖБЫ при ПРЕЗИДЕНТЕ РОССИЙСКОЙ ФЕДЕРАЦИИ

ОРЛОВСКИЙ ФИЛИАЛ

кафедра математики и математических методов в управлении

Самостоятельная работа

По математике

на тему «Вариационный ряд и его характеристики»

для студентов очного отделения факультета «Экономика и менеджмент»

направления подготовки «Управление персоналом»


Цель работы: Освоение понятий математической статистики и приемов первичной обработки данных.

Пример решения типовых задач.

Задача 1.

Путем опроса получены следующие данные ():

1 2 3 2 2 4 3 3 5 1 0 2 4 3 2 2 3 3 1 3 2 4 2 4 3 3 3 2 0 6

3 3 1 1 2 3 1 4 3 1 7 4 3 4 2 3 2 3 3 1 4 3 1 4 5 3 4 2 4 5

3 6 4 1 3 2 4 1 3 1 0 0 4 6 4 7 4 1 3 5

Необходимо:

1) Составить вариационный ряд (статистическое распределение выборки), предварительно записав ранжированный дискретный ряд вариантов.

2) Построить полигон частот и кумуляту.

3) Составить ряд распределения относительных частот (частостей).

4) Найти основные числовые характеристики вариационного ряда (использовать упрощенные формулы для их нахождения): а) среднюю арифметическую , б) медиану Ме и моду Мо , в) дисперсию s 2 , г) среднее квадратическое отклонение s , д) коэффициент вариации V .

5) Пояснить смысл полученных результатов.

Решение.

1) Для составления ранжированного дискретного ряда вариантов отсортируем данные опроса по величине и расположим их в порядке возрастания

0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2

3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

5 5 5 5 6 6 6 7 7.

Составим вариационный ряд, записав в первую строку таблицы наблюдаемые значения (варианты), а во вторую соответствующие им частоты (таблица 1)

Таблица 1.

2) Полигон частот представляет собой ломаную, соединяющую точки (х i ; n i ), i =1, 2,…, m , где m X .

Изобразим полигон частот вариационного ряда (рис. 1).

Рис.1. Полигон частот

Кумулятивная кривая (кумулята) для дискретного вариационного ряда представляет ломаную, соединяющую точки (х i ; n i нак ), i =1, 2,…, m .

Найдем накопленные частоты n i нак (накопленная частота показывает, сколько наблюдалось вариантов со значением признака меньшим х ). Найденные значения заносим в третью строку таблицы 1.



Построим кумуляту (рис. 2).

Рис.2. Кумулята

3) Найдем относительные частоты (частости) , где , где m – число различных значений признака X , которые будем вычислять с одинаковой точностью.

Запишем ряд распределения относительных частот (частостей) в виде таблицы 2

Таблица 2

4) Найдем основные числовые характеристики вариационного ряда:

а) Среднюю арифметическую найдем, используя упрощенную формулу:

,

где - условные варианты

Положим с = 3 (одно из средних наблюдаемых значений), k = 1 (разность между двумя соседними вариантами) и составим расчетную таблицу (табл. 3).

Таблица 3.

x i n i u i u i n i u i 2 n i
-3 -12
-2 -26
-1 -14
Сумма -11

Тогда средняя арифметическая

б) Медианой Ме вариационного ряда называется значение признака, приходящееся на середину ранжированного ряда наблюдений. Данный дискретный вариационный ряд содержит четное число членов (n =80), значит, медиана равна полусумме двух серединных вариантов.

Модой Мо вариационного ряда называется вариант, которому соответствует наибольшая частота. Для данного вариационного ряда наибольшая частота n max = 24 соответствует варианту х = 3, значит мода Мо =3.

в) Дисперсию s 2 , которая является мерой рассеяния возможных значений показателя X вокруг своего среднего значения, найдем, используя упрощенную формулу:

, где u i – условные варианты

Промежуточные вычисления также занесем в таблицу 3.

Тогда дисперсия

г) Среднее квадратическое отклонение s найдем по формуле:

.

д) Коэффициент вариации V : (),

Коэффициент вариации является безмерной величиной, поэтому он пригоден для сравнения рассеяния вариационных рядов, варианты которых имеют различную размерность.

Коэффициент вариации

.

5) Смысл полученных результатов заключается в том, что величина характеризует среднее значение признака X в пределах рассматриваемой выборки, то есть среднее значение составило 2,86. Среднее квадратическое отклонение s описывает абсолютный разброс значений показателя X и в данном случае составляет s ≈ 1,55. Коэффициент вариации V характеризует относительную изменчивость показателя X , то есть относительный разброс вокруг его среднего значения , и в данном случае составляет .

Ответ: ; ; ; .

Задача 2.

Имеются следующие данные о собственном капитале 40 крупнейших банков Центральной России:

12,0 49,4 22,4 39,3 90,5 15,2 75,0 73,0 62,3 25,2
70,4 50,3 72,0 71,6 43,7 68,3 28,3 44,9 86,6 61,0
41,0 70,9 27,3 22,9 88,6 42,5 41,9 55,0 56,9 68,1
120,8 52,4 42,0 119,3 49,6 110,6 54,5 99,3 111,5 26,1

Необходимо:

1) Построить интервальный вариационный ряд.

2) Вычислить среднюю выборочную и выборочную дисперсию

3) Найти среднее квадратическое отклонение, и коэффициент вариации.

4) Построить гистограмму частот распределения.

Решение.

1) Выберем произвольное число интервалов, например, 8. Тогда ширина интервала:

.

Составим расчетную таблицу:

Интервал вариант, х k –x k +1 Частота, n i Середина интервала х i Условная варианта, и i и i n i и i 2 n i (и i + 1) 2 n i
10 – 25 17,5 – 3 – 12
25 – 40 32,5 – 2 – 10
40 – 55 47,5 – 1 – 11
55 – 70 62,5
70 – 85 77,5
85 – 100 92,5
100 – 115 107,5
115 – 130 122,5
Сумма – 5

В качестве ложного нуля выбрано значение с= 62,5(эта варианта расположена примерно в середине вариационного ряда).

Условные варианты определяются по формуле

Поделитесь с друзьями или сохраните для себя:

Загрузка...