Статистичка студија за врската помеѓу статистиката на феномените. Статистичка студија за односите меѓу социо-економските појави. Ако се проучува врската помеѓу две карактеристики, ова е парна корелација. Ако се изучува односот помеѓу многу карактеристики - корелација

Проучувањето на објективно постоечките врски меѓу појавите е најважната задача општа теоријастатистика. Во процесот на статистичко проучување на зависностите, се откриваат причинско-последични односи меѓу појавите, што овозможува да се идентификуваат факторите (знаците) кои имаат значително влијание врз варијацијата на појавите и процесите што се проучуваат. Причинско-последична врска е врска помеѓу појавите и процесите во кои промената на еден од нив - причината - доведува до промена на другиот - ефектот.

Причина е збир на услови, околности, чие дејство доведува до појава на ефект. Ако навистина постојат причинско-последични односи меѓу појавите, тогаш овие состојби нужно мора да се реализираат заедно со дејството на причините. Причинските врски се универзални и разновидни, а за да се откријат причинско-последичните врски, неопходно е да се изберат поединечни појави и да се проучат изолирано.

Од особена важност при проучувањето на причинско-последичните односи е идентификацијата на временската секвенца: причината мора секогаш да му претходи на ефектот, но не секој претходен настан треба да се смета за причина, а следниот - последица.

Во реалната социо-економска реалност, причината и последицата мора да се сметаат за поврзани феномени, чија појава се должи на комплекс од придружни поедноставни причини и последици. Помеѓу сложените групи на причини и последици, можни се повеќевредни врски, во кои една причина ќе биде проследена со едно или друго дејство, или едно дејство ќе има неколку различни причини. За да се воспостави недвосмислена каузална врска помеѓу појавите или да се предвидат можните последици од одредена причина, потребна е целосна апстракција од сите други појави во временската или просторната средина што се проучува. Теоретски, таквата апстракција се репродуцира. Техниките на апстракција често се користат при проучување на врската помеѓу две карактеристики (парична корелација). Но, колку покомплексни се појавите што се проучуваат, толку е потешко да се идентификуваат причинско-последичните односи меѓу нив. Преплетувањето на различни внатрешни и надворешни фактори неминовно води до некои грешки во одредувањето на причината и последицата.

Карактеристика на причинско-последичните односи во општествено-економските појави е нивната транзитивност, т.е. причината и последицата се поврзани со корелација, а не директно. Меѓутоа, во анализата обично се испуштаат меѓуфактори.

Така, на пример, кога се користат индикатори на меѓународната методологија за пресметка, фактор на бруто-добивка се смета за бруто акумулација на постојан и обртни средства, но се дозволени фактори како бруто-аутпут, плати и сл. Правилно откриените причинско-последични односи овозможуваат да се утврди силата на влијанието на поединечните фактори врз резултатите од економската активност.

Социо-економските појави се резултат на истовремено влијание на голем број причини. Следствено, при проучувањето на овие појави, неопходно е, апстрахирајќи се од секундарните, да се идентификуваат главните, фундаментални причини.

Во првата фаза од статистичкото проучување на комуникацијата, се врши квалитативна анализа на феноменот што се проучува со помош на методи економската теорија, социологија, конкретна економија.

Во втората фаза се гради комуникациски модел врз основа на статистички методи: групирања, просеци, табели итн.

Во третата и последна фаза се толкуваат резултатите; анализата е повторно поврзана со квалитативните карактеристики на феноменот што се проучува.

Статистиката има развиено многу методи за проучување на односите, чиј избор зависи од целите на студијата и поставените задачи. Врските меѓу знаците и појавите, поради нивната широка разновидност, се класифицирани по повеќе основи. Знаците според нивното значење за проучување на врската се поделени во две класи. Карактеристиките кои предизвикуваат промени во други сродни особини се нарекуваат факторилни или едноставно фактори. Ефективни се знаците кои се менуваат под влијание на факторите знаци. Врските меѓу појавите и нивните карактеристики се класифицираат според степенот на блискост на поврзаноста, насоката и аналитичкото изразување.

Во статистиката се прави разлика помеѓу функционална врска и стохастичка зависност. Функционална врска е онаа во која одредена вредност на факторската карактеристика одговара на една и само една вредност на добиената карактеристика. Функционалната поврзаност се манифестира во сите случаи на набљудување и за секоја специфична единица од испитуваната популација.

Ако причинско-последичната зависност не се појавува во секој поединечен случај, туку генерално, во просек во текот на голем број набљудувања, тогаш таквата зависност се нарекува стохастичка. Посебен случај на стохастика е корелација, во која промената на просечната вредност на добиената карактеристика се должи на промена на карактеристиките на факторот.

Врз основа на степенот на блискост на поврзувањето, се издвојуваат квантитативни критериуми за проценка на близината на поврзувањето (Табела 1).

Табела 1 Квантитативни критериуми за проценка на блискоста на врските

По насока, се разликуваат директни и обратни врски. Во директна врска со зголемување или намалување на вредностите на факторската карактеристика, се јавува зголемување или намалување на вредностите на резултантната карактеристика. На пример, зголемувањето на продуктивноста на трудот помага да се зголеми нивото на профитабилност на производството. Кога повратни информациивредностите на добиената карактеристика се менуваат под влијание на факторската карактеристика, но во спротивна насока во споредба со промената на факторската карактеристика. Така, со зголемување на нивото на продуктивност на капиталот, трошокот по единица производство се намалува.

Според аналитичкиот израз, врските се разликуваат помеѓу линеарни (или едноставно линеарни) и нелинеарни. Ако статистичка врска помеѓу појавите може приближно да се изрази со равенката на права линија, тогаш таа се нарекува линеарна врска; ако се изрази со равенката на која било крива линија (парабола, хипербола, моќност, експоненцијална, експоненцијална итн.), тогаш таквата врска се нарекува нелинеарна или криволинеарна.

Статистиката не секогаш бара квантитативни проценки на врската; често е важно да се одреди само нејзината насока и природа, да се идентификува формата на влијание на некои фактори врз други. За да се идентификува присуството на врската, неговата природа и насока во статистиката, се користат методи за доведување паралелни податоци; аналитички групи; графички; корелација, регресија.

Методот на доведување паралелни податоци се заснова на споредување на две или повеќе серии статистички вредности. Таквата споредба ни овозможува да утврдиме постоење на врска и да добиеме идеја за нејзината природа. Да ги споредиме промените во две количини и како што се зголемува вредноста, така се зголемува и вредноста. Според тоа, врската меѓу нив е директна и може да се опише или со права линија или со равенка на парабола од втор ред.

Односот помеѓу две карактеристики е графички прикажан со користење на корелацијата. Во координатниот систем, вредностите на факторската карактеристика се исцртуваат на оската на апсцисата, а резултантната карактеристика е нацртана на оската на ординатите. Секое пресекување на линии повлечени низ овие оски е означено со точка. Во отсуство на блиски врски, се забележува случаен распоред на точките на графикот. Колку е посилна врската помеѓу карактеристиките, толку поблиску точките ќе бидат групирани околу одредена линија што ја изразува формата на врската.

Карактеристично за социо-економските појави е тоа што, заедно со значајните фактори кои го формираат нивото на добиената карактеристика, е под влијание на многу други неоткриени и случајни фактори. Ова укажува дека односите меѓу појавите што ги проучува статистиката се од корелациона природа и се аналитички изразени со функција на формата.

Методот на корелација има за задача квантитативно определување на блискоста на врската помеѓу две карактеристики (во парно поврзување) и помеѓу резултантните и многуфакторските карактеристики (во мултифакторска врска).

Корелацијата е статистичка зависност помеѓу случајни променливи кои немаат строго функционална природа, при што промената на една од случајни променлививоди кон промена математичко очекувањедруг.

Во статистиката, се разликуваат следниве опции за зависност:

  • -корелација на пар - врска помеѓу две карактеристики (резултативна и фактор или два фактора);
  • -делумна корелација - зависноста помеѓу резултантните и еднофакторските карактеристики со фиксна вредност на другите факторски карактеристики;
  • -повеќекратна корелација - зависноста на резултантните и два или повеќе факторски карактеристики вклучени во студијата.

Блискоста на врската квантитативно се изразува со големината на коефициентите на корелација. Коефициентите на корелација, кои претставуваат квантитативна карактеристика на блиската врска помеѓу карактеристиките, овозможуваат да се одреди „корисноста“ на факторските карактеристики при конструирање на повеќекратни регресивни равенки. Вредноста на коефициентот на корелација служи и како проценка на конзистентноста на регресивната равенка со идентификуваните причинско-последични односи.

Првично, студиите за корелација беа спроведени во биологијата, а подоцна се проширија и во други области, вклучувајќи ја и социо-економската. Истовремено со корелацијата почна да се користи и регресија. Корелацијата и регресијата се тесно поврзани: корелацијата ја проценува силата (блискоста) на статистичката врска, регресијата ја испитува нејзината форма. И двете служат за воспоставување на односот помеѓу појавите, за утврдување на присуството или отсуството на врска.

Корелација и регресивна анализа како општ концептвклучува мерење на затегнатоста, насока на поврзувањето и воспоставување аналитички израз (форма) на врската (регресивна анализа).

Методот на регресија се состои во одредување на аналитичкиот израз на врската во која промената на една вредност (наречена зависна или резултатска карактеристика) се должи на влијанието на една или повеќе независни вредности (фактори) и множеството на сите други фактори кои исто така влијаат на зависната вредност се земаат како константни и просечни значења. Регресијата може да биде еднофакторна (спарена) или повеќефакторска (повеќекратна).

Во зависност од формата на зависност, постојат:

Линеарна регресија, која се изразува со праволиниска равенка (линеарна функција) од формата:

Yx = a0 + a1x;

Нелинеарна регресија, која се изразува со равенки од формата:

Yx = a0 + a1x + a2 x 2 - парабола; Yx = a0 ++ a1/x - хипербола

Според насоката на комуникација, постојат:

  • -директна регресија (позитивна), која се јавува ако, со зголемување или намалување на независната вредност, соодветно се зголемуваат или намалуваат вредностите на зависната вредност;
  • -инверзна (негативна) регресија, која се појавува под услов со зголемување или намалување на независната вредност, зависната вредност соодветно се намалува или зголемува.

Позитивните и негативните регресии можат полесно да се разберат ако се претставени графички.

За едноставна (спарена) регресија, во услови кога причинско-последичните односи се доволно целосно воспоставени, практично значење добива само последната одредба; Со мноштво причинско-последични врски, невозможно е јасно да се разликуваат некои причински појави од други.

регресија на сезонски флуктуации

9.1. Каузалност, регресија, корелација

Во процесот на статистичко проучување на зависностите, се откриваат причинско-последични односи меѓу појавите, што овозможува да се идентификуваат факторите (знаците) кои имаат големо влијание врз варијацијата на појавите и процесите што се проучуваат. Причинско-последична врска е врска помеѓу појавите и процесите, кога промената на едната од нив, причината, доведува до промена на другата, последицата.

Според нивното значење за проучување на врската, знаците се поделени на два вида: факторски и ефективни.

Социо-економските појави се резултат на истовремено влијание на голем број причини. Следствено, при проучувањето на овие феномени, неопходно е да се идентификуваат главните, главните причини, апстрахирани од секундарните.

Првата фаза од статистичкото проучување на врската се заснова на квалитативна анализа на феноменот што се проучува, т.е. проучување на неговата природа користејќи ги методите на економската теорија, социологијата и конкретната економија. Втората фаза е градење на комуникациски модел. Третата и последна фаза, толкувањето на резултатите, повторно се поврзува со квалитативните карактеристики на феноменот што се проучува.

Во статистиката се прави разлика помеѓу функционални и стохастички врски. Функционална врска е онаа во која одредена вредност на факторската карактеристика одговара на една и само една вредност на добиената карактеристика. Оваа поврзаност се манифестира во сите случаи на набљудување и за секоја конкретна единица од населението што се проучува. Ако причинско-последичната зависност не се појавува во секој поединечен случај, туку генерално, во просек во текот на голем број набљудувања, тогаш таквата зависност се нарекува стохастичка. Посебен случај на стохастичка врска е корелација, во која промената на просечната вредност на ефективната карактеристика се должи на промена на карактеристиките на факторот.

Врските меѓу знаците и појавите, поради нивната широка разновидност, се класифицираат по повеќе основи: според степенот на блискост на поврзаноста, насоката и аналитичкото изразување.

Степенот на блискост на корелациската врскаможе квантитативно да се процени со помош на коефициентот на корелација, чија вредност ја одредува природата на врската (Табела 1).

Табела 1 - Квантитативни критериуми за затегнатост на врската

Кон разликуваат директни и обратни врски.

Во директна врска со зголемување или намалување на вредностите на факторската карактеристика, се јавува зголемување или намалување на вредностите на резултантната карактеристика. Во случај на повратни информации, како што се зголемуваат вредностите на атрибутот фактор, вредностите на резултатот атрибут се намалуваат и обратно.

Според аналитичкиот израз се разликуваат врските: линеарни(или само линеарно) и нелинеарни. Ако статистичката врска помеѓу појавите може приближно да се изрази со равенката на права линија, тогаш таа се нарекува линеарна; ако се изрази со равенката на која било крива линија (парабола, хипербола, експоненцијална, експоненцијална итн.), тогаш таквата врска се нарекува нелинеарна или криволинеарна.

За да се идентификува присуството на врска, неговата природа и насока во статистиката, се користат следните методи: носење паралелни податоци; аналитички групи; статистички графикони; корелации.

Паралелен метод на намалување на податоцитесе заснова на споредба на две или повеќе серии статистички вредности. Таквата споредба ни овозможува да утврдиме постоење на врска и да добиеме идеја за нејзината природа. На пример, промената во две количини е претставена со следните податоци.

Графички, односот помеѓу две карактеристики е прикажан со користење на корелацијата. Во координатниот систем, вредностите на факторската карактеристика се исцртуваат на оската на апсцисата, а резултантната карактеристика е нацртана на оската на ординатите. Колку е посилна врската помеѓу карактеристиките, толку поблиску точките ќе се групираат околу одредена линија што ја изразува формата на врската (сл.).

Во отсуство на блиски врски, постои случаен распоред на точките на графикот.

Карактеристично за социо-економските појави е тоа што, заедно со значајните фактори кои го формираат нивото на ефективниот атрибут, врз него влијаат и многу други неоткриени и случајни фактори. Ова покажува дека односите помеѓу феномените што ги проучува статистиката се од корелациона природа.

Корелацијае статистичка врска помеѓу случајни променливи кои немаат строго функционална природа, во која промената на една од случајните променливи доведува до промена на математичкото очекување (просечна вредност) на другата.

Во статистиката вообичаено е да се прави разлика помеѓу следново видови на зависности.

1. Корелација на пар – врска помеѓу две карактеристики (резултативна и фактор или два фактора).

2. Парцијална корелација - зависноста помеѓу резултантните и еднофакторските карактеристики со фиксна вредност на другите факторски карактеристики.

3. Повеќекратна корелација - зависноста на резултантните и два или повеќе факторски карактеристики вклучени во студијата.

Задача на корелација анализае квантитативно определување на блискоста на врската помеѓу две карактеристики (во парно поврзување) и помеѓу добиените и повеќефакторските карактеристики (во мултифакторна врска).

Блискоста на врската квантитативно се изразува со големината на коефициентите на корелација, кои овозможуваат да се одреди „корисноста“ на факторските карактеристики при конструирање на повеќекратни регресивни равенки. Дополнително, вредноста на коефициентот на корелација служи како проценка на конзистентноста на регресивната равенка со идентификуваните причинско-последични односи.

9.2. Проценка на затегнатоста на врската

Блискоста на корелацијата помеѓу факторот и карактеристиките на изведбата може да се пресмета со користење на следните коефициенти: емпириски коефициент на корелација (Фехнеровиот коефициент); коефициент на асоцијација; Меѓусебен коефициент на непредвидена состојба на Пирсон и Чупров; контингент фактор; Коефициенти на корелација за рангирање на Спирман и Кендал; коефициент на линеарна корелација; однос на корелација итн.

Коефициентот на линеарна корелација ја карактеризира најтесната врска: , каде е просекот на производите на вредностите на карактеристиките xy; - просечни вредности на карактеристики XИ на; - стандардни отстапувања на карактеристиките XИ u.Се користи ако врската помеѓу карактеристиките е линеарна

Коефициентот на линеарна корелација може да биде позитивен или негативен.

Неговата позитивна вредност укажува на директна врска, а нејзината негативна вредност укажува на инверзна врска. Колку е поблиску до ±1, толку е поблиску врската. Со функционална врска помеѓу карактеристики = ±1. Блискоста до 0 значи дека врската помеѓу карактеристиките е слаба.

9.3. Методи на регресивна анализа

Тесно поврзан со концептот на корелација е концептот регресија. Првиот служи за проценка на блискоста на врската, вториот ја испитува неговата форма. Корелација и регресивна анализа, како општ концепт, опфаќа мерење на затегнатоста и насоката на врската (анализа на корелација) и воспоставување аналитички израз (форма) на врската (регресивна анализа).

Откако ќе се идентификува присуството на статистички врски меѓу променливите со помош на корелациона анализа и ќе се процени степенот на нивната блискост, преминуваме кон математички опис на специфичен тип на зависност со помош на регресивна анализа. За да го направите ова, изберете класа на функции што го поврзуваат ефективниот индикатор наи аргументи x 1 , x 2,… xк, изберете ги најинформативните аргументи, пресметајте ги проценките на непознатите вредности на параметрите за комуникација и анализирајте ги својствата на добиената равенка.

Функција која ја опишува зависноста на просечната вредност на добиената карактеристика наод дадените вредности на аргументот се повикува регресивна функција (равенка). Регресијата е линија, тип на зависност на просечната ефективна карактеристика од факторот еден.

Најразвиена во теоријата на статистиката е методологијата на парна корелација, која го разгледува влијанието на варијацијата на факторот карактеристика x врз резултантната y

Линеарната корелација равенка има форма: .

Опции а 0И а 1се нарекуваат параметри на регресивната равенка.

За одредување на параметрите на равенката за регресија, се користи методот најмали квадрати, кој дава систем од две нормални равенки:

.

Со решавање на овој систем во општа форма, можеме да добиеме формули за одредување на параметрите на равенката на регресија: ,

ВЕЖБИ

Проблем 9.1. 15 фабрики се рангирани според зголемување на профитабилноста на производството.

Претпријатие бр.

Профитабилност на производството, %

Аутпут по работник, т/лице

Трошоци по единица производство, Бришење.

Утврдете присуство и форма на корелација помеѓу профитабилноста на производството и аутпутот, профитабилноста на производството и единечната цена на производството користејќи ги методите на статистички графикони и регресивна анализа.

1. Курс по теорија на статистика за обука на специјалисти за финансиски и економски профили: учебник / Салин В. Н. - М.: Финансии и статистика, 2006 година - 480 стр.

2. Општа теорија за статистика: учебник за студенти / М.Р. Ефимова, Е. В. Петрова, В. Н. Румјанцев. - 2. ed., rev. и дополнителни - М.: ИНФРА-М, 2006. - 414 стр.

3. Работилница за општата теорија на статистиката: упатство/ М.Р. Ефимова, О.И. Ганченко, Е.В. Петрова. - Ед. 3-ти, ревидиран и дополнителни - М. Финансии и статистика, 2007. - 368 стр.

4. Работилница за статистика / А.П. Зинченко, А.Е., Шибалкин, О.Б. Тарасова, Е.В. Шаикина; Ед. А.П. Зинченк. – М.: KolosS, 2003. – 392 стр.

5. Статистика: Учебник за ученици. институции проф. образование / В.С. Мхитарјан, Т.А. Дуброва, В.Г. Минашкин и сор.; Ед. В.С. Мхитарјан. – 3-то издание, избришано. – М.: Издавачки центар „Академија“, 2004. -272 стр.

6. Статистика: учебник за студенти / Санкт Петербург. држава Универзитетот за економија и финансии; Изменето од I. I. Елисеева. - М.: Високо образование, 2008. - 566 стр.

7. Теорија на статистика: учебник за студенти на економски специјалности на универзитетите / R. A. Shmoilova [et al.]; ед. Р.А. Шмоилова. - 5-то издание. - М.: Финансии и статистика, 2008. - 656 стр.

Студијата на модерното производство покажува дека секој феномен е тесно меѓусебно поврзан и содејствува.

При проучувањето на специфичните зависности, некои карактеристики делуваат како фактори кои ги одредуваат промените во другите карактеристики. Карактеристиките на оваа група се нарекуваат факторски карактеристики (факторски карактеристики), а карактеристиките кои се резултат на влијанието на овие фактори се нарекуваат ефективни (бидејќи на обемот на аутпутот влијае техничката опрема на производството, тогаш обемот на производството е ефективна, а техничката опременост е факторска карактеристика). Постојат два типа на зависности помеѓу економските појави – функционални и стохастички. Со функционална врска, секој дефиниран систем на вредности на факторските карактеристики одговара на една или неколку строго дефинирани вредности на добиената карактеристика. Примери за функционална зависност може да се дадат од полето на физичките појави (S = v·t).

Стохастичката (веројатна) врска се манифестира само во масовни појави. Во овој поглед, секој специфичен систем на вредности на факторските карактеристики одговара на одреден сет на вредности на добиената карактеристика. Промената на карактеристиките на факторот не води до строго дефинирана промена на добиената карактеристика, туку до промена само во распределбата на нејзините вредности. Ова се должи на фактот што на зависната променлива, покрај избраната променлива, влијаат и голем број неконтролирани или неприменети фактори, а исто така и поради тоа што мерењето на променливите неминовно е придружено со некои случајни грешки. Бидејќи вредностите на зависната променлива подлежат на случајно расејување, тие не можат да се предвидат со доволна точност, туку се означени само со одредена веројатност (број на неисправни делови по смена, број на застој по смена итн.) .

Стохастичката комуникација се нарекува корелација. Корелацијата во широка смисла на зборот значи поврзаност, однос помеѓу објективно постоечките појави и процеси. Регресијата е посебен случај на корелација. Додека анализата на корелација ја оценува силата на стохастичката врска, регресивната анализа ја испитува нејзината форма, т.е. се наоѓа корелационата равенка (регресивна равенка).

Ајде да размислиме различни видовикорелации и регресии.

Регресијата се класифицира според бројот на променливи:

1) спарено – регресија помеѓу две променливи (профит и продуктивност на трудот);

2) повеќекратна – регресија помеѓу зависната променлива y и неколку променливи (продуктивност на трудот, ниво на производствена механизација, квалификации на работниците).

Во однос на формата на зависност, постојат:

линеарна регресија; нелинеарна регресија.

Во зависност од природата на регресијата, постојат:

1) директна регресија. Тоа се случува ако, со зголемување или намалување на вредностите на факторските променливи, вредностите на резултантната променлива исто така се зголемуваат или намалуваат;

2) обратна регресија. Во овој случај, со зголемување или намалување на вредностите на карактеристиката на факторот, добиената карактеристика се намалува или зголемува.

Во однос на видот на поврзување на појавите, тие разликуваат:

1) директна регресија. Во овој случај, појавите се директно поврзани едни со други (трошоци за добивка);

2) индиректна регресија. Се јавува ако променливите на факторот и исходот не се директно во причинско-последична врска и факторската променлива делува на променливата на исходот преку некоја друга променлива (бројот на пожари и приносот на жито (метеоролошки услови));

3) лажна или апсурдна регресија. Тоа произлегува со формален пристап кон појавите што се проучуваат. Како резултат на тоа, може да дојдете до лажни, па дури и бесмислени зависности (бројот на увезени овошја и зголемување на сообраќајните несреќи со фатални последици).

Класификацијата и корелациите се слични.

Изучувањето на меѓузависностите во економијата е од големо значење. Статистиката не само што одговара на прашањето за вистинското постоење на врска меѓу појавите, туку дава и квантитативен опис на оваа врска. Познавајќи ја природата на зависноста на една појава од друга, можно е да се објаснат причините и обемот на промените на феноменот, како и да се испланираат неопходните мерки за негова понатамошна промена. За да се најдат резултатите од корелациската анализа практична употребаи го даде посакуваниот резултат, мора да се исполнат одредени барања:

1) хомогеност на единиците кои се предмет на анализа на корелација (претпријатијата произведуваат ист тип на производи, иста природа на технолошкиот процес и тип на опрема);

2) доволен број на набљудувања;

3) факторите вклучени во студијата мора да бидат независни еден од друг.

За проучување на функционалните односи, се користат методи на рамнотежа и индекс. За проучување на стохастичките врски се користи методот на паралелни серии, методот на аналитички групирања, анализа на варијанса и анализа на регресии и корелации.

Наједноставниот метод за откривање на врски е споредување на две паралелни серии. Суштината на методот е во тоа што прво се рангираат индикаторите кои ја карактеризираат факторската карактеристика, а потоа паралелно со нив се поставуваат соодветните показатели на резултантната карактеристика. Споредбата на сериите конструирани на овој начин овозможува не само да се потврди самото присуство на врската, туку и да се идентификува нејзината насока.

Во случај кога споредената серија се состои од голем број единици, насоката на комуникација за различни единици може да биде различна. Во овој случај, препорачливо е да се користат табели за корелација. Во табела за корелација, факторската карактеристика (x) се става во редови, а резултантната карактеристика (y) се става во колони. Броевите лоцирани на пресекот на редовите и колоните од табелата ја покажуваат фреквенцијата на повторување на дадена комбинација од x и y. Изградбата на корелација табела започнува со групирање на единиците за набљудување според вредностите на факторот и резултантните карактеристики. Ако фреквенциите во табелата за корелација се наоѓаат дијагонално од горниот лев агол до долниот десен агол, тогаш можеме да претпоставиме присуство на директна корелација. Ако фреквенциите се наоѓаат дијагонално од десно кон лево, тогаш се претпоставува присуство на повратни информации помеѓу знаците.

Друг метод за откривање врски е да се изгради групна табела (метод на аналитичко групирање). Множеството вредности на факторот x е поделено во групи и за секоја група се пресметува просечната вредност на добиената карактеристика. Се претпоставува дека со доволно голем број на набљудувања во секоја група, влијанието на другите случајни фактори при пресметувањето на групниот просек ќе се поништи и зависноста на ефективната карактеристика од факторската карактеристика ќе стане појасна и, според тоа, разликите во вредноста на средствата ќе биде поврзана само со разлики во вредноста на оваа факторска карактеристика. Ако не постоеше врска помеѓу факторот и резултантниот атрибут, тогаш сите средини на групата би биле приближно исти по големина.

Наједноставниот показател за близината на врската е коефициентот на корелација на знаци (коефициент Х. Фехнер):

,

каде е бројот на совпаѓања на знаци на отстапувања на поединечна вредност од просекот;

– бројот на несовпаѓања во знаците на отстапувања на поединечна вредност од просекот.

Овој коефициент ви овозможува да добиете идеја за насоката на поврзувањето и приближна карактеристика на неговата затегнатост. За да се пресмета, се пресметуваат просечните вредности на резултантните и факторските карактеристики, а потоа се доделуваат знаци на отстапување за сите вредности на меѓусебно поврзаните карактеристики Kf = [-1;+1]. Ако знаците на сите отстапувања се совпаѓаат, тогаш Kf = 1 - директна врска; ако знаците на сите отстапувања се различни, тогаш Kf = - 1, што укажува на присуство на повратни информации.

Табела 28

Број на работници и билансна добивка

Број на работници, луѓе

Добивка од билансот на состојба, илјади рубли.

Знак на отстапувања на вредностите на поединечните особини од просекот

Одговарање (а), несовпаѓање (б)

Илјада тријте.

, на тој начин, постои слаба повратна информација помеѓу знаците.

За приближување на насоката и силата на врската помеѓу карактеристиките претставени со две серии, можете да го користите и коефициентот на корелација на ранг. При одредување на коефициентот на корелација на ранг, се рангираат вредностите x, а потоа се рангираат соодветните y вредности. Како резултат на тоа, добиваме чинови, т.е. места, броеви на единици на население во подредена серија. Покрај тоа, ако има идентични опции, на секоја од нив им е доделена аритметичката средина на нивните рангови.

Коефициент на корелација на ранг Спирман:

,

каде што d е разликата помеѓу рангот на соодветните вредности на две карактеристики;

n – број на единици по ред.

Коефициентот на корелација на рангирањето зема вредности [-1; 1]. Ако – затворете директно поврзување, – затворете повратни информации, – нема врска. Коефициентот на корелација на ранг има одредени предности во однос на другите карактеристики на насоката и близината на врската: може да се утврди при проучување на податоци кои не можат да се нумерираат, но се рангирани (нијанси, квалитет).

За нумеричко карактеризирање на близината на врската, може да се користат индикатори за варијација на добиената карактеристика: нејзината вкупна дисперзија и дисперзија меѓу групите ().

Коефициент на корелација на ранг на Кендал:

,

каде q е бројот на рангови подредени во обратен редослед.

Во практиката на статистичкото истражување, често е неопходно да се анализираат алтернативните распределби, кога популацијата е распределена за секоја карактеристика во две групи со спротивни карактеристики. Блискоста на врската во овој случај може да се процени со помош на коефициентот контингент:

.

Табела 29

Зависност на успехот на учениците од полот

Студентска популација

ги положил испитите

оние кои не ги положиле испитите

.

Следствено, практично нема врска помеѓу полот на ученикот и неговите академски перформанси.

Коефициентот на асоцијација се пресметува на следниов начин:

Претходно прегледано статистички методиСтудиите за односите честопати излегуваат како недоволни, бидејќи тие не дозволуваат постојната врска да се изрази во форма на специфична математичка равенка. Методите на паралелни серии и аналитички групирања се ефективни само со мал број факторски карактеристики, додека социо-економските појави обично се развиваат под влијание на многу причини. Овие ограничувања се елиминираат со методот на анализа на корелации и регресии.

Методот на анализа на корелации и регресии се состои во конструирање и анализа на економско-математички модел во форма на регресивна равенка која ја изразува зависноста на феноменот од неговите детерминирачки фактори. На пример, зависноста на обемот на производство (y) (милиони рубли) од неговата техничка опрема (x) (%) се изразува со следнава зависност:

.

Може да се претпостави дека со зголемување на техничката опрема за 1%, обемот на производство ќе се зголеми во просек за 21,4 милиони рубли.

Методот на анализа на корелации и регресии се состои од следниве чекори:

прелиминарна анализа; собирање информации и нивна примарна обработка; градење на модел (регресивни равенки); евалуација и анализа на моделот.

Во првата фаза, неопходно е општо да се формулира истражувачкиот проблем (проучување на влијанието на различни фактори врз нивото на продуктивноста на трудот). Следно, треба да ја одредите методологијата за мерење на индикаторот за успешност (продуктивноста на трудот може да се определи со природни, методи на труд или трошоци). Исто така, неопходно е да се одреди бројот на фактори кои имаат најзначајно влијание врз формирањето на ефективната карактеристика.

Во фазата на собирање и обработка на информации, истражувачот мора да запомни дека популацијата што се проучува мора да биде доволно голема во обем. Изворните податоци мора да бидат квалитативно и квантитативно хомогени.

При конструирање на корелациски модел (регресивна равенка) се поставува прашањето за типот на аналитичката функција што го карактеризира механизмот на врска помеѓу карактеристиките. Оваа врска може да се изрази:

права линија ; парабола од втор ред ; хипербола; експоненцијална функција итн.

Односно, се поставува прашањето за изборот на формата на комуникација. Типот на емпириска регресија сугерира каков тип на крива може да се опише. Следно, регресивната равенка е решена. Потоа, со помош на посебни критериуми, се проценува нивната соодветност и се избира формата на поврзување која обезбедува најдобра апроксимација и доволна статистичка веродостојност. Откако ја избравме формата на врската и изградивме регресивна равенка во општа форма, неопходно е да се најде нумеричката вредност на неговите параметри. За да се најдат параметрите, се користи методот на најмали квадрати. Нејзината суштина е како што следува.

Проучувањето на зависностите е застрашувачка задача, бидејќи самите социо-економски феномени се сложени и разновидни. Дополнително, извлечените заклучоци се од веројатен карактер, бидејќи се извлечени од податоци кои се примерок во времето или просторот.

Статистичките методи за проучување на зависноста се градат земајќи ги предвид карактеристиките на обрасците што се проучуваат. Статистиката ги проучува првенствено стохастичките врски, кога една вредност на факторската карактеристика одговара на група вредности на добиената карактеристика. Ако, со промена на вредностите на факторската карактеристика, просечните вредности на групата на добиената карактеристика се менуваат, тогаш таквите врски се нарекуваат корелација. Не секоја стохастичка зависност е корелациона. Ако секоја вредност на факторска карактеристика одговара на строго дефинирана вредност на резултантната карактеристика, тогаш таквата зависност е функционална. Се нарекува и целосна корелација. Двосмислените корелации се нарекуваат нецелосна корелација.

Според механизмот на интеракција, тие се разликуваат:

· Директни врски - кога причината директно влијае на ефектот;

· Индиректни врски - кога има голем број на посредни знаци помеѓу причината и последицата (на пример, ефектот на возраста врз заработката).

Се разликуваат следниве области:

· Директни врски - кога вредноста на факторот и резултантните карактеристики се менуваат во иста насока;

· Повратни информации - кога вредностите на факторот и резултантните карактеристики се менуваат во различни насоки.

· Правилни (линеарни) врски - изразени со права линија;

· Криволинеарни врски - изразени со парабола, хипербола.

Врз основа на бројот на меѓусебно поврзани карактеристики, тие се разликуваат:

· Спарени врски - кога се анализира односот помеѓу две карактеристики (факторијална и резултантна);

· Повеќекратни врски - го карактеризираат влијанието на повеќе карактеристики врз една ефективна.

Врз основа на силата на интеракцијата, тие се разликуваат:

· Слаби (забележливи) врски;

· Силни (блиски) врски.

Задачата на статистиката е да го одреди присуството, насоката, формата и блискоста на врската.

За проучување на зависноста се користат различни статистички методи. Бидејќи зависностите во статистиката се манифестираат преку варијација на карактеристиките, методите главно ја мерат и споредуваат варијацијата на факторот и резултантните карактеристики.

Ако ги нацртаме резултатите од групирањето на графикон, добиваме емпириска регресивна линија. Интервалите на вредностите на карактеристичните фактори се заменуваат со просечни групни индикатори.

Покрај емпириската регресивна линија, која директно ја одредува формата и насоката на врските, постои корелативно поле на кое се рефлектираат параметарските податоци.

Полето за корелација може да се користи и за да се процени природата на врската. Ако точките се концентрирани во близина на дијагоналата што се движи од лево кон десно, од дното кон врвот, тогаш врската е директна. Ако во близина на друга дијагонала - спротивното. Ако точките се расфрлани низ полето на графиконот, нема врска.

Кога се конструира аналитичка групација, важно е правилно да се одреди големината на интервалот. Ако, како резултат на првичното групирање, врската не се појави јасно, можете да го зголемите интервалот. Меѓутоа, со зголемување на интервалите, понекогаш е можно да се открие врска дури и таму каде што нема. Затоа, кога конструираме аналитичко групирање, се водиме од правилото: колку повеќе групи можеме да идентификуваме без да наидеме на ниту еден исклучок, толку е посигурна нашата хипотеза за присуството и формата на врската.

Нематематичките методи обезбедуваат приближна проценка на присуството, формата и насоката на поврзувањето. Подлабоката анализа се врши со користење на математички методи кои се развиени врз основа на методите што ги користат не-математички статистичари:

· Регресивна анализа, која ви овозможува да ја изразите формата на врската користејќи равенка.

· Анализа на корелацијасе користи за одредување на блискоста или силата на врската помеѓу карактеристиките. Методите на корелација се поделени на:

- Параметриски методи кои обезбедуваат проценка на блискоста на врската директно врз основа на вредностите на факторот и резултантните карактеристики;

- Непараметриски методи - обезбедуваат проценка врз основа на условни проценки на карактеристиките.

Оценка на затегнатоста на криволинеарните зависности е дадена по пресметувањето на параметарот на регресивната равенка. Затоа, овој метод се нарекува корелација-регресија.

Ако се анализира зависноста на еден фактор и резултантните карактеристики, тогаш во овој случај се работи со парна корелација и регресија. Ако се анализираат неколку фактори и карактеристики на изведба, ова е повеќекратна корелација и регресија.

Регресијата е линија која го карактеризира најопштиот тренд во односот помеѓу факторот и резултантните карактеристики.

Се претпоставува дека аналитичката равенка ја изразува вистинската форма на зависноста, а сите отстапувања од оваа функција се должат на дејството на различни случајни причини. Бидејќи корелациите се проучуваат, промената на карактеристиката на факторот одговара на промената на просечното ниво на добиената карактеристика. Кога конструиравме аналитички групирања, ја разгледавме емпириската регресивна линија. Сепак, оваа линија не е погодна за економско моделирање и нејзината форма зависи од самоволието на истражувачот. Теоретски, линијата на регресија е помалку зависна од субјективноста на истражувачот, меѓутоа, може да има и самоволие при изборот на формата или функцијата на врската. Се верува дека изборот на функција треба да се заснова на длабоко знаењеспецифики на предметот на истражување.

Во пракса, најчесто се користат следниве форми на регресивни модели:

· Линеарна;

· Полулогаритметичка крива;

· Хипербола;

· Парабола од втор ред;

· Експоненцијална функција;

· Функција за напојување.


Ова својство на просекот, кое вели дека збирот на квадратните отстапувања на сите варијанти на серија од аритметичката средина е помал од збирот на квадратните отстапувања од кој било друг број, е основа на методот на најмали квадрати, што овозможува да ги пресметате параметрите на избраната регресивна равенка на таков начин што линијата на регресија е, во просек, најмалку оддалечена од емпириските податоци.

Непараметриските методи за мерење на блискоста на односите меѓу квантитативните особини беа првите методи за мерење на блискоста на врските. Францускиот научник Гириј првпат се обидел да ја измери блискоста на врската во 30-тите години на 19 век. Тој ги спореди просечните групни вредности на факторот и резултантните карактеристики. Во овој случај, апсолутните вредности беа заменети со нивните соодноси на одредени константи. Добиените резултати беа рангирани по растечки редослед. Жири судеше за присуството или отсуството на врска со споредување претходно по групи и броење на бројот на натпревари и несовпаѓања во ранговите. Доколку преовладуваше бројот на натпревари, врската се сметаше за директна. Несовпаѓање - обратно. Ако имаше еднакви натпревари и несовпаѓања, немаше врска.

Методот Гири го користел Фехнер при развивањето на неговиот коефициент, како и Спирман при развивањето на коефициентот на корелација на ранг.

Коефициентот укажува на присуство на многу блиска врска со повратни информации.

Заедно со Фехнеровиот коефициент, се користат коефициенти на корелација на ранг за мерење на односот на квантитативните карактеристики. Најчест меѓу нив е коефициентот на корелација на ранг Спирман.

Непараметриските методи се користат за мерење на блискоста на односот помеѓу квалитативните и алтернативните карактеристики, како и квантитативните карактеристики, чија распределба се разликува од нормалната распределба.

За мерење на врската помеѓу алтернативните карактеристики, се користат коефициентот на асоцијација на Дејвид Јул и коефициентот на непредвидливост на Карл Пирсон. За да се пресметаат овие индикатори, се користи следнава матрица на меѓусебна дистрибуција на фреквенција:

a, b, c, d - фреквенции на меѓусебна дистрибуција на карактеристики.

Со директно поврзување, фреквенциите се концентрирани долж дијагоналата a-d, со повратна информација долж дијагоналата b-c, без врска, фреквенциите се речиси рамномерно распоредени низ целото поле на табелата.

Коефициент на асоцијација

Коефициентот на асоцијација не е погоден за пресметување ако една од фреквенциите долж дијагоналата е 0. Во овој случај, се користи коефициентот контингент, кој се пресметува со формулата:

Контингентниот коефициент, исто така, укажува на практично отсуство на врска помеѓу карактеристиките (неговата вредност е секогаш помала од K ac).

За мерење на блискоста на линеарна врска, се користи коефициент на корелација. Основната форма на коефициентот на корелација е како што следува:


Всушност, коефициентот на корелација е просекот на производот на стандардните отстапувања:

Ако нема врска помеѓу карактеристиките, тогаш добиената карактеристика не се менува кога се менува факторската карактеристика, затоа. Истиот резултат се добива кога збирот на негативни и позитивни производи се избалансирани.

Вообичаено, за пресметување на коефициентот на корелација, се користат формули кои ги користат оние показатели кои веќе биле пресметани при одредување на параметрите на регресивната равенка.

Повеќекратната корелација и регресија се користат за проучување на влијанието на два или повеќе фактори врз карактеристиката на исходот. Процесот на истражување вклучува неколку фази.

Прво, се избира формата на равенката на врската; најчесто се избира n-димензионална линеарна формула:

Бидејќи пресметките се важни и одземаат многу време, изборот на фактори што ќе се вклучат во моделот на регресија е критичен. Врз основа на квалитативна анализа, неопходно е да се изберат најзначајните фактори. Во фазата на избор на фактори, исто така се пресметува единична матрица на спарени коефициенти на корелација помеѓу карактеристиките на факторите избрани за вклучување во равенката на регресија.

Проучувањето на објективно постоечките врски меѓу социо-економските појави и процеси е најважната задача на теоријата на статистиката. Во тек

Статистичките истражувања на зависности откриваат причинско-последични односи меѓу појавите, што овозможува да се идентификуваат факторите (знаците) кои имаат големо влијание врз варијацијата на појавите и процесите што се проучуваат. Причинско-последичните односи се таква врска помеѓу појавите и процесите кога промената на едната од нив - причината - доведува до промена на другата - ефектот.

Финансиските и економските процеси се резултат на истовремено влијание на голем број причини. Следствено, при проучувањето на овие процеси, неопходно е да се идентификуваат главните, главните причини, апстрахирани од секундарните.

Првата фаза од статистичкото проучување на комуникацијата се заснова на квалитативна анализа поврзана со анализа на природата на општествен или економски феномен користејќи ги методите на економската теорија, социологијата и конкретната економија. Втората фаза - градење на комуникациски модел, се заснова на статистички методи: групирања, просечни вредности итн. Третата и последна фаза, толкувањето на резултатите, повторно се поврзува со квалитативните карактеристики на феноменот што се проучува. Статистиката има развиено многу методи за проучување на односите. Изборот на методот на студија за комуникација зависи од когнитивна цели истражувачки цели.

Знаците, според нивната суштина и значење за проучување на врската, се поделени во две класи. Знаците кои предизвикуваат промени во други придружни знаци се нарекуваат факторски, или едноставно фактори. Карактеристиките кои се менуваат под влијание на факторските карактеристики се нарекуваат ефективни.

Во статистиката се прави разлика помеѓу функционални и стохастички зависности. Функционалние однос во кој одредена вредност на факторска карактеристика одговара на една и само една вредност на резултантната карактеристика.

Ако причинска зависност не се појави во секој поединечен случај, туку генерално, во просек, со голем број на набљудувања, тогаш таквата зависност се нарекува стохастички.Посебен случај на стохастичко спојување е корелацијаоднос во кој промената на просечната вредност на резултантната карактеристика се должи на промена на факторските карактеристики.

Врските меѓу појавите и нивните карактеристики се класифицираат според степенот на блискост,

насока и аналитичко изразување.

Според степенот на блискост на врската, тие се разликуваат:

Со зголемување или намалување на вредностите на факторската карактеристика, доаѓа до зголемување или намалување на вредностите на добиената карактеристика. Така, зголемувањето на обемот на производство придонесува за зголемување на профитот на претпријатието. Кога обратноврски, вредностите на добиената карактеристика се менуваат под влијание на факторската карактеристика, но во спротивна насока во споредба со промената на факторската карактеристика, т.е. обратно- ова е однос во кој, со зголемување или намалување на вредностите на една карактеристика, доаѓа до намалување или зголемување на вредностите на друга карактеристика. Така, намалувањето на трошоците по единица производство повлекува зголемување на профитабилноста.

Според аналитичкиот израз се разликуваат врски директно(или едноставно дали-

neynye) И нелинеарни. Ако може да се примени статистичка врска меѓу појавите

приближно се изразува со равенката на права линија, се нарекува линеарнатип врска.

Споделете со пријателите или заштедете за себе:

Се вчитува...