Економетрија на формула за резидуална варијанса. Решение и анализа. Проценка на точноста на моделот или проценка на приближување

Дисперзија во статистикатасе наоѓа како поединечни вредности на карактеристиката на квадрат од . Во зависност од првичните податоци, се одредува со помош на едноставни и пондерирани формули за варијанса:

1. (за негрупирани податоци) се пресметува со формулата:

2. Пондерирана варијанса (за серии на варијации):

каде n е фреквенција (повторливост на факторот X)

Пример за наоѓање варијанса

Оваа страница опишува стандарден пример за наоѓање варијанса, исто така можете да погледнете и други проблеми за да ја пронајдете

Пример 1. Следниве податоци се достапни за група од 20 студенти оддел за кореспонденција. Потребно е да се конструира интервална серија на распределбата на карактеристиката, да се пресмета просечната вредност на карактеристиката и да се проучи нејзината дисперзија

Ајде да изградиме интервална групација. Ајде да го одредиме опсегот на интервалот користејќи ја формулата:

каде што X max е максималната вредност на карактеристиката за групирање;
X min – минимална вредност на карактеристиката за групирање;
n – број на интервали:

Прифаќаме n=5. Чекорот е: h = (192 - 159)/ 5 = 6,6

Ајде да создадеме интервална групација

За понатамошни пресметки, ќе изградиме помошна табела:

X'i е средината на интервалот. (на пример, средината на интервалот 159 – 165,6 = 162,3)

Ја одредуваме просечната висина на учениците користејќи ја формулата за пондерирана аритметичка просечна вредност:

Ајде да ја одредиме варијансата користејќи ја формулата:

Формулата за дисперзија може да се трансформира на следниов начин:

Од оваа формула произлегува дека варијансата е еднаква на разликата помеѓу просекот на квадратите на опциите и квадратот и просекот.

Варијанс во варијација серија со еднакви интервали со помош на методот на моменти може да се пресмета на следниот начин користејќи го второто својство на дисперзија (поделувајќи ги сите опции со вредноста на интервалот). Одредување на варијанса, пресметано со методот на моменти, со користење на следнава формула е помалку макотрпна:

каде што i е вредноста на интервалот;
А е конвенционална нула, за која е погодно да се користи средината на интервалот со најголема фреквенција;
m1 е квадратот на моментот од прв ред;
m2 - момент на втор ред

(ако во статистичка популација некоја карактеристика се менува на таков начин што има само две меѓусебно исклучувачки опции, тогаш таквата варијабилност се нарекува алтернативна) може да се пресмета со помош на формулата:

Заменувајќи го q = 1-p во оваа формула за дисперзија, добиваме:

Видови варијанса

Вкупна варијансаја мери варијацијата на некоја карактеристика кај целата популација како целина под влијание на сите фактори кои ја предизвикуваат оваа варијација. Тоа е еднакво на средниот квадрат на отстапувањата на поединечните вредности на карактеристиката x од вкупната средна вредност на x и може да се дефинира како едноставна варијанса или пондерирана варијанса.

ја карактеризира случајната варијација, т.е. дел од варијацијата што се должи на влијанието на неоткриените фактори и не зависи од факторот-атрибут што ја формира основата на групата. Таквата дисперзија е еднаква на средниот квадрат на отстапувањата на поединечните вредности на атрибутот во групата X од аритметичката средина на групата и може да се пресмета како едноставна дисперзија или како пондерирана дисперзија.

Така, мерки за варијанса во рамките на групатаваријација на особина во група и се одредува со формулата:

каде xi е просекот на групата;
ni е бројот на единици во групата.

На пример, интергрупните варијанси кои треба да се утврдат во задачата за проучување на влијанието на квалификациите на работниците врз нивото на продуктивноста на трудот во работилница покажуваат варијации во производството во секоја група предизвикани од сите можни фактори (техничка состојба на опремата, достапност на алатки и материјали, возраст на работниците, интензитет на трудот итн.), освен разликите во категоријата на квалификации (во групата сите работници имаат исти квалификации).

Просекот на варијансите во рамките на групата го одразува случајниот, т.е. оној дел од варијацијата што настанал под влијание на сите други фактори, со исклучок на факторот за групирање. Се пресметува со формулата:

Ја карактеризира систематската варијација на добиената карактеристика, која е предизвикана од влијанието на факторот-знак што ја формира основата на групата. Тоа е еднакво на средниот квадрат на отстапувањата на групните средини од вкупната средина. Варијансата меѓу групите се пресметува со формулата:

Правило за додавање варијанса во статистиката

Според правило за собирање варијансивкупната варијанса е еднаква на збирот на просекот на варијансите во рамките на групата и меѓу групите:

Значењето на ова правилое дека вкупната варијанса што настанува под влијание на сите фактори е еднаква на збирот на варијансите што произлегуваат под влијание на сите други фактори и варијансата што настанува поради факторот на групирање.

Користејќи ја формулата за додавање варијанси, можете да ја одредите третата непозната варијанса од две познати варијанси, а исто така да ја процените силата на влијанието на карактеристиката за групирање.

Карактеристики на дисперзија

1. Ако сите вредности на некоја карактеристика се намалат (зголемат) за иста константна количина, тогаш дисперзијата нема да се промени.
2. Ако сите вредности на некоја карактеристика се намалат (зголемат) за ист број пати n, тогаш варијансата соодветно ќе се намали (зголеми) за n^2 пати.

1. Суштината на корелациско-регресивната анализа и нејзините задачи.

2. Дефиниција на регресија и нејзините видови.

3. Карактеристики на спецификацијата на моделот. Причини за постоење на случајна променлива.

4. Методи за избор на спарена регресија.

5. Метод најмали квадрати.

6. Индикатори за мерење на затегнатоста и јачината на поврзувањето.

7. Проценки од статистичка значајност.

8. Предвидена вредност на променливата y и интервали на доверба на прогнозата.

1. Суштината на корелациско-регресивната анализа и нејзините задачи.Економските феномени, бидејќи се многу разновидни, се карактеризираат со многу карактеристики што се одразуваат одредени својстваовие процеси и појави и се предмет на меѓусебно зависни промени. Во некои случаи, врската помеѓу карактеристиките се покажува многу блиска (на пример, часовната работа на вработениот и неговата плата), додека во други случаи таквиот однос воопшто не е изразен или е исклучително слаб (на пример, полот на студентите и нивните академски перформанси). Колку е поблиска врската помеѓу овие карактеристики, толку попрецизни се донесените одлуки.

Постојат два типа на зависност помеѓу појавите и нивните карактеристики:

    функционална (детерминистичка, каузална) зависност . Таа е специфицирана во форма на формула која ја поврзува секоја вредност на една променлива со строго дефинирана вредност на друга променлива (влијанието на случајните фактори се занемарува). Со други зборови, функционална зависност е однос во кој секоја вредност на независната променлива x одговара на прецизно дефинирана вредност на зависната променлива y. Во економијата, функционалните односи меѓу променливите се исклучоци од општото правило;

    статистичка (стохастичка, недетерминистичка) зависност – ова е поврзување на променливи, на кое влијаат случајни фактори, т.е. Ова е врска во која секоја вредност на независната променлива x одговара на множество вредности на зависната променлива y, а однапред не се знае која вредност ќе ја земе y.

Посебен случај на статистичка зависност е корелационата зависност.

Корелација зависност е однос во кој секоја вредност на независната променлива x одговара на одредено математичко очекување (просечна вредност) на зависната променлива y.

Корелациската зависност е „нецелосна“ зависност, која не се појавува во секој поединечен случај, туку само во просечни вредности со доволно голем бројслучаи. На пример, познато е дека подобрувањето на квалификациите на работникот доведува до зголемување на продуктивноста на трудот. Оваа изјава често се потврдува во пракса, но не значи дека двајца или повеќе работници од иста категорија/ниво ангажирани во сличен процес ќе имаат иста продуктивност на трудот.

Корелациската зависност се проучува со помош на методите на корелација и регресивна анализа.

Корелација и регресивна анализа ви овозможува да ја утврдите близината, насоката на врската и формата на оваа врска помеѓу променливите, т.е. неговиот аналитички израз.

Главната задача на корелација анализа се состои од квантитативно определување на блискоста на врската помеѓу две карактеристики во парно поврзување и помеѓу ефективни и неколку факторски карактеристики во мултифакториелна врска и статистичка проценка на веродостојноста на воспоставената врска.

2. Дефиниција на регресија и нејзините видови.Регресивната анализа е главната математичка и статистичка алатка во економетријата. Регресија Вообичаено е да се нарече зависноста на просечната вредност на количината (y) од некоја друга количина или од неколку величини (x i).

Во зависност од бројот на фактори вклучени во равенката за регресија, вообичаено е да се прави разлика помеѓу едноставна (спарена) и повеќекратна регресија.

Едноставна (парична) регресија е модел каде просечната вредност на зависната (објаснета) променлива y се смета како функција на една независна (објаснувачка) променлива x. Имплицитно, регресијата во пар е модел на формата:

Експлицитно:

,

каде што a и b се проценки на коефициентите на регресија.

Повеќекратна регресија е модел каде просечната вредност на зависната (објаснета) променлива y се смета како функција од неколку независни (објаснувачки) променливи x 1, x 2, ... x n. Имплицитно, регресијата во пар е модел на формата:

.

Експлицитно:

каде што a и b 1, b 2, b n се проценки на коефициентите на регресија.

Пример за таков модел е зависноста на платата на вработениот од неговата возраст, образование, квалификации, стаж, индустрија итн.

Во однос на формата на зависност, постојат:

      линеарна регресија;

      нелинеарна регресија, која претпоставува постоење на нелинеарни врски помеѓу факторите изразени со соодветната нелинеарна функција.

Често, моделите кои се нелинеарни по изглед може да се сведат на линеарна форма, што им овозможува да се класифицираат како линеарни. 3. Карактеристики на спецификацијата на моделот. Причини за постоење на случајна променлива. Секоја економетриска студија започнува со , т.е. од формулацијата на типот на моделот, врз основа на соодветната теорија на односи меѓу променливите.

Пред сè, од целиот опсег на фактори кои влијаат на ефективниот атрибут, неопходно е да се идентификуваат најзначајните фактори кои влијаат. Регресијата во пар е доволна ако има доминантен фактор, кој се користи како објаснувачка променлива. Едноставна регресивна равенка ја карактеризира врската помеѓу две променливи, која се манифестира како одредена шема само во просек за севкупноста на набљудувањата. Во регресивната равенка, врската на корелација е претставена во форма на функционална зависност, изразена со соодветната математичка функција. Речиси во секој поединечен случај, вредноста y се состои од два члена:

,

каде што y е вистинската вредност на добиената карактеристика;

– теоретска вредност на резултантната карактеристика, пронајдена врз основа на регресивната равенка;

случајна променлива, карактеризирајќи го отстапувањето на вистинската вредност на добиената карактеристика од теоретската пронајдена со помош на регресивната равенка.

Случајна променлива исто така наречено нарушување. Тоа вклучува влијание на фактори кои не се земени предвид во моделот, случајни грешки и карактеристики на мерењето. Присуството на случајна променлива во моделот се генерира од три извори:

    спецификација на моделот,

    селективна природа на изворните податоци,

    карактеристики на мерните променливи.

Грешките во спецификацијата ќе вклучуваат не само неправилен избор на одредена математичка функција, туку и потценување на кој било значаен фактор во равенката на регресија (користење на спарена регресија наместо повеќекратна).

Заедно со грешките во спецификацијата, може да се појават и грешки при земање примероци, бидејќи истражувачот најчесто се занимава со податоци од примероци кога воспоставува модели на односи меѓу карактеристиките. Грешките при земање примероци се јавуваат и поради хетерогеноста на податоците во оригиналната статистичка популација, што обично се случува при проучување на економските процеси. Ако популацијата е хетерогена, тогаш регресивната равенка нема практично значење. За да се добие добар резултат, единиците со аномални вредности на проучуваните карактеристики обично се исклучуваат од популацијата. Повторно, резултатите од регресијата ги претставуваат карактеристиките на примерокот. Изворни податоци

Сепак, најголемата опасност во практичната употреба на методите на регресија се грешките во мерењето. Ако грешките во спецификацијата може да се намалат со промена на формата на моделот (тип на математичка формула), а грешките при земање примероци може да се намалат со зголемување на обемот на почетните податоци, тогаш грешките во мерењето практично ги поништуваат сите напори за квантифицирање на односот помеѓу карактеристиките.

4. Методи за избор на спарена регресија.Под претпоставка дека грешките во мерењето се минимизирани, фокусот на економетриското истражување е на грешките во спецификацијата на моделот. Во парна регресија, избирање на типот на математичка функција
може да се направи на три начини:

    графички;

    аналитички, т.е. врз основа на теоријата на односот што се изучува;

    експериментален.

При проучување на односот помеѓу две карактеристики графички метод изборот на типот на равенката за регресија е сосема јасен. Се заснова на полето за корелација. Основни типови на криви кои се користат при квантифицирање на односите




Класа математички функцииза да се опише односот помеѓу две променливи е доста широк;

Аналитички метод изборот на типот на регресивна равенка се заснова на проучување на материјалната природа на поврзувањето на карактеристиките што се проучуваат, како и визуелна проценка на природата на врската. Оние. ако зборуваме за Лаферовата крива, која ја покажува врската помеѓу даночната прогресивност и буџетските приходи, тогаш зборуваме за параболична крива, а во микроанализата, изоквантите се хиперболи.

Економетријае наука која ги квантифицира односите економските појавии процеси. Во моментов, решенијата за следните економетриски проблеми се достапни на интернет:

Корелација-регресивен метод на анализа

Непараметриски мерки на асоцијација

Хетероскедастичност на случајната компонента

Автокорелација

  1. Автокорелација на нивоа на временски серии. Тестирање за автокорелација со конструкција на корелограм;

Економетриски методи за спроведување на стручни истражувања

  1. Користејќи го методот на анализа на варијанса, тестирајте ја нултата хипотеза за влијанието на факторот врз квалитетот на објектот.

Резултираното решение е претставено во Word формат. Веднаш по решението има врска за преземање на шаблонот во Excel, што овозможува да се проверат сите добиени индикатори. Ако задачата бара решение во Excel, тогаш можете да користите статистички функции во Excel.

Компоненти на временски серии

  1. Услугата Analytical Smoothing може да се користи за аналитичко измазнување на временска серија (по права линија) и за наоѓање на параметрите на равенката на трендот. За да го направите ова, мора да го наведете количеството изворни податоци. Ако има многу податоци, можете да ги залепите од Excel.
  2. Пресметка на параметрите на равенката на трендовите.
    При изборот на тип на тренд функција, можете да го користите методот на конечни разлики. Ако општата тенденција се изразува со парабола од втор ред, тогаш добиваме константни конечни разлики од втор ред. Ако стапките на раст се приближно константни, тогаш за израмнување се користи експоненцијална функција.
    При изборот на форма на равенка, треба да продолжите од количината на достапни информации. Колку повеќе параметри содржи равенката, толку повеќе набљудувања треба да има со ист степен на веродостојност на проценката.
  3. Измазнување со помош на методот на подвижен просек. Користење на

Да претпоставиме дека ги најдовме овие проценки и можеме да ја напишеме равенката:

ŷ = а + бX,

Каде А- регресивна константа, точка на пресек на регресивната линија со оската OY;

б- коефициент на регресија, наклонот на регресивната линија што ја карактеризира врската ДY¤DX;

ŷ - теоретска вредност на објаснетата променлива.

Како што е познато во парната регресија, изборот на типот математички моделможе да се изврши на три начини:

1. Графички.

2. Аналитички.

3. Експериментални.

Може да се користи графички метод за да се избере функција која ги опишува набљудуваните вредности. Почетните податоци се нацртани на координатна рамнина. Вредностите на факторската карактеристика се нацртани на оската на апсцисата, а вредностите на добиената карактеристика се нацртани на оската на ординатите. Локацијата на точките ќе ја покаже приближната форма на врската. Како по правило, оваа врска е криволинеарна. Ако кривината на оваа линија е мала, тогаш можеме да ја прифатиме хипотезата за постоење на линеарна врска.

Дозволете ни да ја прикажеме функцијата на потрошувачка како дијаграм за расејување. За да го направите ова, во координатниот систем, ја исцртуваме вредноста на приходот на оската на апсцисата, а на оската на ординатите, трошоците за консумирање условен производ. Локацијата на точките што одговараат на множествата вредности „приход-трошок за потрошувачка“ ќе ја прикаже приближната форма на врската (слика 1).

Визуелно, според дијаграмот, речиси никогаш не е можно недвосмислено да се именува најдобрата зависност.

Ајде да продолжиме со евалуација на параметрите на избраната функција аИ бметод на најмали квадрати.

Проблемот со проценката може да се сведе на „класичниот“ проблем за наоѓање на минимумот. Променливите сега се оценки АИ бнепознати параметри на предложената врска наИ X. За да ја пронајдете најмалата вредност на која било функција, прво треба да ги пронајдете парцијалните деривати од прв ред. Потоа изедначете ја секоја од нив на нула и разрешете го добиениот систем на равенки во однос на променливите. Во нашиот случај, таква функција е збир на квадратни отстапувања - С, а променливите се АИ б. Тоа е, ние мора да најдеме = 0 и = 0 и да го решиме добиениот систем на равенки во однос на АИ б.

Дозволете ни да изведеме проценки на параметрите користејќи го методот на најмали квадрати, под претпоставка дека равенката за спојување ја има формата ŷ = а + бX. Потоа функцијата Сизгледа како

. Диференцирање на функцијата СОд страна на А, ја добиваме првата нормална равенка со диференцирање во однос на б- втора нормална равенка. , ,

По соодветни трансформации добиваме:

(*)

Постојат поедноставени правила за изградба на систем на нормални равенки. Ајде да ги примениме на линеарна функција:

1) Помножете го секој член од равенката ŷ = а + бXспоред коефициентот за првиот параметар ( А), односно по еден.

2) Пред секоја променлива ставаме знак за сумирање.

3) Помножете го слободниот член на равенката со n.

4) Ја добиваме првата нормална равенка

5) Помножете го секој член од првобитната равенка со коефициентот на вториот параметар ( б), односно на X.

6) Пред секоја променлива ставаме знак за сумирање.

7) Ја добиваме втората нормална равенка

Користејќи ги овие правила, се составува систем на нормални равенки за која било линеарна функција. Правилата прв ги формулираше англискиот економист Р. Перл.

Параметрите на равенките се пресметуваат со користење следните формули:

, ,

Ајде да изградиме, користејќи ги почетните податоци во табелата 1, систем на нормални равенки (*) и да го решиме во однос на непознатите АИ б:


1677=11*a+4950*ba = -3309

790 400=4950*a+2 502 500*bb = 7,6923

Регресивната равенка е:

ŷ = -3309 + 7,6923 x ,

Да ги споредиме реалните и проценетите трошоци за потрошувачка на производот А (Табела 2).

Табела 2 Споредба на реалните и проценетите вредности на трошоците за потрошувачка на стоки Асо линеарна врска:

Број на група

Трошоци за потрошувачка

стоки А

Отстапување на реалните трошоци од пресметаните

вистински(и)

населба

апсолутна

(y – ŷ)

1 120 -1770,54 1890,54
2 129 -1385,92 1514,92
3 135 -1001,31 1136,31
4 140 -616,45 756,45
5 145 -232,08 377,08
6 151 152,53 -1,53
7 155 537,15 -382,15
8 160 921,76 -761,76
9 171 1306,38 -1135,38
10 182 1690,99 -1508,99
11 189 2075,61 -1886,61
вкупно - - 0

Да ја нацртаме добиената функција ŷ и растурање со помош на вистински вредности (y) и пресметани вредности ( ŷ) .

Пресметаните вредности отстапуваат од вистинските поради фактот што врската помеѓу карактеристиките е корелациона.

Коефициентот на корелација се користи како мерка за блискоста на врската:

=

Добиваме, користејќи ги првичните податоци од Табела 1:

σ x =158;

σ y = 20,76;

р = 0,990.

Коефициентот на линеарна корелација може да земе која било вредност која се движи од минус 1 до плус 1. Колку е поблизок коефициентот на корелација во апсолутна вредност до 1, толку е поблизок односот помеѓу карактеристиките. Знакот на коефициентот на линеарна корелација ја означува насоката на врската - директната врска одговара на знакот плус, а инверзната врска одговара на знакот минус.

Заклучок: однос меѓу вредностите Xи соодветните вредности на

блиска, директна зависност.

Во нашиот пример г = 0,9801

Тоа значи дека промените во трошоците на производот Аможе 98,01% да се објасни со промените во приходите.

Останатите 1,99% може да резултираат од:

1) недоволно добро избрана форма на комуникација;

2) влијанието на било кои други неотсметани фактори врз зависната променлива.

Статистичко тестирање на хипотези.

Ние поставивме нулта хипотеза дека коефициентот на регресија е статистички незначаен:

Х 0 : б = 0.

Статистичката значајност на коефициентот на регресија се проверува со користење т-Студентски т-тест. За да го направите ова, прво одреди го преостанатиот збир на квадрати

с 2 ost= å (y јас – ŷ јас) 2

с 2 ost = 1,3689.

и неговата стандардна девијација

с = 0,39. види ( б ) = 0,018.

Вистинската вредност т-Ученички тест за коефициентот на регресија:

.

т б = 427,35.

Вредноста |t b |>t cr (t cr =2,26 за 95% ниво на значајност) ни овозможува да извлечеме заклучок за разликата од нула (на соодветното ниво на значајност) на коефициентот на регресија и, според тоа, за присуството на влијание (врска) XИ u.

Заклучок: вистинската вредност т-Т-тестот на студентите ја надминува вредноста на табелата, што значи дека нултата хипотеза е отфрлена и со веројатност од 95% се прифаќа алтернативната хипотеза за статистичката значајност на коефициентот на регресија.

[б– t cr *se( б), б+ t cr *se( б)]- 95% интервал на доверба за б.

Интервалот на доверба ја покрива вистинската вредност на параметарот бсо дадена веројатност (во во овој случај 95%).

7,6516 < б < 7,7329.

Ајде да продолжиме со проверка на статистичката значајност на коефициентите на корелација и одредување:

р = 0,990;

г = р 2 = 0,9801.

Ние поставивме нулта хипотеза дека регресивната равенка како целина е статистички незначајна:

Х 0 : р 2 = 0.

Проценката на статистичката значајност на конструираниот регресивен модел во целина се врши со користење Ф-Фишер критериум. Вистинската вредност Ф-критериумите за спарена регресивна равенка линеарна по параметри се дефинирани како:

каде што факторот s 2 е дисперзија за теоретски вредности ŷ (објаснета варијација);

s 2 одмор - остаток на збир на квадрати;

р 2 - коефициент на определување.

Вистинската вредност Ф-Фишер критериум:

Ф ѓ = 443,26

Заклучок: ја отфрламе нултата хипотеза и со веројатност од 95% ја прифаќаме алтернативната хипотеза за статистичката значајност на регресивната равенка.

    Корелациска зависност помеѓу факторот x (просечно ниво на егзистенција по глава на жител на ден на едно работоспособно лице) и добиената карактеристика y (просечна дневна плата). Параметри на линеарната регресивна равенка, економско толкување на коефициентот на регресија.

y=f(x)+E ,y t =f(x) – теоретска функција, E=y- y t

y t =a+bx - корелација зависност на просечната дневна плата (y) од просечното ниво на егзистенција по глава на жител дневно на едно работоспособно лице (x)

a+b =

а =

б=
- коефициент на регресија.

Покажува колку единици се менува просечната плата (Y) кога егзистенцијалното ниво по глава на жител дневно на едно работоспособно лице (X) се зголемува за 1 единица.

б=
= 0,937837482

Тоа значи дека ако просечното ниво на егзистенција по глава на жител на ден на едно работоспособно лице (x) се зголеми за 1 единица, просечната дневна плата ќе се зголеми во просек за 0,937 единици.

a= , a=135,4166667-0,937837482 86,75=54,05926511

3) Коефициент на варијација

Коефициентот на варијација покажува колкав дел од просечната вредност на SV е неговиот просечен распон.

υ x = δх/x = 0,144982838, υ y = δy/y = 0,105751299

4) Коефициент на корелација

Коефициентот на корелација се користи за да се процени блискоста на линеарната врска помеѓу просечниот егзистенцијален минимум по глава на жител дневно на едно работоспособно лице и просечната дневна плата.

rxy = b δх/δy = 0,823674909 бидејќи rxy ˃0 , тогаш корелацијата помеѓу променливите се нарекува директна

Сето ова ја покажува зависноста на просечната дневна плата од просечното ниво на егзистенција по глава на жител дневно на едно работоспособно лице.

5) Коефициент на определување

Коефициентот на определување се користи за да се процени квалитетот на фитинг на линеарните регресивни равенки.

Коефициентот на определување го карактеризира учеството на варијансата на ефективната карактеристика Y (просечна дневна плата) објаснета со регресија во вкупната варијанса на ефективната карактеристика.

R 2 xy = (∑(y t - y средна) 2) / (∑(y - y средна) 2) = 0,678440355, 0,5< R 2 < 0,7 ,

Тоа значи дека јачината на врската е забележлива, блиску до висока, а регресивната равенка е добро избрана.

6) Проценка на точноста на моделот или проценка на приближување.

=1/n ∑ ׀(y i - y t)/y i ׀ 100% - просечна грешка при приближување.

Грешка помала од 5-7% укажува на добро вклопување на моделот.

Ако грешката е поголема од 10%, треба да размислите за избор на различен тип на равенка на моделот.

Грешка при приближување =0,015379395 100%=1,53%, што укажува на добро вклопување на моделот со оригиналните податоци

7) Шема за анализа на варијанса.

∑(y - y avg) 2 =∑(y t - y avg) 2 +∑(y i - y t) 2 n – број на набљудувања, m – број на параметри за променлива x

Компоненти на варијанса

Збир на квадрати

Број на степени на слобода

Дисперзија по степен на слобода

∑(y - y средна) 2

S 2 вкупно =(∑(y - y средна) 2)/(n-1)

Факториски

∑(y t - y av) 2

S 2 факт =(∑(y t - y av) 2)/m

Остаток

∑(y i - y t) 2

S 2 одмор =(∑(y i - y t) 2)/ (n-m-1)

Анализа на варијанса

Компоненти

Збир на квадрати

Број на степени на слобода

Дисперзија

општо

факторски

остаток

8) Проверка на соодветноста на моделот споредФ-Фишер критериум (α=0,05).

Проценката на статистичката значајност на регресивната равенка во целина се врши со користењеФ-Фишер критериум.

H 0 – хипотеза за статистичката значајност на регресивната равенка.

H 1 – статистичка значајност на регресивната равенка.

Ф пресметан се одредува од односот на вредностите на факторот и преостанатите варијанси пресметани по степен на слобода.

F пресметано = S 2 вистински / S 2 одмор = ((∑(y t - y avg) 2)/m) / ((∑(y i - y t) 2)/ (n-m-1)) =1669,585177 / 79,13314895 = 21,098429

Ф табеларен - максималната можна вредност на критериумот што би можел да се формира под влијание на случајни фактори со дадени степени на слобода, т.е. ДО 1 = м, ТО 2 = n- м-1, и ниво на значајност α (α=0,05)

Табела F (0,05; 1; n-2), табела F (0,05; 1; 10), табела F = 4,964602701

АкоФ маса < Ф пресметка , потоа хипотезатаХ 0 случајната природа на проценетите карактеристики се отфрла, а нивната статистичка значајност и веродостојноста на регресивната равенка се препознаваат. Во спротивноХ 0 не се отфрла, а се препознава и статистичката безначајност и неверодостојност на регресивната равенка.Во нашиот случај F табела< F расч, следовательно признаётся статистическая значимость и надёжность уравнения регрессии.

9) Проценка на статистичката значајност на коефициентите на регресија и корелација споредт-Студентски т-тест (α=0,05).

Оценување на значајноста на коефициентот. регресија., t – Студентски критериум Да ја провериме статистичката значајност на параметарот б.

Хипотеза H 0: b=0, t b (калц) = ׀b ׀/ m b, m b = S одмор / (δ x
), каде n е бројот на набљудувања

m b = 79,13314895 / (12,57726123
) = 0,204174979

t b (пресметано) = 0,937837482 / 0,204174979 = 4,593302697

t табелата е максималната можна вредност на критериумот под влијание на случајни фактори со дадени степени на слобода (K=n-2), и ниво на значајност α (α=0,05). t табела = 2,2281, Ако t (calc) > t табела, тогаш хипотезата H 0 се отфрла и се препознава значајноста на параметрите на равенката.

Во нашиот случај, t b (пресметано) > t табела, затоа хипотезата H 0 се отфрла, а се препознава статистичката значајност на параметарот b.

Да ја провериме статистичката значајност на параметарот a.

Хипотеза H 0: a=0 t a (пресметано) = ׀а ׀/ m a
)/(n δ x), m a = (79,13314895
)/(12 12,57726123)= 17,89736655, t a (пресметано) = 54,05926511 / 17,89736655=3,020515055

t a (пресметана) > t табела затоа хипотезата H 0 се отфрла и се препознава статистичката значајност на параметарот a.

Оценување на значењето на корелацијата.Да ја провериме статистичката значајност на коефициентот на корелација.

mrxy =
, mrxy =
=0,179320842, trxy = 0,823674909/ 0,179320842 = 4,593302697

tr = t b , tr > t табела, затоа се препознава статистичката значајност на коефициентот на корелација.

Споделете со пријателите или заштедете за себе:

Се вчитува...