Ekonometria e formulave të variancës së mbetur. Zgjidhja dhe analiza. Vlerësimi i saktësisë së modelit, ose vlerësimi i përafrimit

Dispersioni në statistika gjendet si vlera individuale e karakteristikës në katror nga . Në varësi të të dhënave fillestare, përcaktohet duke përdorur formulat e thjeshta dhe të ponderuara të variancës:

1. (për të dhënat e pagrupuara) llogaritet duke përdorur formulën:

2. Varianca e ponderuar (për seritë e variacioneve):

ku n është frekuenca (përsëritshmëria e faktorit X)

Një shembull i gjetjes së variancës

Kjo faqe përshkruan një shembull standard të gjetjes së variancës, gjithashtu mund të shikoni probleme të tjera për gjetjen e tij

Shembulli 1. Të dhënat e mëposhtme janë të disponueshme për një grup prej 20 studentësh me korrespondencë. Është e nevojshme të ndërtohet një seri intervali të shpërndarjes së karakteristikës, të llogaritet vlera mesatare e karakteristikës dhe të studiohet shpërndarja e saj.

Le të ndërtojmë një grupim interval. Le të përcaktojmë gamën e intervalit duke përdorur formulën:

ku X max është vlera maksimale e karakteristikës së grupimit;
X min – vlera minimale e karakteristikës së grupimit;
n – numri i intervaleve:

Ne pranojmë n=5. Hapi është: h = (192 - 159)/ 5 = 6.6

Le të krijojmë një grupim interval

Për llogaritjet e mëtejshme, ne do të ndërtojmë një tabelë ndihmëse:

X'i është mesi i intervalit. (për shembull, mesi i intervalit 159 - 165.6 = 162.3)

Ne përcaktojmë lartësinë mesatare të studentëve duke përdorur formulën mesatare aritmetike të ponderuar:

Le të përcaktojmë variancën duke përdorur formulën:

Formula e dispersionit mund të transformohet si më poshtë:

Nga kjo formulë del se varianca është e barabartë me diferenca ndërmjet mesatares së katrorëve të opsioneve dhe katrorit dhe mesatares.

Dispersioni në seritë e variacionit me intervale të barabarta duke përdorur metodën e momenteve mund të llogaritet në mënyrën e mëposhtme duke përdorur vetinë e dytë të dispersionit (duke pjesëtuar të gjitha opsionet me vlerën e intervalit). Përcaktimi i variancës, e llogaritur duke përdorur metodën e momenteve, duke përdorur formulën e mëposhtme është më pak e mundimshme:

ku i është vlera e intervalit;
A është një zero konvencionale, për të cilën është e përshtatshme të përdoret mesi i intervalit me frekuencën më të lartë;
m1 është katrori i momentit të rendit të parë;
m2 - momenti i rendit të dytë

(nëse në një popullatë statistikore një karakteristikë ndryshon në atë mënyrë që ekzistojnë vetëm dy opsione ekskluzive reciproke, atëherë një ndryshueshmëri e tillë quhet alternative) mund të llogaritet duke përdorur formulën:

Duke zëvendësuar q = 1-p në këtë formulë dispersioni, marrim:

Llojet e variancës

Varianca totale mat ndryshimin e një karakteristike në të gjithë popullsinë në tërësi nën ndikimin e të gjithë faktorëve që shkaktojnë këtë variacion. Është e barabartë me katrorin mesatar të devijimeve të vlerave individuale të një karakteristike x nga vlera mesatare e përgjithshme e x dhe mund të përkufizohet si variancë e thjeshtë ose variancë e ponderuar.

karakterizon variacionin e rastësishëm, d.m.th. pjesë e variacionit që është për shkak të ndikimit të faktorëve të pa llogaritur dhe nuk varet nga atributi i faktorit që përbën bazën e grupit. Një shpërndarje e tillë është e barabartë me katrorin mesatar të devijimeve të vlerave individuale të atributit brenda grupit X nga mesatarja aritmetike e grupit dhe mund të llogaritet si dispersion i thjeshtë ose si dispersion i peshuar.

Kështu, masat e variancës brenda grupit variacioni i një tipari brenda një grupi dhe përcaktohet nga formula:

ku xi është mesatarja e grupit;
ni është numri i njësive në grup.

Për shembull, variancat brenda grupit që duhet të përcaktohen në detyrën e studimit të ndikimit të kualifikimeve të punëtorëve në nivelin e produktivitetit të punës në një punishte tregojnë ndryshime në prodhimin në secilin grup të shkaktuar nga të gjithë faktorët e mundshëm (gjendja teknike e pajisjeve, disponueshmëria e mjetet dhe materialet, mosha e punëtorëve, intensiteti i punës, etj. .), me përjashtim të dallimeve në kategorinë e kualifikimit (brenda një grupi të gjithë punëtorët kanë të njëjtat kualifikime).

Mesatarja e variancave brenda grupit pasqyron rastësi, d.m.th., atë pjesë të variacionit që ka ndodhur nën ndikimin e të gjithë faktorëve të tjerë, me përjashtim të faktorit të grupimit. Ajo llogaritet duke përdorur formulën:

Karakterizon ndryshimin sistematik të karakteristikës që rezulton, e cila është për shkak të ndikimit të shenjës së faktorit që përbën bazën e grupit. Është e barabartë me katrorin mesatar të devijimeve të mesatareve të grupit nga mesatarja e përgjithshme. Varianca ndërgrupore llogaritet duke përdorur formulën:

Rregulli për shtimin e variancës në statistika

Sipas rregull për shtimin e variancave varianca totale është e barabartë me shumën e mesatares së variancave brenda grupit dhe ndërmjet grupit:

Kuptimi i këtij rregulliështë se varianca totale që lind nën ndikimin e të gjithë faktorëve është e barabartë me shumën e variancave që lindin nën ndikimin e të gjithë faktorëve të tjerë dhe variancën që lind për shkak të faktorit të grupimit.

Duke përdorur formulën për shtimin e variancave, mund të përcaktoni variancën e tretë të panjohur nga dy variancat e njohura, dhe gjithashtu të gjykoni fuqinë e ndikimit të karakteristikës së grupimit.

Vetitë e dispersionit

1. Nëse të gjitha vlerat e një karakteristike zvogëlohen (rriten) me të njëjtën sasi konstante, atëherë shpërndarja nuk do të ndryshojë.
2. Nëse të gjitha vlerat e një karakteristike zvogëlohen (rriten) me të njëjtin numër herë n, atëherë varianca përkatësisht do të ulet (rritet) me n^2 herë.

1. Thelbi i analizës korrelacion-regresion dhe detyrat e saj.

2. Përkufizimi i regresionit dhe llojet e tij.

3. Karakteristikat e specifikimit të modelit. Arsyet e ekzistencës së një ndryshoreje të rastësishme.

4. Metodat për zgjedhjen e regresionit të çiftuar.

5. Metoda e katrorëve më të vegjël.

6. Treguesit për matjen e ngushtësisë dhe forcës së lidhjes.

7. Vlerësimet e rëndësisë statistikore.

8. Vlera e parashikuar e variablit y dhe intervalet e besimit të parashikimit.

1. Thelbi i analizës korrelacion-regresion dhe detyrat e saj. Dukuritë ekonomike, duke qenë shumë të larmishme, karakterizohen nga shumë veçori që pasqyrojnë veti të caktuara të këtyre proceseve dhe dukurive dhe janë subjekt i ndryshimeve të ndërvarura. Në disa raste, marrëdhënia midis karakteristikave rezulton të jetë shumë e ngushtë (për shembull, prodhimi për orë i një punonjësi dhe paga e tij), ndërsa në raste të tjera një marrëdhënie e tillë nuk shprehet fare ose është jashtëzakonisht e dobët (për shembull, gjinia të studentëve dhe performancës së tyre akademike). Sa më e ngushtë të jetë lidhja midis këtyre veçorive, aq më të sakta janë vendimet e marra.

Ekzistojnë dy lloje të varësive midis dukurive dhe karakteristikave të tyre:

    varësi funksionale (përcaktuese, shkakore). . Ai specifikohet në formën e një formule që lidh çdo vlerë të një ndryshoreje me një vlerë të përcaktuar rreptësisht të një ndryshoreje tjetër (ndikimi i faktorëve të rastësishëm neglizhohet). Me fjale te tjera, varësia funksionale është një marrëdhënie në të cilën çdo vlerë e ndryshores së pavarur x korrespondon me një vlerë të përcaktuar saktësisht të ndryshores së varur y. Në ekonomi, marrëdhëniet funksionale ndërmjet variablave janë përjashtime nga rregulli i përgjithshëm;

    varësi statistikore (stokastike, jopërcaktuese). – kjo është një lidhje e variablave, e cila ndikohet nga faktorë të rastësishëm, d.m.th. Kjo është një marrëdhënie në të cilën çdo vlerë e ndryshores së pavarur x korrespondon me një grup vlerash të ndryshores së varur y, dhe nuk dihet paraprakisht se çfarë vlere do të marrë y.

Një rast i veçantë i varësisë statistikore është varësia e korrelacionit.

Varësia e korrelacionit është një marrëdhënie në të cilën çdo vlerë e ndryshores së pavarur x korrespondon me një pritje të caktuar matematikore (vlerë mesatare) të ndryshores së varur y.

Varësia e korrelacionit është një varësi "jo e plotë", e cila nuk shfaqet në çdo rast individual, por vetëm në vlera mesatare për një numër mjaft të madh rastesh. Për shembull, dihet se përmirësimi i kualifikimeve të një punonjësi çon në një rritje të produktivitetit të punës. Kjo deklaratë shpesh konfirmohet në praktikë, por nuk do të thotë se dy ose më shumë punëtorë të së njëjtës kategori/nivel të angazhuar në një proces të ngjashëm do të kenë të njëjtin produktivitet të punës.

Varësia e korrelacionit studiohet duke përdorur metodat e analizës së korrelacionit dhe regresionit.

Analiza e korrelacionit dhe e regresionit ju lejon të vendosni afërsinë, drejtimin e lidhjes dhe formën e kësaj lidhjeje midis variablave, d.m.th. shprehja analitike e saj.

Detyra kryesore e analizës së korrelacionit konsiston në përcaktimin sasior të afërsisë së lidhjes midis dy karakteristikave në një lidhje dyshe dhe midis karakteristikave efektive dhe disa faktorëve në një lidhje shumëfaktoriale dhe vlerësimin statistikor të besueshmërisë së lidhjes së vendosur.

2. Përkufizimi i regresionit dhe llojet e tij. Analiza e regresionit është mjeti kryesor matematikor dhe statistikor në ekonometri. Regresioni Është zakon të quajmë varësinë e vlerës mesatare të një sasie (y) nga një sasi tjetër ose nga disa sasi (x i).

Në varësi të numrit të faktorëve të përfshirë në ekuacionin e regresionit, është zakon të bëhet dallimi midis regresionit të thjeshtë (të çiftuar) dhe të shumëfishtë.

Regresion i thjeshtë (në çift). është një model ku vlera mesatare e variablit të varur (të shpjeguar) y konsiderohet si funksion i një ndryshoreje të pavarur (shpjeguese) x. Në mënyrë implicite, regresioni në çift është një model i formës:

Në mënyrë të qartë:

,

ku a dhe b janë vlerësime të koeficientëve të regresionit.

Regresion i shumëfishtë është një model ku vlera mesatare e variablit të varur (të shpjeguar) y konsiderohet si funksion i disa ndryshoreve të pavarura (shpjeguese) x 1, x 2, ... x n. Në mënyrë implicite, regresioni në çift është një model i formës:

.

Në mënyrë të qartë:

ku a dhe b 1, b 2, b n janë vlerësime të koeficientëve të regresionit.

Një shembull i një modeli të tillë është varësia e pagës së një punonjësi nga mosha, arsimi, kualifikimet, kohëzgjatja e shërbimit, industria, etj.

Për sa i përket formës së varësisë, dallohen:

      regresionit linear;

      regresioni jolinear, i cili supozon ekzistencën e marrëdhënieve jolineare ndërmjet faktorëve të shprehur nga funksioni jolinear përkatës. Shpesh, modelet që janë jolineare në dukje mund të reduktohen në një formë lineare, e cila lejon që ato të klasifikohen si lineare.

3. Karakteristikat e specifikimit të modelit. Arsyet e ekzistencës së një ndryshoreje të rastësishme.Çdo studim ekonometrik fillon me specifikimet e modelit , d.m.th. nga formulimi i llojit të modelit, bazuar në teorinë përkatëse të marrëdhënieve ndërmjet variablave.

Para së gjithash, nga e gjithë sfera e faktorëve që ndikojnë në atributin efektiv, është e nevojshme të identifikohen faktorët më të rëndësishëm që ndikojnë. Regresioni në çift është i mjaftueshëm nëse ekziston një faktor dominues, i cili përdoret si variabël shpjegues. Një ekuacion i thjeshtë regresioni karakterizon marrëdhënien midis dy variablave, i cili manifestohet si një model i caktuar vetëm mesatarisht për tërësinë e vëzhgimeve. Në ekuacionin e regresionit, marrëdhënia e korrelacionit paraqitet në formën e një varësie funksionale, e shprehur me funksionin matematikor përkatës. Pothuajse në çdo rast individual, vlera y përbëhet nga dy terma:

,

ku y është vlera aktuale e karakteristikës që rezulton;

– vlera teorike e karakteristikës rezultante, e gjetur në bazë të ekuacionit të regresionit;

– një ndryshore e rastësishme që karakterizon devijimin e vlerës reale të karakteristikës që rezulton nga vlera teorike e gjetur duke përdorur ekuacionin e regresionit.

Vlera e rastësishme quhet edhe shqetësim. Ai përfshin ndikimin e faktorëve që nuk merren parasysh në model, gabimet e rastësishme dhe veçoritë e matjes. Prania e një variabli të rastësishëm në model gjenerohet nga tre burime:

    specifikimet e modelit,

    natyra selektive e të dhënave burimore,

    veçoritë e variablave matëse.

Gabimet e specifikimeve do të përfshijnë jo vetëm zgjedhjen e gabuar të një funksioni të caktuar matematikor, por edhe nënvlerësimin e çdo faktori të rëndësishëm në ekuacionin e regresionit (duke përdorur regresionin e çiftuar në vend të shumëfishtë).

Së bashku me gabimet e specifikimeve, mund të ndodhin edhe gabime të kampionimit, pasi studiuesi më së shpeshti merret me të dhënat e mostrës kur vendos modele të marrëdhënieve midis karakteristikave. Gabimet e kampionimit ndodhin edhe për shkak të heterogjenitetit të të dhënave në popullatën statistikore origjinale, gjë që zakonisht ndodh gjatë studimit të proceseve ekonomike. Nëse popullsia është heterogjene, atëherë ekuacioni i regresionit nuk ka kuptim praktik. Për të marrë një rezultat të mirë, njësitë me vlera anormale të karakteristikave të studiuara zakonisht përjashtohen nga popullata. Përsëri, rezultatet e regresionit përfaqësojnë karakteristikat e mostrës. Të dhënat burimore

Megjithatë, rreziku më i madh në përdorimin praktik të metodave të regresionit janë gabimet e matjes. Nëse gabimet e specifikimit mund të reduktohen duke ndryshuar formën e modelit (një lloj formule matematikore), dhe gabimet e kampionimit mund të reduktohen duke rritur volumin e të dhënave fillestare, atëherë gabimet e matjes praktikisht anulojnë të gjitha përpjekjet për të përcaktuar sasinë e marrëdhënies midis karakteristikave.

4. Metodat për zgjedhjen e regresionit të çiftuar. Duke supozuar se gabimet e matjes janë minimizuar, fokusi i kërkimit ekonometrik është në gabimet e specifikimit të modelit. Në regresionin çift, duke zgjedhur llojin e funksionit matematik
mund të bëhet në tre mënyra:

    grafik;

    analitike, d.m.th. bazuar në teorinë e marrëdhënies që studiohet;

    eksperimentale.

Gjatë studimit të marrëdhënieve ndërmjet dy karakteristikave metodë grafike zgjedhja e llojit të ekuacionit të regresionit është mjaft e qartë. Ai bazohet në fushën e korrelacionit. Llojet bazë të kurbave të përdorura në përcaktimin sasior të marrëdhënieve




Klasa e funksioneve matematikore për të përshkruar marrëdhënien midis dy variablave është mjaft e gjerë; përdoren gjithashtu lloje të tjera kurbash.

Metoda analitike zgjedhja e llojit të ekuacionit të regresionit bazohet në studimin e natyrës materiale të lidhjes së karakteristikave në studim, si dhe në një vlerësim vizual të natyrës së lidhjes. ato. nëse flasim për lakoren Laffer, që tregon lidhjen ndërmjet progresivitetit të taksave dhe të ardhurave buxhetore, atëherë flasim për një kurbë parabolike, dhe në mikroanalizë, izokuantët janë hiperbola.

Ekonometriaështë një shkencë që ofron një shprehje sasiore të ndërlidhjeve të fenomeneve dhe proceseve ekonomike. Për momentin, zgjidhjet për problemet e mëposhtme ekonometrike janë të disponueshme në internet:

Metoda e analizës korrelacion-regresion

Masat joparametrike të shoqërimit

Heteroskedasticiteti i komponentit të rastësishëm

Autokorrelacioni

  1. Autokorrelacioni i niveleve të serive kohore. Testimi për autokorrelacion me ndërtimin e një korelogrami;

Metodat ekonometrike për kryerjen e hulumtimeve të ekspertëve

  1. Duke përdorur metodën e analizës së variancës, provoni hipotezën zero për ndikimin e një faktori në cilësinë e një objekti.

Zgjidhja që rezulton është paraqitur në formatin Word. Menjëherë pas zgjidhjes ekziston një lidhje për të shkarkuar shabllonin në Excel, i cili bën të mundur kontrollimin e të gjithë treguesve të marrë. Nëse detyra kërkon një zgjidhje në Excel, atëherë mund të përdorni funksionet statistikore në Excel.

Komponentët e serive kohore

  1. Shërbimi Analytical Smoothing mund të përdoret për zbutjen analitike të një serie kohore (përgjatë një vije të drejtë) dhe për gjetjen e parametrave të ekuacionit të trendit. Për ta bërë këtë, duhet të specifikoni sasinë e të dhënave burimore. Nëse ka shumë të dhëna, mund t'i ngjisni nga Excel.
  2. Llogaritja e parametrave të ekuacionit të trendit.
    Kur zgjidhni llojin e funksionit të tendencës, mund të përdorni metodën e diferencës së fundme. Nëse tendenca e përgjithshme shprehet me një parabolë të rendit të dytë, atëherë marrim diferenca të fundme konstante të rendit të dytë. Nëse ritmet e rritjes janë afërsisht konstante, atëherë një funksion eksponencial përdoret për nivelim.
    Kur zgjidhni formën e një ekuacioni, duhet të vazhdoni nga sasia e informacionit në dispozicion. Sa më shumë parametra të përmbajë ekuacioni, aq më shumë vëzhgime duhet të ketë me të njëjtën shkallë të besueshmërisë së vlerësimit.
  3. Zbutja duke përdorur metodën e mesatares lëvizëse. Duke përdorur

Le të supozojmë se kemi gjetur këto vlerësime dhe mund të shkruajmë ekuacionin:

ŷ = a + bX,

Ku A- konstanta e regresionit, pika e prerjes së vijës së regresionit me boshtin OY;

b- koeficienti i regresionit, pjerrësia e vijës së regresionit që karakterizon marrëdhënien DY¤DX;

ŷ - vlera teorike e variablit të shpjeguar.

Siç dihet në regresionin në çift, zgjedhja e llojit të modelit matematik mund të kryhet në tre mënyra:

1. Grafik.

2. Analitike.

3. Eksperimentale.

Një metodë grafike mund të përdoret për të zgjedhur një funksion që përshkruan vlerat e vëzhguara. Të dhënat burimore paraqiten në planin koordinativ. Vlerat e karakteristikës së faktorit vizatohen në boshtin e abshisës, dhe vlerat e karakteristikës që rezulton vizatohen në boshtin e ordinatave. Vendndodhja e pikave do të tregojë formën e përafërt të lidhjes. Si rregull, kjo marrëdhënie është lakuar. Nëse lakimi i kësaj vije është i vogël, atëherë mund të pranojmë hipotezën e ekzistencës së një lidhjeje drejtvizore.

Le të përshkruajmë funksionin e konsumit si një diagram shpërndarjeje. Për ta bërë këtë, në sistemin e koordinatave, ne paraqesim vlerën e të ardhurave në boshtin e abshisës dhe në boshtin e ordinatave, kostot e konsumimit të një produkti të kushtëzuar. Vendndodhja e pikave që korrespondojnë me grupet e vlerave "të ardhura - shpenzime konsumi" do të tregojë formën e përafërt të marrëdhënies (Figura 1).

Vizualisht, bazuar në diagramin, pothuajse kurrë nuk është e mundur të identifikohet pa mëdyshje varësia më e mirë.

Le të kalojmë në vlerësimin e parametrave të funksionit të zgjedhur a Dhe b Metoda e katrorëve më të vegjël.

Problemi i vlerësimit mund të reduktohet në problemin "klasik" të gjetjes së minimumit. Variablat tani janë nota A Dhe b parametra të panjohur të lidhjes së propozuar Dhe X. Për të gjetur vlerën më të vogël të çdo funksioni, së pari duhet të gjeni derivatet e pjesshme të rendit të parë. Pastaj barazoni secilën prej tyre me zero dhe zgjidhni sistemin e ekuacioneve që rezulton në lidhje me variablat. Në rastin tonë, një funksion i tillë është shuma e devijimeve në katror - S, dhe variablat janë A Dhe b. Kjo do të thotë, ne duhet të gjejmë = 0 dhe = 0 dhe të zgjidhim sistemin rezultues të ekuacioneve në lidhje me A Dhe b.

Le të nxjerrim vlerësimet e parametrave duke përdorur metodën e katrorëve më të vegjël, duke supozuar se ekuacioni i bashkimit ka formën ŷ = a + bX. Pastaj funksioni S duket si

. Diferencimi i funksionit S Nga A, ekuacionin e parë normal e marrim duke diferencuar në lidhje me b- ekuacioni i dytë normal. , ,

Pas transformimeve të duhura marrim:

(*)

Ekzistojnë rregulla të thjeshtuara për ndërtimin e një sistemi ekuacionesh normale. Le t'i zbatojmë ato në një funksion linear:

1) Shumëzoni çdo term të ekuacionit ŷ = a + bX nga koeficienti për parametrin e parë ( A), domethënë nga një.

2) Para çdo ndryshoreje vendosim një shenjë përmbledhjeje.

3) Shumëzoni termin e lirë të ekuacionit me n.

4) Marrim ekuacionin e parë normal

5) Shumëzoni çdo term të ekuacionit origjinal me koeficientin e parametrit të dytë ( b), domethënë në X.

6) Para çdo ndryshoreje vendosim një shenjë përmbledhjeje.

7) Marrim ekuacionin e dytë normal

Duke përdorur këto rregulla, për çdo funksion linear përpilohet një sistem ekuacionesh normale. Rregullat u formuluan fillimisht nga ekonomisti anglez R. Pearl.

Parametrat e ekuacioneve llogariten duke përdorur formulat e mëposhtme:

, ,

Le të ndërtojmë, duke përdorur të dhënat fillestare në tabelën 1, një sistem ekuacionesh normale (*) dhe ta zgjidhim atë në lidhje me të panjohurat A Dhe b:


1677=11*a+4950*ba = -3309

790 400=4950*a+2 502 500*bb = 7,6923

Ekuacioni i regresionit është:

ŷ = -3309 + 7,6923 x ,

Le të krahasojmë kostot aktuale dhe të vlerësuara të konsumit të produktit A (Tabela 2).

Tabela 2 Krahasimi i vlerave faktike dhe të vlerësuara të shpenzimeve për konsum të mallrave A me një marrëdhënie lineare:

Numri i grupit

Shpenzimet e konsumit

mallrave A

Devijimi i shpenzimeve faktike nga ato të llogaritura

aktuale(at)

zgjidhje

absolute

(y – ŷ)

1 120 -1770,54 1890,54
2 129 -1385,92 1514,92
3 135 -1001,31 1136,31
4 140 -616,45 756,45
5 145 -232,08 377,08
6 151 152,53 -1,53
7 155 537,15 -382,15
8 160 921,76 -761,76
9 171 1306,38 -1135,38
10 182 1690,99 -1508,99
11 189 2075,61 -1886,61
Total - - 0

Le të vizatojmë funksionin që rezulton ŷ dhe një spërkatje duke përdorur vlerat aktuale (y) dhe vlerat e llogaritura ( ŷ) .

Vlerat e llogaritura devijojnë nga ato aktuale për faktin se marrëdhënia midis karakteristikave është korrelative.

Koeficienti i korrelacionit përdoret si masë e afërsisë së marrëdhënies:

=

Ne marrim, duke përdorur të dhënat fillestare nga Tabela 1:

σ x =158;

σ y = 20,76;

r = 0,990.

Koeficienti i korrelacionit linear mund të marrë çdo vlerë që varion nga minus 1 në plus 1. Sa më afër koeficientit të korrelacionit në vlerë absolute të jetë 1, aq më e ngushtë është marrëdhënia midis karakteristikave. Shenja e koeficientit të korrelacionit linear tregon drejtimin e marrëdhënies - marrëdhënia e drejtpërdrejtë korrespondon me një shenjë plus, dhe marrëdhënia e kundërt korrespondon me një shenjë minus.

konkluzioni: marrëdhëniet ndërmjet vlerave X dhe vlerat përkatëse

varësi e ngushtë, e drejtpërdrejtë.

Në shembullin tonë d = 0,9801

Kjo do të thotë se ndryshimet në kostot e produktit A mund të shpjegohet 98.01% nga ndryshimet në të ardhura.

Pjesa e mbetur prej 1.99% mund të rezultojë nga:

1) formë komunikimi e zgjedhur në mënyrë të pamjaftueshme;

2) ndikimi i çdo faktori tjetër të pa llogaritur në variablin e varur.

Testimi statistikor i hipotezave.

Ne parashtrojmë një hipotezë zero se koeficienti i regresionit është statistikisht i parëndësishëm:

H 0 : b = 0.

Rëndësia statistikore e koeficientit të regresionit kontrollohet duke përdorur t-Testi i studentit. Për ta bërë këtë, së pari përcaktoni shumën e mbetur të katrorëve

s 2 ost= å (y i – ŷ i) 2

s 2 ost = 1,3689.

dhe devijimi standard i tij

s = 0,39. se ( b ) = 0,018.

Vlera aktuale t-Testi i nxënësit për koeficientin e regresionit:

.

t b = 427,35.

Vlera |t b |>t cr (t cr =2.26 për nivelin e rëndësisë 95%) na lejon të nxjerrim një përfundim rreth koeficientit të regresionit që është i ndryshëm nga zero (në nivelin përkatës të rëndësisë) dhe, për rrjedhojë, për praninë e një ndikimi (lidhje) X Dhe u.

konkluzioni: vlera aktuale t-Testi i studentit tejkalon vlerën e tabelës, që do të thotë se hipoteza zero hidhet poshtë dhe me një probabilitet 95% pranohet hipoteza alternative për rëndësinë statistikore të koeficientit të regresionit.

[b– t kr *se( b), b+ t cr *se( b)]- 95% interval besimi për b.

Intervali i besimit mbulon vlerën e vërtetë të parametrit b me një probabilitet të caktuar (në këtë rast 95%).

7,6516 < b < 7,7329.

Le të kalojmë në kontrollimin e rëndësisë statistikore të korrelacionit dhe koeficientëve të përcaktimit:

r = 0,990;

d = r 2 = 0,9801.

Ne parashtrojmë një hipotezë zero se ekuacioni i regresionit në tërësi është statistikisht i parëndësishëm:

H 0 : r 2 = 0.

Vlerësimi i rëndësisë statistikore të modelit të regresionit të ndërtuar në tërësi kryhet duke përdorur F-Kriteri Fisher. Vlera aktuale F-kriteret për një ekuacion të regresionit të çiftuar në parametra linearë përkufizohen si:

ku faktori s 2 është dispersioni për vlerat teorike ŷ (variacioni i shpjeguar);

s 2 pushim - shuma e mbetur e katrorëve;

r 2 - koeficienti i përcaktimit.

Vlera aktuale F-Kriteri Fisher:

F f = 443,26

konkluzioni: ne hedhim poshtë hipotezën zero dhe, me një probabilitet prej 95%, pranojmë hipotezën alternative për rëndësinë statistikore të ekuacionit të regresionit.

    Varësia e korrelacionit ndërmjet faktorit x (niveli mesatar i jetesës për frymë në ditë të një personi të aftë për punë) dhe karakteristikës që rezulton y (paga mesatare ditore). Parametrat e ekuacionit të regresionit linear, interpretimi ekonomik i koeficientit të regresionit.

y=f(x)+E,y t =f(x) – funksioni teorik, E=y-y t

y t =a+bx – varësia e korrelacionit të pagës mesatare ditore (y) nga niveli mesatar i jetesës për frymë në ditë të një personi të aftë për punë (x)

a+b =

a +b =

b=
- koeficienti i regresionit.

Ai tregon se sa njësi ndryshon paga mesatare (Y) kur niveli i jetesës për frymë në ditë i një personi të aftë për punë (X) rritet me 1 njësi.

b=
= 0,937837482

Kjo do të thotë se me një rritje të nivelit mesatar të jetesës për frymë në ditë të një personi të aftë për punë (x) me 1 njësi, paga mesatare ditore do të rritet mesatarisht me 0,937 njësi.

a= -b , a=135.4166667-0.937837482 86.75=54.05926511

3) Koeficienti i variacionit

Koeficienti i variacionit tregon se cila pjesë e vlerës mesatare të SV është përhapja mesatare e saj.

υ x = δх/x = 0,144982838, υ y = δy/y = 0,105751299

4) Koeficienti i korrelacionit

Koeficienti i korrelacionit përdoret për të vlerësuar afërsinë e marrëdhënies lineare midis nivelit mesatar të jetesës për frymë në ditë të një personi të aftë për punë dhe pagës mesatare ditore.

rxy = b δх/δy = 0,823674909 sepse rxy ˃0 , atëherë korrelacioni ndërmjet variablave quhet i drejtpërdrejtë

E gjithë kjo tregon varësinë e pagës mesatare ditore nga niveli mesatar i jetesës për frymë në ditë të një personi të aftë për punë.

5) Koeficienti i përcaktimit

Koeficienti i përcaktimit përdoret për të vlerësuar cilësinë e përshtatjes së ekuacioneve të regresionit linear.

Koeficienti i përcaktimit karakterizon proporcionin e variancës së atributit efektiv Y (paga mesatare ditore) e shpjeguar me regresion në variancën totale të atributit efektiv.

R 2 xy = (∑(y t - y mesatar) 2) / (∑(y - y mesatar) 2) = 0,678440355, 0,5< R 2 < 0,7 ,

Kjo do të thotë se forca e lidhjes është e dukshme, afër e lartë dhe ekuacioni i regresionit është zgjedhur mirë.

6) Vlerësimi i saktësisë së modelit, ose vlerësimi i përafrimit.

=1/n ∑ ׀(y i - y t)/y i ׀ 100% - gabim mesatar i përafrimit.

Një gabim prej më pak se 5-7% tregon një përshtatje të mirë të modelit.

Nëse gabimi është më i madh se 10%, duhet të mendoni të zgjidhni një lloj tjetër të ekuacionit të modelit.

Gabim përafrimi =0,015379395 100%=1,53%, që tregon një përshtatje të mirë të modelit me të dhënat origjinale

7) Skema e analizës së variancës.

∑(y - y mesatar) 2 =∑(y t - y mesatar) 2 +∑(y i - y t) 2 n – numri i vëzhgimeve, m – numri i parametrave për ndryshoren x

Komponentët e variancës

Shuma e katrorëve

Numri i shkallëve të lirisë

Shpërndarja për shkallë lirie

∑(y - y mesatare) 2

S 2 total =(∑(y - y mesatar) 2)/(n-1)

Faktorial

∑(y t - y av) 2

S 2 fakt =(∑(y t - y av) 2)/m

E mbetur

∑(y i - y t) 2

S 2 pushim =(∑(y i - y t) 2)/ (n-m-1)

Analiza e variancës

Komponentët

Shuma e katrorëve

Numri i shkallëve të lirisë

Dispersion

të përgjithshme

faktorial

mbetje

8) Kontrollimi i përshtatshmërisë së modelit sipasF-Kriteri Fisher (α=0.05).

Vlerësimi i rëndësisë statistikore të ekuacionit të regresionit në tërësi kryhet duke përdorurF-Kriteri Fisher.

H 0 – hipoteza për rëndësinë statistikore të ekuacionit të regresionit.

H 1 – rëndësia statistikore e ekuacionit të regresionit.

F e llogaritur përcaktohet nga raporti i vlerave të faktorëve dhe variancave të mbetura të llogaritura për shkallë lirie.

F llogaritur = S 2 fakt / S 2 pushim = ((∑(y t - y av) 2)/m) / ((∑(y i - y t) 2)/ (n-m-1)) =1669.585177 / 79.13314895 = 21.0984296

F tabelare - vlera maksimale e mundshme e kriterit që mund të formohet nën ndikimin e faktorëve të rastësishëm me shkallë të dhëna lirie, d.m.th. TE 1 = m, TE 2 = n- m-1, dhe niveli i rëndësisë α (α=0.05)

Tabela F (0,05; 1; n-2), Tabela F (0,05; 1; 10), Tabela F = 4,964602701

NëseF tabela < F llogaritje , pastaj hipotezaH 0 natyra e rastësishme e karakteristikave të vlerësuara refuzohet dhe njihet rëndësia e tyre statistikore dhe besueshmëria e ekuacionit të regresionit. PërndrysheH 0 nuk refuzohet dhe njihet parëndësia dhe mosbesueshmëria statistikore e ekuacionit të regresionit. Në rastin tonë tabela F< F расч, следовательно признаётся статистическая значимость и надёжность уравнения регрессии.

9) Vlerësimi i rëndësisë statistikore të koeficientëve të regresionit dhe korrelacionit sipast-Testi i studentit (α=0.05).

Vlerësimi i rëndësisë së koeficientit. regresion., t – Kriteri i studentit Le të kontrollojmë rëndësinë statistikore të parametrit b.

Hipoteza H 0: b=0, t b (calc) = ׀b ׀/ m b, m b = S pushim / (δ x
), ku n është numri i vëzhgimeve

m b = 79,13314895 / (12,57726123
) = 0,204174979

t b (llogaritur) = 0,937837482 / 0,204174979 = 4,593302697

Tabela t është vlera maksimale e mundshme e kriterit nën ndikimin e faktorëve të rastësishëm me shkallë të dhënë lirie (K=n-2), dhe nivel të rëndësisë α (α=0.05). tabela t = 2.2281, Nëse t (calc) > tabela t, atëherë hipoteza H 0 refuzohet, dhe rëndësia e parametrave të ekuacionit njihet.

Në rastin tonë, t b (llogaritur) > tabela t, prandaj hipoteza H 0 hidhet poshtë dhe njihet rëndësia statistikore e parametrit b.

Le të kontrollojmë rëndësinë statistikore të parametrit a. Hipoteza H 0: a=0 t a (llogaritur) = ׀а ׀/ m a

m a = (S pushim
)/(n δ x), m a = (79.13314895
)/(12 12.57726123)= 17.89736655, t a (llogaritur) = 54.05926511 / 17.89736655=3.020515055

t a (llogaritur) > t tabela prandaj hipoteza H 0 hidhet poshtë dhe njihet rëndësia statistikore e parametrit a.

Vlerësimi i rëndësisë së korrelacionit. Le të kontrollojmë rëndësinë statistikore të koeficientit të korrelacionit.

mrxy =
, mrxy =
=0,179320842, trxy = 0,823674909/ 0,179320842 = 4,593302697

tr = t b , tr > t tabela, prandaj njihet rëndësia statistikore e koeficientit të korrelacionit.

Ndani me miqtë ose kurseni për veten tuaj:

Po ngarkohet...