Ekuacioni i regresionit. Ekuacioni i regresionit të shumëfishtë. Analiza e korrelacionit dhe regresionit në Excel: udhëzime ekzekutimi Cilat janë kërkesat për një model të analizës së regresionit?

Analiza e regresionit dhe korrelacionit janë metoda kërkimore statistikore. Këto janë mënyrat më të zakonshme për të treguar varësinë e një parametri nga një ose më shumë variabla të pavarur.

Më poshtë, duke përdorur shembuj konkretë praktikë, do të shqyrtojmë këto dy analiza shumë të njohura midis ekonomistëve. Ne gjithashtu do të japim një shembull të marrjes së rezultateve kur i kombinojmë ato.

Analiza e regresionit në Excel

Tregon ndikimin e disa vlerave (të pavarura, të pavarura) në variablin e varur. Për shembull, si varet numri i popullsisë ekonomikisht aktive nga numri i ndërmarrjeve, pagat dhe parametrat e tjerë. Ose: si ndikojnë në nivelin e PBB-së investimet e huaja, çmimet e energjisë etj.

Rezultati i analizës ju lejon të nënvizoni përparësitë. Dhe bazuar në faktorët kryesorë, parashikoni, planifikoni zhvillimin e fushave prioritare dhe merrni vendime menaxheriale.

Regresioni ndodh:

  • lineare (y = a + bx);
  • parabolike (y = a + bx + cx 2);
  • eksponencial (y = a * exp(bx));
  • fuqia (y = a*x^b);
  • hiperbolike (y = b/x + a);
  • logaritmike (y = b * 1n(x) + a);
  • eksponencial (y = a * b^x).

Le të shohim një shembull të ndërtimit të një modeli regresioni në Excel dhe interpretimit të rezultateve. Le të marrim llojin linear të regresionit.

Detyrë. Në 6 ndërmarrje u analizua paga mesatare mujore dhe numri i punonjësve të larguar nga puna. Është e nevojshme të përcaktohet varësia e numrit të punonjësve që largohen nga paga mesatare.

Modeli i regresionit linear duket si ky:

Y = a 0 + a 1 x 1 +…+a k x k.

Ku a janë koeficientët e regresionit, x janë variabla ndikues, k është numri i faktorëve.

Në shembullin tonë, Y është treguesi i largimit nga punonjësit. Faktori ndikues është paga (x).

Excel ka funksione të integruara që mund t'ju ndihmojnë të llogaritni parametrat e një modeli të regresionit linear. Por shtesa "Paketa e analizës" do ta bëjë këtë më shpejt.

Ne aktivizojmë një mjet të fuqishëm analitik:

Pasi të aktivizohet, shtesa do të jetë e disponueshme në skedën e të dhënave.

Tani le të bëjmë vetë analizën e regresionit.



Para së gjithash, ne i kushtojmë vëmendje katrorit R dhe koeficientëve.

R-katror është koeficienti i përcaktimit. Në shembullin tonë - 0,755, ose 75,5%. Kjo do të thotë se parametrat e llogaritur të modelit shpjegojnë 75.5% të marrëdhënies ndërmjet parametrave të studiuar. Sa më i lartë të jetë koeficienti i përcaktimit, aq më i mirë është modeli. Mirë - mbi 0.8. E keqe - më pak se 0.5 (një analizë e tillë vështirë se mund të konsiderohet e arsyeshme). Në shembullin tonë - "jo keq".

Koeficienti 64.1428 tregon se çfarë do të jetë Y nëse të gjitha variablat në modelin në shqyrtim janë të barabartë me 0. Kjo do të thotë, vlera e parametrit të analizuar ndikohet edhe nga faktorë të tjerë që nuk janë përshkruar në model.

Koeficienti -0,16285 tregon peshën e variablit X në Y. Kjo do të thotë se paga mesatare mujore brenda këtij modeli ndikon në numrin e të larguarve me peshën -0,16285 (kjo është një shkallë e vogël ndikimi). Shenja "-" tregon ndikim i keq: sa më e lartë të jetë paga, aq më pak njerëz largohen. E cila është e drejtë.



Analiza e korrelacionit në Excel

Analiza e korrelacionit ndihmon në përcaktimin nëse ka një lidhje midis treguesve në një ose dy mostra. Për shembull, midis kohës së funksionimit të një makinerie dhe kostos së riparimeve, çmimit të pajisjeve dhe kohëzgjatjes së funksionimit, gjatësisë dhe peshës së fëmijëve, etj.

Nëse ka një lidhje, atëherë rritja e njërit parametër a çon në një rritje (korrelacion pozitiv) ose një ulje (negative) të tjetrit. Analiza e korrelacionit e ndihmon analistin të përcaktojë nëse vlera e një treguesi mund të përdoret për të parashikuar vlerën e mundshme të një tjetri.

Koeficienti i korrelacionit shënohet me r. Ndryshon nga +1 në -1. Klasifikimi i korrelacioneve për fusha të ndryshme do të jetë i ndryshëm. Kur koeficienti është 0, nuk ka lidhje lineare midis mostrave.

Le të shohim se si të gjejmë koeficientin e korrelacionit duke përdorur Excel.

Për të gjetur koeficientët e çiftuar, përdoret funksioni CORREL.

Objektivi: Përcaktoni nëse ka një lidhje midis kohës së funksionimit të një torno dhe kostos së mirëmbajtjes së saj.

Vendosni kursorin në çdo qelizë dhe shtypni butonin fx.

  1. Në kategorinë "Statistikore", zgjidhni funksionin CORREL.
  2. Argumenti "Array 1" - diapazoni i parë i vlerave - koha e funksionimit të makinës: A2:A14.
  3. Argumenti "Array 2" - diapazoni i dytë i vlerave - kostoja e riparimit: B2:B14. Klikoni OK.

Për të përcaktuar llojin e lidhjes, duhet të shikoni numrin absolut të koeficientit (çdo fushë e veprimtarisë ka shkallën e vet).

Për analizën e korrelacionit të disa parametrave (më shumë se 2), është më i përshtatshëm të përdoret "Analiza e të dhënave" (shtesa "Paketa e Analizës"). Ju duhet të zgjidhni korrelacionin nga lista dhe të caktoni grupin. Të gjitha.

Koeficientët rezultues do të shfaqen në matricën e korrelacionit. Si kjo:

Analiza e korrelacionit dhe e regresionit

Në praktikë, këto dy teknika shpesh përdoren së bashku.

Shembull:


Tani të dhënat e analizës së regresionit janë bërë të dukshme.

Gjatë studimeve, studentët shumë shpesh ndeshen me një sërë ekuacionesh. Njëri prej tyre - ekuacioni i regresionit - diskutohet në këtë artikull. Ky lloj ekuacioni përdoret posaçërisht për të përshkruar karakteristikat e marrëdhënies ndërmjet parametrat matematikore. Ky lloj barazitë përdoren në statistikë dhe në ekonometri.

Përkufizimi i regresionit

Në matematikë, regresioni nënkupton një sasi të caktuar që përshkruan varësinë e vlerës mesatare të një grupi të dhënash nga vlerat e një sasie tjetër. Ekuacioni i regresionit tregon, në funksion të një karakteristike të veçantë, vlerën mesatare të një karakteristike tjetër. Funksioni i regresionit ka formën ekuacion i thjeshtë y = x, në të cilën y vepron si një ndryshore e varur, dhe x si një ndryshore e pavarur (faktor-tipar). Në fakt, regresioni shprehet si y = f (x).

Cilat janë llojet e marrëdhënieve midis variablave?

Në përgjithësi, ekzistojnë dy lloje të kundërta të marrëdhënieve: korrelacioni dhe regresioni.

E para karakterizohet nga barazia e variablave të kushtëzuar. NË në këtë rast Nuk dihet me siguri se cila variabël varet nga tjetra.

Nëse nuk ka barazi midis variablave dhe kushtet thonë se cila variabël është shpjeguese dhe cila është e varur, atëherë mund të flasim për praninë e një lidhjeje të llojit të dytë. Për të ndërtuar një ekuacion të regresionit linear, do të jetë e nevojshme të zbulohet se çfarë lloj marrëdhënieje vërehet.

Llojet e regresioneve

Sot, ekzistojnë 7 lloje të ndryshme të regresionit: hiperbolik, linear, shumëfish, jolinear, çift, invers, logaritmikisht linear.

Hiperbolike, lineare dhe logaritmike

Ekuacioni i regresionit linear përdoret në statistika për të shpjeguar qartë parametrat e ekuacionit. Duket sikur y = c+t*x+E. Një ekuacion hiperbolik ka formën e një hiperbole të rregullt y = c + m / x + E. Një ekuacion logaritmik linear shpreh marrëdhënien duke përdorur një funksion logaritmik: Në y = Në c + m * Në x + Në E.

Të shumëfishta dhe jolineare

Dy me shume lloje komplekse Regresioni është i shumëfishtë dhe jolinear. Ekuacioni i regresionit të shumëfishtë shprehet me funksionin y = f(x 1, x 2 ... x c) + E. Në këtë situatë, y vepron si një ndryshore e varur dhe x vepron si një ndryshore shpjeguese. Ndryshorja E është stokastike; përfshin ndikimin e faktorëve të tjerë në ekuacion. Ekuacioni i regresionit jolinear është pak i diskutueshëm. Nga njëra anë, në raport me treguesit e marrë në konsideratë, nuk është linear, por nga ana tjetër, në rolin e vlerësimit të treguesve, është linear.

Llojet e kundërta dhe të çiftëzuara të regresioneve

Një invers është një lloj funksioni që duhet të konvertohet në një formë lineare. Në më tradicionalet programet e aplikimit ka formën e një funksioni y = 1/c + m*x+E. Një ekuacion i regresionit në çift tregon marrëdhënien midis të dhënave si funksion i y = f (x) + E. Ashtu si në ekuacionet e tjera, y varet nga x dhe E është një parametër stokastik.

Koncepti i korrelacionit

Ky është një tregues që tregon ekzistencën e një marrëdhënieje midis dy fenomeneve ose proceseve. Forca e marrëdhënies shprehet si një koeficient korrelacioni. Vlera e tij luhatet brenda intervalit [-1;+1]. Një tregues negativ tregon praninë reagime, pozitive - për një vijë të drejtë. Nëse koeficienti merr një vlerë të barabartë me 0, atëherë nuk ka asnjë lidhje. Sa më afër të jetë vlera me 1, aq më e fortë është marrëdhënia midis parametrave; sa më afër 0, aq më e dobët është.

Metodat

Metodat parametrike të korrelacionit mund të vlerësojnë fuqinë e marrëdhënies. Ato përdoren në bazë të vlerësimit të shpërndarjes për të studiuar parametrat që i binden ligjit të shpërndarjes normale.

Parametrat e ekuacionit të regresionit linear janë të nevojshëm për të identifikuar llojin e varësisë, funksionin e ekuacionit të regresionit dhe për të vlerësuar treguesit e formulës së zgjedhur të marrëdhënies. Fusha e korrelacionit përdoret si metodë e identifikimit të lidhjes. Për ta bërë këtë, të gjitha të dhënat ekzistuese duhet të përshkruhen grafikisht. Të gjitha të dhënat e njohura duhet të vizatohen në një sistem koordinativ dy-dimensional drejtkëndor. Kështu formohet një fushë korrelacioni. Vlerat e faktorit përshkrues shënohen përgjatë boshtit të abshisës, ndërsa vlerat e faktorit të varur shënohen përgjatë boshtit të ordinatave. Nëse ekziston një marrëdhënie funksionale midis parametrave, ato rreshtohen në formën e një rreshti.

Nëse koeficienti i korrelacionit të të dhënave të tilla është më pak se 30%, mund të flasim për një mungesë pothuajse të plotë të lidhjes. Nëse është midis 30% dhe 70%, atëherë kjo tregon praninë e lidhjeve të mesme të ngushta. Një tregues 100% është dëshmi e një lidhjeje funksionale.

Një ekuacion jolinear i regresionit, ashtu si ai linear, duhet të plotësohet me një indeks korrelacioni (R).

Korrelacioni për regresion të shumëfishtë

Koeficienti i përcaktimit është një tregues i katrorit të korrelacionit të shumëfishtë. Ai flet për marrëdhënien e ngushtë të grupit të treguesve të paraqitur me karakteristikën që studiohet. Mund të flasë gjithashtu për natyrën e ndikimit të parametrave në rezultat. Ekuacioni i regresionit të shumëfishtë vlerësohet duke përdorur këtë tregues.

Për të llogaritur treguesin e korrelacionit të shumëfishtë, është e nevojshme të llogaritet indeksi i tij.

Metoda me katrorin më të vogël

Kjo metodë është një mënyrë për të vlerësuar faktorët e regresionit. Thelbi i tij është të minimizojë shumën e devijimeve në katror të marra si rezultat i varësisë së faktorit nga funksioni.

Një ekuacion i regresionit linear në çift mund të vlerësohet duke përdorur një metodë të tillë. Ky lloj ekuacionesh përdoret kur zbulohet një marrëdhënie lineare e çiftuar midis treguesve.

Parametrat e ekuacionit

Çdo parametër i funksionit të regresionit linear ka një kuptim specifik. Ekuacioni i regresionit linear të çiftuar përmban dy parametra: c dhe m. Parametri m demonstron ndryshimin mesatar në treguesin përfundimtar të funksionit y, me kusht që ndryshorja x të zvogëlohet (rritet) me një njësi konvencionale. Nëse ndryshorja x është zero, atëherë funksioni është i barabartë me parametrin c. Nëse ndryshorja x nuk është zero, atëherë faktori c nuk ka kuptim ekonomik. Ndikimi i vetëm në funksion është shenja përpara faktorit c. Nëse ka një minus, atëherë mund të themi se ndryshimi në rezultat është i ngadaltë në krahasim me faktorin. Nëse ka një plus, atëherë kjo tregon një ndryshim të përshpejtuar në rezultat.

Çdo parametër që ndryshon vlerën e ekuacionit të regresionit mund të shprehet përmes një ekuacioni. Për shembull, faktori c ka formën c = y - mx.

Të dhëna të grupuara

Ekzistojnë kushte të detyrës në të cilat të gjitha informacionet grupohen sipas atributit x, por për një grup të caktuar tregohen vlerat mesatare përkatëse të treguesit të varur. Në këtë rast, vlerat mesatare karakterizojnë se si ndryshon treguesi në varësi të x. Kështu, informacioni i grupuar ndihmon për të gjetur ekuacionin e regresionit. Përdoret si analizë e marrëdhënieve. Megjithatë, kjo metodë ka të metat e saj. Për fat të keq, treguesit mesatarë janë shpesh subjekt i luhatjeve të jashtme. Këto luhatje nuk pasqyrojnë modelin e marrëdhënies; ato thjesht maskojnë "zhurmën" e saj. Mesataret tregojnë modele marrëdhëniesh shumë më të këqija se një ekuacion i regresionit linear. Megjithatë, ato mund të përdoren si bazë për gjetjen e një ekuacioni. Duke shumëzuar numrin e një popullsie individuale me mesataren përkatëse, mund të merret shuma y brenda grupit. Tjetra, duhet të shtoni të gjitha shumat e marra dhe të gjeni treguesin përfundimtar y. Është pak më e vështirë të bësh llogaritjet me treguesin e shumës xy. Nëse intervalet janë të vogla, mund të marrim me kusht treguesin x për të gjitha njësitë (brenda grupit) të jetë i njëjtë. Ju duhet ta shumëzoni atë me shumën e y për të gjetur shumën e prodhimeve të x dhe y. Më pas, të gjitha shumat mblidhen së bashku dhe fitohet shuma totale xy.

Ekuacioni i regresionit të shumëfishtë në çift: vlerësimi i rëndësisë së një marrëdhënieje

Siç u diskutua më herët, regresioni i shumëfishtë ka një funksion të formës y = f (x 1,x 2,…,x m)+E. Më shpesh, një ekuacion i tillë përdoret për të zgjidhur problemin e ofertës dhe kërkesës për një produkt, të ardhurat nga interesi për aksionet e riblera dhe për të studiuar shkaqet dhe llojin e funksionit të kostos së prodhimit. Përdoret gjithashtu në mënyrë aktive në një shumëllojshmëri të gjerë studimesh dhe llogaritjesh makroekonomike, por në nivelin mikroekonomik ky ekuacion përdoret pak më rrallë.

Detyra kryesore e regresionit të shumëfishtë është të ndërtojë një model të dhënash që përmban një sasi të madhe informacioni për të përcaktuar më tej se çfarë ndikimi ka secili prej faktorëve individualisht dhe në popullata e përgjithshme mbi treguesin që duhet modeluar dhe koeficientët e tij. Ekuacioni i regresionit mund të marrë një shumëllojshmëri të gjerë vlerash. Në këtë rast, për të vlerësuar marrëdhënien, zakonisht përdoren dy lloje funksionesh: lineare dhe jolineare.

Funksioni linear përshkruhet në formën e marrëdhënies së mëposhtme: y = a 0 + a 1 x 1 + a 2 x 2,+ ... + a m x m. Në këtë rast, a2, a m konsiderohen koeficientë të regresionit "të pastër". Ato janë të nevojshme për të karakterizuar ndryshimin mesatar në parametrin y me një ndryshim (ulje ose rritje) në secilin parametër korrespondues x me një njësi, me kushtin e vlerave të qëndrueshme të treguesve të tjerë.

Ekuacionet jolineare kanë, për shembull, formën e një funksioni fuqie y=ax 1 b1 x 2 b2 ...x m bm. Në këtë rast, treguesit b 1, b 2 ..... b m quhen koeficientë elasticiteti, ata demonstrojnë se si rezultati do të ndryshojë (me sa%) me një rritje (ulje) në treguesin përkatës x me 1% dhe me një tregues të qëndrueshëm të faktorëve të tjerë.

Cilët faktorë duhet të merren parasysh gjatë ndërtimit të regresionit të shumëfishtë

Për të ndërtuar saktë regresionin e shumëfishtë, është e nevojshme të zbuloni se cilët faktorë duhet t'i kushtohet vëmendje e veçantë.

Është e nevojshme të kemi njëfarë kuptimi të natyrës së marrëdhënieve ndërmjet faktorëve ekonomikë dhe asaj që po modelohet. Faktorët që duhet të përfshihen duhet të plotësojnë kriteret e mëposhtme:

  • Duhet t'i nënshtrohet matjes sasiore. Për të përdorur një faktor që përshkruan cilësinë e një objekti, në çdo rast duhet t'i jepet një formë sasiore.
  • Nuk duhet të ketë ndërlidhje faktorësh, apo marrëdhënie funksionale. Veprime të tilla më së shpeshti çojnë në pasoja të pakthyeshme - sistemi i ekuacioneve të zakonshme bëhet i pakushtëzuar, dhe kjo përfshin jobesueshmërinë dhe vlerësimet e tij të paqarta.
  • Në rastin e një treguesi të madh korrelacioni, nuk ka asnjë mënyrë për të zbuluar ndikimin e izoluar të faktorëve në rezultatin përfundimtar të treguesit, prandaj, koeficientët bëhen të pakuptueshëm.

Metodat e ndërtimit

Ka një numër të madh metodash dhe metodash që shpjegojnë se si mund të zgjidhni faktorët për një ekuacion. Sidoqoftë, të gjitha këto metoda bazohen në zgjedhjen e koeficientëve duke përdorur një tregues korrelacioni. Ndër to janë:

  • Metoda e eliminimit.
  • Metoda e ndërrimit.
  • Analiza e regresionit hap pas hapi.

Metoda e parë përfshin filtrimin e të gjithë koeficientëve nga grupi total. Metoda e dytë përfshin futjen e shumë faktorëve shtesë. Epo, e treta është eliminimi i faktorëve që janë përdorur më parë për ekuacionin. Secila prej këtyre metodave ka të drejtë të ekzistojë. Ata kanë të mirat dhe të këqijat e tyre, por të gjithë mund ta zgjidhin çështjen e eliminimit të treguesve të panevojshëm në mënyrën e tyre. Si rregull, rezultatet e marra nga secila metodë individuale janë mjaft të afërta.

Metodat e analizës me shumë variacione

Metoda të tilla për përcaktimin e faktorëve bazohen në marrjen në konsideratë të kombinimeve individuale të karakteristikave të ndërlidhura. Këto përfshijnë analizën diskriminuese, njohjen e formës, analizën e komponentit kryesor dhe analizën e grupimeve. Përveç kësaj, ekziston edhe analiza e faktorëve, por ajo u shfaq për shkak të zhvillimit të metodës së komponentëve. Të gjitha ato zbatohen në rrethana të caktuara, në varësi të kushteve dhe faktorëve të caktuar.

Analiza e regresionit është një metodë për të krijuar një shprehje analitike për varësinë stokastike midis karakteristikave në studim. Ekuacioni i regresionit tregon se si ndryshon mesatarja kur ndryshoni ndonjë nga x i , dhe ka formën:

Ku y - variabli i varur (është gjithmonë i njëjtë);

X i - variabla (faktorë) të pavarur (mund të ketë disa prej tyre).

Nëse ka vetëm një variabël të pavarur, kjo është një analizë e thjeshtë regresioni. Nëse ka disa prej tyre ( P 2), atëherë një analizë e tillë quhet multifaktoriale.

Analiza e regresionit zgjidh dy probleme kryesore:

    duke ndërtuar një ekuacion regresioni, d.m.th. gjetja e llojit të marrëdhënies ndërmjet treguesit të rezultatit dhe faktorëve të pavarur x 1 , x 2 , …, x n .

    vlerësimi i rëndësisë së ekuacionit që rezulton, d.m.th. përcaktimi se sa karakteristika të faktorëve të zgjedhur shpjegojnë ndryshimin e një tipari u.

Analiza e regresionit përdoret kryesisht për planifikim, si dhe për zhvillimin e një kuadri rregullator.

Ndryshe nga analiza e korrelacionit, e cila i përgjigjet vetëm pyetjes nëse ekziston një lidhje midis karakteristikave të analizuara, analiza e regresionit gjithashtu ofron shprehjen e saj të formalizuar. Përveç kësaj, nëse analiza e korrelacionit studion ndonjë marrëdhënie midis faktorëve, atëherë analiza e regresionit studion varësinë e njëanshme, d.m.th. një marrëdhënie që tregon se si një ndryshim në karakteristikat e faktorëve ndikon në karakteristikën efektive.

Analiza e regresionit është një nga metodat më të zhvilluara të statistikave matematikore. Në mënyrë rigoroze, për të zbatuar analizën e regresionit është e nevojshme të plotësohen një sërë kërkesash të veçanta (në veçanti, x l , x 2 ,...,x n ;y duhet të jenë variabla të rastësishme të pavarura, normalisht të shpërndara me varianca konstante). NË jeta reale Pajtueshmëria strikte me kërkesat e analizës së regresionit dhe korrelacionit është shumë e rrallë, por të dyja këto metoda janë shumë të zakonshme në kërkimin ekonomik. Varësitë në ekonomi mund të jenë jo vetëm të drejtpërdrejta, por edhe të anasjellta dhe jolineare. Një model regresioni mund të ndërtohet në prani të çdo varësie, megjithatë, në analizën multivariate përdoren vetëm modele lineare të formës:

Ekuacioni i regresionit zakonisht ndërtohet duke përdorur metodën katrorët më të vegjël, thelbi i së cilës është minimizimi i shumës së devijimeve në katror të vlerave aktuale të karakteristikës që rezulton nga vlerat e saj të llogaritura, d.m.th.

Ku T - numri i vëzhgimeve;

j =a+b 1 x 1 j + b 2 x 2 j + ... + b n X n j - vlera e llogaritur e faktorit të rezultatit.

Rekomandohet të përcaktohen koeficientët e regresionit duke përdorur paketa analitike për një kompjuter personal ose një kalkulator të veçantë financiar. Në rastin më të thjeshtë, koeficientët e regresionit të një univariati ekuacioni linear regresionet e formës y = a + bx mund të gjendet duke përdorur formulat:

Analiza e grupimeve

Analiza e grupimeve është një nga metodat e analizës shumëdimensionale të destinuara për grupimin (grupimin) e një popullate, elementët e së cilës karakterizohen nga shumë karakteristika. Vlerat e çdo tipari shërbejnë si koordinata të çdo njësie të popullsisë në studim në hapësirën shumëdimensionale të veçorive. Çdo vëzhgim, i karakterizuar nga vlerat e disa treguesve, mund të përfaqësohet si një pikë në hapësirën e këtyre treguesve, vlerat e të cilave konsiderohen si koordinata në një hapësirë ​​shumëdimensionale. Distanca midis pikave R Dhe q Me k koordinatat përkufizohen si:

Kriteri kryesor për grupimin është se dallimet ndërmjet grupimeve duhet të jenë më domethënëse sesa ndërmjet vëzhgimeve të caktuara për të njëjtin grup, d.m.th. në një hapësirë ​​shumëdimensionale duhet të respektohet pabarazia e mëposhtme:

Ku r 1, 2 - distanca midis grupimeve 1 dhe 2.

Ashtu si procedurat e analizës së regresionit, procedura e grupimit është mjaft punë intensive; këshillohet ta kryeni atë në një kompjuter.

Qëllimi kryesor i analizës së regresionit konsiston në përcaktimin e formës analitike të komunikimit në të cilën ndryshimi i karakteristikës efektive është për shkak të ndikimit të një ose më shumë karakteristikave të faktorëve, dhe grupi i të gjithë faktorëve të tjerë që gjithashtu ndikojnë në karakteristikën efektive merren si vlera konstante dhe mesatare.
Problemet e analizës së regresionit:
a) Vendosja e formës së varësisë. Për sa i përket natyrës dhe formës së marrëdhënies midis dukurive, bëhet dallimi midis regresionit linear pozitiv dhe jolinear dhe negativ linear dhe jolinear.
b) Përcaktimi i funksionit të regresionit në formën e një ekuacioni matematik të një lloji ose tjetër dhe vendosja e ndikimit të variablave shpjegues në variablin e varur.
c) Vlerësimi i vlerave të panjohura të ndryshores së varur. Duke përdorur funksionin e regresionit, ju mund të riprodhoni vlerat e ndryshores së varur brenda intervalit të vlerave të specifikuara të variablave shpjegues (d.m.th., zgjidhni problemin e interpolimit) ose vlerësoni rrjedhën e procesit jashtë intervalit të specifikuar (d.m.th. zgjidh problemin e ekstrapolimit). Rezultati është një vlerësim i vlerës së ndryshores së varur.

Regresioni i çiftëzuar është një ekuacion për marrëdhënien ndërmjet dy variablave y dhe x: y=f(x), ku y është ndryshorja e varur (atributi rezultativ); x është një variabël shpjegues i pavarur (feature-factor).

Ka regresione lineare dhe jolineare.
Regresioni linear: y = a + bx + ε
Regresionet jolineare ndahen në dy klasa: regresione që janë jolineare në lidhje me variablat shpjegues të përfshirë në analizë, por lineare në lidhje me parametrat e vlerësuar dhe regresione që janë jolineare në lidhje me parametrat e vlerësuar.
Regresionet që janë jolineare në variablat shpjegues:

Regresionet që janë jolineare në lidhje me parametrat që vlerësohen:

  • fuqia y=a x b ε
  • eksponencial y=a b x ε
  • eksponencial y=e a+b x ε
Ndërtimi i një ekuacioni regresioni zbret në vlerësimin e parametrave të tij. Për të vlerësuar parametrat e regresioneve lineare në parametra, përdoret metoda e katrorëve më të vegjël (OLS). Metoda e katrorëve më të vegjël bën të mundur marrjen e vlerësimeve të tilla të parametrave në të cilat shuma e devijimeve në katror të vlerave aktuale të karakteristikës efektive y nga y x teorike është minimale, d.m.th.
.
Për ekuacionet lineare dhe jolineare të reduktueshme në ato lineare, sistemi i mëposhtëm zgjidhet për a dhe b:

Ju mund të përdorni formula të gatshme që rrjedhin nga ky sistem:

Afërsia e marrëdhënies midis fenomeneve që studiohen vlerësohet nga koeficienti i korrelacionit të çiftit linear r xy për regresionin linear (-1≤r xy ≤1):

dhe indeksi i korrelacionit p xy - për regresionin jolinear (0≤p xy ≤1):

Cilësia e modelit të ndërtuar do të vlerësohet nga koeficienti (indeksi) i përcaktimit, si dhe gabimi mesatar i përafrimit.
Gabim mesatar i përafrimit - devijimi mesatar i vlerave të llogaritura nga ato aktuale:
.
Kufiri i lejuar i vlerave A nuk është më shumë se 8-10%.
Koeficienti mesatar i elasticitetit E tregon se me çfarë përqindje mesatarisht do të ndryshojë rezultati total nga ai madhësi mesatare kur faktori x ndryshon me 1% nga vlera mesatare e tij:
.

Qëllimi i analizës së variancës është të analizojë variancën e ndryshores së varur:
∑(y-y )²=∑(y x -y )²+∑(y-y x)²
ku ∑(y-y)² është shuma totale e devijimeve në katror;
∑(y x -y)² - shuma e devijimeve në katror për shkak të regresionit ("shpjeguar" ose "faktorial");
∑(y-y x)² - shuma e mbetur e devijimeve në katror.
Pjesa e variancës e shpjeguar me regresion në variancën totale të karakteristikës rezultante y karakterizohet nga koeficienti (indeksi) i përcaktimit R2:

Koeficienti i përcaktimit është katrori i koeficientit ose indeksit të korrelacionit.

F-testi - vlerësimi i cilësisë së ekuacionit të regresionit - konsiston në testimin e hipotezës Nr për parëndësi statistikore të ekuacionit të regresionit dhe treguesit të afërsisë së marrëdhënies. Për ta bërë këtë, bëhet një krahasim midis faktit aktual F dhe vlerave kritike (tabelore) të tabelës F të kriterit Fisher F. Fakti F përcaktohet nga raporti i vlerave të faktorit dhe variancat e mbetura, i projektuar për një shkallë lirie:
,
ku n është numri i njësive të popullsisë; m është numri i parametrave për variablat x.
Tabela F është vlera maksimale e mundshme e kriterit nën ndikimin e faktorëve të rastësishëm në shkallë të caktuar lirie dhe niveli i rëndësisë a. Niveli i rëndësisë a është probabiliteti për të refuzuar hipotezën e saktë, me kusht që ajo të jetë e vërtetë. Zakonisht a merret e barabartë me 0.05 ose 0.01.
Nëse tabela F< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >F fakt, atëherë hipoteza H o nuk hidhet poshtë dhe njihet parëndësia dhe pabesueshmëria statistikore e ekuacionit të regresionit.
Për të vlerësuar rëndësinë statistikore të koeficientëve të regresionit dhe korrelacionit, janë llogaritur testi i Studentit dhe intervalet e besimit për secilin tregues. Parashtrohet një hipotezë për natyrën e rastësishme të treguesve, d.m.th. për dallimin e tyre të parëndësishëm nga zero. Vlerësimi i rëndësisë së koeficientëve të regresionit dhe korrelacionit duke përdorur T-testin Student kryhet duke krahasuar vlerat e tyre me madhësinë e gabimit të rastësishëm:
; ; .
Gabimet e rastësishme të parametrave të regresionit linear dhe koeficientit të korrelacionit përcaktohen nga formula:



Duke krahasuar vlerat aktuale dhe kritike (tabelore) të statistikave t - tabela t dhe t fakt - ne pranojmë ose hedhim poshtë hipotezën H o.
Marrëdhënia ndërmjet testit Fisher F dhe statistikës studentore t shprehet me barazi

Nëse t tabela< t факт то H o отклоняется, т.е. a , b и r xy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >t është fakt që hipoteza H o nuk hidhet poshtë dhe njihet natyra e rastësishme e formimit të a, b ose r xy.
Për të llogaritur intervalin e besimit, ne përcaktojmë gabimin maksimal D për secilin tregues:
Δ a =t tabela m a , Δ b =t tabela m b .
Formulat për llogaritjen e intervaleve të besimit janë si më poshtë:
γ a =aΔ a ; γ a =a-Δ a ; γ a =a+Δa
γ b =bΔ b ; γ b =b-Δ b; γ b =b+Δ b
Nëse zero bie brenda intervalit të besimit, d.m.th. Nëse kufiri i poshtëm është negativ dhe kufiri i sipërm është pozitiv, atëherë parametri i vlerësuar merret zero, pasi nuk mund të marrë njëkohësisht vlera pozitive dhe negative.
Vlera e parashikimit y p përcaktohet duke zëvendësuar vlerën korresponduese (parashikuese) x p në ekuacionin e regresionit y x =a+b·x. Gabimi mesatar standard i parashikimit m y x llogaritet:
,
Ku
dhe ndërtohet një interval besimi për parashikimin:
γ y x =y p Δ y p ; γ y x min=y p -Δ y p ; γ y x max=y p +Δ y p
ku Δ y x =t tabela m y x.

Shembull zgjidhje

Detyra nr. 1. Për shtatë territore të rajonit Ural në vitin 199X, vlerat e dy karakteristikave janë të njohura.
Tabela 1.

Kërkohet: 1. Për të karakterizuar varësinë e y nga x, llogaritni parametrat e funksioneve të mëposhtme:
a) lineare;
b) fuqia (duhet të kryeni fillimisht procedurën e linearizimit të variablave duke marrë logaritmin e të dy pjesëve);
c) demonstrative;
d) një hiperbolë barabrinjës (ju duhet gjithashtu të kuptoni se si ta paralinearizoni këtë model).
2. Vlerësoni çdo model përmes gabimit mesatar të përafrimit A dhe testit Fisher's F.

Zgjidhja (opsioni nr. 1)

Për të llogaritur parametrat a dhe b të regresionit linear y=a+b·x (llogaritja mund të bëhet duke përdorur një kalkulator).
zgjidhni një sistem ekuacionesh normale për A Dhe b:
Duke përdorur të dhënat fillestare, ne llogarisim ∑y, ∑x, ∑y x, ∑x², ∑y²:
y x yx x 2 y 2 y xy-y xA i
l68,8 45,1 3102,88 2034,01 4733,44 61,3 7,5 10,9
2 61,2 59,0 3610,80 3481,00 3745,44 56,5 4,7 7,7
3 59,9 57,2 3426,28 3271,84 3588,01 57,1 2,8 4,7
4 56,7 61,8 3504,06 3819,24 3214,89 55,5 1,2 2,1
5 55,0 58,8 3234,00 3457,44 3025,00 56,5 -1,5 2,7
6 54,3 47,2 2562,96 2227,84 2948,49 60,5 -6,2 11,4
7 49,3 55,2 2721,36 3047,04 2430,49 57,8 -8,5 17,2
Total405,2 384,3 22162,34 21338,41 23685,76 405,2 0,0 56,7
e mërkurë kuptimi (Gjithsej/n)57,89
y
54,90
x
3166,05
x y
3048,34
3383,68
XX8,1
s 5,74 5,86 XXXXXX
s 232,92 34,34 XXXXXX


a=y -b x = 57,89+0,35 54,9 ≈ 76,88

Ekuacioni i regresionit: y = 76,88 - 0,35X. Me një rritje të pagës mesatare ditore me 1 rub. pesha e shpenzimeve për blerjen e produkteve ushqimore ulet mesatarisht me 0.35 pikë përqindjeje.
Le të llogarisim koeficientin e korrelacionit të çiftit linear:

Lidhja është e moderuar, e kundërt.
Le të përcaktojmë koeficientin e përcaktimit: r² xy =(-0.35)=0.127
Ndryshimi prej 12.7% në rezultat shpjegohet me ndryshimin në faktorin x. Zëvendësimi në ekuacionin e regresionit vlerat aktuale X, le të përcaktojmë vlerat teorike (të llogaritura) të y x. Le të gjejmë vlerën e gabimit mesatar të përafrimit A:

Mesatarisht, vlerat e llogaritura devijojnë nga ato aktuale me 8.1%.
Le të llogarisim kriterin F:

Vlera e përftuar tregon nevojën për të pranuar hipotezën H 0 për natyrën e rastësishme të varësisë së identifikuar dhe papërfillshmërinë statistikore të parametrave të ekuacionit dhe treguesit të afërsisë së lidhjes.
1b. Ndërtimit të modelit të fuqisë y=a·x b i paraprin procedura e linearizimit të variablave. Në shembull, linearizimi kryhet duke marrë logaritmet e të dy anëve të ekuacionit:
log y=log a + b log x
Y=C+b·Y
ku Y=log(y), X=log(x), C=log(a).

Për llogaritjet ne përdorim të dhënat në tabelë. 1.3.
Tabela 1.3

YX YX Y2 X 2 y xy-y x(y-y x)²A i
1 1,8376 1,6542 3,0398 3,3768 2,7364 61,0 7,8 60,8 11,3
2 1,7868 1,7709 3,1642 3,1927 3,1361 56,3 4,9 24,0 8,0
3 1,7774 1,7574 3,1236 3,1592 3,0885 56,8 3,1 9,6 5,2
4 1,7536 1,7910 3,1407 3,0751 3,2077 55,5 1,2 1,4 2,1
5 1,7404 1,7694 3,0795 3,0290 3,1308 56,3 -1,3 1,7 2,4
6 1,7348 1,6739 2,9039 3,0095 2,8019 60,2 -5,9 34,8 10,9
7 1,6928 1,7419 2,9487 2,8656 3,0342 57,4 -8,1 65,6 16,4
Total12,3234 12,1587 21,4003 21,7078 21,1355 403,5 1,7 197,9 56,3
Vlera mesatare1,7605 1,7370 3,0572 3,1011 3,0194 XX28,27 8,0
σ 0,0425 0,0484 XXXXXXX
σ 20,0018 0,0023 XXXXXXX

Le të llogarisim C dhe b:

C=Y -b X = 1,7605+0,298 1,7370 = 2,278126
Marrim një ekuacion linear: Y=2.278-0.298 X
Pasi kemi kryer fuqizimin e tij, marrim: y=10 2.278 ·x -0.298
Zëvendësimi i vlerave aktuale në këtë ekuacion X, marrim vlerat teorike të rezultatit. Bazuar në to, ne do të llogarisim treguesit e mëposhtëm: ngushtësia e lidhjes - indeksi i korrelacionit p xy dhe gabimi mesatar i përafrimit A.

Karakteristikat e modelit fuqi-ligj tregojnë se ai përshkruan marrëdhënien disi më mirë se funksioni linear.

1c. Ndërtimit të ekuacionit të lakores eksponenciale y=a·b x i paraprin procedura e linearizimit të variablave duke marrë logaritmin e të dy anëve të ekuacionit:
log y=log a + x log b
Y=C+B x
Për llogaritjet ne përdorim të dhënat e tabelës.

Yx Yx Y2 x 2y xy-y x(y-y x)²A i
1 1,8376 45,1 82,8758 3,3768 2034,01 60,7 8,1 65,61 11,8
2 1,7868 59,0 105,4212 3,1927 3481,00 56,4 4,8 23,04 7,8
3 1,7774 57,2 101,6673 3,1592 3271,84 56,9 3,0 9,00 5,0
4 1,7536 61,8 108,3725 3,0751 3819,24 55,5 1,2 1,44 2,1
5 1,7404 58,8 102,3355 3,0290 3457,44 56,4 -1,4 1,96 2,5
6 1,7348 47,2 81,8826 3,0095 2227,84 60,0 -5,7 32,49 10,5
7 1,6928 55,2 93,4426 2,8656 3047,04 57,5 -8,2 67,24 16,6
Total12,3234 384,3 675,9974 21,7078 21338,41 403,4 -1,8 200,78 56,3
e mërkurë zn.1,7605 54,9 96,5711 3,1011 3048,34 XX28,68 8,0
σ 0,0425 5,86 XXXXXXX
σ 20,0018 34,339 XXXXXXX

Vlerat e parametrave të regresionit A dhe arriti në:

A=Y -B x = 1,7605+0,0023 54,9 = 1,887
Ekuacioni linear i përftuar është: Y=1,887-0,0023x. Le të fuqizojmë ekuacionin që rezulton dhe ta shkruajmë në formën e zakonshme:
y x =10 1,887 10 -0,0023x = 77,1 0,9947 x
Le të vlerësojmë afërsinë e lidhjes përmes indeksit të korrelacionit p xy:

3588,01 56,9 3,0 9,00 5,0 4 56,7 0,0162 0,9175 0,000262 3214,89 55,5 1,2 1,44 2,1 5 55 0,0170 0,9354 0,000289 3025,00 56,4 -1,4 1,96 2,5 6 54,3 0,0212 1,1504 0,000449 2948,49 60,8 -6,5 42,25 12,0 7 49,3 0,0181 0,8931 0,000328 2430,49 57,5 -8,2 67,24 16,6 Total405,2 0,1291 7,5064 0,002413 23685,76 405,2 0,0 194,90 56,5 Vlera mesatare57,9 0,0184 1,0723 0,000345 3383,68 XX27,84 8,1 σ 5,74 0,002145 XXXXXXX σ 232,9476 0,000005 XX

Analiza e regresionit është metodë statistikore hulumtim që ju lejon të tregoni varësinë e një parametri të caktuar nga një ose më shumë variabla të pavarur. Në epokën para kompjuterit, përdorimi i tij ishte mjaft i vështirë, veçanërisht kur bëhej fjalë për vëllime të mëdha të dhënash. Sot, pasi keni mësuar se si të ndërtoni regresion në Excel, mund të zgjidhni probleme komplekse statistikore në vetëm disa minuta. Më poshtë janë shembuj specifikë nga fusha e ekonomisë.

Llojet e regresionit

Vetë ky koncept u fut në matematikë në 1886. Regresioni ndodh:

  • lineare;
  • parabolike;
  • qetësues;
  • eksponenciale;
  • hiperbolike;
  • demonstrative;
  • logaritmike.

Shembulli 1

Le të shqyrtojmë problemin e përcaktimit të varësisë së numrit të anëtarëve të ekipit që largohen nga paga mesatare në 6 ndërmarrje industriale.

Detyrë. Në gjashtë ndërmarrje u analizua paga mesatare mujore dhe numri i të punësuarve që largohen vullnetarisht. Në formë tabelare kemi:

Numri i njerëzve që kanë lënë duhanin

Paga

30,000 rubla

35,000 rubla

40,000 rubla

45,000 rubla

50,000 rubla

55,000 rubla

60,000 rubla

Për detyrën e përcaktimit të varësisë së numrit të punonjësve që largohen nga paga mesatare në 6 ndërmarrje, modeli i regresionit ka formën e ekuacionit Y = a 0 + a 1 x 1 +...+a k x k, ku x i janë variablat ndikues, a i janë koeficientët e regresionit dhe k është numri i faktorëve.

Për këtë problem, Y është treguesi i largimit të punonjësve dhe faktori ndikues është paga, të cilën e shënojmë me X.

Përdorimi i aftësive të procesorit Excel

Analiza e regresionit në Excel duhet të paraprihet duke aplikuar funksione të integruara në të dhënat ekzistuese tabelare. Sidoqoftë, për këto qëllime është më mirë të përdorni shtesën shumë të dobishme "Analysis Pack". Për ta aktivizuar ju duhet:

  • nga skeda "File" shkoni te seksioni "Opsionet";
  • në dritaren që hapet, zgjidhni rreshtin "Shtesa";
  • klikoni në butonin "Shko" që ndodhet më poshtë, në të djathtë të rreshtit "Menaxhimi";
  • kontrolloni kutinë pranë emrit "Paketa e analizës" dhe konfirmoni veprimet tuaja duke klikuar "Ok".

Nëse gjithçka është bërë si duhet, butoni i kërkuar do të shfaqet në anën e djathtë të skedës "Të dhënat", e vendosur mbi fletën e punës Excel.

në Excel

Tani që kemi në dorë të gjitha mjetet e nevojshme virtuale për të kryer llogaritjet ekonometrike, mund të fillojmë të zgjidhim problemin tonë. Për këtë:

  • Klikoni në butonin "Analiza e të dhënave";
  • në dritaren që hapet, klikoni në butonin "Regresion";
  • në skedën që shfaqet, futni gamën e vlerave për Y (numri i punonjësve që largohen nga puna) dhe për X (pagat e tyre);
  • Ne konfirmojmë veprimet tona duke shtypur butonin "Ok".

Si rezultat, programi do të mbushë automatikisht një tabelë të re me të dhëna të analizës së regresionit. Shënim! Excel ju lejon të vendosni manualisht vendndodhjen që preferoni për këtë qëllim. Për shembull, mund të jetë e njëjta fletë ku ndodhen vlerat Y dhe X, ose madje nje liber i ri, i projektuar posaçërisht për ruajtjen e të dhënave të tilla.

Analiza e rezultateve të regresionit për R-katror

Në Excel, të dhënat e marra gjatë përpunimit të të dhënave në shembullin në shqyrtim kanë formën:

Para së gjithash, duhet t'i kushtoni vëmendje vlerës së katrorit R. Ai përfaqëson koeficientin e përcaktimit. Në këtë shembull, R-katror = 0.755 (75.5%), d.m.th., parametrat e llogaritur të modelit shpjegojnë lidhjen midis parametrave në shqyrtim me 75.5%. Sa më e lartë të jetë vlera e koeficientit të përcaktimit, aq më i përshtatshëm është modeli i përzgjedhur për një detyrë specifike. Konsiderohet se përshkruan saktë situatën reale kur vlera e katrorit R është mbi 0.8. Nëse R-katror<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Analiza e Shanseve

Numri 64.1428 tregon se cila do të jetë vlera e Y nëse të gjitha variablat xi në modelin që po shqyrtojmë rivendosen në zero. Me fjalë të tjera, mund të argumentohet se vlera e parametrit të analizuar ndikohet edhe nga faktorë të tjerë që nuk janë përshkruar në një model specifik.

Koeficienti tjetër -0,16285, i vendosur në qelizën B18, tregon peshën e ndikimit të ndryshores X në Y. Kjo do të thotë se paga mesatare mujore e punonjësve brenda modelit në shqyrtim ndikon në numrin e larguesve me peshë -0,16285, d.m.th. shkalla e ndikimit të saj është krejtësisht e vogël. Shenja "-" tregon se koeficienti është negativ. Kjo është e qartë, pasi të gjithë e dinë që sa më e lartë të jetë paga në ndërmarrje, aq më pak njerëz shprehin dëshirën për të ndërprerë kontratën e punës ose për t'u larguar.

Regresion i shumëfishtë

Ky term i referohet një ekuacioni të marrëdhënieve me disa variabla të pavarur të formës:

y=f(x 1 +x 2 +…x m) + ε, ku y është karakteristika rezultante (ndryshore e varur), dhe x 1, x 2,…x m janë karakteristika të faktorëve (ndryshore të pavarura).

Vlerësimi i parametrave

Për regresionin e shumëfishtë (MR), ai kryhet duke përdorur metodën e katrorëve më të vegjël (OLS). Për ekuacionet lineare të formës Y = a + b 1 x 1 +…+b m x m + ε ne ndërtojmë një sistem ekuacionesh normale (shih më poshtë)

Për të kuptuar parimin e metodës, merrni parasysh një rast me dy faktorë. Pastaj kemi një situatë të përshkruar nga formula

Nga këtu marrim:

ku σ është varianca e tiparit përkatës të pasqyruar në indeks.

OLS është i zbatueshëm për ekuacionin MR në një shkallë të standardizuar. Në këtë rast, marrim ekuacionin:

në të cilat t y, t x 1, ... t xm janë variabla të standardizuara, për të cilat vlerat mesatare janë të barabarta me 0; β i janë koeficientët e standardizuar të regresionit, dhe devijimi standard është 1.

Ju lutemi vini re se të gjitha β i në këtë rast specifikohen si të normalizuara dhe të centralizuara, prandaj krahasimi i tyre me njëri-tjetrin konsiderohet i saktë dhe i pranueshëm. Përveç kësaj, është e zakonshme që të ekzaminohen faktorët duke hedhur poshtë ata me vlerat më të ulëta βi.

Problem me përdorimin e ekuacionit të regresionit linear

Supozoni se kemi një tabelë të dinamikës së çmimeve për një produkt specifik N gjatë 8 muajve të fundit. Është e nevojshme të merret një vendim për këshillueshmërinë e blerjes së një grupi të tij me një çmim prej 1850 rubla/t.

numri i muajit

emri i muajit

çmimi i produktit N

1750 rubla për ton

1755 rubla për ton

1767 rubla për ton

1760 rubla për ton

1770 rubla për ton

1790 rubla për ton

1810 rubla për ton

1840 rubla për ton

Për të zgjidhur këtë problem në procesorin e spreadsheet Excel, duhet të përdorni mjetin "Analiza e të dhënave", e njohur tashmë nga shembulli i paraqitur më sipër. Tjetra, zgjidhni seksionin "Regresioni" dhe vendosni parametrat. Duhet mbajtur mend se në fushën "Input intervali Y" duhet të futet një sërë vlerash për variablin e varur (në këtë rast, çmimet për mallrat në muaj të caktuar të vitit), dhe në "Inputin interval X" - për variablin e pavarur (numri i muajit). Konfirmoni veprimin duke klikuar "Ok". Në një fletë të re (nëse tregohet kështu) marrim të dhëna për regresion.

Duke i përdorur ato ndërtojmë një ekuacion linear të formës y=ax+b, ku parametrat a dhe b janë koeficientët e drejtëzës me emrin e numrit të muajit dhe koeficientët dhe drejtëzat “Y-prerja” nga fleta me rezultatet e analizës së regresionit. Kështu, ekuacioni i regresionit linear (LR) për detyrën 3 shkruhet si:

Çmimi i produktit N = 11.714* numri i muajit + 1727.54.

ose në shënimin algjebrik

y = 11,714 x + 1727,54

Analiza e rezultateve

Për të vendosur nëse ekuacioni i regresionit linear që rezulton është adekuat, përdoren koeficientët e korrelacionit të shumëfishtë (MCC) dhe përcaktimit, si dhe testi Fisher dhe testi Student t. Në tabelën e Excel-it me rezultatet e regresionit, ato quhen respektivisht R të shumëfishta, R-katrore, F-statistikë dhe t-statistika.

KMC R bën të mundur vlerësimin e afërsisë së marrëdhënies probabilistike midis variablave të pavarur dhe të varur. Vlera e tij e lartë tregon një lidhje mjaft të fortë midis variablave "Numri i muajit" dhe "Çmimi i produktit N në rubla për 1 ton". Megjithatë, natyra e kësaj marrëdhënieje mbetet e panjohur.

Katrori i koeficientit të përcaktimit R2 (RI) është karakteristikë numerike e proporcionit të shpërndarjes totale dhe tregon shpërndarjen e cilës pjesë të të dhënave eksperimentale, d.m.th. vlerat e ndryshores së varur korrespondojnë me ekuacionin e regresionit linear. Në problemin në shqyrtim, kjo vlerë është e barabartë me 84.8%, d.m.th., të dhënat statistikore përshkruhen me një shkallë të lartë saktësie nga SD që rezulton.

Statistikat F, të quajtura edhe testi i Fisher-it, përdoren për të vlerësuar rëndësinë e një marrëdhënieje lineare, duke hedhur poshtë ose konfirmuar hipotezën e ekzistencës së saj.

(Testi i studentit) ndihmon për të vlerësuar rëndësinë e koeficientit për një term të panjohur ose të lirë të një marrëdhënieje lineare. Nëse vlera e testit t > tcr, atëherë hipoteza për parëndësinë e termit të lirë të ekuacionit linear hidhet poshtë.

Në problemin në shqyrtim për termin e lirë, duke përdorur mjetet e Excel-it, u arrit që t = 169.20903, dhe p = 2.89E-12, d.m.th., kemi probabilitet zero që hipoteza e saktë për parëndësinë e termit të lirë të hidhet poshtë. . Për koeficientin për të panjohurën t=5,79405, dhe p=0,001158. Me fjalë të tjera, probabiliteti që hipoteza e saktë për parëndësinë e koeficientit për një të panjohur të hidhet poshtë është 0.12%.

Kështu, mund të argumentohet se ekuacioni i regresionit linear që rezulton është adekuat.

Problemi i fizibilitetit të blerjes së një blloku aksionesh

Regresioni i shumëfishtë në Excel kryhet duke përdorur të njëjtin mjet Analiza e të Dhënave. Le të shqyrtojmë një problem specifik aplikimi.

Menaxhmenti i kompanisë NNN duhet të vendosë për këshillueshmërinë e blerjes së 20% të aksioneve në MMM SHA. Kostoja e paketës (PS) është 70 milionë dollarë amerikanë. Specialistët e NNN kanë mbledhur të dhëna për transaksione të ngjashme. Është vendosur që vlera e bllokut të aksioneve të vlerësohet sipas parametrave të tillë, të shprehur në miliona dollarë amerikanë, si:

  • llogaritë e pagueshme (VK);
  • vëllimi i qarkullimit vjetor (VO);
  • llogaritë e arkëtueshme (VD);
  • kostoja e aseteve fikse (COF).

Përveç kësaj, përdoret parametri i pagave të prapambetura të ndërmarrjes (V3 P) në mijëra dollarë amerikanë.

Zgjidhja duke përdorur procesorin e fletëllogaritjes Excel

Para së gjithash, ju duhet të krijoni një tabelë të të dhënave burimore. Duket kështu:

  • telefononi dritaren "Analiza e të dhënave";
  • zgjidhni seksionin "Regresioni";
  • Në kutinë "Input intervali Y", vendosni gamën e vlerave të variablave të varur nga kolona G;
  • Klikoni në ikonën me një shigjetë të kuqe në të djathtë të dritares "Input interval X" dhe theksoni gamën e të gjitha vlerave nga kolonat B, C, D, F në fletë.

Shënoni artikullin "Fleta e re e punës" dhe klikoni "Ok".

Merrni një analizë regresioni për një problem të caktuar.

Studimi i rezultateve dhe përfundimeve

Ne "mbledhim" nga të dhënat e rrumbullakosura të paraqitura më sipër në fletën tabelare procesor Excel, ekuacioni i regresionit:

SP = 0,103*SOF + 0,541*VO - 0,031*VK +0,405*VD +0,691*VZP - 265,844.

Në një formë matematikore më të njohur, mund të shkruhet si:

y = 0,103*x1 + 0,541*x2 - 0,031*x3 +0,405*x4 +0,691*x5 - 265,844

Të dhënat për MMM SHA janë paraqitur në tabelë:

Duke i zëvendësuar ato në ekuacionin e regresionit, marrim një shifër prej 64.72 milion dollarë amerikanë. Kjo do të thotë se aksionet e MMM sh.a. nuk ia vlen të blihen, pasi vlera e tyre prej 70 milionë dollarësh është mjaft e fryrë.

Siç mund ta shihni, përdorimi i tabelës Excel dhe ekuacioni i regresionit bënë të mundur marrjen e një vendimi të informuar në lidhje me realizueshmërinë e një transaksioni shumë specifik.

Tani e dini se çfarë është regresioni. Shembujt e Excel të diskutuar më sipër do t'ju ndihmojnë të vendosni probleme praktike nga fusha e ekonometrisë.

Ndani me miqtë ose kurseni për veten tuaj:

Po ngarkohet...