Ռեգրեսիայի հավասարում. Բազմակի ռեգրեսիայի հավասարում. Հարաբերակցություն և ռեգրեսիոն վերլուծություն Excel-ում. կատարման հրահանգներ Որոնք են պահանջները ռեգրեսիոն վերլուծության մոդելում

Ռեգրեսիոն և հարաբերակցության վերլուծություն - վիճակագրական հետազոտության մեթոդներ: Սրանք ամենատարածված եղանակներն են՝ ցույց տալու պարամետրի կախվածությունը մեկ կամ մի քանի անկախ փոփոխականներից:

Ստորև, օգտագործելով կոնկրետ գործնական օրինակներ, կդիտարկենք տնտեսագետների շրջանում այս երկու շատ տարածված վերլուծությունները։ Կբերենք նաև արդյունքների ստացման օրինակ, երբ դրանք համակցված են։

Ռեգրեսիայի վերլուծություն Excel-ում

Ցույց է տալիս որոշ արժեքների (անկախ, անկախ) ազդեցությունը կախված փոփոխականի վրա: Օրինակ, թե ինչպես է տնտեսապես ակտիվ բնակչության թիվը կախված ձեռնարկությունների թվից, աշխատավարձից և այլ պարամետրերից: Կամ՝ ինչպե՞ս են ՀՆԱ-ի մակարդակի վրա ազդում օտարերկրյա ներդրումները, էներգակիրների գները և այլն։

Վերլուծության արդյունքը թույլ է տալիս առաջնահերթություն տալ: Եվ հիմնվելով հիմնական գործոնների վրա՝ կանխատեսել, պլանավորել առաջնահերթ ոլորտների զարգացումը, կայացնել կառավարման որոշումներ։

Հետընթացը տեղի է ունենում.

գծային (y = a + bx);
պարաբոլիկ (y = a + bx + cx 2);
էքսպոնենցիալ (y = a * exp (bx));
հզորություն (y = a*x^b);
հիպերբոլիկ (y = b/x + a);
լոգարիթմական (y = b * 1n (x) + a);
էքսպոնենցիալ (y = a * b^x):

Դիտարկենք Excel-ում ռեգրեսիոն մոդել կառուցելու և արդյունքների մեկնաբանման օրինակը: Վերցնենք ռեգրեսիայի գծային տեսակ։

Առաջադրանք. 6 ձեռնարկություններում վերլուծվել են միջին ամսական աշխատավարձը և հեռացած աշխատողների թիվը։ Անհրաժեշտ է որոշել թոշակի անցած աշխատողների թվի կախվածությունը միջին աշխատավարձից։

Գծային ռեգրեսիայի մոդելն ունի հետևյալ ձևը.

Y \u003d a 0 + a 1 x 1 + ... + a k x k.

Այնտեղ, որտեղ a-ն ռեգրեսիայի գործակիցներն են, x-ը՝ ազդող փոփոխականները, իսկ k-ը՝ գործոնների քանակը:

Մեր օրինակում Y-ը աշխատողներից դուրս գալու ցուցանիշն է: Ազդող գործոնը աշխատավարձն է (x):

Excel-ն ունի ներկառուցված գործառույթներ, որոնք կարող են օգտագործվել գծային ռեգրեսիայի մոդելի պարամետրերը հաշվարկելու համար: Բայց Analysis ToolPak հավելումը դա կանի ավելի արագ:

Ակտիվացրեք հզոր վերլուծական գործիք.

Ակտիվացնելուց հետո հավելումը հասանելի կլինի Տվյալների ներդիրում:

Այժմ մենք ուղղակիորեն կզբաղվենք ռեգրեսիոն վերլուծությամբ:

Առաջին հերթին ուշադրություն ենք դարձնում R-քառակուսին և գործակիցներին։

R-քառակուսին որոշման գործակիցն է: Մեր օրինակում այն կազմում է 0,755 կամ 75,5%: Սա նշանակում է, որ մոդելի հաշվարկված պարամետրերը 75,5%-ով բացատրում են ուսումնասիրված պարամետրերի կապը։ Որքան բարձր է որոշման գործակիցը, այնքան լավ է մոդելը: Լավ - 0.8-ից բարձր: Վատ - 0,5-ից պակաս (նման վերլուծությունը հազիվ թե ողջամիտ համարվի): Մեր օրինակում՝ «վատ չէ»։

64.1428 գործակիցը ցույց է տալիս, թե ինչ կլինի Y-ը, եթե դիտարկվող մոդելի բոլոր փոփոխականները հավասար են 0-ի: Այսինքն, այլ գործոններ, որոնք նկարագրված չեն մոդելում, նույնպես ազդում են վերլուծված պարամետրի արժեքի վրա:

-0,16285 գործակիցը ցույց է տալիս X փոփոխականի կշիռը Y-ի վրա: Այսինքն, այս մոդելի միջին ամսական աշխատավարձը ազդում է -0,16285 քաշով հրաժարվողների թվի վրա (սա ազդեցության փոքր աստիճան է): «-» նշանը ցույց է տալիս բացասական ազդեցություն. որքան բարձր է աշխատավարձը, այնքան քիչ է հրաժարվում: Ինչն արդարացի է։

Հարաբերակցության վերլուծություն Excel-ում

Հարաբերակցության վերլուծությունը օգնում է պարզել, թե արդյոք մեկ կամ երկու նմուշների ցուցանիշների միջև կապ կա: Օրինակ, մեքենայի շահագործման ժամանակի և վերանորոգման արժեքի, սարքավորումների գնի և շահագործման տևողության, երեխաների հասակի և քաշի միջև և այլն:

Եթե կա հարաբերություն, ապա մի պարամետրի աճը հանգեցնում է մյուսի աճի (դրական հարաբերակցության), թե նվազմանը (բացասական): Հարաբերակցության վերլուծությունը օգնում է վերլուծաբանին որոշել, թե արդյոք մեկ ցուցիչի արժեքը կարող է օգտագործվել մյուսի հնարավոր արժեքը կանխատեսելու համար:

Հարաբերակցության գործակիցը նշվում է r. Տատանվում է +1-ից մինչև -1: Տարբեր ոլորտների համար հարաբերակցությունների դասակարգումը տարբեր կլինի: Երբ գործակցի արժեքը 0 է, նմուշների միջև գծային հարաբերություն չկա:

Մտածեք, թե ինչպես օգտագործել Excel-ը հարաբերակցության գործակիցը գտնելու համար:

CORREL ֆունկցիան օգտագործվում է զուգակցված գործակիցները գտնելու համար։

Առաջադրանք. Որոշեք, թե արդյոք կապ կա խառատահաստոցի շահագործման ժամանակի և դրա պահպանման ծախսերի միջև:

Տեղադրեք կուրսորը ցանկացած բջիջի մեջ և սեղմեք fx կոճակը:

«Վիճակագրական» կատեգորիայում ընտրեք CORREL ֆունկցիան:
Փաստարկ «Array 1» - արժեքների առաջին միջակայքը - մեքենայի ժամանակը. A2: A14:
Փաստարկ «Array 2» - արժեքների երկրորդ միջակայք - վերանորոգման արժեքը. B2:B14: Սեղմեք OK:

Կապի տեսակը որոշելու համար անհրաժեշտ է դիտարկել գործակցի բացարձակ թիվը (գործունեության յուրաքանչյուր ոլորտ ունի իր սանդղակը):

Մի քանի պարամետրերի (ավելի քան 2) հարաբերական վերլուծության համար ավելի հարմար է օգտագործել «Տվյալների վերլուծություն» («Վերլուծական փաթեթ» հավելում): Ցանկում դուք պետք է ընտրեք հարաբերակցություն և նշանակեք զանգված: Բոլորը.

Ստացված գործակիցները կցուցադրվեն հարաբերակցության մատրիցով: Այս մեկի պես.

Հարաբերակցային-ռեգեսիոն վերլուծություն

Գործնականում այս երկու տեխնիկան հաճախ օգտագործվում են միասին:

Օրինակ:

Այժմ ռեգրեսիոն վերլուծության տվյալները տեսանելի են։

Ուսման ընթացքում ուսանողները շատ հաճախ հանդիպում են տարբեր հավասարումների։ Դրանցից մեկը՝ ռեգրեսիայի հավասարումը, քննարկվում է այս հոդվածում։ Այս տեսակի հավասարումը հատուկ օգտագործվում է մաթեմատիկական պարամետրերի միջև փոխհարաբերությունների բնութագրերը նկարագրելու համար: Այս տեսակըհավասարություններն օգտագործվում են վիճակագրության և էկոնոմետրիկայի մեջ։

Ռեգրեսիայի սահմանում

Մաթեմատիկայի մեջ ռեգրեսիան հասկացվում է որպես որոշակի մեծություն, որը նկարագրում է տվյալների հավաքածուի միջին արժեքի կախվածությունը մեկ այլ մեծության արժեքներից: Ռեգրեսիայի հավասարումը ցույց է տալիս, որպես որոշակի հատկանիշի ֆունկցիա, մեկ այլ հատկանիշի միջին արժեքը: Ռեգրեսիոն ֆունկցիան ունի պարզ y \u003d x հավասարման ձև, որում y-ն գործում է որպես կախված փոփոխական, իսկ x-ը անկախ փոփոխական է (հատկանիշի գործոն): Փաստորեն, ռեգրեսիան արտահայտվում է որպես y = f (x):

Որո՞նք են փոփոխականների միջև փոխհարաբերությունների տեսակները

Ընդհանուր առմամբ, առանձնանում են հարաբերությունների երկու հակադիր տեսակ՝ հարաբերակցություն և ռեգրեսիա։

Առաջինը բնութագրվում է պայմանական փոփոխականների հավասարությամբ։ IN այս դեպքըհստակ հայտնի չէ, թե որ փոփոխականն է կախված մյուսից:

Եթե փոփոխականների միջև հավասարություն չկա, և պայմաններն ասում են, թե որ փոփոխականն է բացատրական և որը կախված, ապա կարելի է խոսել երկրորդ տիպի կապի առկայության մասին։ Գծային ռեգրեսիոն հավասարում կառուցելու համար անհրաժեշտ կլինի պարզել, թե ինչ տեսակի հարաբերություն է նկատվում։

Ռեգրեսիաների տեսակները

Մինչ օրս ռեգրեսիայի 7 տարբեր տեսակ կա՝ հիպերբոլիկ, գծային, բազմակի, ոչ գծային, զույգական, հակադարձ, լոգարիթմականորեն գծային։

Հիպերբոլիկ, գծային և լոգարիթմական

Գծային ռեգրեսիայի հավասարումը օգտագործվում է վիճակագրության մեջ՝ հստակ բացատրելու հավասարման պարամետրերը։ Կարծես y = c + m * x + E: Հիպերբոլիկ հավասարումն ունի կանոնավոր հիպերբոլայի ձև y \u003d c + m / x + E: Լոգարիթմորեն գծային հավասարումն արտահայտում է հարաբերությունը լոգարիթմական ֆունկցիայի միջոցով. In y \u003d In c + m * In x + In E:

Բազմակի և ոչ գծային

Ռեգրեսիայի երկու ավելի բարդ տեսակները բազմակի և ոչ գծային են: Բազմակի ռեգրեսիայի հավասարումն արտահայտվում է y \u003d f (x 1, x 2 ... x c) + E ֆունկցիայով: Այս իրավիճակում y-ը կախված փոփոխականն է, իսկ x-ը՝ բացատրական: E փոփոխականը ստոխաստիկ է և ներառում է այլ գործոնների ազդեցությունը հավասարման մեջ։ Ոչ գծային ռեգրեսիայի հավասարումը մի փոքր անհամապատասխան է: Մի կողմից հաշվի առնված ցուցանիշների առումով այն գծային չէ, իսկ մյուս կողմից՝ ցուցանիշների գնահատման դերում՝ գծային։

Հակադարձ և զույգային ռեգրեսիաներ

Հակադարձը ֆունկցիայի մի տեսակ է, որը պետք է փոխարկվի գծային ձևի: Ամենավանդականում կիրառական ծրագրերայն ունի y = 1/c + m*x + E ֆունկցիայի ձև: Զուգակցված ռեգրեսիոն հավասարումը ցույց է տալիս տվյալների միջև կապը որպես y = f(x) + E ֆունկցիա: Ճիշտ ինչպես մյուս հավասարումները, y-ը կախված է x-ից, իսկ E-ն ստոխաստիկ պարամետր է:

Հարաբերակցության հայեցակարգը

Սա ցուցիչ է, որը ցույց է տալիս երկու երևույթների կամ գործընթացների միջև հարաբերությունների առկայությունը։ Հարաբերությունների ուժն արտահայտվում է որպես հարաբերակցության գործակից: Դրա արժեքը տատանվում է [-1;+1] միջակայքում: Բացասական ցուցանիշը ցույց է տալիս ներկայությունը հետադարձ կապ, դրական՝ ուղիղ գծի մասին։ Եթե գործակիցը վերցնում է 0-ի արժեք, ապա հարաբերություն չկա: Որքան մոտ է արժեքը 1-ին, այնքան ուժեղ է հարաբերությունները պարամետրերի միջև, այնքան մոտ է 0-ին, այնքան թույլ է:

Մեթոդներ

Հարաբերակցության պարամետրային մեթոդները կարող են գնահատել հարաբերությունների խստությունը: Դրանք օգտագործվում են բաշխման գնահատումների հիման վրա՝ ուսումնասիրելու այն պարամետրերը, որոնք ենթարկվում են նորմալ բաշխման օրենքին:

Գծային ռեգրեսիայի հավասարման պարամետրերն անհրաժեշտ են կախվածության տեսակը, ռեգրեսիոն հավասարման գործառույթը պարզելու և ընտրված հարաբերությունների բանաձևի ցուցանիշները գնահատելու համար: Հարաբերակցության դաշտը օգտագործվում է որպես հարաբերությունների նույնականացման մեթոդ: Դա անելու համար բոլոր գոյություն ունեցող տվյալները պետք է ներկայացվեն գրաֆիկորեն: Ուղղանկյուն երկչափ կոորդինատային համակարգում բոլոր հայտնի տվյալները պետք է գծագրվեն: Այսպես է ձևավորվում հարաբերակցության դաշտը։ Նկարագրող գործոնի արժեքը նշվում է աբսցիսայի երկայնքով, իսկ կախյալ գործոնի արժեքները նշվում են օրդինատի երկայնքով: Եթե պարամետրերի միջև ֆունկցիոնալ հարաբերություն կա, դրանք շարվում են գծի տեսքով:

Եթե նման տվյալների հարաբերակցության գործակիցը 30%-ից պակաս է, կարելի է խոսել կապի գրեթե լիակատար բացակայության մասին։ Եթե այն գտնվում է 30%-ից 70%-ի սահմաններում, ապա դա ցույց է տալիս միջին խստության օղակների առկայությունը: 100% ցուցանիշը ֆունկցիոնալ կապի վկայություն է:

Ոչ գծային ռեգրեսիոն հավասարումը, ինչպես գծայինը, պետք է լրացվի հարաբերակցության ինդեքսով (R):

Հարաբերակցություն բազմակի ռեգրեսիայի համար

Որոշման գործակիցը բազմակի հարաբերակցության քառակուսու ցուցիչ է։ Նա խոսում է ուսումնասիրվող հատկանիշի հետ ներկայացված ցուցանիշների բազմության փոխհարաբերության խստության մասին։ Այն կարող է խոսել նաև արդյունքի վրա պարամետրերի ազդեցության բնույթի մասին: Բազմակի ռեգրեսիայի հավասարումը գնահատվում է՝ օգտագործելով այս ցուցանիշը:

Բազմակի հարաբերակցության ինդեքսը հաշվարկելու համար անհրաժեշտ է հաշվարկել դրա ինդեքսը։

Նվազագույն քառակուսի մեթոդ

Այս մեթոդը ռեգրեսիոն գործոնների գնահատման միջոց է։ Դրա էությունը կայանում է նրանում, որ նվազագույնի հասցվի քառակուսի շեղումների գումարը, որը ստացվում է ֆունկցիայից գործոնի կախվածության պատճառով։

Նման մեթոդով կարելի է գնահատել զուգակցված գծային ռեգրեսիայի հավասարումը: Հավասարումների այս տեսակն օգտագործվում է զուգակցված գծային հարաբերությունների ցուցիչների միջև հայտնաբերման դեպքում։

Հավասարումների ընտրանքներ

Գծային ռեգրեսիայի ֆունկցիայի յուրաքանչյուր պարամետր ունի որոշակի նշանակություն: Զուգակցված գծային ռեգրեսիայի հավասարումը պարունակում է երկու պարամետր՝ c և m։ t պարամետրը ցույց է տալիս y ֆունկցիայի վերջնական ցուցիչի միջին փոփոխությունը՝ x փոփոխականի մեկ պայմանական միավորով նվազման (աճի) ենթակա։ Եթե x փոփոխականը զրո է, ապա ֆունկցիան հավասար է c պարամետրին։ Եթե x փոփոխականը զրո չէ, ապա c գործոնը տնտեսական իմաստ չունի։ Ֆունկցիայի վրա միակ ազդեցությունը c գործոնի դիմաց գտնվող նշանն է: Եթե կա մինուս, ապա կարելի է ասել գործոնի համեմատ արդյունքի դանդաղ փոփոխության մասին։ Եթե կա գումարած, ապա սա ցույց է տալիս արդյունքի արագացված փոփոխություն:

Յուրաքանչյուր պարամետր, որը փոխում է ռեգրեսիոն հավասարման արժեքը, կարող է արտահայտվել հավասարման տեսքով: Օրինակ, c գործոնն ունի c = y - mx ձևը:

Խմբավորված տվյալներ

Կան առաջադրանքի այնպիսի պայմաններ, որոնցում ամբողջ տեղեկատվությունը խմբավորվում է ըստ x հատկանիշի, բայց միևնույն ժամանակ, որոշակի խմբի համար նշվում են կախված ցուցիչի համապատասխան միջին արժեքները: Այս դեպքում միջին արժեքները բնութագրում են, թե ինչպես է ցուցանիշը կախված x-ից: Այսպիսով, խմբավորված տեղեկատվությունը օգնում է գտնել ռեգրեսիայի հավասարումը: Այն օգտագործվում է որպես հարաբերությունների վերլուծություն: Այնուամենայնիվ, այս մեթոդն ունի իր թերությունները. Ցավոք սրտի, միջին ցուցանիշները հաճախ ենթարկվում են արտաքին տատանումների: Այս տատանումները հարաբերությունների օրինաչափությունների արտացոլումը չեն, դրանք պարզապես քողարկում են դրա «աղմուկը»։ Միջինները ցույց են տալիս հարաբերությունների օրինաչափություններ, որոնք շատ ավելի վատն են, քան գծային ռեգրեսիոն հավասարումը: Այնուամենայնիվ, դրանք կարող են օգտագործվել որպես հավասարում գտնելու հիմք: Բազմապատկելով որոշակի բնակչության չափը համապատասխան միջինով, կարող եք ստանալ y-ի գումարը խմբի ներսում: Հաջորդը, դուք պետք է նոկաուտի ենթարկեք ստացված բոլոր գումարները և գտնեք վերջնական ցուցանիշը y: Մի փոքր ավելի դժվար է հաշվարկներ կատարել xy գումարի ցուցիչով։ Այն դեպքում, երբ միջակայքերը փոքր են, մենք կարող ենք պայմանականորեն ընդունել x ցուցանիշը բոլոր միավորների համար (խմբի ներսում): Բազմապատկեք այն y-ի գումարով, որպեսզի գտնեք x-ի և y-ի արտադրյալների գումարը: Այնուհետև, բոլոր գումարները բախվում են իրար և ստացվում է xy ընդհանուր գումարը:

Բազմակի զույգ հավասարումների ռեգրեսիա. հարաբերությունների կարևորության գնահատում

Ինչպես արդեն քննարկվեց, բազմակի ռեգրեսիան ունի y = f (x 1 ,x 2 ,…,x m)+E ձևի ֆունկցիա: Ամենից հաճախ նման հավասարումն օգտագործվում է ապրանքի առաջարկի և պահանջարկի խնդիրը լուծելու, հետգնված բաժնետոմսերի տոկոսային եկամուտների, արտադրության արժեքի ֆունկցիայի պատճառներն ու տեսակը ուսումնասիրելու համար: Այն նաև ակտիվորեն օգտագործվում է մակրոտնտեսական հետազոտությունների և հաշվարկների լայն տեսականիում, սակայն միկրոտնտեսության մակարդակում այս հավասարումը մի փոքր ավելի հազվադեպ է օգտագործվում:

Բազմաթիվ ռեգրեսիայի հիմնական խնդիրն է կառուցել տվյալների մոդել, որը պարունակում է հսկայական քանակությամբ տեղեկատվություն, որպեսզի հետագայում որոշի, թե ինչ ազդեցություն ունի գործոններից յուրաքանչյուրն առանձին-առանձին և ընդհանուր առմամբ մոդելավորվող ցուցանիշի և դրա գործակիցների վրա: Ռեգրեսիայի հավասարումը կարող է ընդունել տարբեր արժեքներ: Այս դեպքում հարաբերությունները գնահատելու համար սովորաբար օգտագործվում են երկու տեսակի ֆունկցիաներ՝ գծային և ոչ գծային։

Գծային ֆունկցիան պատկերված է նման հարաբերությունների տեսքով՝ y \u003d a 0 + a 1 x 1 + a 2 x 2, + ... + a m x m: Այս դեպքում a2, a m-ը համարվում են «մաքուր» ռեգրեսիայի գործակիցներ։ Դրանք անհրաժեշտ են y պարամետրի միջին փոփոխությունը յուրաքանչյուր համապատասխան x պարամետրի փոփոխությամբ (նվազում կամ աճ) մեկ միավորով բնութագրելու համար՝ այլ ցուցանիշների կայուն արժեքի պայմանով։

Ոչ գծային հավասարումներն ունեն, օրինակ, ուժային ֆունկցիայի y=ax 1 b1 x 2 b2 ...x m bm . Այս դեպքում ցուցանիշները b 1, b 2 ..... b m - կոչվում են առաձգականության գործակիցներ, դրանք ցույց են տալիս, թե ինչպես կփոխվի արդյունքը (որքանով%) համապատասխան x ցուցանիշի 1% աճով (նվազմամբ) և այլ գործոնների կայուն ցուցիչով:

Ինչ գործոններ պետք է հաշվի առնել բազմակի ռեգրեսիա կառուցելիս

Բազմակի ռեգրեսիա ճիշտ կառուցելու համար անհրաժեշտ է պարզել, թե որ գործոններին պետք է հատուկ ուշադրություն դարձնել։

Անհրաժեշտ է որոշակի պատկերացում ունենալ տնտեսական գործոնների և մոդելավորված գործոնների միջև փոխհարաբերությունների բնույթի մասին: Ներառվող գործոնները պետք է համապատասխանեն հետևյալ չափանիշներին.

Պետք է չափելի լինի: Օբյեկտի որակը բնութագրող գործոն օգտագործելու համար, ամեն դեպքում, նրան պետք է քանակական ձև տալ։
Գործոնային փոխկապակցվածություն կամ ֆունկցիոնալ հարաբերություն չպետք է լինի: Նման գործողությունները առավել հաճախ հանգեցնում են անդառնալի հետևանքների. սովորական հավասարումների համակարգը դառնում է անվերապահ, և դա ենթադրում է դրա անվստահելիությունը և անորոշ գնահատականները:
Հսկայական հարաբերակցության ցուցիչի դեպքում հնարավոր չէ պարզել գործոնների մեկուսացված ազդեցությունը ցուցանիշի վերջնական արդյունքի վրա, հետևաբար գործակիցները դառնում են անմեկնելի։

Շինարարության մեթոդներ

Գոյություն ունեն հսկայական թվով մեթոդներ և եղանակներ բացատրելու, թե ինչպես կարող եք ընտրել հավասարման գործոնները: Այնուամենայնիվ, այս բոլոր մեթոդները հիմնված են հարաբերակցության ինդեքսով գործակիցների ընտրության վրա: Դրանց թվում են.

Բացառման մեթոդ.
Միացնել մեթոդը:
Փուլային ռեգրեսիոն վերլուծություն.

Առաջին մեթոդը ներառում է համախառն հավաքածուից բոլոր գործակիցների մաղումը: Երկրորդ մեթոդը ներառում է բազմաթիվ լրացուցիչ գործոնների ներդրում: Դե, երրորդը այն գործոնների վերացումն է, որոնք նախկինում կիրառվում էին հավասարման վրա: Այս մեթոդներից յուրաքանչյուրն իրավունք ունի գոյություն ունենալ: Նրանք ունեն իրենց դրական և բացասական կողմերը, բայց կարող են յուրովի լուծել ավելորդ ցուցանիշների վերացման հարցը։ Որպես կանոն, յուրաքանչյուր առանձին մեթոդով ստացված արդյունքները բավականին մոտ են։

Բազմաչափ վերլուծության մեթոդներ

Գործոնների որոշման նման մեթոդները հիմնված են փոխկապակցված հատկանիշների առանձին համակցությունների դիտարկման վրա: Դրանք ներառում են տարբերակիչ վերլուծություն, օրինաչափությունների ճանաչում, հիմնական բաղադրիչի վերլուծություն և կլաստերային վերլուծություն: Բացի այդ, կա նաև գործոնային վերլուծություն, սակայն այն առաջացել է բաղադրիչ մեթոդի մշակման արդյունքում։ Դրանք բոլորն էլ կիրառվում են որոշակի հանգամանքներում, որոշակի պայմաններում ու գործոններով։

Ռեգրեսիոն վերլուծությունը հետազոտված հատկանիշների միջև ստոխաստիկ կապի վերլուծական արտահայտության հաստատման մեթոդ է: Ռեգրեսիայի հավասարումը ցույց է տալիս, թե միջինում ինչպես է փոխվում ժամըորևէ մեկը փոխելիս x ես , և նման է.

Որտեղ y -կախված փոփոխական (դա միշտ մեկն է);

X ես - անկախ փոփոխականներ (գործոններ) (դրանցից կարող են լինել մի քանիսը):

Եթե կա միայն մեկ անկախ փոփոխական, սա պարզ ռեգրեսիոն վերլուծություն է: Եթե կան մի քանիսը Պ 2), ապա նման վերլուծությունը կոչվում է բազմաչափ:

Ռեգրեսիոն վերլուծության ընթացքում լուծվում են երկու հիմնական խնդիր.

ռեգրեսիայի հավասարման կառուցում, այսինքն. գտնել արդյունքի ցուցանիշի և անկախ գործոնների միջև կապի տեսակը x 1 , x 2 , …, x n .

ստացված հավասարման նշանակության գնահատումը, այսինքն. որոշում, թե որքանով են ընտրված գործոնի հատկանիշները բացատրում հատկանիշի տատանումները y.

Ռեգրեսիոն վերլուծությունը հիմնականում օգտագործվում է պլանավորման, ինչպես նաև կարգավորող դաշտի մշակման համար:

Ի տարբերություն հարաբերակցության վերլուծության, որը պատասխանում է միայն այն հարցին, թե արդյոք կապ կա վերլուծված հատկանիշների միջև, ռեգրեսիոն վերլուծությունը տալիս է նաև իր ֆորմալացված արտահայտությունը։ Բացի այդ, եթե հարաբերակցության վերլուծությունը ուսումնասիրում է գործոնների որևէ հարաբերություն, ապա ռեգրեսիոն վերլուծությունը ուսումնասիրում է միակողմանի կախվածությունը, այսինքն. կապ, որը ցույց է տալիս, թե ինչպես է գործոնային նշանների փոփոխությունն ազդում արդյունքի նշանի վրա:

Ռեգրեսիոն վերլուծությունը մաթեմատիկական վիճակագրության ամենազարգացած մեթոդներից է։ Խստորեն ասած, ռեգրեսիոն վերլուծության իրականացումը պահանջում է մի շարք հատուկ պահանջների կատարում (մասնավորապես. xլ , x 2 ,..., x n ;yպետք է լինեն անկախ, նորմալ բաշխված պատահական փոփոխականներ՝ մշտական շեղումներով): IN իրական կյանքՌեգրեսիայի և հարաբերակցության վերլուծության պահանջների խիստ համապատասխանությունը շատ հազվադեպ է, բայց այս երկու մեթոդներն էլ շատ տարածված են տնտեսական հետազոտություններում: Տնտեսության մեջ կախվածությունները կարող են լինել ոչ միայն ուղղակի, այլ նաև հակադարձ և ոչ գծային։ Ռեգրեսիոն մոդելը կարող է կառուցվել ցանկացած կախվածության առկայության դեպքում, սակայն բազմաչափ վերլուծության մեջ օգտագործվում են միայն ձևի գծային մոդելներ.

Ռեգրեսիոն հավասարման կառուցումը, որպես կանոն, իրականացվում է նվազագույն քառակուսիների մեթոդով, որի էությունն այն է, որ նվազագույնի հասցվի ստացված հատկանիշի իրական արժեքների քառակուսի շեղումների գումարը դրա հաշվարկված արժեքներից, այսինքն.

Որտեղ T -դիտարկումների քանակը;

ժ =ա+բ 1 x 1 ժ +b 2 x 2 ժ + ... + բ n X n ժ - արդյունքի գործոնի հաշվարկված արժեքը.

Ռեգրեսիայի գործակիցները խորհուրդ է տրվում որոշել անհատական համակարգչի կամ հատուկ ֆինանսական հաշվիչի վերլուծական փաթեթների միջոցով: Ամենապարզ դեպքում՝ միակողմանի ռեգրեսիայի գործակիցները գծային հավասարումտիպի ռեգրեսիա y = a + bxկարելի է գտնել՝ օգտագործելով բանաձևերը.

կլաստերային վերլուծություն

Կլաստերային վերլուծությունը բազմաչափ վերլուծության մեթոդներից մեկն է, որը նախատեսված է բնակչության խմբավորման (կլաստերի) համար, որի տարրերը բնութագրվում են բազմաթիվ հատկանիշներով։ Հատկանիշներից յուրաքանչյուրի արժեքները ծառայում են որպես ուսումնասիրված բնակչության յուրաքանչյուր միավորի կոորդինատներ հատկանիշների բազմաչափ տարածության մեջ: Յուրաքանչյուր դիտարկում, որը բնութագրվում է մի քանի ցուցանիշների արժեքներով, կարող է ներկայացվել որպես կետ այս ցուցանիշների տարածության մեջ, որի արժեքները համարվում են կոորդինատներ բազմաչափ տարածության մեջ: Կետերի միջև հեռավորությունը ՌԵվ քՀետ կկոորդինատները սահմանվում են հետևյալ կերպ.

Կլաստերավորման հիմնական չափանիշն այն է, որ կլաստերների միջև տարբերությունները պետք է ավելի նշանակալի լինեն, քան նույն կլաստերին վերագրված դիտարկումների միջև, այսինքն. բազմաչափ տարածության մեջ անհավասարությունը պետք է դիտարկել.

Որտեղ r 1, 2 - հեռավորությունը 1-ին և 2-րդ կլաստերների միջև:

Ինչպես նաև ռեգրեսիոն վերլուծության ընթացակարգերը, կլաստերավորման ընթացակարգը բավականին աշխատատար է, նպատակահարմար է այն կատարել համակարգչով։

Ռեգրեսիոն վերլուծության հիմնական նպատակըբաղկացած է հարաբերությունների վերլուծական ձևի որոշումից, որի արդյունքում արդյունքի հատկանիշի փոփոխությունը պայմանավորված է մեկ կամ մի քանի գործոնի նշանների ազդեցությամբ, իսկ մնացած բոլոր գործոնների բազմությունը, որոնք նույնպես ազդում են արդյունքի հատկանիշի վրա, ընդունվում են որպես հաստատուն և միջին արժեքներ:
Ռեգրեսիոն վերլուծության առաջադրանքներ:
ա) Կախվածության ձևի հաստատում. Ինչ վերաբերում է երևույթների փոխհարաբերությունների բնույթին և ձևին, կան դրական գծային և ոչ գծային և բացասական գծային և ոչ գծային ռեգրեսիաներ:
բ) ռեգրեսիոն ֆունկցիայի սահմանում այս կամ այն տիպի մաթեմատիկական հավասարման տեսքով և բացատրական փոփոխականների ազդեցության սահմանում կախված փոփոխականի վրա.
գ) կախված փոփոխականի անհայտ արժեքների գնահատում. Օգտագործելով ռեգրեսիայի գործառույթը, դուք կարող եք վերարտադրել կախված փոփոխականի արժեքները բացատրական փոփոխականների տրված արժեքների միջակայքում (այսինքն՝ լուծել ինտերպոլացիայի խնդիրը) կամ գնահատել գործընթացի ընթացքը նշված միջակայքից դուրս (այսինքն՝ լուծել էքստրապոլացիայի խնդիրը): Արդյունքը կախված փոփոխականի արժեքի գնահատումն է:

Զույգ ռեգրեսիա - y և x երկու փոփոխականների փոխհարաբերության հավասարումը. y=f(x), որտեղ y-ը կախված փոփոխականն է (արդյունքի նշան); x - անկախ, բացատրական փոփոխական (հատկանիշ-գործոն):

Տարբերում են գծային և ոչ գծային ռեգրեսիաներ։
Գծային ռեգրեսիա՝ y = a + bx + ε
Ոչ գծային ռեգրեսիաները բաժանվում են երկու դասի՝ ռեգրեսիաներ, որոնք ոչ գծային են վերլուծության մեջ ներառված բացատրական փոփոխականների նկատմամբ, բայց գծային՝ գնահատված պարամետրերի նկատմամբ, և ռեգրեսիաներ, որոնք գնահատված պարամետրերի նկատմամբ ոչ գծային են:
Ռեգրեսիաներ, որոնք ոչ գծային են բացատրական փոփոխականներում.

Գնահատված պարամետրերում ոչ գծային ռեգրեսիաներ.

հզորություն y=a x b ε
էքսպոնենցիալ y=a b x ε
էքսպոնենցիալ y=e a+b x ε

Ռեգրեսիայի հավասարման կառուցումը կրճատվում է մինչև դրա պարամետրերի գնահատումը: Ռեգրեսիաների այն պարամետրերը գնահատելու համար, որոնք պարամետրերով գծային են, օգտագործվում է նվազագույն քառակուսիների մեթոդը (LSM): LSM-ը հնարավորություն է տալիս ձեռք բերել այնպիսի պարամետրերի գնահատումներ, որոնց դեպքում y արդյունավետ հատկանիշի իրական արժեքների քառակուսի շեղումների գումարը տեսական արժեքներից նվազագույն է, այսինքն.

.
Գծային և ոչ գծային հավասարումների համար, որոնք կրճատվում են գծային, a-ի և b-ի համար լուծվում է հետևյալ համակարգը.

Դուք կարող եք օգտագործել այս համակարգից բխող պատրաստի բանաձևերը.

Ուսումնասիրված երևույթների միջև կապի սերտությունը գնահատվում է գծային զույգ հարաբերակցության գործակցով r xy գծային ռեգրեսիայի համար (-1≤r xy ≤1).

և հարաբերակցության ինդեքսը p xy - ոչ գծային ռեգրեսիայի համար (0≤p xy ≤1):

Կառուցված մոդելի որակի գնահատումը կտրվի որոշման գործակցով (ինդեքսով), ինչպես նաև միջին մոտարկման սխալով:
Միջին մոտավոր սխալը հաշվարկված արժեքների միջին շեղումն է իրական արժեքներից.

.
A արժեքների թույլատրելի սահմանը `ոչ ավելի, քան 8-10%:
Էլաստիկության E միջին գործակիցը ցույց է տալիս, թե միջինում քանի տոկոսով արդյունքը կփոխվի y-ից Միջին չափերբ x գործակիցը միջին արժեքից փոխվում է 1%-ով.
.

Տարբերակման վերլուծության խնդիրն է վերլուծել կախված փոփոխականի շեղումը.
∑(y-y )²=∑(y x -y)²+∑(y-y x)²
որտեղ ∑(y-y)² քառակուսի շեղումների ընդհանուր գումարն է.
∑(y x -y)² - ռեգրեսիայի պատճառով քառակուսի շեղումների գումարը («բացատրված» կամ «գործոնային»);
∑(y-y x)² - քառակուսի շեղումների մնացորդային գումար:
Ռեգրեսիայով բացատրվող շեղումների մասնաբաժինը արդյունավետ հատկանիշի y ընդհանուր շեղման մեջ բնութագրվում է R2 որոշման գործակցով (ինդեքսով).

Որոշման գործակիցը գործակցի կամ հարաբերակցության ինդեքսի քառակուսին է։

F-test - ռեգրեսիոն հավասարման որակի գնահատում - բաղկացած է վարկածի փորձարկումից, սակայն ռեգրեսիոն հավասարման վիճակագրական աննշանության և կապի սերտության ցուցիչի մասին: Դրա համար կատարվում է փաստացի F փաստի և Fisher F-չափանիշի արժեքների կրիտիկական (աղյուսակային) F աղյուսակի համեմատություն: F փաստը որոշվում է ազատության մեկ աստիճանի համար հաշվարկված գործոնային և մնացորդային շեղումների արժեքների հարաբերակցությունից.
,
որտեղ n-ը բնակչության միավորների թիվն է. m-ը x փոփոխականների պարամետրերի թիվն է:
F աղյուսակը չափանիշի առավելագույն հնարավոր արժեքն է պատահական գործոնների ազդեցության տակ ազատության տվյալ աստիճանների և նշանակության մակարդակի համար a. Նշանակության մակարդակ ա - ճիշտ վարկածը մերժելու հավանականությունը, պայմանով, որ այն ճիշտ է: Սովորաբար a-ն վերցվում է հավասար 0,05 կամ 0,01:
Եթե F աղյուսակ< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >F-ն փաստ է, ապա Հ-ի մասին վարկածը չի մերժվում և ճանաչվում է ռեգրեսիոն հավասարման վիճակագրական աննշանությունը, անարժանահավատությունը։
Ռեգրեսիայի և հարաբերակցության գործակիցների վիճակագրական նշանակությունը գնահատելու համար հաշվարկվում են Student-ի t-test և վստահության միջակայքերը յուրաքանչյուր ցուցանիշի համար: Առաջ է քաշվում H վարկածը ցուցանիշների պատահական բնույթի մասին, այսինքն. զրոյից դրանց աննշան տարբերության մասին։ Ռեգրեսիայի և հարաբերակցության գործակիցների նշանակության գնահատումը Student-ի t-թեստի միջոցով իրականացվում է դրանց արժեքները պատահական սխալի մեծության հետ համեմատելով.
; ; .
Գծային ռեգրեսիայի պարամետրերի և հարաբերակցության գործակիցի պատահական սխալները որոշվում են բանաձևերով.

Համեմատելով t-վիճակագրության փաստացի և կրիտիկական (աղյուսակային) արժեքները՝ t tabl և t fact, մենք ընդունում կամ մերժում ենք H o վարկածը:
Ֆիշերի F-թեստի և Student-ի t-վիճակագրության միջև կապն արտահայտվում է հավասարությամբ

Եթե t սեղան< t факт то H o отклоняется, т.е. a , b и r xy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >t այն փաստը, որ H-ի մասին վարկածը չի մերժվում, և ճանաչվում է a, b կամ r xy-ի ձևավորման պատահական բնույթը:
Վստահության միջակայքը հաշվարկելու համար մենք սահմանում ենք D սահմանային սխալը յուրաքանչյուր ցուցանիշի համար.
Δ a =t աղյուսակ m a, Δ b =t աղյուսակ m b.
Վստահության միջակայքերը հաշվարկելու բանաձևերը հետևյալն են.
γ a \u003d aΔ a; γ a \u003d a-Δ a; γ a =a+Δa
γ b = bΔ b; γ b = b-Δ b; γb =b+Δb
Եթե զրոն ընկնում է վստահության միջակայքի սահմաններում, այսինքն. Եթե ստորին սահմանը բացասական է, իսկ վերին սահմանը դրական է, ապա գնահատված պարամետրը ենթադրվում է զրոյական, քանի որ այն չի կարող միաժամանակ ընդունել և՛ դրական, և՛ բացասական արժեքներ:
Կանխատեսվող y p արժեքը որոշվում է համապատասխան (կանխատեսված) x p արժեքը փոխարինելով ռեգրեսիոն հավասարման y x =a+b·x . m y x կանխատեսման միջին ստանդարտ սխալը հաշվարկվում է.
,
Որտեղ
և կանխատեսման վստահության միջակայքը կառուցված է.
γ y x =y p Δ y p ; γ y x min=y p -Δ y p ; γ y x max=y p +Δ y p
որտեղ Δ y x =t աղյուսակ ·m y x.

Լուծման օրինակ

Առաջադրանք թիվ 1. Ուրալի շրջանի յոթ տարածքների համար 199X-ի համար հայտնի են երկու նշանների արժեքներ:
Աղյուսակ 1.

Պահանջվում է: 1. y-ի կախվածությունը x-ից բնութագրելու համար հաշվարկեք հետեւյալ ֆունկցիաների պարամետրերը.
ա) գծային;
բ) ուժային օրենք (նախկինում անհրաժեշտ էր կատարել փոփոխականների գծայինացման ընթացակարգը՝ վերցնելով երկու մասերի լոգարիթմը).
գ) ցուցադրական;
դ) հավասարակողմ հիպերբոլա (դուք նաև պետք է պարզեք, թե ինչպես կարելի է նախապես գծայինացնել այս մոդելը):
2. Գնահատեք յուրաքանչյուր մոդել A-ի միջին մոտավոր սխալի և Ֆիշերի F-թեստի միջոցով:

Լուծում (տարբերակ թիվ 1)

y=a+b·x գծային ռեգրեսիայի a և b պարամետրերը հաշվարկելու համար (հաշվարկը կարելի է կատարել հաշվիչի միջոցով):
լուծել նորմալ հավասարումների համակարգը ԱԵվ բ.

Նախնական տվյալների հիման վրա մենք հաշվարկում ենք ∑y, ∑x, ∑y x, ∑x², ∑y²:

	y	x	yx	x2	y2	y x	y-y x	Աի
լ	68,8	45,1	3102,88	2034,01	4733,44	61,3	7,5	10,9
2	61,2	59,0	3610,80	3481,00	3745,44	56,5	4,7	7,7
3	59,9	57,2	3426,28	3271,84	3588,01	57,1	2,8	4,7
4	56,7	61,8	3504,06	3819,24	3214,89	55,5	1,2	2,1
5	55,0	58,8	3234,00	3457,44	3025,00	56,5	-1,5	2,7
6	54,3	47,2	2562,96	2227,84	2948,49	60,5	-6,2	11,4
7	49,3	55,2	2721,36	3047,04	2430,49	57,8	-8,5	17,2
Ընդամենը	405,2	384,3	22162,34	21338,41	23685,76	405,2	0,0	56,7
ամուսնացնել արժեքը (Ընդամենը/n)	57,89 y	54,90 x	3166,05 x y	3048,34 x²	3383,68 y²	X	X	8,1
ս	5,74	5,86	X	X	X	X	X	X
s2	32,92	34,34	X	X	X	X	X	X

a=y -b x = 57,89+0,35 54,9 ≈ 76,88

Ռեգրեսիայի հավասարում. y= 76,88 - 0,35X.Միջին օրական աշխատավարձի 1 ռուբլով ավելացմամբ. պարենային ապրանքների ձեռքբերման ծախսերի տեսակարար կշիռը կրճատվում է միջինը 0,35% կետով։
Հաշվեք զույգ հարաբերակցության գծային գործակիցը.

Հաղորդակցությունը չափավոր է, հակադարձ:
Որոշենք որոշման գործակիցը՝ r² xy =(-0.35)=0.127
Արդյունքի 12,7% տատանումը բացատրվում է x գործոնի տատանումով։ Փաստացի արժեքների փոխարինում ռեգրեսիայի հավասարման մեջ X, մենք որոշում ենք y x-ի տեսական (հաշվարկված) արժեքները։ Եկեք գտնենք A միջին մոտարկման սխալի արժեքը.

Միջին հաշվով, հաշվարկված արժեքները 8,1%-ով շեղվում են իրականից։
Եկեք հաշվարկենք F-չափանիշը.

Ստացված արժեքը ցույց է տալիս H 0 վարկածն ընդունելու անհրաժեշտությունը բացահայտված կախվածության պատահական բնույթի և հավասարման պարամետրերի և կապի խստության ցուցիչի վիճակագրական աննշանության մասին:
1բ. y=a x b հզորության մոդելի կառուցմանը նախորդում է փոփոխականների գծայնացման ընթացակարգը։ Օրինակում գծայինացումը կատարվում է՝ հաշվի առնելով հավասարման երկու կողմերի լոգարիթմը.
lg y=lg a + b lg x
Y=C+b Յ
որտեղ Y=lg(y), X=lg(x), C=lg(a):

Հաշվարկների համար մենք օգտագործում ենք աղյուսակի տվյալները: 1.3.
Աղյուսակ 1.3

	Յ	X	YX	Y2	x2	y x	y-y x	(y-yx)²	Աի
1	1,8376	1,6542	3,0398	3,3768	2,7364	61,0	7,8	60,8	11,3
2	1,7868	1,7709	3,1642	3,1927	3,1361	56,3	4,9	24,0	8,0
3	1,7774	1,7574	3,1236	3,1592	3,0885	56,8	3,1	9,6	5,2
4	1,7536	1,7910	3,1407	3,0751	3,2077	55,5	1,2	1,4	2,1
5	1,7404	1,7694	3,0795	3,0290	3,1308	56,3	-1,3	1,7	2,4
6	1,7348	1,6739	2,9039	3,0095	2,8019	60,2	-5,9	34,8	10,9
7	1,6928	1,7419	2,9487	2,8656	3,0342	57,4	-8,1	65,6	16,4
Ընդամենը	12,3234	12,1587	21,4003	21,7078	21,1355	403,5	1,7	197,9	56,3
Միջին արժեքը	1,7605	1,7370	3,0572	3,1011	3,0194	X	X	28,27	8,0
σ	0,0425	0,0484	X	X	X	X	X	X	X
σ2	0,0018	0,0023	X	X	X	X	X	X	X

Հաշվեք C և b.

C=Y -b X = 1,7605+0,298 1,7370 = 2,278126
Ստանում ենք գծային հավասարում` Y=2.278-0.298 X
Այն հզորացնելուց հետո ստանում ենք՝ y=10 2.278 x -0.298
Այս հավասարման մեջ փոխարինելով իրական արժեքները X,մենք ստանում ենք արդյունքի տեսական արժեքները: Դրանց հիման վրա մենք հաշվարկում ենք ցուցիչները՝ կապի խստությունը՝ հարաբերակցության ինդեքսը p xy և միջին մոտարկման սխալը Ա.

Հզորության մոդելի բնութագրերը ցույց են տալիս, որ այն նկարագրում է հարաբերությունները մի փոքր ավելի լավ, քան գծային ֆունկցիան:

1վ. y \u003d a b x էքսպոնենցիոնալ կորի հավասարման կառուցմանը նախորդում է փոփոխականների գծայինացման կարգը հավասարման երկու մասերի լոգարիթմը վերցնելիս.
lg y=lg a + x lg բ
Y=C+B x
Հաշվարկների համար մենք օգտագործում ենք աղյուսակի տվյալները:

	Յ	x	Yx	Y2	x2	y x	y-y x	(y-yx)²	Աի
1	1,8376	45,1	82,8758	3,3768	2034,01	60,7	8,1	65,61	11,8
2	1,7868	59,0	105,4212	3,1927	3481,00	56,4	4,8	23,04	7,8
3	1,7774	57,2	101,6673	3,1592	3271,84	56,9	3,0	9,00	5,0
4	1,7536	61,8	108,3725	3,0751	3819,24	55,5	1,2	1,44	2,1
5	1,7404	58,8	102,3355	3,0290	3457,44	56,4	-1,4	1,96	2,5
6	1,7348	47,2	81,8826	3,0095	2227,84	60,0	-5,7	32,49	10,5
7	1,6928	55,2	93,4426	2,8656	3047,04	57,5	-8,2	67,24	16,6
Ընդամենը	12,3234	384,3	675,9974	21,7078	21338,41	403,4	-1,8	200,78	56,3
ամուսնացնել zn.	1,7605	54,9	96,5711	3,1011	3048,34	X	X	28,68	8,0
σ	0,0425	5,86	X	X	X	X	X	X	X
σ2	0,0018	34,339	X	X	X	X	X	X	X

Ռեգրեսիայի պարամետրերի արժեքները A և INկազմել է.

A=Y -B x = 1,7605+0,0023 54,9 = 1,887
Ստացվում է գծային հավասարում` Y=1.887-0.0023x. Մենք ուժեղացնում ենք ստացված հավասարումը և գրում այն սովորական ձևով.
y x =10 1,887 10 -0,0023x = 77,1 0,9947 x
Մենք գնահատում ենք հարաբերությունների խստությունը հարաբերակցության ինդեքսի միջոցով p xy.

3588,01 56,9 3,0 9,00 5,0 4 56,7 0,0162 0,9175 0,000262 3214,89 55,5 1,2 1,44 2,1 5 55 0,0170 0,9354 0,000289 3025,00 56,4 -1,4 1,96 2,5 6 54,3 0,0212 1,1504 0,000449 2948,49 60,8 -6,5 42,25 12,0 7 49,3 0,0181 0,8931 0,000328 2430,49 57,5 -8,2 67,24 16,6 Ընդամենը405,2 0,1291 7,5064 0,002413 23685,76 405,2 0,0 194,90 56,5 Միջին արժեքը57,9 0,0184 1,0723 0,000345 3383,68 XX27,84 8,1 σ 5,74 0,002145 XXXXXXX σ232,9476 0,000005 XX

Ռեգրեսիոն վերլուծությունը վիճակագրական հետազոտության մեթոդ է, որը թույլ է տալիս ցույց տալ պարամետրի կախվածությունը մեկ կամ մի քանի անկախ փոփոխականներից: Նախհամակարգչային դարաշրջանում դրա օգտագործումը բավականին դժվար էր, հատկապես, երբ խոսքը գնում էր մեծ քանակությամբ տվյալների մասին: Այսօր, սովորելով, թե ինչպես ստեղծել ռեգրեսիա Excel-ում, դուք կարող եք լուծել բարդ վիճակագրական խնդիրներ ընդամենը մի քանի րոպեում: Ստորև ներկայացված են կոնկրետ օրինակներտնտեսագիտության բնագավառից։

Ռեգրեսիայի տեսակները

Հայեցակարգն ինքնին մաթեմատիկա է մտցվել 1886 թվականին։ Հետընթացը տեղի է ունենում.

գծային;
պարաբոլիկ;
ուժ;
էքսպոնենցիալ;
հիպերբոլիկ;
ցուցադրական;
լոգարիթմական.

Օրինակ 1

Դիտարկենք 6 արդյունաբերական ձեռնարկություններում թոշակի անցած թիմի անդամների թվի կախվածությունը միջին աշխատավարձից որոշելու խնդիրը:

Առաջադրանք. Վեց ձեռնարկություններում մենք վերլուծել ենք միջին ամսական աշխատավարձը և իրենց կամքով հեռացած աշխատողների թիվը։ Աղյուսակային ձևով մենք ունենք.


		հեռացածների թիվը	Աշխատավարձ
			30000 ռուբլի
			35000 ռուբլի
			40000 ռուբլի
			45000 ռուբլի
			50000 ռուբլի
			55000 ռուբլի
			60000 ռուբլի

6 ձեռնարկություններում թոշակառու աշխատողների թվի կախվածությունը միջին աշխատավարձից որոշելու խնդրի համար ռեգրեսիոն մոդելն ունի Y = a 0 + a 1 x 1 +…+a k x k հավասարման ձևը, որտեղ x i-ն ազդող փոփոխականներն են, a i-ն՝ ռեգրեսիայի գործակիցները, a k-ը՝ գործոնների թիվը:

Այս առաջադրանքի համար Y-ը մեկնած աշխատողների ցուցիչն է, իսկ ազդող գործոնը աշխատավարձն է, որը նշում ենք X-ով։

Օգտագործելով «Excel» աղյուսակի հնարավորությունները

Excel-ում ռեգրեսիոն վերլուծությանը պետք է նախորդի առկա աղյուսակային տվյալների վրա ներկառուցված գործառույթների կիրառումը: Այնուամենայնիվ, այս նպատակների համար ավելի լավ է օգտագործել «Վերլուծության գործիքակազմ» շատ օգտակար հավելումը: Այն ակտիվացնելու համար ձեզ հարկավոր է.

«Ֆայլ» ներդիրից անցեք «Ընտրանքներ» բաժին;
բացվող պատուհանում ընտրեք «Հավելումներ» տողը;
կտտացրեք «Գնալ» կոճակին, որը գտնվում է ներքևում, «Կառավարում» տողի աջ կողմում;
ստուգեք «Վերլուծական փաթեթ» անվանման կողքին գտնվող վանդակը և հաստատեք ձեր գործողությունները՝ սեղմելով «OK»:

Եթե ամեն ինչ ճիշտ է արված, ցանկալի կոճակը կհայտնվի «Տվյալներ» ներդիրի աջ կողմում, որը գտնվում է Excel-ի աշխատաթերթի վերևում:

Excel-ում

Այժմ, երբ մենք ունենք բոլոր անհրաժեշտ վիրտուալ գործիքները էկոնոմետրիկ հաշվարկներ կատարելու համար, մենք կարող ենք սկսել լուծել մեր խնդիրը: Սրա համար:

սեղմեք «Տվյալների վերլուծություն» կոճակը;
բացվող պատուհանում սեղմեք «Regression» կոճակը;
երևացող ներդիրում մուտքագրեք արժեքների միջակայքը Y-ի (աշխատողների թիվը, ովքեր թողել են աշխատանք) և X-ի համար (նրանց աշխատավարձը).
Մենք հաստատում ենք մեր գործողությունները՝ սեղմելով «Ok» կոճակը:

Արդյունքում, ծրագիրը ավտոմատ կերպով կհամալրի աղյուսակի նոր թերթիկը ռեգրեսիայի վերլուծության տվյալներով: Նշում! Excel-ն ունի այս նպատակով ձեր նախընտրած գտնվելու վայրը ձեռքով սահմանելու հնարավորություն: Օրինակ, դա կարող է լինել նույն թերթիկը, որտեղ գտնվում են Y և X արժեքները կամ նույնիսկ Նոր գիրք, հատուկ նախագծված նման տվյալների պահպանման համար։

Ռ-քառակուսի համար ռեգրեսիայի արդյունքների վերլուծություն

Excel-ում դիտարկված օրինակի տվյալների մշակման ընթացքում ստացված տվյալները այսպիսի տեսք ունեն.

Առաջին հերթին պետք է ուշադրություն դարձնել R-քառակուսու արժեքին: Դա որոշման գործակիցն է։ Այս օրինակում R-square = 0,755 (75,5%), այսինքն՝ մոդելի հաշվարկված պարամետրերը բացատրում են դիտարկվող պարամետրերի միջև կապը 75,5%-ով: Որքան բարձր է որոշման գործակիցը, այնքան ավելի կիրառելի է ընտրված մոդելը կոնկրետ առաջադրանք. Ենթադրվում է, որ այն ճիշտ է նկարագրում իրական իրավիճակը R-քառակուսի արժեքով 0,8-ից բարձր: Եթե R-քառակուսի<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Հարաբերակցության վերլուծություն

64.1428 թիվը ցույց է տալիս, թե որքան կլինի Y-ի արժեքը, եթե մեր դիտարկած մոդելի բոլոր xi փոփոխականները սահմանվեն զրոյի: Այլ կերպ ասած, կարելի է պնդել, որ վերլուծված պարամետրի արժեքի վրա ազդում են նաև այլ գործոններ, որոնք նկարագրված չեն կոնկրետ մոդելում:

Հաջորդ գործակիցը -0,16285, որը գտնվում է B18 բջիջում, ցույց է տալիս X փոփոխականի ազդեցության կշիռը Y-ի վրա: Սա նշանակում է, որ դիտարկվող մոդելի աշխատողների միջին ամսական աշխատավարձը ազդում է -0,16285 քաշով հրաժարվողների թվի վրա, այսինքն՝ դրա ազդեցության աստիճանը շատ փոքր է: «-» նշանը ցույց է տալիս, որ գործակիցը բացասական արժեք ունի: Սա ակնհայտ է, քանի որ բոլորը գիտեն, որ որքան բարձր է աշխատավարձը ձեռնարկությունում, այնքան քիչ մարդիկ ցանկություն են հայտնում խզել աշխատանքային պայմանագիրը կամ դուրս գալ աշխատանքից։

Բազմակի ռեգրեսիա

Այս տերմինը վերաբերում է ձևի մի քանի անկախ փոփոխականներով կապի հավասարմանը.

y \u003d f (x 1 + x 2 + ... x m) + ε, որտեղ y-ն էֆեկտիվ հատկանիշն է (կախված փոփոխական), իսկ x 1, x 2, ... x m-ը գործոնային գործոններն են (անկախ փոփոխականներ):

Պարամետրերի գնահատում

Բազմակի ռեգրեսիայի (MR) համար այն իրականացվում է նվազագույն քառակուսիների մեթոդով (OLS): Y = a + b 1 x 1 +…+b m x m + ε ձևի գծային հավասարումների համար մենք կառուցում ենք նորմալ հավասարումների համակարգ (տես ստորև)

Մեթոդի սկզբունքը հասկանալու համար հաշվի առեք երկու գործոն դեպքը։ Այնուհետև մենք ունենք բանաձևով նկարագրված իրավիճակ

Այստեղից մենք ստանում ենք.

որտեղ σ ինդեքսում արտացոլված համապատասխան հատկանիշի շեղումն է:

LSM-ը կիրառելի է MP հավասարման համար ստանդարտացված սանդղակով: Այս դեպքում մենք ստանում ենք հավասարումը.

որտեղ t y, t x 1, … t xm ստանդարտացված փոփոխականներ են, որոնց համար միջին արժեքները 0 են; β i-ն ստանդարտացված ռեգրեսիայի գործակիցներն են, իսկ ստանդարտ շեղումը 1 է:

Խնդրում ենք նկատի ունենալ, որ բոլոր β i-ն այս դեպքում սահմանվում են որպես նորմալացված և կենտրոնացված, ուստի դրանց համեմատությունը միմյանց հետ համարվում է ճիշտ և թույլատրելի: Բացի այդ, ընդունված է զտել գործոնները՝ հրաժարվելով βi-ի ամենափոքր արժեքներով:

Խնդիր՝ օգտագործելով գծային ռեգրեսիոն հավասարումը

Ենթադրենք, կա N կոնկրետ ապրանքի գների դինամիկայի աղյուսակ վերջին 8 ամիսների ընթացքում։ Անհրաժեշտ է որոշում կայացնել դրա խմբաքանակը 1850 ռուբլի/տ գնով գնելու նպատակահարմարության մասին։


ամսվա համարը	ամսվա անվանումը	ապրանքի գինը N
		1750 ռուբլի մեկ տոննայի համար
		1755 ռուբլի մեկ տոննայի համար
		1767 ռուբլի մեկ տոննայի համար
		1760 ռուբլի մեկ տոննայի համար
		1770 ռուբլի մեկ տոննայի համար
		1790 ռուբլի մեկ տոննայի համար
		1810 ռուբլի մեկ տոննայի համար
		1840 ռուբլի մեկ տոննայի համար

Excel-ի աղյուսակում այս խնդիրը լուծելու համար անհրաժեշտ է օգտագործել վերը նշված օրինակից արդեն հայտնի Տվյալների վերլուծության գործիքը: Հաջորդը, ընտրեք «Regression» բաժինը և սահմանեք պարամետրերը: Պետք է հիշել, որ «Input interval Y» դաշտում պետք է մուտքագրվի կախված փոփոխականի արժեքների մի շարք (այս դեպքում՝ ապրանքի գինը տարվա կոնկրետ ամիսներին), իսկ «Մուտքային միջակայքում X»՝ անկախ փոփոխականի համար (ամսվա համարը): Հաստատեք գործողությունը, սեղմելով «Ok»: Նոր թերթիկի վրա (եթե այդպես էր նշված), մենք ստանում ենք ռեգրեսիայի տվյալներ:

Դրանց հիման վրա կառուցում ենք y=ax+b ձևի գծային հավասարում, որտեղ a և b պարամետրերը ամսվա համարի անվանումով տողի գործակիցներն են և գործակիցները և «Y-հատում» տողը ռեգրեսիոն վերլուծության արդյունքներով թերթիկից։ Այսպիսով, 3-րդ խնդրի գծային ռեգրեսիայի հավասարումը (LE) գրված է հետևյալ կերպ.

Ապրանքի գինը N = 11.714* ամսվա համար + 1727.54.

կամ հանրահաշվական նշումով

y = 11,714 x + 1727,54

Արդյունքների վերլուծություն

Որոշելու համար, թե արդյոք ստացված գծային ռեգրեսիոն հավասարումը համարժեք է, օգտագործվում են բազմակի հարաբերակցության գործակիցներ (MCC) և որոշման գործակիցներ, ինչպես նաև Ֆիշերի թեստը և Student-ի թեստը: Ռեգրեսիայի արդյունքներով Excel աղյուսակում դրանք հայտնվում են համապատասխանաբար բազմաթիվ R, R-square, F-statistic և t-statistic անուններով:

KMC R-ն հնարավորություն է տալիս գնահատել անկախ և կախյալ փոփոխականների միջև հավանականական հարաբերությունների խստությունը: Դրա բարձր արժեքը ցույց է տալիս բավականին ամուր հարաբերություններ «Ամսվա համար» և «Ապրանքների գինը N ռուբլով 1 տոննայի դիմաց» փոփոխականների միջև: Այնուամենայնիվ, այս հարաբերությունների բնույթը մնում է անհայտ:

R 2 (RI) որոշման գործակցի քառակուսին ընդհանուր ցրման մասնաբաժնի թվային բնութագիրն է և ցույց է տալիս փորձարարական տվյալների որ մասի ցրումը, այսինքն. կախված փոփոխականի արժեքները համապատասխանում են գծային ռեգրեսիայի հավասարմանը: Քննարկվող խնդիրում այս արժեքը հավասար է 84,8%-ի, այսինքն՝ վիճակագրական տվյալները բարձր ճշգրտությամբ նկարագրված են ստացված SD-ով։

F- վիճակագրությունը, որը նաև կոչվում է Ֆիշերի թեստ, օգտագործվում է գծային հարաբերությունների նշանակությունը գնահատելու համար՝ հերքելով կամ հաստատելով դրա գոյության վարկածը։

(Ուսանողի չափանիշը) օգնում է գնահատել գործակիցի նշանակությունը գծային հարաբերությունների անհայտ կամ ազատ անդամով։ Եթե t-չափանիշի արժեքը > t cr, ապա գծային հավասարման ազատ անդամի աննշանության վարկածը մերժվում է։

Ազատ անդամի համար քննարկվող խնդիրում Excel-ի գործիքների միջոցով ստացվել է, որ t=169.20903 և p=2.89E-12, այսինքն՝ ունենք զրոյական հավանականություն, որ ազատ անդամի աննշանության մասին ճիշտ վարկածը կմերժվի։ Անհայտ t=5.79405 գործակցի համար, իսկ p=0.001158: Այսինքն՝ հավանականությունը, որ անհայտի համար գործակցի աննշանության մասին ճիշտ վարկածը կմերժվի 0,12% է։

Այսպիսով, կարելի է պնդել, որ ստացված գծային ռեգրեսիայի հավասարումը համարժեք է:

Բաժնետոմսերի բլոկի գնման նպատակահարմարության խնդիրը

Excel-ում բազմակի ռեգրեսիա իրականացվում է տվյալների վերլուծության նույն գործիքի միջոցով: Դիտարկենք կոնկրետ կիրառական խնդիր:

NNN-ի ղեկավարությունը պետք է որոշում կայացնի MMM SA-ի 20% բաժնետոմսերի գնման նպատակահարմարության վերաբերյալ: Փաթեթի (ԲԸ) արժեքը 70 մլն ԱՄՆ դոլար է։ NNN-ի մասնագետները տվյալներ են հավաքել նմանատիպ գործարքների վերաբերյալ։ Որոշվել է բաժնետոմսերի բլոկի արժեքը գնահատել այնպիսի պարամետրերով, որոնք արտահայտված են միլիոնավոր ԱՄՆ դոլարով, ինչպիսիք են.

կրեդիտորական պարտքեր (VK);
տարեկան շրջանառություն (VO);
դեբիտորական պարտքեր (VD);
հիմնական միջոցների արժեքը (SOF):

Բացի այդ, օգտագործվում է ձեռնարկության աշխատավարձի պարտքերի պարամետրը (V3 P) հազարավոր ԱՄՆ դոլարով:

Լուծում Excel աղյուսակի միջոցով

Առաջին հերթին, դուք պետք է ստեղծեք նախնական տվյալների աղյուսակ: Այն կարծես այսպիսին է.

զանգահարել «Տվյալների վերլուծություն» պատուհանը;
ընտրեք «Regression» բաժինը;
«Մուտքային միջակայք Y» վանդակում մուտքագրեք G սյունակից կախված փոփոխականների արժեքների միջակայքը.
կտտացրեք «Input interval X» պատուհանի աջ կողմում գտնվող կարմիր սլաքով պատկերակին և թերթի B, C, D, F սյունակներից ընտրեք բոլոր արժեքների միջակայքը:

Ընտրեք «Նոր աշխատաթերթ» և սեղմեք «Լավ»:

Ստացեք ռեգրեսիոն վերլուծություն տվյալ խնդրի համար:

Արդյունքների և եզրակացությունների ուսումնասիրություն

«Մենք հավաքում ենք» աղյուսակային թերթիկի վրա ներկայացված կլորացված տվյալներից Excel պրոցեսոր, ռեգրեսիայի հավասարում.

SP \u003d 0,103 * SOF + 0,541 * VO - 0,031 * VK + 0,405 * VD + 0,691 * VZP - 265,844:

Ավելի ծանոթ մաթեմատիկական ձևով այն կարելի է գրել այսպես.

y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

«ՄՄՄ» ԲԲԸ-ի տվյալները ներկայացված են աղյուսակում.

Դրանք փոխարինելով ռեգրեսիոն հավասարման մեջ՝ ստանում են 64,72 մլն ԱՄՆ դոլարի ցուցանիշ։ Սա նշանակում է, որ «ՄՄՄ» ԲԲԸ-ի բաժնետոմսերը չպետք է ձեռք բերվեն, քանի որ դրանց 70 մլն ԱՄՆ դոլար արժեքը բավականին գերագնահատված է։

Ինչպես տեսնում եք, Excel-ի աղյուսակի և ռեգրեսիայի հավասարման օգտագործումը թույլ տվեցին տեղեկացված որոշում կայացնել շատ կոնկրետ գործարքի իրագործելիության վերաբերյալ:

Այժմ դուք գիտեք, թե ինչ է ռեգրեսիան: Excel-ում վերը քննարկված օրինակները կօգնեն ձեզ որոշել: գործնական առաջադրանքներէկոնոմետրիկայի բնագավառից։