Ընդհանրացված նվազագույն քառակուսիները excel-ում: Գծային զույգ ռեգրեսիոն վերլուծություն: Խնդրի շարադրանք՝ օգտագործելով կոնկրետ օրինակ

Մեթոդ նվազագույն քառակուսիները(LSM) հիմնված է հետազոտվող տվյալներից ընտրված ֆունկցիայի քառակուսի շեղումների գումարը նվազագույնի հասցնելու վրա: Այս հոդվածում մենք կմոտավորենք առկա տվյալները՝ օգտագործելով գծային ֆունկցիաy = ա x + բ .

Նվազագույն քառակուսի մեթոդ(անգլերեն) Սովորական Նվազագույնը Քառակուսիներ , Օ.Լ.Ս.) անհայտ պարամետրերի գնահատման առումով ռեգրեսիոն վերլուծության հիմնական մեթոդներից մեկն է ռեգրեսիայի մոդելներընտրանքի տվյալների համաձայն:

Դիտարկենք մոտարկումն ըստ ֆունկցիաների, որոնք կախված են միայն մեկ փոփոխականից.

  • Գծային՝ y=ax+b (այս հոդվածը)
  • y=a*Ln(x)+b
  • y=a*x մ
  • y=a*EXP(b*x)+с
  • y=ax 2 +bx+c

ՆշումՍույն հոդվածում դիտարկվում են 3-րդից 6-րդ աստիճանի բազմանդամով մոտեցման դեպքերը։ Այստեղ դիտարկվում է մոտարկումը եռանկյունաչափական բազմանդամով։

Գծային կախվածություն

Մեզ հետաքրքրում է 2 փոփոխականների կապը XԵվ y. Ենթադրություն կա, որ yկախված Xգծային օրենքի համաձայն y = կացին + բ. Այս հարաբերությունների պարամետրերը որոշելու համար հետազոտողը կատարել է դիտարկումներ՝ x i-ի յուրաքանչյուր արժեքի համար կատարվել է y i-ի չափում (տե՛ս ֆայլի օրինակ): Համապատասխանաբար, թող լինի 20 զույգ արժեք (x i; y i):

Նշում:Եթե ​​փոփոխության քայլն է X մշտական ​​է, ապա կառուցել սփռել հողամասերըկարող է օգտագործվել, եթե ոչ, ապա դուք պետք է օգտագործեք գծապատկերի տեսակը Բիծ .

Դիագրամից ակնհայտ է, որ փոփոխականների միջև կապը մոտ է գծային: Հասկանալու համար, թե շատ ուղիղներից որն է առավել «ճիշտ» նկարագրում փոփոխականների միջև կապը, անհրաժեշտ է որոշել այն չափանիշը, որով կհամեմատվեն գծերը:

Որպես այդպիսի չափանիշ մենք օգտագործում ենք արտահայտությունը.

Որտեղ ŷ ես = ա * x i + բ ; n – արժեքների զույգերի քանակը (մեր դեպքում n=20)

Վերոնշյալ արտահայտությունը y i և ŷ i դիտարկված արժեքների միջև քառակուսի հեռավորությունների գումարն է և հաճախ նշվում է որպես SSE ( Գումար -ից Քառակուսի Սխալներ (Մնացորդներ), քառակուսի սխալների գումարը (մնացորդները)) .

Նվազագույն քառակուսի մեթոդայսպիսի տող ընտրելն է ŷ = կացին + բ, որի համար վերը նշված արտահայտությունը վերցնում է նվազագույն արժեքը։

Նշում:Երկչափ տարածության ցանկացած գիծ եզակիորեն որոշվում է 2 պարամետրի արժեքներով. ա (լանջի) և բ (հերթափոխ):

Ենթադրվում է, որ որքան փոքր է քառակուսի հեռավորությունների գումարը, այնքան համապատասխան տողը ավելի լավ է մոտեցնում առկա տվյալներին և կարող է հետագայում օգտագործվել x փոփոխականից y-ի արժեքները կանխատեսելու համար: Հասկանալի է, որ նույնիսկ եթե իրականում փոփոխականների միջև հարաբերություն չկա կամ հարաբերությունը ոչ գծային է, ապա OLS-ը դեռ կընտրի «լավագույն» տողը: Այսպիսով, նվազագույն քառակուսիների մեթոդը ոչինչ չի ասում փոփոխականների միջև իրական հարաբերությունների առկայության մասին, մեթոդը պարզապես թույլ է տալիս ընտրել նման գործառույթի պարամետրերը: ա Եվ բ , որի համար վերը նշված արտահայտությունը նվազագույն է։

Կատարելով ոչ շատ բարդ մաթեմատիկական գործողություններ (մանրամասների համար տե՛ս), կարող եք հաշվարկել պարամետրերը ա Եվ բ :

Ինչպես երևում է բանաձևից, պարամետրը ա ներկայացնում է կովարիանսի հարաբերակցությունը և, հետևաբար, MS EXCEL-ում՝ պարամետրը հաշվարկելու համար Ա Դուք կարող եք օգտագործել հետևյալ բանաձևերը (տես Գծային թերթիկի օրինակ ֆայլ):

= KOVAR(B26:B45;C26:C45)/ DISP.G(B26:B45)կամ

= ԿՈՎԱՐԻԱՆՍ.B(B26:B45;C26:C45)/DISP.B(B26:B45)

Նաև պարամետրը հաշվարկելու համար Ա Դուք կարող եք օգտագործել բանաձևը = TILT (C26:C45;B26:B45). Պարամետրի համար բ օգտագործեք բանաձևը = LEG (C26:C45;B26:B45) .

Վերջապես, LINEST() ֆունկցիան թույլ է տալիս միաժամանակ հաշվարկել երկու պարամետրերը: Բանաձև մուտքագրելու համար LINEST(C26:C45;B26:B45)Դուք պետք է ընտրեք 2 բջիջ անընդմեջ և սեղմեք CTRL + SHIFT + ՄՏՆԵԼ(տես հոդվածի մասին): Արժեքը կվերադարձվի ձախ բջիջում Ա , աջ կողմում - բ .

ՆշումՆերածման հետ խառնաշփոթությունից խուսափելու համար զանգվածի բանաձևերդուք պետք է լրացուցիչ օգտագործեք INDEX() ֆունկցիան: Բանաձև = INDEX(LINEST(C26:C45,B26:B45),1)կամ պարզապես = LINEST(C26:C45;B26:B45)կվերադարձնի գծի թեքության համար պատասխանատու պարամետրը, այսինքն. Ա . Բանաձև = INDEX(LINEST(C26:C45,B26:B45),2)կվերադարձնի Y առանցքի հետ գծի հատման համար պատասխանատու պարամետրը, այսինքն. բ .

Հաշվարկելով պարամետրերը, ցրման դիագրամկարող եք գծել համապատասխան գիծը:

Նվազագույն քառակուսիների մեթոդով ուղիղ գիծ գծելու մեկ այլ եղանակ է գրաֆիկի գործիքը Թրենդային գիծ. Դա անելու համար ընտրեք դիագրամը, ընտրեք ընտրացանկից Դասավորության ներդիր, Վ խմբային վերլուծությունսեղմել Թրենդային գիծ, ապա Գծային մոտարկում .

Նշելով երկխոսության վանդակում «ցուցադրել հավասարումը դիագրամում» վանդակը, կարող եք համոզվել, որ վերը նշված պարամետրերը համընկնում են դիագրամի արժեքներին:

ՆշումՈրպեսզի պարամետրերը համընկնեն, դիագրամի տեսակը պետք է լինի: Բանն այն է, որ դիագրամ կառուցելիս Ժամանակացույց X-առանցքի արժեքները չեն կարող սահմանվել օգտագործողի կողմից (օգտագործողը կարող է նշել միայն պիտակներ, որոնք չեն ազդում կետերի գտնվելու վայրի վրա): X արժեքների փոխարեն օգտագործվում է 1 հաջորդականությունը. 2; 3; ... (համարակալման կատեգորիաների համար): Հետեւաբար, եթե դուք կառուցեք միտում գիծտիպային դիագրամի վրա Ժամանակացույց, ապա X-ի իրական արժեքների փոխարեն կօգտագործվեն այս հաջորդականության արժեքները, ինչը կհանգեցնի սխալ արդյունքի (եթե, իհարկե, փաստացի արժեքներ X-ը չեն համապատասխանում 1-ին հաջորդականությանը; 2; 3; ...).

Այն ունի բազմաթիվ կիրառումներ, քանի որ թույլ է տալիս մոտավոր ներկայացում տրված գործառույթըմյուսներն ավելի պարզ են: LSM-ը կարող է չափազանց օգտակար լինել դիտարկումների մշակման համար, և այն ակտիվորեն օգտագործվում է որոշ քանակություններ գնահատելու համար՝ հիմնվելով պատահական սխալներ պարունակող մյուսների չափումների արդյունքների վրա: Այս հոդվածում դուք կսովորեք, թե ինչպես իրականացնել նվազագույն քառակուսիների հաշվարկները Excel-ում:

Խնդրի շարադրանք՝ օգտագործելով կոնկրետ օրինակ

Ենթադրենք, որ կան երկու ցուցիչներ X և Y: Ավելին, Y-ը կախված է X-ից: Քանի որ OLS-ը մեզ հետաքրքրում է ռեգրեսիոն վերլուծության տեսանկյունից (Excel-ում դրա մեթոդներն իրականացվում են ներկառուցված գործառույթների միջոցով), մենք պետք է անմիջապես անցնենք դիտարկմանը. կոնկրետ խնդիր.

Այսպիսով, թող X-ը լինի մթերային խանութի մանրածախ տարածքը՝ չափված քառակուսի մետր, իսկ Y-ը տարեկան շրջանառությունն է, որը որոշվում է միլիոնավոր ռուբլով:

Պահանջվում է կանխատեսում անել, թե ինչ շրջանառություն (Y) կունենա խանութը, եթե ունի այս կամ այն ​​մանրածախ տարածք։ Ակնհայտ է, որ Y = f (X) ֆունկցիան աճում է, քանի որ հիպերմարկետում ավելի շատ ապրանքներ են վաճառվում, քան կրպակը:

Մի քանի խոսք կանխատեսման համար օգտագործվող սկզբնական տվյալների ճիշտության մասին

Ենթադրենք, մենք ունենք աղյուսակ, որը կառուցվել է տվյալների օգտագործմամբ n խանութների համար:

Համաձայն մաթեմատիկական վիճակագրություն, արդյունքները քիչ թե շատ ճիշտ կլինեն, եթե ուսումնասիրվեն առնվազն 5-6 օբյեկտների վերաբերյալ տվյալներ։ Բացի այդ, «անոմալ» արդյունքները չեն կարող օգտագործվել: Մասնավորապես, էլիտար փոքր բուտիկը կարող է ունենալ մի քանի անգամ ավելի մեծ շրջանառություն, քան «masmarket» դասի խոշոր մանրածախ կետերի շրջանառությունը։

Մեթոդի էությունը

Աղյուսակի տվյալները կարելի է պատկերել դեկարտյան հարթության վրա M 1 (x 1, y 1), ... M n (x n, y n) կետերի տեսքով: Այժմ խնդրի լուծումը կկրճատվի y = f (x) մոտավոր ֆունկցիայի ընտրությամբ, որն ունի M 1, M 2, .. M n կետերին հնարավորինս մոտ անցնող գրաֆիկ:

Իհարկե, դուք կարող եք օգտագործել բազմանդամ բարձր աստիճան, բայց այս տարբերակը ոչ միայն դժվար է իրականացնել, այլև պարզապես սխալ է, քանի որ այն չի արտացոլի այն հիմնական միտումը, որը պետք է հայտնաբերել: Ամենախելամիտ լուծումը y = ax + b ուղիղ գիծը փնտրելն է, որը լավագույնս մոտավոր է փորձարարական տվյալներին, ավելի ճիշտ՝ a և b գործակիցներին։

Ճշգրտության գնահատում

Ցանկացած մոտավորության դեպքում դրա ճշգրտության գնահատումը առանձնահատուկ նշանակություն ունի: Եկեք e i-ով նշենք x i կետի ֆունկցիոնալ և փորձարարական արժեքների տարբերությունը (շեղումը), այսինքն e i = y i - f (x i):

Ակնհայտ է, որ մոտարկման ճշգրտությունը գնահատելու համար կարող եք օգտագործել շեղումների գումարը, այսինքն՝ X-ի կախվածության Y-ից մոտավոր ներկայացման համար ուղիղ գիծ ընտրելիս պետք է նախապատվությունը տալ նրան, որն ունի ամենափոքր արժեքը: գումարել e i բոլոր քննարկվող կետերում: Այնուամենայնիվ, ամեն ինչ այնքան էլ պարզ չէ, քանի որ դրական շեղումների հետ միասին կլինեն նաև բացասական:

Խնդիրը կարելի է լուծել՝ օգտագործելով շեղման մոդուլները կամ դրանց քառակուսիները։ Վերջին մեթոդը ամենաշատ կիրառվողն է։ Այն օգտագործվում է բազմաթիվ ոլորտներում, այդ թվում ռեգրեսիոն վերլուծություն(Excel-ում դրա իրականացումն իրականացվում է երկու ներկառուցված գործառույթների միջոցով) և վաղուց ապացուցել է իր արդյունավետությունը:

Նվազագույն քառակուսի մեթոդ

Excel-ը, ինչպես գիտեք, ունի ներկառուցված AutoSum ֆունկցիա, որը թույլ է տալիս հաշվարկել ընտրված տիրույթում գտնվող բոլոր արժեքների արժեքները: Այսպիսով, ոչինչ չի խանգարի մեզ հաշվարկել արտահայտության արժեքը (e 1 2 + e 2 2 + e 3 2 + ... e n 2):

Մաթեմատիկական նշումով սա նման է.

Քանի որ ի սկզբանե որոշում է կայացվել մոտավորել ուղիղ գծով, մենք ունենք.

Այսպիսով, X և Y մեծությունների հատուկ կախվածությունը լավագույնս նկարագրող ուղիղ գիծը գտնելու խնդիրը հանգում է երկու փոփոխականների ֆունկցիայի նվազագույնի հաշվարկին.

Դա անելու համար հարկավոր է մասնակի ածանցյալները a և b նոր փոփոխականների նկատմամբ հավասարեցնել զրոյի և լուծել պարզունակ համակարգ, որը բաղկացած է երկու հավասարումներից 2 անհայտ ձևով.

Որոշ պարզ փոխակերպումներից հետո, ներառյալ բաժանումը 2-ի և գումարների շահարկումից հետո, մենք ստանում ենք.

Լուծելով այն, օրինակ, օգտագործելով Քրամերի մեթոդը, մենք ստանում ենք անշարժ կետ a * և b * որոշակի գործակիցներով: Սա նվազագույնն է, այսինքն՝ կանխատեսելու համար, թե ինչ շրջանառություն կունենա խանութը որոշակի տարածքի համար, հարմար է y = a * x + b * ուղիղ գիծը, որը ռեգրեսիոն մոդել է տվյալ օրինակի համար։ Իհարկե, դա թույլ չի տա ձեզ գտնել ճշգրիտ արդյունքը, բայց դա կօգնի ձեզ պատկերացում կազմել, թե արդյոք խանութի ապառիկով որոշակի տարածք գնելը կվճարի:

Ինչպես իրականացնել նվազագույն քառակուսիները Excel-ում

Excel-ն ունի նվազագույն քառակուսիների օգտագործմամբ արժեքները հաշվարկելու գործառույթ: Այն ունի հետևյալ ձևը. «TREND» (հայտնի Y արժեքներ; հայտնի X արժեքներ; նոր X արժեքներ; հաստատուն): Եկեք կիրառենք Excel-ում OLS-ի հաշվարկման բանաձևը մեր աղյուսակում:

Դա անելու համար մուտքագրեք «=» նշանը այն բջիջում, որտեղ պետք է ցուցադրվի Excel-ում նվազագույն քառակուսիների մեթոդով հաշվարկի արդյունքը և ընտրեք «TREND» ֆունկցիան: Բացվող պատուհանում լրացրեք համապատասխան դաշտերը՝ ընդգծելով.

  • Y-ի հայտնի արժեքների միջակայք (in այս դեպքումտվյալներ առևտրի շրջանառության համար);
  • միջակայք x 1, …x n, այսինքն՝ մանրածախ տարածքի չափը;
  • x-ի և՛ հայտնի, և՛ անհայտ արժեքները, որոնց համար անհրաժեշտ է պարզել շրջանառության չափը (աշխատանքային թերթում դրանց գտնվելու վայրի մասին տեղեկությունների համար տե՛ս ստորև):

Բացի այդ, բանաձևը պարունակում է «Const» տրամաբանական փոփոխականը: Եթե ​​համապատասխան դաշտում մուտքագրեք 1, դա կնշանակի, որ դուք պետք է կատարեք հաշվարկները՝ ենթադրելով, որ b = 0:

Եթե ​​Ձեզ անհրաժեշտ է պարզել մեկից ավելի x արժեքի կանխատեսումը, ապա բանաձևը մուտքագրելուց հետո չպետք է սեղմել «Enter», այլ պետք է մուտքագրել «Shift» + «Control» + «Enter» համադրությունը ստեղնաշարի վրա:

Որոշ առանձնահատկություններ

Ռեգրեսիոն վերլուծությունը կարող է հասանելի լինել նույնիսկ կեղծիքների համար: Անհայտ փոփոխականների զանգվածի արժեքը կանխատեսելու Excel բանաձևը՝ TREND, կարող է օգտագործվել նույնիսկ նրանց կողմից, ովքեր երբեք չեն լսել նվազագույն քառակուսիների մասին: Բավական է միայն իմանալ նրա աշխատանքի որոշ առանձնահատկությունները։ Մասնավորապես:

  • Եթե ​​դուք դասավորեք y փոփոխականի հայտնի արժեքների տիրույթը մեկ տողում կամ սյունակում, ապա յուրաքանչյուր տող (սյունակ) x-ի հայտնի արժեքներով ծրագրի կողմից կընկալվի որպես առանձին փոփոխական:
  • Եթե ​​TREND պատուհանում նշված չէ հայտնի x-ով միջակայքը, ապա Excel-ում ֆունկցիան օգտագործելիս ծրագիրը այն կվերաբերվի որպես ամբողջ թվերից բաղկացած զանգված, որոնց թիվը համապատասխանում է տվյալ արժեքներով տիրույթին: փոփոխական y.
  • «Կանխատեսված» արժեքների զանգված դուրս բերելու համար միտումը հաշվարկելու արտահայտությունը պետք է մուտքագրվի որպես զանգվածի բանաձև:
  • Եթե ​​x-ի նոր արժեքները նշված չեն, ապա TREND ֆունկցիան դրանք համարում է հայտնիներին հավասար: Եթե ​​դրանք նշված չեն, ապա զանգված 1 ընդունվում է որպես արգումենտ; 2; 3; 4;…, որը համարժեք է արդեն իսկ միջակայքին տրված պարամետրեր y.
  • Նոր x արժեքներ պարունակող միջակայքը պետք է ունենա նույն կամ ավելի տողեր կամ սյունակներ, ինչ տվյալ y արժեքները պարունակող միջակայքը: Այսինքն, այն պետք է համաչափ լինի անկախ փոփոխականներին։
  • Հայտնի x արժեքներով զանգվածը կարող է պարունակել բազմաթիվ փոփոխականներ: Այնուամենայնիվ, եթե մենք խոսում ենք միայն մեկի մասին, ապա պահանջվում է, որ x և y-ի տրված արժեքներով միջակայքերը լինեն համաչափ: Մի քանի փոփոխականների դեպքում անհրաժեշտ է, որ տվյալ y արժեքներով միջակայքը տեղավորվի մեկ սյունակում կամ մեկ տողում։

PREDICTION ֆունկցիան

Իրականացվում է մի քանի գործառույթների միջոցով: Դրանցից մեկը կոչվում է «ԿԱՆԽԱՏԵՍՈՒԹՅՈՒՆ»: Այն նման է «TREND»-ին, այսինքն՝ տալիս է նվազագույն քառակուսիների մեթոդով հաշվարկների արդյունքը: Սակայն միայն մեկ X-ի համար, որի համար Y-ի արժեքը անհայտ է:

Այժմ դուք գիտեք բանաձևեր Excel-ում կեղծիքների համար, որոնք թույլ են տալիս կանխատեսել որոշակի ցուցանիշի ապագա արժեքը՝ գծային միտումի համաձայն:

Նվազագույն քառակուսիների մեթոդ (LSM)

Համակարգի մ գծային հավասարումներ n անհայտներով ունի ձև.

Հնարավոր է երեք դեպք՝ մ n. Այն դեպքը, երբ m=n դիտարկվել է նախորդ պարբերություններում։ Երբ մ

Եթե ​​m>n և համակարգը համահունչ են, ապա A մատրիցն ունի առնվազն m - n գծային կախված տողեր: Այստեղ լուծումը կարելի է ստանալ՝ ընտրելով n ցանկացած գծային անկախ հավասարումներ (եթե դրանք կան) և կիրառելով X = A -1 CV բանաձևը, այսինքն՝ խնդիրը նվազեցնելով նախկինում լուծվածի։ Այս դեպքում ստացված լուծումը միշտ կբավարարի մնացած m - n հավասարումները։

Այնուամենայնիվ, համակարգչից օգտվելիս ավելի հարմար է օգտագործել ավելի ընդհանուր մոտեցում՝ նվազագույն քառակուսիների մեթոդը։

Հանրահաշվական նվազագույն քառակուսիների մեթոդ

Հանրահաշվական նվազագույն քառակուսիների մեթոդը գծային հավասարումների համակարգերի լուծման մեթոդ է

նվազագույնի հասցնելով էվկլիդեսյան նորմը

Կացին? բ. >inf. (1.2)

Փորձարարական տվյալների վերլուծություն

Եկեք դիտարկենք մի քանի փորձ, որի ընթացքում ժամանակի պահերին

Օրինակ՝ չափվում է Q(t) ջերմաստիճանը։ Թող չափումների արդյունքները նշվեն զանգվածով

Ենթադրենք, որ փորձարարական պայմաններն այնպիսին են, որ չափումները կատարվում են հայտնի սխալով։ Այս դեպքերում ջերմաստիճանի փոփոխության օրենքը Q(t) որոնվում է՝ օգտագործելով որոշակի բազմանդամ

P(t) = + + + ... +,

որոշելով անհայտ գործակիցները, ..., այն նկատառումներից, որ հավասարությամբ սահմանված E(, ...,) արժեքը.

գաուսի հանրահաշվական էքսելային մոտարկում

վերցրեց նվազագույն արժեքը. Քանի որ քառակուսիների գումարը նվազագույնի է հասցված, այս մեթոդը կոչվում է նվազագույն քառակուսիների մոտարկում տվյալներին:

Եթե ​​P(t)-ը փոխարինենք իր արտահայտությամբ, կստանանք

Եկեք խնդիր դնենք զանգվածը սահմանելու համար, որպեսզի արժեքը լինի նվազագույն, այսինքն. Եկեք սահմանենք զանգվածը՝ օգտագործելով նվազագույն քառակուսիների մեթոդը։ Դա անելու համար մենք մասնակի ածանցյալները հավասարեցնում ենք զրոյի.

Եթե ​​մուտքագրեք m × n մատրիցը A = (), i = 1, 2..., m; j = 1, 2, ..., n, որտեղ

I = 1, 2..., m; j = 1, 2, ..., n,

ապա գրավոր հավասարությունը կձևավորվի

Եկեք վերագրենք գրավոր հավասարությունը մատրիցներով գործողությունների առումով: Մատրիցը սյունակով բազմապատկելու սահմանմամբ ունենք

Փոխադրված մատրիցայի համար նմանատիպ հարաբերությունն այսպիսի տեսք ունի

Ներկայացնենք նշումը. կնշանակենք վեկտորի կացին i-րդ բաղադրիչը, ըստ գրված մատրիցային հավասարումների, կունենանք.

Մատրիցային ձևով այս հավասարությունը կարող է վերագրվել որպես

A T x=A T B (1.3)

Այստեղ A-ն ուղղանկյուն m×n մատրիցա է: Ընդ որում, տվյալների մոտարկման խնդիրներում, որպես կանոն, m > n. Հավասարումը (1.3) կոչվում է նորմալ հավասարում:

Հնարավոր է եղել հենց սկզբից, օգտագործելով վեկտորների էվկլիդյան նորմը, խնդիրը գրել համարժեք մատրիցային ձևով.

Մեր նպատակն է նվազագույնի հասցնել այս ֆունկցիան x-ում: Որպեսզի լուծման կետում հասնենք նվազագույնին, այս կետում x-ի նկատմամբ առաջին ածանցյալները պետք է հավասար լինեն զրոյի: Այս ֆունկցիայի ածանցյալներն են

2A T B + 2A T Ax

և հետևաբար լուծումը պետք է բավարարի գծային հավասարումների համակարգին

(A T A)x = (A T B):

Այս հավասարումները կոչվում են նորմալ հավասարումներ։ Եթե ​​A-ն m× n մատրից է, ապա A>A - n × n մատրից է, այսինքն. Նորմալ հավասարման մատրիցը միշտ քառակուսի սիմետրիկ մատրից է: Ավելին, այն ունի դրական որոշակիության հատկություն այն առումով, որ (A>Ax, x) = (Ax, Ax) ? 0.

Մեկնաբանություն. Երբեմն (1.3) ձևի հավասարման լուծումը կոչվում է Ax = B համակարգի լուծում, որտեղ A-ն ուղղանկյուն m × n (m > n) մատրից է՝ օգտագործելով նվազագույն քառակուսիների մեթոդը:

Նվազագույն քառակուսիների խնդիրը կարելի է գրաֆիկորեն մեկնաբանել որպես տվյալների կետերից մինչև մոդելի կորի ուղղահայաց հեռավորությունները (տես Նկար 1.1): Այս գաղափարը հիմնված է այն ենթադրության վրա, որ մոտարկման բոլոր սխալները համապատասխանում են դիտարկումների սխալներին: Եթե ​​անկախ փոփոխականներում կան նաև սխալներ, ապա ավելի նպատակահարմար կլինի նվազեցնել Էվկլիդեսյան հեռավորությունը տվյալներից մինչև մոդել:

MNC Excel-ում

Ստորև բերված ալգորիթմը Excel-ում OLS-ի իրականացման համար ենթադրում է, որ բոլոր նախնական տվյալները արդեն հայտնի են: Ձախ կողմում գտնվող համակարգի մատրիցային հավասարման AЧX=B երկու կողմերը բազմապատկում ենք А Т համակարգի փոխադրված մատրիցով.

A T AX=A T B

Այնուհետև մենք ձախ կողմում գտնվող հավասարման երկու կողմերը բազմապատկում ենք (A T A) -1 մատրիցով: Եթե ​​այս մատրիցը գոյություն ունի, ապա համակարգը սահմանվում է: Հաշվի առնելով դա

(A T A) -1 *(A T A)=E, մենք ստանում ենք

X=(A T A) -1 A T B.

Ստացված մատրիցային հավասարումը n անհայտ ունեցող m գծային հավասարումների համակարգի լուծումն է m>n-ի համար:

Դիտարկենք վերը նշված ալգորիթմի կիրառումը կոնկրետ օրինակ.

Օրինակ. Թող հարկ լինի լուծել համակարգը

Excel-ում այս խնդրի բանաձեւի ցուցադրման ռեժիմում լուծումների թերթիկը այսպիսի տեսք ունի.


Հաշվարկի արդյունքները.

Պահանջվող X վեկտորը գտնվում է E11:E12 միջակայքում:

Գծային հավասարումների տվյալ համակարգը լուծելիս օգտագործվել են հետևյալ ֆունկցիաները.

1. MOBR - վերադառնում է հակադարձ մատրիցազանգվածում պահվող մատրիցայի համար։

Շարահյուսություն՝ MOBR (զանգված):

Զանգվածը թվային զանգված է՝ հավասար թվով տողերով և սյունակներով։

2. MULTIPULT - վերադարձնում է մատրիցների արտադրյալը (մատրիցաները պահվում են զանգվածներով): Արդյունքը մի զանգված է, որն ունի նույն թվով տողեր, որքան array1-ը և նույն թվով սյունակներ, որքան array2-ը:

Շարահյուսություն՝ MULTIPLE (զանգված 1, զանգված 2):

Array1, array2-ը բազմապատկվող զանգվածներ են:

Զանգվածի տիրույթի վերին ձախ բջիջում ֆունկցիա մուտքագրելուց հետո ընտրեք զանգվածը՝ սկսելով բանաձևը պարունակող բջիջից, սեղմեք F2, այնուհետև սեղմեք CTRL+SHIFT+ENTER։

3. ՏՐԱՆՍՊՈՐՏ - բջիջների ուղղահայաց շարքը վերածում է հորիզոնականի կամ հակառակը: Այս ֆունկցիան օգտագործելու արդյունքում հայտնվում է զանգված, որի տողերի թիվը հավասար է սկզբնական զանգվածի սյունակների թվին, իսկ սյունակների թիվը՝ սկզբնական զանգվածի տողերի թվին։

4.1. Ներկառուցված գործառույթների օգտագործումը

Հաշվարկ ռեգրեսիայի գործակիցներըիրականացվում է ֆունկցիայի միջոցով

LINEST(Արժեքներ_y; x-արժեքներ; Կոնստ; վիճակագրություն),

Արժեքներ_y- y արժեքների զանգված,

x-արժեքներ- կամընտիր արժեքների զանգված x, եթե զանգված Xբաց թողնված է, ենթադրվում է, որ սա նույն չափի զանգված է (1;2;3;...) Արժեքներ_y,

Կոնստ- բուլյան արժեք, որը ցույց է տալիս, թե արդյոք հաստատունը պահանջվում է բհավասար էր 0. Եթե Կոնստիմաստ ունի ՃԻՇՏկամ բաց թողնված, ապա բհաշվարկվում է սովորական եղանակով. Եթե ​​փաստարկը ԿոնստՍՈՒՏ է, ուրեմն բենթադրվում է 0, իսկ արժեքները աընտրված են այնպես, որ կապը կատարվի y=ax.

Վիճակագրությունբուլյան արժեք է, որը ցույց է տալիս, թե արդյոք լրացուցիչ ռեգրեսիայի վիճակագրություն է պահանջվում վերադարձնել: Եթե ​​փաստարկը Վիճակագրությունիմաստ ունի ՃԻՇՏ, ապա ֆունկցիան LINESTվերադարձնում է լրացուցիչ ռեգրեսիայի վիճակագրություն: Եթե ​​փաստարկը Վիճակագրությունիմաստ ունի ՍՈՒՏկամ բաց թողնված, ապա ֆունկցիան LINESTվերադարձնում է միայն գործակիցը աև մշտական բ.

Պետք է հիշել, որ գործառույթների արդյունքը LINEST ()արժեքների մի շարք է՝ զանգված:

Հաշվարկի համար հարաբերակցության գործակիցըֆունկցիան օգտագործվում է

CORREL(Զանգված 1;Զանգված 2),

վերադարձնելով հարաբերակցության գործակիցի արժեքները, որտեղ Զանգված 1- արժեքների զանգված y, Զանգված 2- արժեքների զանգված x. Զանգված 1Եվ Զանգված 2պետք է լինի նույն չափը:

ՕՐԻՆԱԿ 1. Կախվածություն y(x) ներկայացված է աղյուսակում: Կառուցել ռեգրեսիայի գիծև հաշվարկիր հարաբերակցության գործակիցը.

y 0.5 1.5 2.5 3.5
x 2.39 2.81 3.25 3.75 4.11 4.45 4.85 5.25

Եկեք արժեքների աղյուսակը մուտքագրենք MS Excel թերթիկի մեջ և կառուցենք ցրված գծապատկեր: Աշխատանքային թերթիկը կունենա Նկ. 2.

Ռեգրեսիայի գործակիցների արժեքները հաշվարկելու համար ԱԵվ բընտրեք բջիջները A7:B7,Եկեք անցնենք գործառույթի մոգին և կատեգորիային Վիճակագրականընտրել գործառույթ LINEST. Եկեք լրացնենք երկխոսության տուփը, որը երևում է, ինչպես ցույց է տրված Նկ. 3 և սեղմեք լավ.


Արդյունքում, հաշվարկված արժեքը կհայտնվի միայն բջիջում A6(նկ. 4): Որպեսզի արժեքը հայտնվի բջիջում B6դուք պետք է մուտքագրեք խմբագրման ռեժիմ (բանալ F2), ապա սեղմեք ստեղների համակցությունը CTRL+SHIFT+ENTER.

Բջջում հարաբերակցության գործակիցի արժեքը հաշվարկելու համար C6ներկայացվել է հետևյալ բանաձևը:

C7=CORREL(B3:J3;B2:J2).

Իմանալով ռեգրեսիայի գործակիցները ԱԵվ բեկեք հաշվարկենք ֆունկցիայի արժեքները y=կացին+բտրվածի համար x. Դա անելու համար մենք ներկայացնում ենք բանաձևը

B5=$A$7*B2+$B$7

և պատճենեք այն տիրույթում C5:J5(նկ. 5):

Դիագրամի վրա գծենք ռեգրեսիայի գիծը: Գրաֆիկի վրա ընտրեք փորձնական կետերը, աջ սեղմեք և ընտրեք հրամանը Նախնական տվյալներ. Հայտնվող երկխոսության վանդակում (նկ. 5) ընտրեք ներդիրը Շարքև սեղմեք կոճակի վրա Ավելացնել. Եկեք լրացնենք մուտքագրման դաշտերը, ինչպես ցույց է տրված Նկ. 6 և սեղմեք կոճակը լավ. Փորձարարական տվյալների գրաֆիկին կավելացվի ռեգրեսիոն գիծ: Լռելյայնորեն, դրա գրաֆիկը գծվելու է որպես կետեր, որոնք միացված չեն հարթեցնող գծերով:



Ռեգրեսիայի գծի տեսքը փոխելու համար կատարեք հետևյալ քայլերը. Աջ սեղմեք գծային գրաֆիկը պատկերող կետերի վրա և ընտրեք հրամանը Գծապատկերի տեսակըև սահմանեք ցրման դիագրամի տեսակը, ինչպես ցույց է տրված Նկ. 7.

Գծի տեսակը, գույնը և հաստությունը կարելի է փոխել հետևյալ կերպ. Ընտրեք գծապատկերի վրա, սեղմեք աջը և ընտրեք հրամանը համատեքստի ընտրացանկում Տվյալների շարքի ձևաչափը...Հաջորդը, կատարեք կարգավորումներ, օրինակ, ինչպես ցույց է տրված Նկ. 8.

Բոլոր փոխակերպումների արդյունքում մենք ստանում ենք փորձարարական տվյալների գրաֆիկ և ռեգրեսիոն գիծ մեկ գրաֆիկական տարածքում (նկ. 9):

4.2. Թրենդային գիծ օգտագործելով:

MS Excel-ում տարբեր մոտավոր կախվածությունների կառուցումն իրականացվում է որպես գծապատկերային հատկություն. միտում գիծ.

ՕՐԻՆԱԿ 2. Փորձի արդյունքում որոշվել է որոշակի աղյուսակային կախվածություն։

0.15 0.16 0.17 0.18 0.19 0.20
4.4817 4.4930 5.4739 6.0496 6.6859 7.3891

Ընտրեք և կառուցեք մոտավոր կախվածություն: Կառուցեք աղյուսակային և ընտրված վերլուծական կախվածությունների գրաֆիկներ:

Խնդրի լուծումը կարելի է բաժանել հետևյալ փուլերի՝ սկզբնական տվյալների մուտքագրում, ցրման գծապատկերի կառուցում և այս գծապատկերում միտումի գծի ավելացում։

Եկեք մանրամասն նայենք այս գործընթացին: Եկեք սկզբնական տվյալները մուտքագրենք աշխատանքային թերթիկ և գծագրենք փորձնական տվյալները: Հաջորդը, ընտրեք փորձնական կետերը գրաֆիկի վրա, աջ սեղմեք և օգտագործեք հրամանը Ավելացնելլ միտում գիծ(նկ. 10):

Երկխոսության տուփը, որը հայտնվում է, թույլ է տալիս կառուցել մոտավոր հարաբերություններ:

Այս պատուհանի առաջին ներդիրը (նկ. 11) ցույց է տալիս մոտավոր կախվածության տեսակը:

Երկրորդի վրա (նկ. 12) որոշվում են շինարարական պարամետրերը.

· մոտավոր կախվածության անվանումը;

· կանխատեսում առաջ (հետ) ըստ nմիավորներ (այս պարամետրը որոշում է, թե քանի միավոր առաջ (հետ) պետք է երկարացվի միտումի գիծը);

ցույց տալ կորի հատման կետը ուղիղ գծով y=կոնստ;

· ցույց տալ մոտավոր ֆունկցիան դիագրամի վրա, թե ոչ (հավասարումը դիագրամի վրա ցույց տալու տարբերակ);

· տեղադրել ստանդարտ շեղման արժեքը դիագրամի վրա, թե ոչ (մոտավորության հուսալիության արժեքը դիագրամի վրա տեղադրելու տարբերակ):

Որպես մոտավոր կախվածություն ընտրենք երկրորդ աստիճանի բազմանդամը (նկ. 11) և գրաֆիկի վրա ցուցադրենք այս բազմանդամը նկարագրող հավասարումը (նկ. 12): Ստացված դիագրամը ներկայացված է Նկ. 13.

Նմանապես օգտագործելով միտում գծերԴուք կարող եք ընտրել այնպիսի կախվածությունների պարամետրեր, ինչպիսիք են

գծային y=a∙x+բ,

լոգարիթմական y=a∙ln(x)+բ,

· էքսպոնենցիալ y=a∙e բ,

· հանգստացնող y=a∙x բ,

բազմանդամ y=a∙x 2 +b∙x+գ, y=a∙x 3 +b∙x 2 +c∙x+dև այլն, մինչև 6-րդ աստիճանի բազմանդամը ներառյալ,

· գծային ֆիլտրում.

4.3. Օգտագործելով Ընտրանքների վերլուծության գործիքը. լուծում գտնելը:

Զգալի հետաքրքրություն է ներկայացնում MS Excel-ում ֆունկցիոնալ հարաբերությունների պարամետրերի ընտրության իրականացումը` օգտագործելով նվազագույն քառակուսիների մեթոդը, օգտագործելով ընտրանքների վերլուծության գործիքը. Որոնել լուծում: Այս տեխնիկան թույլ է տալիս ընտրել ցանկացած տեսակի ֆունկցիայի պարամետրերը: Դիտարկենք այս հնարավորությունը՝ որպես օրինակ օգտագործելով հետևյալ խնդիրը.

ՕՐԻՆԱԿ 3. Փորձի արդյունքում ստացվել է z(t) կախվածությունը՝ ներկայացված աղյուսակում

0,66 0,9 1,17 1,47 1,7 1,74 2,08 2,63 3,12
38,9 68,8 64,4 66,5 64,95 59,36 82,6 90,63 113,5

Ընտրեք կախվածության գործակիցները Z(t)=4 +Bt 3 +Ct 2 +Dt+K-ումնվազագույն քառակուսիների մեթոդ.

Այս խնդիրը համարժեք է հինգ փոփոխականների ֆունկցիայի նվազագույնը գտնելու խնդրին

Դիտարկենք օպտիմալացման խնդրի լուծման գործընթացը (նկ. 14):

Թող արժեքները Ա, IN, ՀԵՏ, ԴԵվ TOպահվում են բջիջներում A7:E7. Եկեք հաշվարկենք ֆունկցիայի տեսական արժեքները Զ(տ)=4 +Bt 3 +Ct 2 +Dt+Kտրվածի համար տ(B2:J2). Դա անելու համար, խցում B4մուտքագրեք ֆունկցիայի արժեքը առաջին կետում (բջջ B2):

B4=$A$7*B2^4+$B$7*B2^3+$C$7*B2^2+$D$7*B2+$E$7.

Եկեք պատճենենք այս բանաձևը միջակայքում C4:J4և ստացիր ֆունկցիայի ակնկալվող արժեքը այն կետերում, որոնց աբսցիսները պահվում են բջիջներում B2:J2.

Բջիջին B5Ներկայացնենք մի բանաձև, որը հաշվարկում է փորձարարական և հաշվարկված կետերի տարբերության քառակուսին.

B5=(B4-B3)^2,

և պատճենեք այն տիրույթում C5:J5. Խցում F7մենք կպահենք ընդհանուր քառակուսի սխալը (10): Դա անելու համար մուտքագրեք բանաձևը.

F7 = SUM(B5:J5).

Եկեք օգտագործենք հրամանը Service® Որոնել լուծումև լուծել օպտիմալացման խնդիրը առանց սահմանափակումների: Համապատասխանաբար լրացնենք մուտքագրման դաշտերը Նկ.-ում ցուցադրված երկխոսության վանդակում: 14 և սեղմեք կոճակը Կատարել. Եթե ​​լուծում է գտնվել, ապա նկ. 15.

Որոշման բլոկի արդյունքը կուղարկվի բջիջներ A7:E7պարամետրերի արժեքներըգործառույթները Զ(տ)=4 +Bt 3 +Ct 2 +Dt+K. Բջիջներում B4:J4մենք ստանում ենք սպասվող ֆունկցիայի արժեքըելակետերում։ Խցում F7կպահվի ընդհանուր քառակուսի սխալ.

Դուք կարող եք ցուցադրել փորձնական կետերը և հարմարեցված գիծը մեկ գրաֆիկական տարածքում՝ ընտրելով տիրույթ B2:J4, զանգ Գծապատկերների մոգ, և այնուհետև ձևաչափեք ստացված գրաֆիկների տեսքը:

Բրինձ. 17-ը ցույց է տալիս MS Excel-ի աշխատաթերթը հաշվարկները կատարելուց հետո:

Կիսվեք ընկերների հետ կամ խնայեք ինքներդ.

Բեռնվում է...