Reqressiya tənliyi. Çoxsaylı reqressiya tənliyi. Excel-də korrelyasiya və reqressiya təhlili: icra təlimatları Reqressiya təhlili modelində hansı tələblər var

Reqressiya və korrelyasiya təhlili - statistik tədqiqat metodları. Bunlar bir parametrin bir və ya bir neçə müstəqil dəyişəndən asılılığını göstərmək üçün ən ümumi üsullardır.

Aşağıda konkret praktiki nümunələrdən istifadə edərək iqtisadçılar arasında çox məşhur olan bu iki təhlili nəzərdən keçirəcəyik. Onlar birləşdirildikdə nəticələrin əldə edilməsinə dair bir nümunə də verəcəyik.

Excel-də reqressiya təhlili

Bəzi dəyərlərin (müstəqil, müstəqil) asılı dəyişənə təsirini göstərir. Məsələn, iqtisadi fəal əhalinin sayı müəssisələrin sayından, əmək haqqından və digər parametrlərdən necə asılıdır. Yaxud: xarici investisiyalar, enerji qiymətləri və s. ÜDM-in səviyyəsinə necə təsir edir.

Təhlilin nəticəsi prioritetləşdirməyə imkan verir. Və əsas amillərə əsaslanaraq, proqnozlaşdırmaq, prioritet sahələrin inkişafını planlaşdırmaq, idarəetmə qərarları qəbul etmək.

Reqressiya baş verir:

  • xətti (y = a + bx);
  • parabolik (y = a + bx + cx 2);
  • eksponensial (y = a * exp(bx));
  • güc (y = a*x^b);
  • hiperbolik (y = b/x + a);
  • loqarifmik (y = b * 1n(x) + a);
  • eksponensial (y = a * b^x).

Excel-də reqressiya modelinin qurulması və nəticələrin şərh edilməsi nümunəsini nəzərdən keçirin. Gəlin xətti reqressiya növünü götürək.

Tapşırıq. 6 müəssisədə orta aylıq əmək haqqı və işdən çıxan işçilərin sayı təhlil edilib. Təqaüdə çıxan işçilərin sayının orta əməkhaqqından asılılığını müəyyən etmək lazımdır.

Xətti reqressiya modeli aşağıdakı formaya malikdir:

Y \u003d a 0 + a 1 x 1 + ... + a k x k.

a reqressiya əmsalları olduğu halda, x təsir edən dəyişənlər, k isə amillərin sayıdır.

Bizim nümunəmizdə Y işdən çıxan işçilərin göstəricisidir. Təsir edən amil əmək haqqıdır (x).

Excel xətti reqressiya modelinin parametrlərini hesablamaq üçün istifadə edilə bilən daxili funksiyalara malikdir. Lakin Analysis ToolPak əlavəsi bunu daha sürətli edəcək.

Güclü analitik aləti aktivləşdirin:

Aktivləşdirildikdən sonra əlavə Məlumatlar sekmesinde mövcud olacaq.

İndi biz birbaşa reqressiya təhlili ilə məşğul olacağıq.



İlk növbədə R-kvadratına və əmsallara diqqət yetiririk.

R-kvadrat determinasiya əmsalıdır. Bizim nümunəmizdə 0,755 və ya 75,5% təşkil edir. Bu o deməkdir ki, modelin hesablanmış parametrləri öyrənilən parametrlər arasındakı əlaqəni 75,5% izah edir. Determinasiya əmsalı nə qədər yüksək olarsa, model bir o qədər yaxşı olar. Yaxşı - 0,8-dən yuxarı. Zəif - 0,5-dən az (belə bir analiz çətin ki, ağlabatan hesab edilə bilər). Bizim nümunəmizdə - "pis deyil".

64.1428 əmsalı baxılan modeldə bütün dəyişənlər 0-a bərabər olarsa Y-nin nə olacağını göstərir.Yəni modeldə təsvir olunmayan digər amillər də təhlil edilən parametrin qiymətinə təsir göstərir.

-0,16285 əmsalı X dəyişəninin Y-də çəkisini göstərir. Yəni bu model daxilində orta aylıq əmək haqqı -0,16285 çəkisi ilə işdən çıxanların sayına təsir göstərir (bu, az təsir dərəcəsidir). “-” işarəsi mənfi təsir göstərir: əmək haqqı nə qədər yüksək olsa, işdən bir o qədər azdır. Hansı ədalətlidir.



Excel-də korrelyasiya təhlili

Korrelyasiya təhlili bir və ya iki nümunədəki göstəricilər arasında əlaqənin olub olmadığını müəyyən etməyə kömək edir. Məsələn, maşının işləmə müddəti ilə təmir xərcləri arasında, avadanlıqların qiyməti və istismar müddəti, uşaqların boyu və çəkisi və s.

Əgər əlaqə varsa, onda bir parametrin artması digərində artıma (müsbət korrelyasiya), yoxsa azalmaya (mənfi) gətirib çıxarır. Korrelyasiya təhlili analitikə bir göstəricinin dəyərinin digərinin mümkün dəyərini proqnozlaşdıra biləcəyini müəyyən etməyə kömək edir.

Korrelyasiya əmsalı r ilə işarələnir. +1 ilə -1 arasında dəyişir. Müxtəlif sahələr üçün korrelyasiyaların təsnifatı fərqli olacaq. Əmsal dəyəri 0 olduqda, nümunələr arasında xətti əlaqə yoxdur.

Korrelyasiya əmsalını tapmaq üçün Excel-dən necə istifadə edəcəyinizi düşünün.

CORREL funksiyası qoşalaşmış əmsalları tapmaq üçün istifadə olunur.

Tapşırıq: Torna dəzgahının işləmə müddəti ilə onun saxlanması xərcləri arasında əlaqənin olub olmadığını müəyyənləşdirin.

Kursoru istənilən xanaya qoyun və fx düyməsini basın.

  1. "Statistika" kateqoriyasında CORREL funksiyasını seçin.
  2. Arqument "Array 1" - ilk dəyərlər diapazonu - maşının vaxtı: A2: A14.
  3. Arqument "Array 2" - dəyərlərin ikinci diapazonu - təmir dəyəri: B2: B14. OK düyməsini basın.

Əlaqənin növünü müəyyən etmək üçün əmsalın mütləq sayına baxmaq lazımdır (hər bir fəaliyyət sahəsinin öz miqyası var).

Bir neçə parametrin (2-dən çox) korrelyasiya təhlili üçün “Məlumatların təhlili” (“Təhlil paketi” əlavəsi) istifadə etmək daha rahatdır. Siyahıda korrelyasiya seçmək və massiv təyin etmək lazımdır. Hamısı.

Əldə edilən əmsallar korrelyasiya matrisində göstəriləcək. Bu kimi:

Korrelyasiya-reqressiya təhlili

Praktikada bu iki texnika tez-tez birlikdə istifadə olunur.

Misal:


Məlumat indi görünür reqressiya təhlili.

Tələbələr təhsil müddətində çox vaxt müxtəlif tənliklərlə qarşılaşırlar. Onlardan biri - reqressiya tənliyi bu məqalədə nəzərdən keçirilir. Bu tip tənlik riyazi parametrlər arasındakı əlaqənin xüsusiyyətlərini təsvir etmək üçün xüsusi olaraq istifadə olunur. Bu tip bərabərliklər statistikada və ekonometriyada istifadə olunur.

Reqressiyanın tərifi

Riyaziyyatda reqressiya, məlumat dəstinin orta dəyərinin başqa bir kəmiyyətin dəyərlərindən asılılığını təsvir edən müəyyən bir kəmiyyət kimi başa düşülür. Reqressiya tənliyi müəyyən bir xüsusiyyətin funksiyası kimi başqa bir xüsusiyyətin orta qiymətini göstərir. Reqressiya funksiyası sadə y \u003d x tənliyi formasına malikdir, burada y asılı dəyişən kimi çıxış edir, x isə müstəqil dəyişəndir (xüsusiyyət amili). Əslində reqressiya y = f (x) kimi ifadə edilir.

Dəyişənlər arasında əlaqə növləri hansılardır

Ümumiyyətlə, iki əks əlaqə növü fərqləndirilir: korrelyasiya və reqressiya.

Birincisi şərti dəyişənlərin bərabərliyi ilə xarakterizə olunur. IN bu məsələ hansı dəyişənin digərindən asılı olduğu dəqiq bilinmir.

Əgər dəyişənlər arasında bərabərlik yoxdursa və şərtlər hansı dəyişənin izahlı, hansının asılı olduğunu deyirsə, onda ikinci tip əlaqənin mövcudluğundan danışmaq olar. Xətti reqressiya tənliyini qurmaq üçün hansı növ əlaqənin müşahidə olunduğunu öyrənmək lazımdır.

Reqressiya növləri

Bu günə qədər 7 müxtəlif reqressiya növü mövcuddur: hiperbolik, xətti, çoxlu, qeyri-xətti, cütlük, tərs, loqarifmik xətti.

Hiperbolik, xətti və loqarifmik

Xətti reqressiya tənliyindən statistikada tənliyin parametrlərini aydın şəkildə izah etmək üçün istifadə olunur. y = c + m * x + E kimi görünür. Hiperbolik tənlik müntəzəm hiperbola y \u003d c + m / x + E şəklindədir. Loqarifmik xətti tənlik loqarifmik funksiyadan istifadə edərək əlaqəni ifadə edir: y \u003d C + m ilə * x + In E ilə.

Çoxlu və qeyri-xətti

Daha iki mürəkkəb reqressiya növü çoxlu və qeyri-xəttidir. Çoxsaylı reqressiya tənliyi y \u003d f (x 1, x 2 ... x c) + E funksiyası ilə ifadə edilir. Bu vəziyyətdə y asılı dəyişən, x isə izahedici dəyişəndir. Dəyişən E stoxastikdir və tənlikdəki digər amillərin təsirini ehtiva edir. Qeyri-xətti reqressiya tənliyi bir qədər uyğunsuzdur. Bir tərəfdən nəzərə alınan göstəricilərə münasibətdə o, xətti deyil, digər tərəfdən isə göstəricilərin qiymətləndirilməsi rolunda xətti xarakter daşıyır.

Tərs və cüt reqressiyalar

Tərs, xətti formaya çevrilməsi lazım olan bir növ funksiyadır. Ən ənənəvi şəkildə tətbiq proqramları y = 1/c + m*x + E funksiyası formasına malikdir. Qoşalaşmış reqressiya tənliyi verilənlər arasındakı əlaqəni y = f(x) + E funksiyası kimi göstərir. Digər tənliklər kimi, y də x-dən asılıdır və E stoxastik parametrdir.

Korrelyasiya anlayışı

Bu, iki hadisə və ya proses arasında əlaqənin mövcudluğunu nümayiş etdirən göstəricidir. Əlaqənin gücü korrelyasiya əmsalı kimi ifadə edilir. Onun dəyəri [-1;+1] intervalında dəyişir. Mənfi göstərici varlığı göstərir rəy, müsbət - düz xətt haqqında. Əgər əmsal 0-a bərabər qiymət alırsa, onda heç bir əlaqə yoxdur. Dəyər 1-ə nə qədər yaxındırsa - parametrlər arasında əlaqə nə qədər güclüdürsə, 0-a yaxındır - bir o qədər zəifdir.

Metodlar

Korrelyasiya parametrik üsulları əlaqənin sıxlığını qiymətləndirə bilər. Onlar normal paylanma qanununa tabe olan parametrləri öyrənmək üçün paylanma təxminləri əsasında istifadə olunur.

Xətti reqressiya tənliyinin parametrləri asılılığın növünü, reqressiya tənliyinin funksiyasını müəyyən etmək və seçilmiş əlaqə formulunun göstəricilərini qiymətləndirmək üçün lazımdır. Korrelyasiya sahəsi əlaqəni müəyyən etmək üçün bir üsul kimi istifadə olunur. Bunun üçün bütün mövcud məlumatlar qrafik şəkildə təqdim edilməlidir. Dördbucaqlı ikiölçülü koordinat sistemində bütün məlum verilənlərin qrafiki çəkilməlidir. Korrelyasiya sahəsi belə formalaşır. Təsvir edən amilin dəyəri absis boyunca, asılı amilin dəyərləri isə ordinat boyunca qeyd olunur. Parametrlər arasında funksional əlaqə varsa, onlar xətt şəklində düzülür.

Bu cür məlumatların korrelyasiya əmsalı 30% -dən azdırsa, əlaqənin demək olar ki, tam olmaması haqqında danışa bilərik. 30% ilə 70% arasındadırsa, bu, orta sıxlıq əlaqələrinin olduğunu göstərir. 100% göstərici funksional əlaqənin sübutudur.

Xətti olmayan reqressiya tənliyi, xətti tənlik kimi, korrelyasiya indeksi (R) ilə tamamlanmalıdır.

Çoxlu reqressiya üçün korrelyasiya

Determinasiya əmsalı çoxsaylı korrelyasiya kvadratının göstəricisidir. Təqdim olunan göstəricilər toplusunun tədqiq olunan əlamətlə əlaqəsinin sıxlığından danışır. Parametrlərin nəticəyə təsirinin təbiətindən də danışa bilər. Çoxsaylı reqressiya tənliyi bu göstəricidən istifadə etməklə qiymətləndirilir.

Çoxsaylı korrelyasiya indeksini hesablamaq üçün onun indeksini hesablamaq lazımdır.

Ən kiçik kvadrat üsulu

Bu üsul reqressiya faktorlarını qiymətləndirmək üsuludur. Onun mahiyyəti amilin funksiyadan asılılığı səbəbindən alınan kvadrat kənarlaşmaların cəmini minimuma endirməkdən ibarətdir.

Belə bir metoddan istifadə etməklə qoşalaşmış xətti reqressiya tənliyini qiymətləndirmək olar. Bu tip tənliklər qoşalaşmış xətti əlaqənin göstəriciləri arasında aşkar edildikdə istifadə olunur.

Tənlik Seçimləri

Xətti reqressiya funksiyasının hər bir parametri özünəməxsus məna daşıyır. Qoşalaşmış xətti reqressiya tənliyi iki parametrdən ibarətdir: c və m.T parametri x dəyişəninin bir şərti vahid azalması (artım) şərti ilə y funksiyasının yekun göstəricisinin orta dəyişməsini göstərir. Əgər x dəyişəni sıfırdırsa, funksiya c parametrinə bərabərdir. Əgər x dəyişəni sıfır deyilsə, onda c faktorunun iqtisadi mənası yoxdur. Funksiyaya yeganə təsir c faktorunun qarşısındakı işarədir. Bir mənfi varsa, o zaman amillə müqayisədə nəticənin yavaş dəyişməsi haqqında deyə bilərik. Bir artı varsa, bu nəticədə sürətlənmiş dəyişikliyi göstərir.

Reqressiya tənliyinin qiymətini dəyişən hər bir parametr tənliklə ifadə oluna bilər. Məsələn, c faktoru c = y - mx formasına malikdir.

Qruplaşdırılmış məlumatlar

Tapşırıqın belə şərtləri var ki, burada bütün məlumatlar x atributuna görə qruplaşdırılır, lakin eyni zamanda müəyyən bir qrup üçün asılı göstəricinin müvafiq orta dəyərləri göstərilir. Bu vəziyyətdə, orta dəyərlər göstəricinin x-dən necə asılı olduğunu xarakterizə edir. Beləliklə, qruplaşdırılmış məlumat reqressiya tənliyini tapmağa kömək edir. Münasibətlərin təhlili kimi istifadə olunur. Bununla belə, bu metodun çatışmazlıqları var. Təəssüf ki, orta göstəricilər çox vaxt xarici dalğalanmalara məruz qalır. Bu dalğalanmalar münasibətlərin qanunauyğunluqlarını əks etdirmir, sadəcə olaraq onun “səs-küyünü” maskalayır. Ortalar xətti reqressiya tənliyindən daha pis əlaqə nümunələrini göstərir. Bununla belə, onlar tənlik tapmaq üçün əsas kimi istifadə edilə bilər. Müəyyən bir əhalinin ölçüsünü müvafiq orta ilə çarparaq, qrup daxilində y cəmini əldə edə bilərsiniz. Sonra, bütün alınan məbləğləri silmək və son göstəricini tapmaq lazımdır y. Xy cəmi göstəricisi ilə hesablamalar aparmaq bir qədər çətindir. Fasilələr kiçik olduqda, şərti olaraq bütün vahidlər üçün (qrup daxilində) x göstəricisini eyni qəbul edə bilərik. X və y-nin hasillərinin cəmini tapmaq üçün onu y cəmi ilə çarpın. Bundan əlavə, bütün məbləğlər bir-birinə vurulur və ümumi xy məbləği alınır.

Çoxlu Cütlük Tənlik Reqresiyası: Münasibətlərin Əhəmiyyətinin Qiymətləndirilməsi

Daha əvvəl müzakirə edildiyi kimi, çoxlu reqressiya y \u003d f (x 1, x 2, ..., x m) + E şəklində bir funksiyaya malikdir. Çox vaxt belə bir tənlik mallara tələb və təklif, geri alınmış səhmlər üzrə faiz gəlirləri problemini həll etmək, istehsal xərcləri funksiyasının səbəblərini və növünü öyrənmək üçün istifadə olunur. O, həmçinin müxtəlif makroiqtisadi tədqiqatlarda və hesablamalarda fəal şəkildə istifadə olunur, lakin mikroiqtisadiyyat səviyyəsində bu tənlik bir qədər az istifadə olunur.

Çoxsaylı reqressiyanın əsas vəzifəsi hər bir faktorun ayrı-ayrılıqda və onların məcmusunda modelləşdiriləcək göstəriciyə və onun əmsallarına hansı təsirinin olduğunu daha da müəyyən etmək üçün böyük miqdarda məlumatı özündə cəmləşdirən məlumat modelini qurmaqdır. Reqressiya tənliyi müxtəlif qiymətlər ala bilər. Bu halda əlaqəni qiymətləndirmək üçün adətən iki növ funksiyadan istifadə olunur: xətti və qeyri-xətti.

Xətti funksiya belə bir əlaqə şəklində təsvir edilmişdir: y \u003d a 0 + a 1 x 1 + a 2 x 2, + ... + a m x m. Bu halda a2, a m , “saf” reqressiyanın əmsalları hesab edilir. Onlar y parametrinin orta dəyişməsini hər bir müvafiq x parametrində bir vahid dəyişməsi (azalması və ya artması) ilə, digər göstəricilərin sabit qiyməti şərti ilə xarakterizə etmək üçün lazımdır.

Qeyri-xətti tənliklər, məsələn, güc funksiyasının formasına malikdir y=ax 1 b1 x 2 b2 ...x m bm . Bu halda b 1, b 2 ..... b m - göstəriciləri elastiklik əmsalları adlanır, onlar müvafiq göstərici x-də 1% artım (azalma) ilə nəticənin necə dəyişəcəyini (nə qədər%) nümayiş etdirirlər. və digər amillərin sabit göstəricisi ilə.

Çoxsaylı reqressiya qurarkən hansı amillər nəzərə alınmalıdır

Çoxsaylı reqressiyanın düzgün qurulması üçün hansı amillərə xüsusi diqqət yetirilməli olduğunu tapmaq lazımdır.

İqtisadi amillərlə modelləşdirilənlər arasındakı əlaqənin mahiyyətini müəyyən qədər dərk etmək lazımdır. Daxil ediləcək amillər aşağıdakı meyarlara cavab verməlidir:

  • Ölçülə bilən olmalıdır. Obyektin keyfiyyətini xarakterizə edən amildən istifadə etmək üçün istənilən halda ona kəmiyyət forması verilməlidir.
  • Heç bir amil qarşılıqlı əlaqəsi və ya funksional əlaqəsi olmamalıdır. Bu cür hərəkətlər çox vaxt geri dönməz nəticələrə səbəb olur - adi tənliklər sistemi şərtsiz olur və bu, onun etibarsızlığına və qeyri-səlis qiymətləndirmələrinə səbəb olur.
  • Böyük bir korrelyasiya göstəricisi halında, göstəricinin son nəticəsinə amillərin təcrid olunmuş təsirini tapmaq üçün heç bir yol yoxdur, buna görə də əmsallar şərh olunmaz olur.

Tikinti üsulları

Tənlik üçün amilləri necə seçə biləcəyinizi izah etmək üçün çox sayda üsul və üsul var. Lakin bütün bu üsullar korrelyasiya indeksindən istifadə edərək əmsalların seçilməsinə əsaslanır. Onların arasında:

  • İstisna üsulu.
  • Metodunu yandırın.
  • Addım-addım reqressiya təhlili.

Birinci üsul məcmu dəstdən bütün əmsalların süzülməsini nəzərdə tutur. İkinci üsul bir çox əlavə amillərin tətbiqini nəzərdə tutur. Yaxşı, üçüncüsü, əvvəllər tənliyə tətbiq olunan amillərin aradan qaldırılmasıdır. Bu üsulların hər birinin mövcud olmaq hüququ var. Onların müsbət və mənfi cəhətləri var, lakin lazımsız göstəricilərin yoxlanılması məsələsini öz yolları ilə həll edə bilərlər. Bir qayda olaraq, hər bir fərdi üsulla əldə edilən nəticələr olduqca yaxındır.

Çoxvariantlı analiz üsulları

Faktorların müəyyən edilməsi üçün bu cür üsullar bir-biri ilə əlaqəli xüsusiyyətlərin fərdi birləşmələrinin nəzərə alınmasına əsaslanır. Bunlara diskriminant təhlili, nümunənin tanınması, əsas komponent təhlili və klaster təhlili daxildir. Bundan əlavə, faktor təhlili də mövcuddur, lakin bu, komponent metodunun inkişafı nəticəsində ortaya çıxdı. Onların hamısı müəyyən şəraitdə, müəyyən şərtlərdə və amillərdə tətbiq edilir.

Reqressiya təhlili tədqiq olunan əlamətlər arasında stoxastik əlaqənin analitik ifadəsinin qurulması üsuludur. Reqressiya tənliyi orta hesabla necə dəyişdiyini göstərir saat hər hansı birini dəyişdirərkən x i , və belə görünür:

Harada y - asılı dəyişən (həmişə birdir);

X i - müstəqil dəyişənlər (amillər) (onlardan bir neçəsi ola bilər).

Yalnız bir müstəqil dəyişən varsa, bu sadə reqressiya analizidir. Bir neçə varsa P 2), onda belə analiz çoxvariantlı adlanır.

Reqressiya təhlili zamanı iki əsas vəzifə həll olunur:

    reqressiya tənliyinin qurulması, yəni. nəticə göstəricisi ilə müstəqil amillər arasında əlaqə növünün tapılması x 1 , x 2 , …, x n .

    nəticədə yaranan tənliyin əhəmiyyətinin qiymətləndirilməsi, yəni. seçilmiş amil xüsusiyyətlərinin xüsusiyyətin dəyişməsini nə dərəcədə izah etdiyini müəyyən etmək y.

Reqressiya təhlili əsasən planlaşdırma, eləcə də normativ bazanın işlənib hazırlanması üçün istifadə olunur.

Yalnız təhlil edilən əlamətlər arasında əlaqənin olub-olmaması sualına cavab verən korrelyasiya təhlilindən fərqli olaraq reqressiya təhlili həm də özünün rəsmi ifadəsini verir. Bundan əlavə, korrelyasiya təhlili amillərin hər hansı əlaqəsini öyrənirsə, reqressiya təhlili birtərəfli asılılığı öyrənir, yəni. faktor işarələrindəki dəyişikliyin nəticə işarəsinə necə təsir etdiyini göstərən əlaqə.

Reqressiya təhlili riyazi statistikanın ən inkişaf etmiş üsullarından biridir. Düzünü desək, reqressiya təhlilinin həyata keçirilməsi bir sıra xüsusi tələblərin yerinə yetirilməsini tələb edir (xüsusən, x l ,x 2 ,...,x n ;y sabit dispersiyaya malik müstəqil, normal paylanmış təsadüfi dəyişənlər olmalıdır). IN həqiqi həyat reqressiya və korrelyasiya təhlilinin tələblərinə ciddi riayət olunması çox nadir hallarda baş verir, lakin bu metodların hər ikisi iqtisadi tədqiqatlarda çox geniş yayılmışdır. İqtisadiyyatda asılılıqlar təkcə birbaşa deyil, həm də tərs və qeyri-xətti ola bilər. Hər hansı bir asılılıq olduqda reqressiya modeli qurula bilər, lakin çoxdəyişənli analizdə yalnız formanın xətti modellərindən istifadə olunur:

Reqressiya tənliyinin qurulması, bir qayda olaraq, ən kiçik kvadratlar metodu ilə həyata keçirilir, onun mahiyyəti əldə edilən atributun faktiki dəyərlərinin kvadratik sapmalarının cəmini hesablanmış dəyərlərindən minimuma endirməkdir, yəni:

Harada T - müşahidələrin sayı;

j =a+b 1 x 1 j +b 2 x 2 j + ... + b n X n j - nəticə faktorunun hesablanmış dəyəri.

Reqressiya əmsallarını fərdi kompüter və ya xüsusi maliyyə kalkulyatoru üçün analitik paketlərdən istifadə etməklə müəyyən etmək tövsiyə olunur. Ən sadə halda birdəyişənli reqressiya əmsalları xətti tənlik tip reqressiya y = a + bx düsturlardan istifadə etməklə tapmaq olar:

klaster analizi

Klaster analizi çoxdəyişənli analiz üsullarından biridir, elementləri bir çox xüsusiyyətləri ilə xarakterizə olunan populyasiyanın qruplaşdırılması (klasterləşdirilməsi) üçün nəzərdə tutulmuşdur. Xüsusiyyətlərin hər birinin dəyərləri xüsusiyyətlərin çoxölçülü məkanında öyrənilən əhalinin hər bir vahidinin koordinatları kimi xidmət edir. Bir neçə göstəricinin dəyərləri ilə xarakterizə olunan hər bir müşahidə bu göstəricilərin məkanında bir nöqtə kimi təqdim edilə bilər, dəyərləri çoxölçülü məkanda koordinatlar kimi qəbul edilir. Nöqtələr arasındakı məsafə Rq ilə k koordinatları aşağıdakı kimi müəyyən edilir:

Klasterləşmənin əsas meyarı ondan ibarətdir ki, klasterlər arasındakı fərqlər eyni klasterə təyin edilmiş müşahidələr arasındakı fərqlərdən daha əhəmiyyətli olmalıdır, yəni. çoxölçülü fəzada bərabərsizlik müşahidə edilməlidir:

Harada r 1, 2 - 1 və 2 qruplar arasındakı məsafə.

Reqressiya təhlili prosedurları kimi, klasterləşdirmə proseduru da kifayət qədər zəhmətlidir, onu kompüterdə yerinə yetirmək məqsədəuyğundur.

Reqressiya təhlilinin əsas məqsədi nəticə atributunun dəyişməsinin bir və ya bir neçə amil əlamətinin təsiri nəticəsində baş verdiyi münasibətin analitik formasının müəyyən edilməsindən ibarətdir və sabit və orta qiymətlər kimi nəticələnən xüsusiyyətə də təsir edən bütün digər amillərin məcmusu qəbul edilir. .
Reqressiya təhlilinin vəzifələri:
a) Asılılıq formasının müəyyən edilməsi. Hadisələr arasındakı əlaqənin xarakterinə və formasına gəldikdə, müsbət xətti və qeyri-xətti və mənfi xətti və qeyri-xətti reqressiya fərqlənir.
b) Bu və ya digər tipli riyazi tənlik şəklində reqressiya funksiyasının təyini və izahlı dəyişənlərin asılı dəyişənə təsirinin qurulması.
c) Asılı dəyişənin naməlum qiymətlərinin qiymətləndirilməsi. Reqressiya funksiyasından istifadə edərək, izahlı dəyişənlərin verilmiş dəyərləri intervalında asılı dəyişənin dəyərlərini təkrar edə bilərsiniz (yəni, interpolyasiya problemini həll edin) və ya müəyyən edilmiş intervaldan kənarda prosesin gedişatını qiymətləndirə bilərsiniz (yəni, ekstrapolyasiya problemini həll edin). Nəticə asılı dəyişənin dəyərinin qiymətləndirilməsidir.

Cüt reqressiya - iki y və x dəyişəninin əlaqə tənliyi: y=f(x), burada y asılı dəyişəndir (nəticə işarəsi); x - müstəqil, izahlı dəyişən (xüsusiyyət-amil).

Xətti və qeyri-xətti reqressiyalar var.
Xətti reqressiya: y = a + bx + ε
Qeyri-xətti reqressiyalar iki sinfə bölünür: təhlilə daxil edilmiş izahlı dəyişənlərə görə qeyri-xətti, lakin təxmin edilən parametrlərə görə xətti olmayan reqressiyalar və təxmin edilən parametrlərə görə qeyri-xətti olan reqressiyalar.
İzahedici dəyişənlərdə qeyri-xətti olan reqressiyalar:

Təxmin edilən parametrlərdə qeyri-xətti olan reqressiyalar:

  • güc y=a x b ε
  • eksponensial y=a b x ε
  • eksponensial y=e a+b x ε
Reqressiya tənliyinin qurulması onun parametrlərinin qiymətləndirilməsinə qədər azaldılır. Parametrlərdə xətti olan reqressiyaların parametrlərini qiymətləndirmək üçün ən kiçik kvadratlar metodundan (LSM) istifadə olunur. LSM, y x nəzəri dəyərlərindən effektiv xüsusiyyətin y faktiki dəyərlərinin kvadratik sapmalarının cəminin minimal olduğu parametrlərin belə təxminlərini əldə etməyə imkan verir, yəni.
.
Xətti və qeyri-xətti tənliklər üçün a və b üçün aşağıdakı sistem həll edilir:

Bu sistemdən gələn hazır düsturlardan istifadə edə bilərsiniz:

Öyrənilən hadisələr arasında əlaqənin yaxınlığı xətti reqressiya üçün r xy xətti cüt korrelyasiya əmsalı ilə qiymətləndirilir (-1≤r xy ≤1):

və korrelyasiya indeksi p xy - qeyri-xətti reqressiya üçün (0≤p xy ≤1):

Qurulmuş modelin keyfiyyətinin qiymətləndirilməsi təyinetmə əmsalı (indeksi), həmçinin orta yaxınlaşma xətası ilə veriləcəkdir.
Orta yaxınlaşma xətası hesablanmış dəyərlərin faktiki olanlardan orta sapmasıdır:
.
A dəyərlərinin icazə verilən həddi - 8-10% -dən çox deyil.
Orta elastiklik əmsalı E y nəticəsinin məcmuda orta hesabla neçə faiz dəyişəcəyini göstərir. orta ölçü x əmsalı orta qiymətindən 1% dəyişdikdə:
.

Dispersiya təhlilinin vəzifəsi asılı dəyişənin dispersiyasını təhlil etməkdir:
∑(y-y )²=∑(y x -y )²+∑(y-y x)²
burada ∑(y-y)² kvadrat sapmaların ümumi cəmidir;
∑(y x -y)² - reqressiya ("izah edilən" və ya "faktorial") ilə əlaqədar kvadratik kənarlaşmaların cəmi;
∑(y-y x)² - kvadrat sapmaların qalıq cəmi.
Reqressiya ilə izah olunan dispersiyanın y effektiv xüsusiyyətinin ümumi dispersiyasında payı R2 təyini əmsalı (indeksi) ilə xarakterizə olunur:

Determinasiya əmsalı əmsalın və ya korrelyasiya indeksinin kvadratıdır.

F-testi - reqressiya tənliyinin keyfiyyətinin qiymətləndirilməsi - fərziyyənin yoxlanılmasından ibarətdir Lakin reqressiya tənliyinin statistik əhəmiyyətsizliyi və əlaqənin yaxınlıq göstəricisi haqqında. Bunun üçün faktiki F faktının və Fisher F-meyarının dəyərlərinin kritik (cədvəl) F cədvəlinin müqayisəsi aparılır. F faktı bir sərbəstlik dərəcəsi üçün hesablanmış faktorial və qalıq dispersiyaların qiymətlərinin nisbətindən müəyyən edilir:
,
burada n - əhali vahidlərinin sayı; m, x dəyişənləri üçün parametrlərin sayıdır.
F cədvəli verilmiş sərbəstlik dərəcələri və a əhəmiyyətlilik səviyyəsi üçün təsadüfi amillərin təsiri altında meyarın mümkün olan maksimum qiymətidir. Əhəmiyyət səviyyəsi a - doğru olması şərtilə düzgün fərziyyənin rədd edilməsi ehtimalı. Adətən a 0,05 və ya 0,01-ə bərabər alınır.
Əgər F cədvəli< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >F faktdır, onda H haqqında fərziyyə rədd edilmir və reqressiya tənliyinin statistik əhəmiyyətsizliyi, etibarsızlığı tanınır.
Reqressiya və korrelyasiya əmsallarının statistik əhəmiyyətini qiymətləndirmək üçün hər bir göstərici üçün Student t-testi və inam intervalları hesablanır. Göstəricilərin təsadüfi təbiəti haqqında H hipotezi irəli sürülür, yəni. onların sıfırdan əhəmiyyətsiz fərqi haqqında. Tələbənin t-testindən istifadə edərək reqressiya və korrelyasiya əmsallarının əhəmiyyətinin qiymətləndirilməsi onların dəyərlərini təsadüfi səhvin böyüklüyü ilə müqayisə etməklə həyata keçirilir:
; ; .
Xətti reqressiya parametrlərinin və korrelyasiya əmsalının təsadüfi səhvləri düsturlarla müəyyən edilir:



T-statistikanın faktiki və kritik (cədvəl) dəyərlərini - t tabl və t faktını müqayisə edərək, H o hipotezini qəbul edirik və ya rədd edirik.
Fişerin F-testi ilə Tələbənin t-statistikası arasındakı əlaqə bərabərliklə ifadə edilir

Əgər t cədvəli< t факт то H o отклоняется, т.е. a , b и r xy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >t haqqında H hipotezinin rədd edilməməsi və a, b və ya r xy-nin əmələ gəlməsinin təsadüfi xarakterinin tanınması.
Etibar intervalını hesablamaq üçün hər bir göstərici üçün marjinal D səhvini təyin edirik:
Δ a =t cədvəli m a , Δ b =t cədvəli m b .
Etibar intervallarının hesablanması üçün düsturlar aşağıdakılardır:
γ a \u003d aΔ a; γ a \u003d a-Δ a; γ a =a+Δa
γ b = bΔ b ; γ b = b-Δ b ; γb =b+Δb
Sıfır etimad intervalının hüdudlarına düşürsə, yəni. Aşağı hədd mənfi və yuxarı həddi müsbətdirsə, təxmin edilən parametr eyni vaxtda həm müsbət, həm də mənfi dəyərləri qəbul edə bilmədiyi üçün sıfır hesab olunur.
Proqnoz dəyəri y p müvafiq (proqnozlaşdırılan) dəyəri x p reqressiya tənliyinə y x =a+b·x əvəz etməklə müəyyən edilir. Proqnozun orta standart xətası m y x hesablanır:
,
Harada
və proqnozun etibarlılıq intervalı qurulur:
γ y x =y p Δ y p ; γ y x min=y p -Δ y p ; γ y x max=y p +Δ y p
burada Δ y x =t cədvəli ·m y x .

Həll nümunəsi

Tapşırıq nömrəsi 1. Ural bölgəsinin yeddi ərazisi üçün 199X üçün iki işarənin dəyəri məlumdur.
Cədvəl 1.

Tələb olunur: 1. y-nin x-dən asılılığını xarakterizə etmək üçün aşağıdakı funksiyaların parametrlərini hesablayın:
a) xətti;
b) güc qanunu (əvvəllər hər iki hissənin loqarifmini götürməklə dəyişənlərin xəttiləşdirilməsi prosedurunu yerinə yetirmək lazımdır);
c) nümayiş etdirici;
d) bərabərtərəfli hiperbola (həmçinin bu modeli necə əvvəlcədən xəttiləşdirməyi başa düşməlisiniz).
2. Hər bir modeli orta yaxınlaşma xətası A və Fişerin F-testi vasitəsilə qiymətləndirin.

Həll (Variant №1)

Xətti reqressiyanın a və b parametrlərini hesablamaq üçün y=a+b·x (hesablama kalkulyatordan istifadə etməklə aparıla bilər).
ilə bağlı normal tənliklər sistemini həll edin Ab:
İlkin məlumatlara əsasən ∑y, ∑x, ∑y x, ∑x², ∑y² hesablayırıq:
y x yx x2 y2 y xy-y xAi
l68,8 45,1 3102,88 2034,01 4733,44 61,3 7,5 10,9
2 61,2 59,0 3610,80 3481,00 3745,44 56,5 4,7 7,7
3 59,9 57,2 3426,28 3271,84 3588,01 57,1 2,8 4,7
4 56,7 61,8 3504,06 3819,24 3214,89 55,5 1,2 2,1
5 55,0 58,8 3234,00 3457,44 3025,00 56,5 -1,5 2,7
6 54,3 47,2 2562,96 2227,84 2948,49 60,5 -6,2 11,4
7 49,3 55,2 2721,36 3047,04 2430,49 57,8 -8,5 17,2
Ümumi405,2 384,3 22162,34 21338,41 23685,76 405,2 0,0 56,7
Çərşənbə dəyər (Cəmi/n)57,89
y
54,90
x
3166,05
x y
3048,34
3383,68
XX8,1
s 5,74 5,86 XXXXXX
s232,92 34,34 XXXXXX


a=y -b x = 57,89+0,35 54,9 ≈ 76,88

Reqressiya tənliyi: y= 76,88 - 0,35X. Orta gündəlik əmək haqqının 1 rubl artması ilə. ərzaq məhsullarının alınmasına çəkilən xərclərin payı orta hesabla 0,35% bənd azalır.
Cüt korrelyasiyanın xətti əmsalını hesablayın:

Ünsiyyət orta səviyyədədir, tərsdir.
Determinasiya əmsalını təyin edək: r² xy =(-0,35)=0,127
Nəticənin 12,7% dəyişməsi x faktorunun dəyişməsi ilə izah olunur. Həqiqi dəyərləri reqressiya tənliyinə əvəz etmək X, y x-in nəzəri (hesablanmış) qiymətlərini təyin edirik. Orta yaxınlaşma xətasının qiymətini tapaq A:

Orta hesabla hesablanmış dəyərlər faktiki olanlardan 8,1% kənara çıxır.
F kriteriyasını hesablayaq:

Alınan dəyər aşkar edilmiş asılılığın təsadüfi təbiəti və tənliyin parametrlərinin statistik əhəmiyyətsizliyi və əlaqənin sıxlığının göstəricisi haqqında H 0 hipotezinin qəbul edilməsinin zəruriliyini göstərir.
1b. y=a x b güc modelinin qurulmasından əvvəl dəyişənlərin xəttiləşdirilməsi proseduru aparılır. Nümunədə xəttiləşdirmə tənliyin hər iki tərəfinin loqarifmini götürməklə həyata keçirilir:
lg y=lg a + b lg x
Y=C+b Y
burada Y=lg(y), X=lg(x), C=lg(a).

Hesablamalar üçün Cədvəldəki məlumatlardan istifadə edirik. 1.3.
Cədvəl 1.3

YX YX Y2 x2 y xy-y x(y-yx)²Ai
1 1,8376 1,6542 3,0398 3,3768 2,7364 61,0 7,8 60,8 11,3
2 1,7868 1,7709 3,1642 3,1927 3,1361 56,3 4,9 24,0 8,0
3 1,7774 1,7574 3,1236 3,1592 3,0885 56,8 3,1 9,6 5,2
4 1,7536 1,7910 3,1407 3,0751 3,2077 55,5 1,2 1,4 2,1
5 1,7404 1,7694 3,0795 3,0290 3,1308 56,3 -1,3 1,7 2,4
6 1,7348 1,6739 2,9039 3,0095 2,8019 60,2 -5,9 34,8 10,9
7 1,6928 1,7419 2,9487 2,8656 3,0342 57,4 -8,1 65,6 16,4
Ümumi12,3234 12,1587 21,4003 21,7078 21,1355 403,5 1,7 197,9 56,3
Orta dəyər1,7605 1,7370 3,0572 3,1011 3,0194 XX28,27 8,0
σ 0,0425 0,0484 XXXXXXX
σ20,0018 0,0023 XXXXXXX

C və b hesablayın:

C=Y -b X = 1,7605+0,298 1,7370 = 2,278126
Xətti tənlik alırıq: Y=2,278-0,298 X
Onu gücləndirdikdən sonra alırıq: y=10 2.278 x -0.298
Bu tənlikdə faktiki dəyərləri əvəz etməklə X, nəticənin nəzəri dəyərlərini alırıq. Onlara əsasən, biz göstəriciləri hesablayırıq: əlaqənin sıxlığı - korrelyasiya indeksi p xy və orta yaxınlaşma xətası A .

Güc modelinin xüsusiyyətləri onun əlaqəni xətti funksiyadan bir qədər yaxşı təsvir etdiyini göstərir.

1c. y \u003d a b x eksponensial əyri tənliyinin qurulmasından əvvəl tənliyin hər iki hissəsinin loqarifmini götürərkən dəyişənlərin xəttiləşdirilməsi proseduru aparılır:
lg y=lg a + x lg b
Y=C+B x
Hesablamalar üçün cədvəl məlumatlarından istifadə edirik.

Yx Yx Y2 x2y xy-y x(y-yx)²Ai
1 1,8376 45,1 82,8758 3,3768 2034,01 60,7 8,1 65,61 11,8
2 1,7868 59,0 105,4212 3,1927 3481,00 56,4 4,8 23,04 7,8
3 1,7774 57,2 101,6673 3,1592 3271,84 56,9 3,0 9,00 5,0
4 1,7536 61,8 108,3725 3,0751 3819,24 55,5 1,2 1,44 2,1
5 1,7404 58,8 102,3355 3,0290 3457,44 56,4 -1,4 1,96 2,5
6 1,7348 47,2 81,8826 3,0095 2227,84 60,0 -5,7 32,49 10,5
7 1,6928 55,2 93,4426 2,8656 3047,04 57,5 -8,2 67,24 16,6
Ümumi12,3234 384,3 675,9974 21,7078 21338,41 403,4 -1,8 200,78 56,3
Çərşənbə zn.1,7605 54,9 96,5711 3,1011 3048,34 XX28,68 8,0
σ 0,0425 5,86 XXXXXXX
σ20,0018 34,339 XXXXXXX

A və reqressiya parametrlərinin dəyərləri IN təşkil edib:

A=Y -B x = 1,7605+0,0023 54,9 = 1,887
Xətti tənlik alınır: Y=1,887-0,0023x. Yaranan tənliyi gücləndirib adi formada yazırıq:
y x =10 1,887 10 -0,0023x = 77,1 0,9947 x
Əlaqənin sıxlığını p xy korrelyasiya indeksi ilə qiymətləndiririk:

3588,01 56,9 3,0 9,00 5,0 4 56,7 0,0162 0,9175 0,000262 3214,89 55,5 1,2 1,44 2,1 5 55 0,0170 0,9354 0,000289 3025,00 56,4 -1,4 1,96 2,5 6 54,3 0,0212 1,1504 0,000449 2948,49 60,8 -6,5 42,25 12,0 7 49,3 0,0181 0,8931 0,000328 2430,49 57,5 -8,2 67,24 16,6 Ümumi405,2 0,1291 7,5064 0,002413 23685,76 405,2 0,0 194,90 56,5 Orta dəyər57,9 0,0184 1,0723 0,000345 3383,68 XX27,84 8,1 σ 5,74 0,002145 XXXXXXX σ232,9476 0,000005 XX

Reqressiya təhlili bir parametrin bir və ya bir neçə müstəqil dəyişəndən asılılığını göstərməyə imkan verən statistik tədqiqat üsuludur. Kompüterdən əvvəlki dövrdə onun istifadəsi, xüsusən də böyük həcmli məlumatlara gəldikdə, olduqca çətin idi. Bu gün Excel-də reqressiya qurmağı öyrənərək, bir neçə dəqiqə ərzində mürəkkəb statistik problemləri həll edə bilərsiniz. Aşağıda konkret misallar iqtisadiyyat sahəsindən.

Reqressiya növləri

Bu konsepsiyanın özü riyaziyyata 1886-cı ildə daxil edilmişdir. Reqressiya baş verir:

  • xətti;
  • parabolik;
  • güc;
  • eksponensial;
  • hiperbolik;
  • nümayişkaranə;
  • loqarifmik.

Misal 1

6 sənaye müəssisəsində təqaüdə çıxmış komanda üzvlərinin sayının orta əmək haqqından asılılığının müəyyən edilməsi problemini nəzərdən keçirək.

Tapşırıq. Altı müəssisədə biz orta aylıq əmək haqqını və öz istəyi ilə işdən çıxan işçilərin sayını təhlil etdik. Cədvəl şəklində bizdə:

Gedənlərin sayı

Maaş

30 000 rubl

35000 rubl

40 000 rubl

45000 rubl

50000 rubl

55000 rubl

60 000 rubl

6 müəssisədə pensiyaya çıxan işçilərin sayının orta əməkhaqqından asılılığının müəyyən edilməsi problemi üçün reqressiya modeli Y = a 0 + a 1 x 1 +…+a k x k tənliyi formasına malikdir, burada x i təsir edən dəyişənlərdir. , a i reqressiya əmsalları, a k faktorların sayıdır.

Bu tapşırıq üçün Y işdən çıxan işçilərin göstəricisidir, təsir edən amil isə X ilə işarə etdiyimiz əmək haqqıdır.

"Excel" elektron cədvəlinin imkanlarından istifadə

Excel-də reqressiya təhlilindən əvvəl mövcud cədvəl məlumatlarına daxili funksiyaların tətbiqi aparılmalıdır. Bununla belə, bu məqsədlər üçün çox faydalı "Analiz Alətlər dəsti" əlavəsindən istifadə etmək daha yaxşıdır. Onu aktivləşdirmək üçün sizə lazımdır:

  • "Fayl" sekmesinden "Seçimlər" bölməsinə keçin;
  • açılan pəncərədə "Əlavələr" sətrini seçin;
  • "İdarəetmə" xəttinin sağında, altındakı "Get" düyməsini basın;
  • "Analiz Paketi" adının yanındakı qutuyu işarələyin və "OK" düyməsini basaraq hərəkətlərinizi təsdiqləyin.

Hər şey düzgün aparılırsa, Excel iş vərəqinin yuxarısında yerləşən Məlumatlar sekmesinin sağ tərəfində istədiyiniz düymə görünəcək.

Excel-də

Ekonometrik hesablamalar aparmaq üçün bütün lazımi virtual alətlərə malik olduğumuz üçün problemimizi həll etməyə başlaya bilərik. Bunun üçün:

  • "Məlumatların təhlili" düyməsini basın;
  • açılan pəncərədə "Reqressiya" düyməsini sıxın;
  • görünən sekmədə Y (işdən çıxan işçilərin sayı) və X (onların maaşları) üçün dəyərlər diapazonunu daxil edin;
  • "Ok" düyməsini basaraq hərəkətlərimizi təsdiq edirik.

Nəticədə, proqram avtomatik olaraq yeni vərəq dolduracaq cədvəl prosessoru reqressiya təhlili məlumatları. Qeyd! Excel bu məqsədlə istədiyiniz yeri əl ilə təyin etmək imkanına malikdir. Məsələn, Y və X dəyərlərinin olduğu eyni vərəq ola bilər və ya hətta Yeni kitab, bu cür məlumatların saxlanması üçün xüsusi olaraq hazırlanmışdır.

R-kvadrat üçün reqressiya nəticələrinin təhlili

Excel-də nəzərdən keçirilən nümunənin məlumatlarının emalı zamanı əldə edilən məlumatlar belə görünür:

İlk növbədə, R-kvadratının dəyərinə diqqət yetirməlisiniz. Bu təyinetmə əmsalıdır. Bu nümunədə R-kvadrat = 0,755 (75,5%), yəni modelin hesablanmış parametrləri nəzərdən keçirilən parametrlər arasındakı əlaqəni 75,5% izah edir. Təyinetmə əmsalının dəyəri nə qədər yüksək olarsa, müəyyən bir tapşırıq üçün seçilmiş model bir o qədər tətbiq oluna bilər. 0,8-dən yuxarı R-kvadrat dəyəri ilə real vəziyyəti düzgün təsvir etdiyinə inanılır. R kvadratı varsa<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Nisbətlərin təhlili

64.1428 rəqəmi, nəzərdən keçirdiyimiz modeldəki bütün xi dəyişənləri sıfıra təyin olunarsa, Y-nin dəyərinin nə olacağını göstərir. Başqa sözlə, təhlil edilən parametrin dəyərinə müəyyən bir modeldə təsvir olunmayan digər amillərin də təsir etdiyini iddia etmək olar.

B18 xanasında yerləşən növbəti əmsal -0,16285, X dəyişəninin Y-yə təsirinin çəkisini göstərir. Bu o deməkdir ki, nəzərdən keçirilən model daxilində işçilərin orta aylıq əmək haqqı -0,16285 çəkisi ilə işdən çıxanların sayına təsir edir, yəni. təsirinin dərəcəsi ümumiyyətlə kiçikdir. "-" işarəsi əmsalın mənfi qiymətə malik olduğunu göstərir. Bu, göz qabağındadır, çünki hamı bilir ki, müəssisədə əmək haqqı nə qədər yüksək olsa, əmək müqaviləsini ləğv etmək və ya işdən çıxmaq arzusu bir o qədər az olur.

Çoxsaylı reqressiya

Bu termin formanın bir neçə müstəqil dəyişəni ilə əlaqə tənliyinə istinad edir:

y \u003d f (x 1 + x 2 + ... x m) + ε, burada y effektiv xüsusiyyətdir (asılı dəyişən) və x 1 , x 2 , ... x m faktor amilləridir (müstəqil dəyişənlər).

Parametrlərin qiymətləndirilməsi

Çoxsaylı reqressiya (MR) üçün ən kiçik kvadratlar (OLS) metodundan istifadə etməklə həyata keçirilir. Y = a + b 1 x 1 +…+b m x m + ε formalı xətti tənliklər üçün normal tənliklər sistemi qururuq (aşağıya bax)

Metodun prinsipini başa düşmək üçün iki faktorlu işi nəzərdən keçirin. Sonra düsturla təsvir olunan bir vəziyyətimiz var

Buradan əldə edirik:

burada σ indeksdə əks olunan müvafiq əlamətin dispersiyasıdır.

LSM standartlaşdırıla bilən miqyasda MP tənliyinə tətbiq olunur. Bu vəziyyətdə tənliyi alırıq:

burada t y , t x 1, … t xm orta dəyərləri 0 olan standartlaşdırılmış dəyişənlərdir; β i standartlaşdırılmış reqressiya əmsallarıdır, standart kənarlaşma isə 1-dir.

Nəzərə alın ki, bu vəziyyətdə bütün β i normallaşdırılmış və mərkəzləşdirilmiş olaraq təyin edilmişdir, buna görə də onların bir-biri ilə müqayisəsi düzgün və məqbul hesab olunur. Bundan əlavə, ən kiçik βi dəyərləri olanları ataraq amilləri süzmək adətdir.

Xətti reqressiya tənliyindən istifadə problemi

Tutaq ki, son 8 ay ərzində konkret N məhsulunun qiymət dinamikasının cədvəli var. Onun partiyasını 1850 rubl/t qiymətində satın almağın məqsədəuyğunluğu barədə qərar qəbul etmək lazımdır.

ay nömrəsi

ay adı

N malın qiyməti

ton başına 1750 rubl

Ton üçün 1755 rubl

Ton üçün 1767 rubl

Ton üçün 1760 rubl

Ton üçün 1770 rubl

Ton üçün 1790 rubl

Ton üçün 1810 rubl

Ton üçün 1840 rubl

Excel cədvəlində bu problemi həll etmək üçün yuxarıdakı misaldan məlum olan Məlumatların Təhlili alətindən istifadə etməlisiniz. Sonra, "Reqressiya" bölməsini seçin və parametrləri təyin edin. Yadda saxlamaq lazımdır ki, "Giriş intervalı Y" sahəsində asılı dəyişən üçün bir sıra dəyərlər (bu halda ilin müəyyən aylarında məhsulun qiyməti) daxil edilməlidir və "Giriş" bölməsinə interval X" - müstəqil dəyişən üçün (ay nömrəsi). "Ok" düyməsini basaraq hərəkəti təsdiqləyin. Yeni vərəqdə (əgər belə göstərilibsə) reqressiya üçün məlumat alırıq.

Onlara əsaslanaraq y=ax+b formalı xətti tənlik qururuq, burada a və b parametrləri ayın nömrəsinin adı və əmsalları olan sətirin əmsalları və “Y-kəsişməsi” sətirindən reqressiya təhlilinin nəticələri ilə vərəq. Beləliklə, 3-cü məsələ üçün xətti reqressiya tənliyi (LE) aşağıdakı kimi yazılır:

Məhsulun qiyməti N = 11.714* ay nömrəsi + 1727.54.

və ya cəbri qeydlərdə

y = 11,714 x + 1727,54

Nəticələrin təhlili

Yaranan xətti reqressiya tənliyinin adekvat olub-olmamasına qərar vermək üçün çoxlu korrelyasiya əmsalları (MCC) və təyinetmə əmsallarından, həmçinin Fisher testindən və Student testindən istifadə olunur. Reqressiya nəticələri ilə Excel cədvəlində onlar müvafiq olaraq çoxlu R, R-kvadrat, F-statistik və t-statistik adlar altında görünür.

KMC R müstəqil və asılı dəyişənlər arasında ehtimal əlaqəsinin sıxlığını qiymətləndirməyə imkan verir. Onun yüksək dəyəri “Ayın sayı” və “1 ton üçün rublla N malın qiyməti” dəyişənləri arasında kifayət qədər güclü əlaqə olduğunu göstərir. Ancaq bu əlaqənin mahiyyəti naməlum olaraq qalır.

R 2 (RI) təyin əmsalının kvadratı ümumi səpilmə payının ədədi xarakteristikasıdır və eksperimental məlumatların hansı hissəsinin səpələnməsini göstərir, yəni. asılı dəyişənin dəyərləri xətti reqressiya tənliyinə uyğundur. Baxılan problemdə bu qiymət 84,8%-ə bərabərdir, yəni statistik məlumatlar əldə edilmiş ŞD ilə yüksək dəqiqliklə təsvir edilmişdir.

F-statistika, həmçinin Fişer testi adlanır, xətti əlaqənin əhəmiyyətini qiymətləndirmək, onun mövcudluğu ilə bağlı fərziyyəni təkzib etmək və ya təsdiqləmək üçün istifadə olunur.

(Tələbə meyarı) xətti əlaqənin naməlum və ya sərbəst müddəti ilə əmsalın əhəmiyyətini qiymətləndirməyə kömək edir. Əgər t-kriteriyasının qiyməti > t cr olarsa, onda xətti tənliyin sərbəst müddətinin əhəmiyyətsizliyi fərziyyəsi rədd edilir.

Sərbəst üzv üçün nəzərdən keçirilən problemdə Excel alətlərindən istifadə edərək, t = 169.20903 və p = 2.89E-12 olduğu, yəni azad üzvün əhəmiyyətsizliyi ilə bağlı düzgün fərziyyənin olacağına sıfır ehtimalımız var. rədd edildi. Naməlum əmsal üçün t=5,79405, və p=0,001158. Başqa sözlə, naməlum üçün əmsalın əhəmiyyətsizliyi haqqında düzgün fərziyyənin rədd edilmə ehtimalı 0,12% təşkil edir.

Beləliklə, ortaya çıxan xətti reqressiya tənliyinin adekvat olduğunu iddia etmək olar.

Səhmlər blokunun alınmasının məqsədəuyğunluğu problemi

Excel-də çoxlu reqressiya eyni Məlumat Təhlili alətindən istifadə etməklə həyata keçirilir. Xüsusi tətbiq olunan problemi nəzərdən keçirin.

NNN rəhbərliyi MMM SA-da 20% payın alınmasının məqsədəuyğunluğu barədə qərar qəbul etməlidir. Paketin (BM) dəyəri 70 milyon ABŞ dollarıdır. NNN mütəxəssisləri oxşar əməliyyatlar haqqında məlumat toplayıblar. Səhmlər blokunun dəyərinin milyonlarla ABŞ dolları ilə ifadə olunan parametrlər üzrə qiymətləndirilməsi qərara alınıb:

  • kreditor borcları (VK);
  • illik dövriyyə (VO);
  • debitor borcları (VD);
  • əsas vəsaitlərin dəyəri (SOF).

Bundan əlavə, müəssisənin əmək haqqı üzrə borcları (V3 P) minlərlə ABŞ dolları parametrindən istifadə olunur.

Excel cədvəlindən istifadə edərək həll

Əvvəlcə ilkin məlumatların cədvəlini yaratmalısınız. Bu belə görünür:

  • "Məlumatların təhlili" pəncərəsinə zəng edin;
  • "Reqressiya" bölməsini seçin;
  • "Giriş intervalı Y" xanasına G sütunundan asılı dəyişənlərin dəyərlərinin diapazonunu daxil edin;
  • "Giriş intervalı X" pəncərəsinin sağındakı qırmızı ox ilə işarəni vurun və vərəqdəki B, C, D, F sütunlarından bütün dəyərlərin diapazonunu seçin.

"Yeni iş səhifəsi" seçin və "Ok" düyməsini basın.

Verilmiş problem üçün reqressiya analizini əldə edin.

Nəticələrin və nəticələrin yoxlanılması

Excel cədvəl vərəqində yuxarıda göstərilən dairəvi məlumatlardan reqressiya tənliyini “toplayırıq”:

SP \u003d 0,103 * SOF + 0,541 * VO - 0,031 * VK + 0,405 * VD + 0,691 * VZP - 265,844.

Daha tanış olan riyazi formada onu belə yazmaq olar:

y = 0,103*x1 + 0,541*x2 - 0,031*x3 +0,405*x4 +0,691*x5 - 265,844

"MMM" ASC üçün məlumatlar cədvəldə təqdim olunur:

Onları reqressiya tənliyi ilə əvəz etdikdə 64,72 milyon ABŞ dolları rəqəmi əldə edirlər. Bu o deməkdir ki, MMM ASC-nin səhmləri alınmamalıdır, çünki onların dəyəri 70 milyon ABŞ dolları çox şişirdilmişdir.

Gördüyünüz kimi, Excel elektron cədvəlindən və reqressiya tənliyindən istifadə çox konkret əməliyyatın mümkünlüyü ilə bağlı əsaslandırılmış qərar qəbul etməyə imkan verdi.

İndi reqressiyanın nə olduğunu bilirsiniz. Yuxarıda müzakirə edilən Excel-dəki nümunələr sizə qərar verməyə kömək edəcək. praktiki tapşırıqlar ekonometriya sahəsindən.

Dostlarınızla paylaşın və ya özünüz üçün qənaət edin:

Yüklənir...