Regressiya tenglamasi. Ko'p regressiya tenglamasi. Excelda korrelyatsiya va regressiya tahlili: bajarish ko'rsatmalari Regressiya tahlili modeliga qanday talablar qo'yiladi?

Regressiya va korrelyatsiya tahlili statistik tadqiqot usullari hisoblanadi. Bu parametrning bir yoki bir nechta mustaqil o'zgaruvchilarga bog'liqligini ko'rsatishning eng keng tarqalgan usullari.

Quyida, aniq amaliy misollardan foydalangan holda, iqtisodchilar orasida juda mashhur bo'lgan ushbu ikkita tahlilni ko'rib chiqamiz. Ularni birlashtirganda natijalarni olish misolini ham keltiramiz.

Excelda regressiya tahlili

Ba'zi qiymatlarning (mustaqil, mustaqil) qaram o'zgaruvchiga ta'sirini ko'rsatadi. Masalan, iqtisodiy faol aholi soni korxonalar soni, ish haqi va boshqa parametrlarga qanday bog'liq. Yoki: xorijiy investitsiyalar, energiya narxlari va boshqalar YaIM darajasiga qanday ta'sir qiladi.

Tahlil natijasi ustuvorliklarni ajratib ko'rsatish imkonini beradi. Va asosiy omillarga asoslanib, ustuvor yo'nalishlarni rivojlantirishni bashorat qilish, rejalashtirish va boshqaruv qarorlarini qabul qilish.

Regressiya sodir bo'ladi:

  • chiziqli (y = a + bx);
  • parabolik (y = a + bx + cx 2);
  • eksponensial (y = a * exp(bx));
  • quvvat (y = a*x^b);
  • giperbolik (y = b/x + a);
  • logarifmik (y = b * 1n(x) + a);
  • eksponentsial (y = a * b^x).

Keling, Excelda regressiya modelini yaratish va natijalarni sharhlash misolini ko'rib chiqaylik. Regressiyaning chiziqli turini olaylik.

Vazifa. 6 ta korxonada o‘rtacha oylik ish haqi va ishdan bo‘shatilgan xodimlar soni tahlil qilindi. Ishdan bo'shatilgan xodimlar sonining o'rtacha ish haqiga bog'liqligini aniqlash kerak.

Chiziqli regressiya modeli quyidagicha ko'rinadi:

Y = a 0 + a 1 x 1 +…+a k x k.

Bu erda a regressiya koeffitsientlari, x - ta'sir qiluvchi o'zgaruvchilar, k - omillar soni.

Bizning misolimizda Y - xodimlarni ishdan bo'shatish ko'rsatkichi. Ta'sir etuvchi omil - bu ish haqi (x).

Excelda chiziqli regressiya modelining parametrlarini hisoblashda yordam beradigan o'rnatilgan funktsiyalar mavjud. Ammo "Tahlil paketi" qo'shimchasi buni tezroq bajaradi.

Biz kuchli tahliliy vositani faollashtiramiz:

Faollashtirilgandan so'ng, plagin Ma'lumotlar ko'rinishida mavjud bo'ladi.

Endi regressiya tahlilining o'zini bajaramiz.



Avvalo, biz R-kvadrat va koeffitsientlarga e'tibor beramiz.

R-kvadrat - determinatsiya koeffitsienti. Bizning misolimizda - 0,755 yoki 75,5%. Bu shuni anglatadiki, modelning hisoblangan parametrlari o'rganilayotgan parametrlar orasidagi bog'liqlikning 75,5% ni tushuntiradi. Determinatsiya koeffitsienti qanchalik yuqori bo'lsa, model shunchalik yaxshi bo'ladi. Yaxshi - 0,8 dan yuqori. Yomon - 0,5 dan kam (bunday tahlilni oqilona deb hisoblash qiyin). Bizning misolimizda - "yomon emas".

64.1428 koeffitsienti ko'rib chiqilayotgan modeldagi barcha o'zgaruvchilar 0 ga teng bo'lsa, Y qanday bo'lishini ko'rsatadi. Ya'ni tahlil qilinayotgan parametr qiymatiga modelda tavsiflanmagan boshqa omillar ham ta'sir qiladi.

-0,16285 koeffitsienti X o'zgaruvchisining Y bo'yicha og'irligini ko'rsatadi. Ya'ni, ushbu model doirasidagi o'rtacha oylik ish haqi -0,16285 og'irlikdagi ishdan bo'shaganlar soniga ta'sir qiladi (bu ta'sirning kichik darajasi). "-" belgisi ko'rsatadi yomon ta'sir: ish haqi qancha ko'p bo'lsa, shuncha kam odam chiqib ketadi. Qaysi adolatli.



Excelda korrelyatsiya tahlili

Korrelyatsiya tahlili bir yoki ikkita namunadagi ko'rsatkichlar o'rtasida bog'liqlik mavjudligini aniqlashga yordam beradi. Masalan, mashinaning ishlash muddati va ta'mirlash xarajatlari, uskunaning narxi va ishlash muddati, bolalarning bo'yi va vazni va boshqalar.

Agar bog'lanish mavjud bo'lsa, unda bir parametrning o'sishi ikkinchisining o'sishiga (ijobiy korrelyatsiya) yoki pasayishiga (salbiy) olib keladi. Korrelyatsiya tahlili tahlilchiga bir ko'rsatkichning qiymati boshqasining mumkin bo'lgan qiymatini bashorat qilish uchun ishlatilishi mumkinligini aniqlashga yordam beradi.

Korrelyatsiya koeffitsienti r bilan belgilanadi. +1 dan -1 gacha o'zgaradi. Turli sohalar uchun korrelyatsiyalarning tasnifi har xil bo'ladi. Koeffitsient 0 bo'lsa, namunalar o'rtasida chiziqli bog'liqlik bo'lmaydi.

Keling, Excel yordamida korrelyatsiya koeffitsientini qanday topishni ko'rib chiqaylik.

Juftlangan koeffitsientlarni topish uchun CORREL funksiyasidan foydalaniladi.

Maqsad: tokarlik stanogining ish vaqti va unga texnik xizmat ko'rsatish xarajatlari o'rtasida bog'liqlik mavjudligini aniqlash.

Kursorni istalgan katakka qo'ying va fx tugmasini bosing.

  1. “Statistika” toifasida CORREL funksiyasini tanlang.
  2. Argument "1-massiv" - qiymatlarning birinchi diapazoni - mashinaning ishlash vaqti: A2: A14.
  3. Argument "2-massiv" - qiymatlarning ikkinchi diapazoni - ta'mirlash narxi: B2: B14. OK tugmasini bosing.

Ulanish turini aniqlash uchun siz koeffitsientning mutlaq soniga qarashingiz kerak (har bir faoliyat sohasi o'z shkalasiga ega).

Bir nechta parametrlarni (2 dan ortiq) korrelyatsion tahlil qilish uchun "Ma'lumotlarni tahlil qilish" ("Tahlil paketi" qo'shimchasi) dan foydalanish qulayroqdir. Siz ro'yxatdan korrelyatsiyani tanlashingiz va massivni belgilashingiz kerak. Hammasi.

Olingan koeffitsientlar korrelyatsiya matritsasida ko'rsatiladi. Shunga o'xshash:

Korrelyatsiya va regressiya tahlili

Amalda, bu ikki usul ko'pincha birgalikda qo'llaniladi.

Misol:


Endi regressiya tahlili ma'lumotlari paydo bo'ldi.

O'qish davomida talabalar ko'pincha turli xil tenglamalarga duch kelishadi. Ulardan biri - regressiya tenglamasi - bu maqolada muhokama qilinadi. Ushbu turdagi tenglamalar o'rtasidagi munosabatlarning xususiyatlarini tavsiflash uchun maxsus qo'llaniladi matematik parametrlar. Bu tur tenglik statistika va ekonometriyada qo'llaniladi.

Regressiya ta'rifi

Matematikada regressiya ma'lumotlar to'plamining o'rtacha qiymatining boshqa miqdorning qiymatlariga bog'liqligini tavsiflovchi ma'lum miqdorni anglatadi. Regressiya tenglamasi ma'lum bir xarakteristikaning funktsiyasi sifatida boshqa xarakteristikaning o'rtacha qiymatini ko'rsatadi. Regressiya funktsiyasi shaklga ega oddiy tenglama y = x, bunda y bog'liq o'zgaruvchi, x esa mustaqil o'zgaruvchi (xususiyat-omil) sifatida ishlaydi. Aslida regressiya y = f (x) shaklida ifodalanadi.

O'zgaruvchilar o'rtasidagi munosabatlarning qanday turlari mavjud?

Umuman olganda, munosabatlarning ikki qarama-qarshi turi mavjud: korrelyatsiya va regressiya.

Birinchisi, shartli o'zgaruvchilarning tengligi bilan tavsiflanadi. IN Ushbu holatda Qaysi o'zgaruvchining boshqasiga bog'liqligi aniq ma'lum emas.

Agar o'zgaruvchilar o'rtasida tenglik bo'lmasa va shartlar qaysi o'zgaruvchining tushuntirish va qaysi bog'liqligini aytsa, ikkinchi turdagi bog'lanish mavjudligi haqida gapirish mumkin. Chiziqli regressiya tenglamasini qurish uchun qanday turdagi munosabatlar kuzatilayotganligini aniqlash kerak bo'ladi.

Regressiya turlari

Bugungi kunda regressiyaning 7 xil turi mavjud: giperbolik, chiziqli, ko'p, chiziqli bo'lmagan, juftlik, teskari, logarifmik chiziqli.

Giperbolik, chiziqli va logarifmik

Lineer regressiya tenglamasi statistikada tenglamaning parametrlarini aniq tushuntirish uchun ishlatiladi. y = c+t*x+E ga o'xshaydi. Giperbolik tenglama muntazam giperbola y = c + m / x + E ko'rinishiga ega. Logarifmik chiziqli tenglama aloqani logarifmik funksiya yordamida ifodalaydi: In y = In c + m * In x + In E.

Ko'p va chiziqli bo'lmagan

Yana ikkita murakkab turlari Regressiya ko'p va chiziqli emas. Ko‘p regressiya tenglamasi y = f(x 1, x 2 ... x c) + E funksiya bilan ifodalanadi. Bunday vaziyatda y bog'liq o'zgaruvchi, x esa tushuntirish o'zgaruvchisi vazifasini bajaradi. E o'zgaruvchisi stokastik bo'lib, u tenglamadagi boshqa omillarning ta'sirini o'z ichiga oladi. Chiziqli bo'lmagan regressiya tenglamasi biroz bahsli. Bir tomondan, hisobga olingan ko'rsatkichlarga nisbatan, u chiziqli emas, balki boshqa tomondan, ko'rsatkichlarni baholash rolida chiziqli.

Teskari va juftlashgan regressiya turlari

Teskari funktsiya chiziqli shaklga o'tkazilishi kerak bo'lgan funktsiya turidir. Eng an'anaviy tarzda amaliy dasturlar u y = 1/c + m*x+E funksiya shakliga ega. Juft regressiya tenglamasi y = f (x) + E funksiyasi sifatida ma’lumotlar o‘rtasidagi munosabatni ko‘rsatadi. Xuddi boshqa tenglamalarda bo‘lgani kabi, y ham x ga bog‘liq va E stokastik parametrdir.

Korrelyatsiya tushunchasi

Bu ikki hodisa yoki jarayon o'rtasidagi munosabatlar mavjudligini ko'rsatadigan ko'rsatkichdir. Aloqaning mustahkamligi korrelyatsiya koeffitsienti sifatida ifodalanadi. Uning qiymati [-1;+1] oralig'ida o'zgarib turadi. Salbiy ko'rsatkich mavjudligini ko'rsatadi fikr-mulohaza, ijobiy - to'g'ri chiziq haqida. Agar koeffitsient 0 ga teng qiymatni qabul qilsa, unda hech qanday bog'liqlik yo'q. Qiymat 1 ga qanchalik yaqin bo'lsa, parametrlar o'rtasidagi bog'liqlik shunchalik kuchli bo'ladi, 0 ga yaqinroq bo'lsa, u zaifroq bo'ladi.

Usullari

Korrelyatsiya parametrik usullari munosabatlarning mustahkamligini baholashi mumkin. Ular normal taqsimot qonuniga bo'ysunadigan parametrlarni o'rganish uchun taqsimotni baholash asosida qo'llaniladi.

Chiziqli regressiya tenglamasining parametrlari bog'liqlik turini, regressiya tenglamasining funktsiyasini aniqlash va tanlangan munosabatlar formulasining ko'rsatkichlarini baholash uchun zarurdir. Korrelyatsiya maydoni ulanishni aniqlash usuli sifatida ishlatiladi. Buning uchun barcha mavjud ma'lumotlar grafik tarzda tasvirlangan bo'lishi kerak. Barcha ma'lum ma'lumotlar to'rtburchaklar ikki o'lchovli koordinatalar tizimida chizilgan bo'lishi kerak. Korrelyatsiya maydoni shunday shakllanadi. Ta'riflovchi omilning qiymatlari abscissa o'qi bo'ylab, bog'liq omilning qiymatlari esa ordinat o'qi bo'ylab belgilanadi. Parametrlar o'rtasida funksional bog'liqlik mavjud bo'lsa, ular chiziq shaklida joylashtiriladi.

Agar bunday ma'lumotlarning korrelyatsiya koeffitsienti 30% dan kam bo'lsa, biz ulanishning deyarli to'liq yo'qligi haqida gapirishimiz mumkin. Agar u 30% dan 70% gacha bo'lsa, unda bu o'rta-yaqin ulanishlar mavjudligini ko'rsatadi. 100% ko'rsatkich funktsional ulanishning dalilidir.

Chiziqli bo'lmagan regressiya tenglamasi, xuddi chiziqli kabi, korrelyatsiya indeksi (R) bilan to'ldirilishi kerak.

Ko'p regressiya uchun korrelyatsiya

Determinatsiya koeffitsienti ko'p korrelyatsiya kvadratining ko'rsatkichidir. U taqdim etilgan ko'rsatkichlar to'plamining o'rganilayotgan xususiyat bilan yaqin aloqasi haqida gapiradi. Parametrlarning natijaga ta'sirining tabiati haqida ham gapirish mumkin. Ko'p regressiya tenglamasi ushbu ko'rsatkich yordamida baholanadi.

Ko'p korrelyatsiya ko'rsatkichini hisoblash uchun uning indeksini hisoblash kerak.

Eng kichik kvadrat usuli

Bu usul regressiya omillarini baholash usulidir. Uning mohiyati omilning funktsiyaga bog'liqligi natijasida olingan kvadrat og'ishlar yig'indisini minimallashtirishdan iborat.

Bunday usul yordamida juft chiziqli regressiya tenglamasini baholash mumkin. Ushbu turdagi tenglamalar ko'rsatkichlar o'rtasida juft chiziqli munosabatlar aniqlanganda qo'llaniladi.

Tenglama parametrlari

Chiziqli regressiya funktsiyasining har bir parametri o'ziga xos ma'noga ega. Juftlangan chiziqli regressiya tenglamasi ikkita parametrni o'z ichiga oladi: c va m.. m parametr y funksiyaning yakuniy ko'rsatkichining o'rtacha o'zgarishini ko'rsatadi, agar x o'zgaruvchisi bitta shartli birlikka kamayishi (ko'tarilishi) sharti bilan. Agar x o'zgaruvchisi nolga teng bo'lsa, u holda funktsiya c parametriga teng bo'ladi. Agar x o'zgaruvchisi nolga teng bo'lmasa, u holda c omil iqtisodiy ma'noga ega emas. Funksiyaga faqat c omil oldidagi belgi ta'sir qiladi. Agar minus mavjud bo'lsa, unda natijaning o'zgarishi omilga nisbatan sekin deb aytishimiz mumkin. Agar ortiqcha bo'lsa, bu natijaning tezlashtirilgan o'zgarishini ko'rsatadi.

Regressiya tenglamasining qiymatini o'zgartiruvchi har bir parametr tenglama orqali ifodalanishi mumkin. Masalan, c omil c = y - mx ko'rinishga ega.

Guruhlangan ma'lumotlar

Barcha ma'lumotlar x atributi bo'yicha guruhlangan vazifa shartlari mavjud, ammo ma'lum bir guruh uchun bog'liq ko'rsatkichning mos keladigan o'rtacha qiymatlari ko'rsatilgan. Bunday holda, o'rtacha qiymatlar x ga qarab indikator qanday o'zgarishini tavsiflaydi. Shunday qilib, guruhlangan ma'lumotlar regressiya tenglamasini topishga yordam beradi. U munosabatlarni tahlil qilish uchun ishlatiladi. Biroq, bu usul o'zining kamchiliklariga ega. Afsuski, o'rtacha ko'rsatkichlar ko'pincha tashqi tebranishlarga duchor bo'ladi. Bu tebranishlar munosabatlarning naqshini aks ettirmaydi, ular shunchaki uning "shovqinini" niqoblaydi. O'rtachalar chiziqli regressiya tenglamasidan ko'ra yomonroq munosabatlar naqshlarini ko'rsatadi. Biroq, ular tenglamani topish uchun asos sifatida ishlatilishi mumkin. Alohida aholi sonini mos keladigan o'rtacha ko'rsatkichga ko'paytirish orqali guruh ichidagi y yig'indisini olish mumkin. Keyinchalik, siz olingan barcha summalarni qo'shishingiz va yakuniy ko'rsatkichni topishingiz kerak y. Xy yig'indisi ko'rsatkichi bilan hisob-kitob qilish biroz qiyinroq. Agar intervallar kichik bo'lsa, barcha birliklar (guruh ichidagi) uchun x ko'rsatkichini bir xil bo'lishi uchun shartli ravishda olishimiz mumkin. X va y ko'paytmalarining yig'indisini bilish uchun uni y yig'indisiga ko'paytirish kerak. Keyinchalik, barcha miqdorlar qo'shiladi va umumiy miqdor xy olinadi.

Ko'p juftlik regressiya tenglamasi: munosabatlarning ahamiyatini baholash

Yuqorida aytib o'tilganidek, ko'p regressiya y = f (x 1,x 2,…,x m)+E ko'rinishidagi funktsiyaga ega. Ko'pincha bunday tenglama mahsulotga bo'lgan talab va taklif, sotib olingan aktsiyalardan foiz daromadlari muammosini hal qilish, ishlab chiqarish xarajatlari funktsiyasining sabablari va turini o'rganish uchun ishlatiladi. Bundan tashqari, u turli xil makroiqtisodiy tadqiqotlar va hisob-kitoblarda faol qo'llaniladi, ammo mikroiqtisodiyot darajasida bu tenglama biroz kamroq qo'llaniladi.

Ko'p regressiyaning asosiy vazifasi - har bir omilning alohida va o'ziga qanday ta'sir qilishini aniqlash uchun katta hajmdagi ma'lumotlarni o'z ichiga olgan ma'lumotlar modelini yaratish. umumiy aholi modellashtirish kerak bo'lgan ko'rsatkich va uning koeffitsientlari bo'yicha. Regressiya tenglamasi turli xil qiymatlarni qabul qilishi mumkin. Bunday holda, munosabatlarni baholash uchun odatda ikkita turdagi funktsiyalar qo'llaniladi: chiziqli va chiziqli bo'lmagan.

Chiziqli funksiya quyidagi munosabat shaklida tasvirlangan: y = a 0 + a 1 x 1 + a 2 x 2,+ ... + a m x m. Bunday holda, a2, a m "sof" regressiya koeffitsientlari hisoblanadi. Ular y parametrining o'rtacha o'zgarishini har bir mos keladigan x parametrining bir birlikka o'zgarishi (kamayishi yoki ortishi) bilan, boshqa ko'rsatkichlarning barqaror qiymatlari sharti bilan tavsiflash uchun zarurdir.

Nochiziqli tenglamalar, masalan, y=ax 1 b1 x 2 b2 ...x m bm quvvat funksiyasi shakliga ega. Bunda b 1, b 2 ..... b m ko'rsatkichlari elastiklik koeffitsientlari deb ataladi, ular tegishli ko'rsatkich x 1% ga ortishi (kamayishi) bilan natija qanday o'zgarishini (qancha% ga) ko'rsatadi. boshqa omillarning barqaror ko'rsatkichi bilan.

Ko'p regressiyani qurishda qanday omillarni hisobga olish kerak

Ko'p regressiyani to'g'ri qurish uchun qaysi omillarga alohida e'tibor berish kerakligini aniqlash kerak.

Iqtisodiy omillar va modellashtirilayotgan narsalar o'rtasidagi munosabatlarning mohiyati haqida bir oz tushunchaga ega bo'lish kerak. Qo'shilishi kerak bo'lgan omillar quyidagi mezonlarga javob berishi kerak:

  • Miqdoriy o'lchovga bo'ysunishi kerak. Ob'ektning sifatini tavsiflovchi omildan foydalanish uchun har qanday holatda unga miqdoriy shakl berilishi kerak.
  • Faktorlarning o'zaro bog'liqligi yoki funktsional aloqasi bo'lmasligi kerak. Bunday harakatlar ko'pincha qaytarilmas oqibatlarga olib keladi - oddiy tenglamalar tizimi shartsiz bo'lib qoladi va bu uning ishonchsizligi va noaniq baholariga olib keladi.
  • Katta korrelyatsiya ko'rsatkichi bo'lsa, indikatorning yakuniy natijasiga omillarning izolyatsiya qilingan ta'sirini aniqlashning hech qanday usuli yo'q, shuning uchun koeffitsientlar izohlanmaydi.

Qurilish usullari

Tenglama uchun omillarni qanday tanlash mumkinligini tushuntiradigan juda ko'p usul va usullar mavjud. Biroq, bu usullarning barchasi korrelyatsiya ko'rsatkichi yordamida koeffitsientlarni tanlashga asoslangan. Ular orasida:

  • Yo'q qilish usuli.
  • O'zgartirish usuli.
  • Bosqichli regressiya tahlili.

Birinchi usul umumiy to'plamdan barcha koeffitsientlarni filtrlashni o'z ichiga oladi. Ikkinchi usul ko'plab qo'shimcha omillarni kiritishni o'z ichiga oladi. Uchinchisi, tenglama uchun ilgari ishlatilgan omillarni yo'q qilishdir. Ushbu usullarning har biri mavjud bo'lish huquqiga ega. Ularning ijobiy va salbiy tomonlari bor, lekin ularning barchasi keraksiz ko'rsatkichlarni yo'q qilish masalasini o'z yo'li bilan hal qilishlari mumkin. Qoida tariqasida, har bir individual usul bilan olingan natijalar juda yaqin.

Ko'p o'lchovli tahlil usullari

Faktorlarni aniqlashning bunday usullari o'zaro bog'liq xususiyatlarning individual birikmalarini hisobga olishga asoslangan. Bularga diskriminant tahlili, shaklni aniqlash, asosiy komponentlar tahlili va klaster tahlili kiradi. Bundan tashqari, omilli tahlil ham mavjud, ammo u komponent usulining rivojlanishi tufayli paydo bo'ldi. Ularning barchasi muayyan sharoitlarda, ma'lum shartlar va omillarni hisobga olgan holda qo'llaniladi.

Regressiya tahlili - bu o'rganilayotgan xususiyatlar o'rtasidagi stokastik bog'liqlikning analitik ifodasini o'rnatish usuli. Regressiya tenglamasi o'rtacha qanday o'zgarishini ko'rsatadi da birini o'zgartirganda x i , va quyidagi shaklga ega:

Qayerda y - qaram o'zgaruvchi (u har doim bir xil);

X i - mustaqil o'zgaruvchilar (omillar) (ularning bir nechtasi bo'lishi mumkin).

Agar faqat bitta mustaqil o'zgaruvchi bo'lsa, bu oddiy regressiya tahlilidir. Agar ulardan bir nechtasi bo'lsa ( P 2), u holda bunday tahlil multifaktorial deb ataladi.

Regressiya tahlili ikkita asosiy muammoni hal qiladi:

    regressiya tenglamasini qurish, ya'ni. natija ko'rsatkichi va mustaqil omillar o'rtasidagi bog'liqlik turini topish x 1 , x 2 , …, x n .

    olingan tenglamaning ahamiyatini baholash, ya'ni. Tanlangan omil xarakteristikalari belgining o'zgarishini qanchalik izohlashini aniqlash u.

Regressiya tahlili asosan rejalashtirish, shuningdek, normativ-huquqiy bazani ishlab chiqish uchun ishlatiladi.

Tahlil qilinayotgan xususiyatlar o'rtasida bog'liqlik bor-yo'qligi haqidagi savolga javob beradigan korrelyatsiya tahlilidan farqli o'laroq, regressiya tahlili ham uning rasmiylashtirilgan ifodasini beradi. Bundan tashqari, agar korrelyatsiya tahlili omillar o'rtasidagi har qanday munosabatni o'rgansa, regressiya tahlili bir tomonlama bog'liqlikni o'rganadi, ya'ni. omil xususiyatlarining o'zgarishi samarali xarakteristikaga qanday ta'sir qilishini ko'rsatadigan munosabatlar.

Regressiya tahlili matematik statistikaning eng rivojlangan usullaridan biridir. To'g'ri aytganda, regressiya tahlilini amalga oshirish uchun bir qator maxsus talablarni bajarish kerak (xususan, x l ,x 2 ,...,x n ;y mustaqil, normal taqsimlangan, doimiy dispersiyaga ega tasodifiy o'zgaruvchilar bo'lishi kerak). IN haqiqiy hayot regressiya va korrelyatsion tahlil talablariga qat'iy rioya qilish juda kam uchraydi, lekin bu usullarning ikkalasi ham iqtisodiy tadqiqotlarda juda keng tarqalgan. Iqtisodiyotdagi bog'liqliklar nafaqat bevosita, balki teskari va chiziqli bo'lmagan bo'lishi mumkin. Regressiya modeli har qanday bog'liqlik mavjud bo'lganda tuzilishi mumkin, ammo ko'p o'lchovli tahlilda faqat shaklning chiziqli modellari qo'llaniladi:

Regressiya tenglamasi odatda usul yordamida tuziladi eng kichik kvadratlar, uning mohiyati natijada olingan xarakteristikaning haqiqiy qiymatlarining kvadratik og'ishlari yig'indisini uning hisoblangan qiymatlaridan minimallashtirishdir, ya'ni:

Qayerda T - kuzatishlar soni;

j =a+b 1 x 1 j +b 2 x 2 j + ... + b n X n j - natija omilining hisoblangan qiymati.

Shaxsiy kompyuter yoki maxsus moliyaviy kalkulyator uchun analitik paketlar yordamida regressiya koeffitsientlarini aniqlash tavsiya etiladi. Eng oddiy holatda, bir o'zgaruvchanlikning regressiya koeffitsientlari chiziqli tenglama shaklning regressiyalari y = a + bx formulalar yordamida topish mumkin:

Klaster tahlili

Klaster tahlili ko'p o'lchovli tahlil usullaridan biri bo'lib, elementlari ko'plab xususiyatlar bilan tavsiflangan populyatsiyani guruhlash (klasterlash) uchun mo'ljallangan. Har bir xususiyatning qiymatlari xususiyatlarning ko'p o'lchovli maydonida o'rganilayotgan populyatsiyaning har bir birligining koordinatalari bo'lib xizmat qiladi. Bir nechta ko'rsatkichlarning qiymatlari bilan tavsiflangan har bir kuzatuv ushbu ko'rsatkichlar bo'shlig'idagi nuqta sifatida ifodalanishi mumkin, ularning qiymatlari ko'p o'lchovli makonda koordinatalar sifatida qabul qilinadi. Nuqtalar orasidagi masofa R Va q Bilan k koordinatalari quyidagicha aniqlanadi:

Klasterlashning asosiy mezoni shundan iboratki, klasterlar o'rtasidagi farqlar bir xil klasterga tayinlangan kuzatishlar orasidagi farqlarga qaraganda muhimroq bo'lishi kerak, ya'ni. ko'p o'lchovli fazoda quyidagi tengsizlik kuzatilishi kerak:

Qayerda r 1, 2 - 1 va 2 klasterlar orasidagi masofa.

Regressiya tahlili protseduralari singari, klasterlash jarayoni ham juda ko'p mehnat talab qiladi, uni kompyuterda bajarish tavsiya etiladi.

Regressiya tahlilining asosiy maqsadi samarali xarakteristikaning o'zgarishi bir yoki bir nechta omil belgilarining ta'siri bilan bog'liq bo'lgan aloqaning analitik shaklini aniqlashdan iborat bo'lib, samarali xarakteristikaga ham ta'sir qiluvchi boshqa barcha omillar to'plami doimiy va o'rtacha qiymatlar sifatida qabul qilinadi.
Regressiya tahlili muammolari:
a) Tobelik shaklini belgilash. Hodisalar orasidagi munosabatlarning tabiati va shakliga kelsak, ijobiy chiziqli va chiziqli bo'lmagan va manfiy chiziqli va chiziqli bo'lmagan regressiya o'rtasida farqlanadi.
b) U yoki bu turdagi matematik tenglama ko'rinishidagi regressiya funksiyasini aniqlash va izohli o'zgaruvchilarning bog'liq o'zgaruvchiga ta'sirini o'rnatish.
c) qaram o'zgaruvchining noma'lum qiymatlarini baholash. Regressiya funktsiyasidan foydalanib, siz tushuntiruvchi o'zgaruvchilarning belgilangan qiymatlari oralig'ida bog'liq o'zgaruvchining qiymatlarini ko'paytirishingiz mumkin (ya'ni, interpolyatsiya muammosini hal qilish) yoki belgilangan oraliqdan tashqarida jarayonning borishini baholashingiz mumkin (ya'ni, ekstrapolyatsiya masalasini yechish). Natijada bog'liq o'zgaruvchining qiymatini taxmin qilish mumkin.

Juftlangan regressiya - ikki o'zgaruvchi y va x o'rtasidagi munosabat tenglamasi: y=f(x), bu erda y - bog'liq o'zgaruvchi (natija atributi); x - mustaqil izohlovchi o'zgaruvchi (xususiyat-omil).

Chiziqli va chiziqli bo'lmagan regressiyalar mavjud.
Chiziqli regressiya: y = a + bx + e
Nochiziqli regressiyalar ikki sinfga bo'linadi: tahlilga kiritilgan tushuntirish o'zgaruvchilari bo'yicha chiziqli bo'lmagan, lekin taxmin qilingan parametrlarga nisbatan chiziqli regressiyalar va taxmin qilingan parametrlarga nisbatan chiziqli bo'lmagan regressiyalar.
Tushuntiruvchi o'zgaruvchilarda chiziqli bo'lmagan regressiyalar:

Baholanayotgan parametrlarga nisbatan chiziqli bo'lmagan regressiyalar:

  • quvvat y=a x b e
  • eksponensial y=a b x e
  • eksponensial y=e a+b x e
Regressiya tenglamasini tuzish uning parametrlarini baholashdan iborat. Parametrlarda chiziqli regressiya parametrlarini baholash uchun eng kichik kvadratlar usuli (OLS) qo'llaniladi. Eng kichik kvadratlar usuli shunday parametr baholarini olish imkonini beradi, bunda olingan y xarakteristikasining nazariy y x dan haqiqiy qiymatlarining kvadratik og'ishlari yig'indisi minimal bo'ladi, ya'ni.
.
Chiziqli va chiziqli bo'lmagan tenglamalar uchun a va b uchun quyidagi tizim yechiladi:

Siz ushbu tizimdan kelib chiqadigan tayyor formulalardan foydalanishingiz mumkin:

O'rganilayotgan hodisalar orasidagi bog'lanishning yaqinligi chiziqli regressiya uchun r xy chiziqli juft korrelyatsiya koeffitsienti (-1≤r xy ≤1) bilan baholanadi:

va korrelyatsiya indeksi p xy - chiziqli bo'lmagan regressiya uchun (0≤p xy ≤1):

Tuzilgan modelning sifati aniqlash koeffitsienti (indeks), shuningdek, yaqinlashishning o'rtacha xatosi bilan baholanadi.
O'rtacha taxminiy xato - hisoblangan qiymatlarning haqiqiylardan o'rtacha og'ishi:
.
A qiymatlarining ruxsat etilgan chegarasi 8-10% dan oshmaydi.
E o'rtacha elastiklik koeffitsienti umumiy natijaning o'rtacha necha foizga o'zgarishini ko'rsatadi o'rtacha hajmi x omil o'rtacha qiymatidan 1% ga o'zgarganda:
.

Dispersiyani tahlil qilishning maqsadi qaram o'zgaruvchining dispersiyasini tahlil qilishdir:
∑(y-y )²=∑(y x -y )²+∑(y-y x)²
bu erda ∑(y-y)² - kvadrat og'ishlarning umumiy yig'indisi;
∑(y x -y)² - regressiya ("tushuntirilgan" yoki "faktorial") tufayli kvadrat og'ishlar yig'indisi;
∑(y-y x)² - kvadrat og'ishlarning qoldiq yig'indisi.
Regressiya bilan izohlangan dispersiyaning y natijaviy xarakteristikaning umumiy dispersiyadagi ulushi R2 aniqlash koeffitsienti (indeks) bilan tavsiflanadi:

Determinatsiya koeffitsienti koeffitsient yoki korrelyatsiya indeksining kvadratidir.

F-testi - regressiya tenglamasining sifatini baholash - regressiya tenglamasining statistik ahamiyatsizligi va munosabatlarning yaqinligi ko'rsatkichi haqidagi gipotezani tekshirishdan iborat. Buning uchun haqiqiy F fakti va Fisher F-mezonining kritik (jadval) F jadval qiymatlari o'rtasida taqqoslash amalga oshiriladi. F fakt faktor va qiymatlarining nisbati asosida aniqlanadi qoldiq farqlar, bir darajadagi erkinlik uchun mo'ljallangan:
,
bu yerda n - aholi birliklari soni; m - x o'zgaruvchilar uchun parametrlar soni.
F jadvali - berilgan erkinlik va ahamiyatlilik darajasidagi tasodifiy omillar ta'sirida mezonning mumkin bo'lgan maksimal qiymati a. Muhimlik darajasi a - to'g'ri bo'lgan farazni rad etish ehtimoli. Odatda a 0,05 yoki 0,01 ga teng qabul qilinadi.
Agar F jadvali< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >F haqiqat, keyin H o gipotezasi rad etilmaydi va regressiya tenglamasining statistik ahamiyatsizligi va ishonchsizligi tan olinadi.
Regressiya va korrelyatsiya koeffitsientlarining statistik ahamiyatini baholash uchun har bir ko'rsatkich uchun Student t-testi va ishonch intervallari hisoblab chiqiladi. Ko'rsatkichlarning tasodifiy tabiati haqida gipoteza ilgari suriladi, ya'ni. noldan ularning ahamiyatsiz farqi haqida. Regressiya va korrelyatsiya koeffitsientlarining ahamiyatini Student t-testi yordamida baholash ularning qiymatlarini tasodifiy xatoning kattaligi bilan solishtirish orqali amalga oshiriladi:
; ; .
Chiziqli regressiya parametrlari va korrelyatsiya koeffitsientining tasodifiy xatolari quyidagi formulalar bilan aniqlanadi:



T-statistikaning haqiqiy va kritik (jadvalli) qiymatlarini - t jadvali va t faktini taqqoslab, biz H o gipotezasini qabul qilamiz yoki rad etamiz.
Fisher F-testi va Student t-statistikasi o'rtasidagi bog'liqlik tenglik bilan ifodalanadi

Agar t jadvali< t факт то H o отклоняется, т.е. a , b и r xy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >t - H o gipotezasi rad etilmagani va a, b yoki r xy hosil bo'lishining tasodifiy tabiati tan olingan haqiqatdir.
Ishonch oralig'ini hisoblash uchun har bir ko'rsatkich uchun maksimal D xatosini aniqlaymiz:
D a =t jadval m a, D b =t jadval m b.
Ishonch oraliqlarini hisoblash uchun formulalar quyidagicha:
g a =aD a ; g a =a-D a ; g a =a+DA
g b =bD b ; g b =b-D b ; g b =b+D b
Agar nol ishonch oralig'iga tushsa, ya'ni. Agar pastki chegara salbiy va yuqori chegara ijobiy bo'lsa, u holda taxminiy parametr nolga teng deb hisoblanadi, chunki u bir vaqtning o'zida ham ijobiy, ham salbiy qiymatlarni qabul qila olmaydi.
Prognoz qiymati y p y x =a+b·x regressiya tenglamasiga mos keladigan (prognoz) x p qiymatini almashtirish orqali aniqlanadi. Prognozning o'rtacha standart xatosi m y x hisoblanadi:
,
Qayerda
va prognoz uchun ishonch oralig'i tuziladi:
g y x =y p D y p ; g y x min=y p -D y p ; g y x max=y p +D y p
Bu yerda D y x =t jadval m y x.

Misol yechim

Vazifa № 1. 199X yilda Ural viloyatining ettita hududi uchun ikkita xususiyatning qiymati ma'lum.
1-jadval.

Majburiy: 1. y ning x ga bog’liqligini xarakterlash uchun quyidagi funksiyalarning parametrlarini hisoblang:
a) chiziqli;
b) quvvat (avval ikkala qismning logarifmini olib, o'zgaruvchilarni chiziqli qilish protsedurasini bajarishingiz kerak);
c) ko'rgazmali;
d) teng qirrali giperbola (shuningdek, ushbu modelni qanday qilib oldindan chiziqli qilish kerakligini aniqlab olishingiz kerak).
2. Har bir modelni A yaqinlashuvining o'rtacha xatosi va Fisherning F testi orqali baholang.

Yechim (variant №1)

Chiziqli regressiyaning a va b parametrlarini hisoblash uchun y=a+b·x (hisoblash kalkulyator yordamida amalga oshirilishi mumkin).
uchun normal tenglamalar tizimini yechish A Va b:
Dastlabki ma'lumotlardan foydalanib, biz ∑y, ∑x, ∑y x, ∑x², ∑y² ni hisoblaymiz:
y x yx x 2 y 2 y xy-y xA i
l68,8 45,1 3102,88 2034,01 4733,44 61,3 7,5 10,9
2 61,2 59,0 3610,80 3481,00 3745,44 56,5 4,7 7,7
3 59,9 57,2 3426,28 3271,84 3588,01 57,1 2,8 4,7
4 56,7 61,8 3504,06 3819,24 3214,89 55,5 1,2 2,1
5 55,0 58,8 3234,00 3457,44 3025,00 56,5 -1,5 2,7
6 54,3 47,2 2562,96 2227,84 2948,49 60,5 -6,2 11,4
7 49,3 55,2 2721,36 3047,04 2430,49 57,8 -8,5 17,2
Jami405,2 384,3 22162,34 21338,41 23685,76 405,2 0,0 56,7
Chorshanba. ma'nosi (Jami/n)57,89
y
54,90
x
3166,05
x y
3048,34
3383,68
XX8,1
s 5,74 5,86 XXXXXX
s 232,92 34,34 XXXXXX


a=y -b x = 57,89+0,35 54,9 ≈ 76,88

Regressiya tenglamasi: y = 76,88 - 0,35X. O'rtacha kunlik ish haqining 1 rublga oshishi bilan. oziq-ovqat mahsulotlarini xarid qilish xarajatlari ulushi o'rtacha 0,35 foiz punktga kamaydi.
Keling, chiziqli juft korrelyatsiya koeffitsientini hisoblaymiz:

Ulanish o'rtacha, teskari.
Determinatsiya koeffitsientini aniqlaymiz: r² xy =(-0,35)=0,127
Natijaning 12,7% o'zgarishi x omilining o'zgarishi bilan izohlanadi. Regressiya tenglamasiga almashtirish haqiqiy qiymatlar X, keling, y x ning nazariy (hisoblangan) qiymatlarini aniqlaymiz. O'rtacha yaqinlashish xatosi A qiymatini topamiz:

O'rtacha hisoblangan qiymatlar haqiqiy qiymatlardan 8,1% ga og'adi.
F-mezonini hisoblaymiz:

Olingan qiymat aniqlangan bog'liqlikning tasodifiy tabiati va tenglama parametrlarining statistik ahamiyatsizligi va ulanishning yaqinligi ko'rsatkichi haqida H 0 gipotezasini qabul qilish zarurligini ko'rsatadi.
1b. y=a·x b quvvat modelini qurishdan oldin o'zgaruvchilarni chiziqlilashtirish protsedurasi amalga oshiriladi. Misolda linearizatsiya tenglamaning ikkala tomonining logarifmlarini olish orqali amalga oshiriladi:
lg y=lg a + b lg x
Y=C+b·Y
Bu yerda Y=log(y), X=log(x), C=log(a).

Hisoblash uchun biz jadvaldagi ma'lumotlardan foydalanamiz. 1.3.
1.3-jadval

YX YX Y2 X 2 y xy-y x(y-y x)²A i
1 1,8376 1,6542 3,0398 3,3768 2,7364 61,0 7,8 60,8 11,3
2 1,7868 1,7709 3,1642 3,1927 3,1361 56,3 4,9 24,0 8,0
3 1,7774 1,7574 3,1236 3,1592 3,0885 56,8 3,1 9,6 5,2
4 1,7536 1,7910 3,1407 3,0751 3,2077 55,5 1,2 1,4 2,1
5 1,7404 1,7694 3,0795 3,0290 3,1308 56,3 -1,3 1,7 2,4
6 1,7348 1,6739 2,9039 3,0095 2,8019 60,2 -5,9 34,8 10,9
7 1,6928 1,7419 2,9487 2,8656 3,0342 57,4 -8,1 65,6 16,4
Jami12,3234 12,1587 21,4003 21,7078 21,1355 403,5 1,7 197,9 56,3
O'rtacha qiymati1,7605 1,7370 3,0572 3,1011 3,0194 XX28,27 8,0
σ 0,0425 0,0484 XXXXXXX
s 20,0018 0,0023 XXXXXXX

C va b ni hisoblaymiz:

C=Y -b·X = 1,7605+0,298·1,7370 = 2,278126
Chiziqli tenglamani olamiz: Y=2,278-0,298 X
Uning potentsiallanishini amalga oshirib, biz quyidagilarni olamiz: y=10 2,278 ·x -0,298
Ushbu tenglamaga haqiqiy qiymatlarni almashtirish X, biz natijaning nazariy qiymatlarini olamiz. Ularga asoslanib, biz quyidagi ko'rsatkichlarni hisoblaymiz: ulanishning zichligi - korrelyatsiya indeksi p xy va o'rtacha yaqinlashish xatosi A.

Quvvat qonuni modelining xarakteristikalari shuni ko'rsatadiki, u munosabatlarni chiziqli funktsiyaga qaraganda yaxshiroq tasvirlaydi.

1c. y=a·b x ko'rsatkichli egri chiziq tenglamasini qurishdan oldin tenglamaning har ikki tomonining logarifmini olish yo'li bilan o'zgaruvchilarni chiziqli qilish protsedurasi amalga oshiriladi:
log y=log a + x log b
Y=C+B x
Hisoblash uchun biz jadval ma'lumotlaridan foydalanamiz.

Yx Yx Y2 x 2y xy-y x(y-y x)²A i
1 1,8376 45,1 82,8758 3,3768 2034,01 60,7 8,1 65,61 11,8
2 1,7868 59,0 105,4212 3,1927 3481,00 56,4 4,8 23,04 7,8
3 1,7774 57,2 101,6673 3,1592 3271,84 56,9 3,0 9,00 5,0
4 1,7536 61,8 108,3725 3,0751 3819,24 55,5 1,2 1,44 2,1
5 1,7404 58,8 102,3355 3,0290 3457,44 56,4 -1,4 1,96 2,5
6 1,7348 47,2 81,8826 3,0095 2227,84 60,0 -5,7 32,49 10,5
7 1,6928 55,2 93,4426 2,8656 3047,04 57,5 -8,2 67,24 16,6
Jami12,3234 384,3 675,9974 21,7078 21338,41 403,4 -1,8 200,78 56,3
Chorshanba. zn.1,7605 54,9 96,5711 3,1011 3048,34 XX28,68 8,0
σ 0,0425 5,86 XXXXXXX
s 20,0018 34,339 XXXXXXX

Regressiya parametrlarining qiymatlari A va IN tashkil etdi:

A=Y -B x = 1,7605+0,0023 54,9 = 1,887
Olingan chiziqli tenglama: Y=1,887-0,0023x. Keling, hosil bo'lgan tenglamani kuchaytiramiz va uni odatdagi shaklda yozamiz:
y x =10 1,887 10 -0,0023x = 77,1 0,9947 x
Ulanishning yaqinligini p xy korrelyatsiya indeksi orqali baholaymiz:

3588,01 56,9 3,0 9,00 5,0 4 56,7 0,0162 0,9175 0,000262 3214,89 55,5 1,2 1,44 2,1 5 55 0,0170 0,9354 0,000289 3025,00 56,4 -1,4 1,96 2,5 6 54,3 0,0212 1,1504 0,000449 2948,49 60,8 -6,5 42,25 12,0 7 49,3 0,0181 0,8931 0,000328 2430,49 57,5 -8,2 67,24 16,6 Jami405,2 0,1291 7,5064 0,002413 23685,76 405,2 0,0 194,90 56,5 O'rtacha qiymati57,9 0,0184 1,0723 0,000345 3383,68 XX27,84 8,1 σ 5,74 0,002145 XXXXXXX s 232,9476 0,000005 XX

Regressiya tahlili statistik usul muayyan parametrning bir yoki bir nechta mustaqil o'zgaruvchilarga bog'liqligini ko'rsatishga imkon beruvchi tadqiqot. Kompyuterdan oldingi davrda undan foydalanish juda qiyin edi, ayniqsa katta hajmdagi ma'lumotlar haqida gap ketganda. Bugungi kunda Excelda regressiyani qanday yaratishni o'rganganingizdan so'ng, siz bir necha daqiqada murakkab statistik muammolarni hal qilishingiz mumkin. Quyida aniq misollar iqtisodiyot sohasidan.

Regressiya turlari

Ushbu tushunchaning o'zi 1886 yilda matematikaga kiritilgan. Regressiya sodir bo'ladi:

  • chiziqli;
  • parabolik;
  • tinchlantiruvchi;
  • eksponentsial;
  • giperbolik;
  • ko'rgazmali;
  • logarifmik.

1-misol

6 ta sanoat korxonasida ishdan bo'shatilgan jamoa a'zolari sonining o'rtacha ish haqiga bog'liqligini aniqlash muammosini ko'rib chiqaylik.

Vazifa. Oltita korxonada o‘rtacha oylik ish haqi va o‘z xohishi bilan ishdan bo‘shagan xodimlar soni tahlil qilindi. Jadval shaklida bizda:

Chiqib ketganlar soni

Ish haqi

30 000 rubl

35 000 rubl

40 000 rubl

45 000 rubl

50 000 rubl

55 000 rubl

60 000 rubl

6 ta korxonada ishdan bo'shatilgan ishchilar sonining o'rtacha ish haqiga bog'liqligini aniqlash vazifasi uchun regressiya modeli Y = a 0 + a 1 x 1 +...+a k x k tenglama ko'rinishiga ega, bu erda x i - o'zgaruvchilarga ta'sir etuvchi, a i - regressiya koeffitsientlari, k - omillar soni.

Ushbu muammo uchun Y xodimlarni ishdan bo'shatish ko'rsatkichi, ta'sir etuvchi omil esa ish haqi bo'lib, biz uni X bilan belgilaymiz.

Excel elektron jadval protsessorining imkoniyatlaridan foydalanish

Excelda regressiya tahlilidan oldin mavjud jadval ma'lumotlariga o'rnatilgan funktsiyalarni qo'llash kerak. Biroq, bu maqsadlar uchun juda foydali "Tahlil to'plami" qo'shimchasidan foydalanish yaxshiroqdir. Uni faollashtirish uchun sizga kerak:

  • "Fayl" yorlig'idan "Tanlovlar" bo'limiga o'ting;
  • ochilgan oynada "Qo'shimchalar" qatorini tanlang;
  • pastda, "Boshqarish" qatorining o'ng tomonida joylashgan "O'tish" tugmasini bosing;
  • "Tahlil paketi" nomining yonidagi katakchani belgilang va "Ok" tugmasini bosib harakatlaringizni tasdiqlang.

Har bir narsa to'g'ri bajarilgan bo'lsa, Excel ish varag'i ustida joylashgan "Ma'lumotlar" yorlig'ining o'ng tomonida kerakli tugma paydo bo'ladi.

Excelda

Endi bizda ekonometrik hisob-kitoblarni amalga oshirish uchun barcha kerakli virtual vositalar mavjud, biz muammoimizni hal qilishni boshlashimiz mumkin. Buning uchun:

  • "Ma'lumotlarni tahlil qilish" tugmasini bosing;
  • ochilgan oynada "Regressiya" tugmasini bosing;
  • paydo bo'lgan yorliqda Y (ishdan bo'shatilgan xodimlar soni) va X (ularning ish haqi) uchun qiymatlar oralig'ini kiriting;
  • "Ok" tugmasini bosish orqali harakatlarimizni tasdiqlaymiz.

Natijada, dastur avtomatik ravishda yangi elektron jadvalni regressiya tahlili ma'lumotlari bilan to'ldiradi. Eslatma! Excel bu maqsadda o'zingiz yoqtirgan joyni qo'lda sozlash imkonini beradi. Masalan, bu Y va X qiymatlari joylashgan bir xil varaq yoki hatto bo'lishi mumkin Yangi kitob, bunday ma'lumotlarni saqlash uchun maxsus mo'ljallangan.

R-kvadrat uchun regressiya natijalarini tahlil qilish

Excelda ko'rib chiqilayotgan misoldagi ma'lumotlarni qayta ishlash jarayonida olingan ma'lumotlar quyidagi shaklga ega:

Avvalo, siz R-kvadrat qiymatiga e'tibor berishingiz kerak. Determinatsiya koeffitsientini ifodalaydi. Ushbu misolda R-kvadrat = 0,755 (75,5%), ya'ni modelning hisoblangan parametrlari ko'rib chiqilayotgan parametrlar o'rtasidagi munosabatni 75,5% ga tushuntiradi. Determinatsiya koeffitsientining qiymati qanchalik baland bo'lsa, tanlangan model ma'lum bir vazifa uchun qanchalik mos keladi. R-kvadrat qiymati 0,8 dan yuqori bo'lsa, haqiqiy vaziyatni to'g'ri tasvirlash deb hisoblanadi. Agar R-kvadrat bo'lsa<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Imkoniyatlar tahlili

64.1428 raqami, agar biz ko'rib chiqayotgan modeldagi barcha xi o'zgaruvchilari nolga qaytarilsa, Y ning qiymati qanday bo'lishini ko'rsatadi. Boshqacha qilib aytganda, tahlil qilinayotgan parametrning qiymatiga ma'lum bir modelda tavsiflanmagan boshqa omillar ham ta'sir qiladi, deb bahslashish mumkin.

Keyingi koeffitsient -0,16285, B18 katakchasida joylashgan, X o'zgaruvchisining Y ga ta'sirining og'irligini ko'rsatadi. Bu ko'rib chiqilayotgan model doirasidagi xodimlarning o'rtacha oylik ish haqi -0,16285 og'irlikdagi ishdan bo'shaganlar soniga ta'sir qiladi, ya'ni. uning ta'sir darajasi butunlay kichik. "-" belgisi koeffitsientning salbiy ekanligini ko'rsatadi. Bu aniq, chunki korxonada ish haqi qancha yuqori bo'lsa, shunchalik kam odam mehnat shartnomasini bekor qilish yoki ishdan bo'shatish istagini bildirishini hamma biladi.

Ko'p regressiya

Ushbu atama shaklning bir nechta mustaqil o'zgaruvchilari bilan munosabatlar tenglamasini anglatadi:

y=f(x 1 +x 2 +…x m) + e, bu yerda y natijaviy xarakteristika (bog‘liq o‘zgaruvchi), x 1, x 2,…x m esa omil xarakteristikasi (mustaqil o‘zgaruvchilar).

Parametrni baholash

Ko'p regressiya (MR) uchun u eng kichik kvadratlar usuli (OLS) yordamida amalga oshiriladi. Y = a + b 1 x 1 +…+b m x m + e ko‘rinishdagi chiziqli tenglamalar uchun normal tenglamalar tizimini tuzamiz (pastga qarang).

Usulning printsipini tushunish uchun ikki faktorli ishni ko'rib chiqing. Keyin formula bilan tasvirlangan vaziyatga egamiz

Bu erdan biz olamiz:

bu erda s - indeksda aks ettirilgan mos keladigan xususiyatning dispersiyasi.

OLS standartlashtirilgan shkala bo'yicha MR tenglamasiga qo'llaniladi. Bunday holda, biz tenglamani olamiz:

bunda t y, t x 1, … t xm standartlashtirilgan o'zgaruvchilar bo'lib, ular uchun o'rtacha qiymatlari 0 ga teng; b i - standartlashtirilgan regressiya koeffitsientlari, standart og'ish esa 1 ga teng.

E'tibor bering, bu holda barcha b i normallashtirilgan va markazlashtirilgan deb ko'rsatilgan, shuning uchun ularni bir-biri bilan taqqoslash to'g'ri va maqbul deb hisoblanadi. Bundan tashqari, eng past bi qiymatlariga ega bo'lgan omillarni rad etish orqali omillarni tekshirish odatiy holdir.

Chiziqli regressiya tenglamasidan foydalanish masalasi

Aytaylik, bizda so'nggi 8 oy ichida ma'lum bir mahsulot N uchun narx dinamikasi jadvali mavjud. Uning partiyasini 1850 rubl / t narxda sotib olishning maqsadga muvofiqligi to'g'risida qaror qabul qilish kerak.

oy raqami

oy nomi

mahsulot narxi N

Bir tonna uchun 1750 rubl

Bir tonna uchun 1755 rubl

Bir tonna uchun 1767 rubl

Bir tonna uchun 1760 rubl

Bir tonna uchun 1770 rubl

Bir tonna uchun 1790 rubl

Bir tonna uchun 1810 rubl

Tonna uchun 1840 rubl

Excel elektron jadval protsessorida ushbu muammoni hal qilish uchun siz yuqorida keltirilgan misoldan ma'lum bo'lgan "Ma'lumotlarni tahlil qilish" vositasidan foydalanishingiz kerak. Keyinchalik, "Regressiya" bo'limini tanlang va parametrlarni o'rnating. Shuni esda tutish kerakki, "Kirish oralig'i Y" maydoniga qaram o'zgaruvchi uchun qiymatlar oralig'i (bu holda yilning ma'lum oylarida tovarlar narxi) va "Kirish oralig'i X" ga kiritilishi kerak. - mustaqil o'zgaruvchi uchun (oy raqami). “Ok” tugmasini bosish orqali amalni tasdiqlang. Yangi varaqda (agar ko'rsatilgan bo'lsa) biz regressiya uchun ma'lumotlarni olamiz.

Ulardan foydalanib, biz y=ax+b ko'rinishdagi chiziqli tenglamani tuzamiz, bu erda a va b parametrlari oy raqami nomi bilan chiziqning koeffitsientlari va varaqdan "Y-kesishma" koeffitsientlari va chiziqlari. regressiya tahlili natijalari. Shunday qilib, 3-topshiriq uchun chiziqli regressiya tenglamasi (LR) quyidagicha yoziladi:

Mahsulot narxi N = 11.714* oy raqami + 1727.54.

yoki algebraik yozuvda

y = 11,714 x + 1727,54

Natijalarni tahlil qilish

Olingan chiziqli regressiya tenglamasining adekvatligini aniqlash uchun ko'p korrelyatsiya (MCC) va aniqlash koeffitsientlari, shuningdek, Fisher testi va Student t testi qo'llaniladi. Regressiya natijalari bilan Excel elektron jadvalida ular mos ravishda bir nechta R, R-kvadrat, F-statistik va t-statistik deb ataladi.

KMC R mustaqil va qaram o'zgaruvchilar o'rtasidagi ehtimollik munosabatlarining yaqinligini baholash imkonini beradi. Uning yuqori qiymati "Oy soni" va "1 tonna uchun rubldagi N mahsulot narxi" o'zgaruvchilari o'rtasida juda kuchli bog'liqlikdan dalolat beradi. Biroq, bu munosabatlarning tabiati noma'lumligicha qolmoqda.

R2 (RI) aniqlash koeffitsientining kvadrati umumiy tarqalish nisbatining raqamli xarakteristikasi bo'lib, eksperimental ma'lumotlarning qaysi qismining tarqalishini ko'rsatadi, ya'ni. qaram o'zgaruvchining qiymatlari chiziqli regressiya tenglamasiga mos keladi. Ko'rib chiqilayotgan muammoda bu qiymat 84,8% ga teng, ya'ni statistik ma'lumotlar SD tomonidan yuqori aniqlik bilan tavsiflanadi.

F-statistika, Fisher testi deb ham ataladi, chiziqli munosabatlarning ahamiyatini baholash, uning mavjudligi haqidagi gipotezani rad etish yoki tasdiqlash uchun ishlatiladi.

(Talaba testi) chiziqli munosabatlarning noma'lum yoki erkin muddati bilan koeffitsientning ahamiyatini baholashga yordam beradi. Agar t-testning qiymati > tcr bo'lsa, chiziqli tenglamaning erkin hadining ahamiyatsizligi haqidagi gipoteza rad etiladi.

Erkin muddat uchun ko'rib chiqilayotgan muammoda, Excel vositalaridan foydalangan holda, t = 169.20903 va p = 2.89E-12 ekanligi aniqlandi, ya'ni bizda erkin atamaning ahamiyatsizligi haqidagi to'g'ri farazni rad etish ehtimoli nolga teng. . Noma'lum uchun koeffitsient uchun t=5,79405, va p=0,001158. Boshqacha qilib aytganda, noma'lum uchun koeffitsientning ahamiyatsizligi haqidagi to'g'ri gipotezani rad etish ehtimoli 0,12% ni tashkil qiladi.

Shunday qilib, natijada olingan chiziqli regressiya tenglamasi adekvat ekanligini ta'kidlash mumkin.

Aktsiyalar paketini sotib olishning maqsadga muvofiqligi muammosi

Excelda bir nechta regressiya bir xil ma'lumotlarni tahlil qilish vositasi yordamida amalga oshiriladi. Keling, maxsus dastur muammosini ko'rib chiqaylik.

NNN kompaniyasi rahbariyati MMM OAJning 20% ​​ulushini sotib olishning maqsadga muvofiqligi to'g'risida qaror qabul qilishi kerak. Paket narxi (SP) 70 million AQSh dollarini tashkil etadi. NNN mutaxassislari shunga o'xshash operatsiyalar bo'yicha ma'lumotlarni to'plashdi. Aktsiyalar paketining qiymatini millionlab AQSh dollarida ifodalangan quyidagi parametrlar bo'yicha baholashga qaror qilindi:

  • kreditorlik qarzlari (VK);
  • yillik aylanma hajmi (VO);
  • debitorlik qarzlari (VD);
  • asosiy vositalarning tannarxi (COF).

Bundan tashqari, korxonaning ish haqi bo'yicha qarzdorligi parametri (V3 P) ming AQSH dollarida qo'llaniladi.

Excel elektron jadval protsessoridan foydalangan holda yechim

Avvalo, siz manba ma'lumotlar jadvalini yaratishingiz kerak. Bu shunday ko'rinadi:

  • "Ma'lumotlarni tahlil qilish" oynasiga qo'ng'iroq qiling;
  • "Regressiya" bo'limini tanlang;
  • "Kirish oralig'i Y" maydoniga G ustunidan qaram o'zgaruvchilar qiymatlari oralig'ini kiriting;
  • "Kirish oralig'i X" oynasining o'ng tomonidagi qizil o'q bilan belgini bosing va varaqdagi B, C, D, F ustunlaridagi barcha qiymatlar oralig'ini belgilang.

"Yangi ish varag'i" bandini belgilang va "OK" tugmasini bosing.

Berilgan muammo uchun regressiya tahlilini oling.

Natijalar va xulosalarni o'rganish

Biz jadvalli varaqda yuqorida keltirilgan yaxlitlangan ma'lumotlardan "yig'amiz" Excel protsessor, regressiya tenglamasi:

SP = 0,103 * SOF + 0,541 * VO - 0,031 * VK +0,405 * VD +0,691 * VZP - 265,844.

Ko'proq tanish matematik shaklda uni quyidagicha yozish mumkin:

y = 0,103*x1 + 0,541*x2 - 0,031*x3 +0,405*x4 +0,691*x5 - 265,844

"MMM" OAJ uchun ma'lumotlar jadvalda keltirilgan:

Ularni regressiya tenglamasiga almashtirsak, biz 64,72 million AQSh dollarini olamiz. Bu “MMM” AJ aksiyalarini sotib olishga arzigulik emasligini anglatadi, chunki ularning qiymati 70 million AQSH dollariga teng.

Ko'rib turganingizdek, Excel elektron jadvalidan va regressiya tenglamasidan foydalanish juda aniq bitimning maqsadga muvofiqligi to'g'risida xabardor qaror qabul qilish imkonini berdi.

Endi siz regressiya nima ekanligini bilasiz. Yuqorida muhokama qilingan Excel misollari qaror qabul qilishga yordam beradi amaliy muammolar ekonometrika sohasidan.

Do'stlaringizga ulashing yoki o'zingiz uchun saqlang:

Yuklanmoqda...