Statistisk studie av sammenhengen mellom fenomenstatistikk. Statistisk studie av sammenhenger mellom sosioøkonomiske fenomener. Hvis forholdet mellom to egenskaper studeres, er dette en parvis korrelasjon. Hvis forholdet mellom mange egenskaper studeres - korrelasjon

Studiet av objektivt eksisterende sammenhenger mellom fenomener er den viktigste oppgaven generell teori statistikk. I prosessen med statistisk studie av avhengigheter avdekkes årsak-virkning-forhold mellom fenomener, noe som gjør det mulig å identifisere faktorer (tegn) som har en betydelig innvirkning på variasjonen av fenomenene og prosessene som studeres. Et årsak-virkningsforhold er en sammenheng mellom fenomener og prosesser der en endring i den ene - årsaken - fører til en endring i den andre - virkningen.

En årsak er et sett av forhold, omstendigheter, hvis handling fører til utseendet til en effekt. Hvis det virkelig er årsak-virkning-forhold mellom fenomener, må disse forholdene nødvendigvis realiseres sammen med årsakenes virkning. Årsakssammenhenger er universelle og mangfoldige, og for å oppdage årsak-virkningsforhold er det nødvendig å velge individuelle fenomener og studere dem isolert.

Av spesiell viktighet når man studerer årsak-virkning-forhold er identifiseringen av tidssekvensen: årsaken må alltid gå foran effekten, men ikke alle tidligere hendelser skal betraktes som en årsak, og den påfølgende - en konsekvens.

I den virkelige sosioøkonomiske virkeligheten må årsak og virkning betraktes som relaterte fenomener, hvis utseende skyldes et kompleks av medfølgende enklere årsaker og virkninger. Mellom komplekse grupper av årsaker og virkninger er det mulige sammenhenger med flere verdier, der en årsak vil bli fulgt av en eller annen handling, eller en handling vil ha flere forskjellige årsaker. For å etablere en entydig årsakssammenheng mellom fenomener eller for å forutsi mulige konsekvenser av en spesifikk årsak, kreves fullstendig abstraksjon fra alle andre fenomener i det tidsmessige eller romlige miljøet som studeres. Teoretisk er en slik abstraksjon gjengitt. Abstraksjonsteknikker brukes ofte når man studerer forholdet mellom to egenskaper (parvis korrelasjon). Men jo mer komplekse fenomenene som studeres, desto vanskeligere er det å identifisere årsak-virkning-forhold mellom dem. Sammenveving av ulike interne og eksterne faktorer fører uunngåelig til noen feil ved å bestemme årsak og virkning.

Et trekk ved årsak-virkningsforhold i sosioøkonomiske fenomener er deres transitivitet, dvs. årsak og virkning er relatert av korrelasjon, ikke direkte. Imidlertid er mellomliggende faktorer vanligvis utelatt i analysen.

Så, for eksempel, når du bruker indikatorer for den internasjonale beregningsmetoden, anses bruttofortjenestefaktoren for å være bruttoakkumulering av fast kapital og arbeidskapital, men slike faktorer som brutto produksjon, lønn osv. er tillatt. Korrekt avdekkede årsak-virkning-forhold gjør det mulig å fastslå styrken av individuelle faktorers innflytelse på resultatene av økonomisk aktivitet.

Sosioøkonomiske fenomener er et resultat av samtidig påvirkning av et stort antall årsaker. Følgelig, når man studerer disse fenomenene, er det nødvendig å abstrahere fra sekundære å identifisere de viktigste, grunnleggende årsakene.

På den første fasen av statistisk studie av kommunikasjon utføres en kvalitativ analyse av fenomenet som studeres ved hjelp av metoder økonomisk teori, sosiologi, konkret økonomi.

På andre trinn bygges en kommunikasjonsmodell basert på statistiske metoder: grupperinger, gjennomsnitt, tabeller mv.

I tredje og siste trinn tolkes resultatene; analyse er igjen relatert til de kvalitative trekkene ved fenomenet som studeres.

Statistikk har utviklet mange metoder for å studere sammenhenger, valget av disse avhenger av studiets mål og oppgavene som er satt. Forbindelsene mellom tegn og fenomener, på grunn av deres store variasjon, er klassifisert på en rekke grunner. Tegn i henhold til deres betydning for å studere forholdet er delt inn i to klasser. Egenskaper som forårsaker endringer i andre relaterte egenskaper kalles faktorielle, eller ganske enkelt faktorer. Tegn som endres under påvirkning av faktortegn er effektive. Forbindelser mellom fenomener og deres egenskaper klassifiseres etter graden av nærhet til sammenhengen, retningen og det analytiske uttrykket.

I statistikk skilles det mellom funksjonell sammenheng og stokastisk avhengighet. Et funksjonelt forhold er et der en viss verdi av en faktorkarakteristikk tilsvarer én og bare én verdi av den resulterende karakteristikken. Den funksjonelle forbindelsen manifesteres i alle tilfeller av observasjon og for hver spesifikk enhet av befolkningen som studeres.

Hvis en årsaksavhengighet ikke vises i hvert enkelt tilfelle, men generelt i gjennomsnitt over et stort antall observasjoner, kalles en slik avhengighet stokastisk. Et spesielt tilfelle av stokastisk er et korrelasjonsforhold, der en endring i gjennomsnittsverdien til den resulterende karakteristikken skyldes en endring i faktorkarakteristikker.

Ut fra graden av tilknytningsnærhet skilles det ut kvantitative kriterier for vurdering av tilknytningsnærhet (tabell 1).

Tabell 1 Kvantitative kriterier for vurdering av sammenhengens nærhet

Ved retning skilles direkte og omvendte forbindelser. I en direkte forbindelse med en økning eller reduksjon i verdiene til en faktorkarakteristikk, oppstår en økning eller reduksjon i verdiene til den resulterende karakteristikken. For eksempel bidrar en økning i arbeidsproduktiviteten til å øke lønnsomhetsnivået i produksjonen. Når tilbakemelding verdiene til den resulterende karakteristikken endres under påvirkning av faktorkarakteristikken, men i motsatt retning sammenlignet med endringen i faktorkarakteristikken. Med en økning i kapitalproduktivitetsnivået synker således kostnaden per produksjonsenhet.

I følge det analytiske uttrykket skilles forbindelser mellom lineær (eller ganske enkelt lineær) og ikke-lineær. Hvis en statistisk sammenheng mellom fenomener tilnærmet kan uttrykkes ved likningen av en rett linje, så kalles det en lineær sammenheng; hvis det uttrykkes ved ligningen til en hvilken som helst buet linje (parabel, hyperbel, potens, eksponentiell, eksponentiell, etc.), kalles et slikt forhold ikke-lineært eller krumlinjet.

Statistikk krever ikke alltid kvantitative vurderinger av forholdet; ofte er det viktig å bare bestemme retningen og arten, for å identifisere formen for påvirkning av noen faktorer på andre. For å identifisere tilstedeværelsen av et forhold, dets natur og retning i statistikk, brukes metoder for å bringe parallelle data; analytiske grupper; grafikk; korrelasjon, regresjon.

Metoden for å bringe parallelle data er basert på å sammenligne to eller flere serier med statistiske verdier. En slik sammenligning lar oss fastslå eksistensen av en forbindelse og få en ide om dens natur. La oss sammenligne endringene i to mengder og etter hvert som verdien øker, øker også verdien. Derfor er forbindelsen mellom dem direkte, og den kan beskrives enten med en rettlinjeligning eller en annenordens parabelligning.

Forholdet mellom to funksjoner er avbildet grafisk ved hjelp av korrelasjonsfeltet. I koordinatsystemet er verdiene til faktorkarakteristikken plottet på abscisseaksen, og den resulterende karakteristikken er plottet på ordinataksen. Hvert skjæringspunkt av linjer trukket gjennom disse aksene er indikert med en prikk. I fravær av nære forbindelser observeres et tilfeldig arrangement av punkter på grafen. Jo sterkere forbindelsen mellom funksjonene er, desto tettere vil punktene bli gruppert rundt en bestemt linje som uttrykker forbindelsens form.

Det er karakteristisk for sosioøkonomiske fenomener at det, sammen med de betydelige faktorene som utgjør nivået til den resulterende karakteristikken, påvirkes av mange andre uoppdagede og tilfeldige faktorer. Dette indikerer at relasjonene mellom fenomenene studert av statistikk er korrelasjonelle i naturen og er analytisk uttrykt av en funksjon av formen.

Korrelasjonsmetoden har som oppgave å kvantitativt bestemme nærheten av sammenhengen mellom to egenskaper (i en parvis sammenheng) og mellom de resulterende og mange faktoregenskapene (i en multifaktoriell sammenheng).

Korrelasjon er en statistisk avhengighet mellom tilfeldige variabler som ikke har en strengt funksjonell karakter, der en endring i en av tilfeldige variabler fører til endring matematisk forventning en annen.

I statistikk skilles følgende avhengighetsalternativer ut:

-par korrelasjon - en sammenheng mellom to egenskaper (resultativ og faktor eller to faktor);
-delvis korrelasjon - avhengigheten mellom de resulterende og en faktorkarakteristikk med en fast verdi av andre faktorkarakteristikker;
-multippelkorrelasjon - avhengigheten av den resulterende og to eller flere faktorkarakteristika inkludert i studien.

Nærheten til forbindelsen uttrykkes kvantitativt ved størrelsen på korrelasjonskoeffisientene. Korrelasjonskoeffisienter, som representerer en kvantitativ karakteristikk av det nære forholdet mellom egenskaper, gjør det mulig å bestemme "nytten" av faktorkarakteristikker ved å konstruere flere regresjonsligninger. Verdien av korrelasjonskoeffisienten fungerer også som en vurdering av konsistensen av regresjonsligningen med de identifiserte årsak-virkningsforhold.

I utgangspunktet ble korrelasjonsstudier utført innen biologi, og senere spredt til andre områder, inkludert sosioøkonomi. Samtidig med korrelasjon begynte regresjon å bli brukt. Korrelasjon og regresjon er nært beslektet: korrelasjon evaluerer styrken (nærheten) til en statistisk sammenheng, regresjon undersøker formen. Begge tjener til å etablere forholdet mellom fenomener, for å bestemme tilstedeværelsen eller fraværet av en forbindelse.

Korrelasjons- og regresjonsanalyse som generelt konsept omfatter måling av tetthet, retning av forbindelsen og etablering av et analytisk uttrykk (form) av sammenhengen (regresjonsanalyse).

Regresjonsmetoden består i å bestemme det analytiske uttrykket for et forhold der en endring i en verdi (kalt en avhengig eller resulterende karakteristikk) skyldes påvirkningen av en eller flere uavhengige verdier (faktorer) og settet av alle andre faktorer som også påvirker den avhengige verdien tas som konstante og gjennomsnittlige betydninger. Regresjon kan være enkeltfaktor (paret) eller multifaktor (multippel).

Avhengig av formen for avhengighet er det:

Lineær regresjon, som uttrykkes ved en rettlinjeligning (lineær funksjon) av formen:

Yx = a0 + a1x;

Ikke-lineær regresjon, som uttrykkes ved ligninger av formen:

Yx = a0 + a1x + a2 x 2 - parabel; Yx = a0 ++ a1/x - hyperbel

I henhold til kommunikasjonsretningen er det:

-direkte regresjon (positiv), som oppstår hvis, med en økning eller reduksjon i den uavhengige verdien, verdiene til den avhengige verdien også øker eller reduseres tilsvarende;
-invers (negativ) regresjon, som vises under forutsetning av at med en økning eller reduksjon i den uavhengige verdien, reduseres eller øker den avhengige verdien tilsvarende.

Positive og negative regresjoner kan lettere forstås hvis de er representert grafisk.

For enkel (paret) regresjon, i forhold der årsak-virkning-forhold er tilstrekkelig fullstendig etablert, får bare den siste bestemmelsen praktisk betydning; Med et mangfold av årsakssammenhenger er det umulig å tydelig skille noen årsaksfenomener fra andre.

sesongmessige fluktuasjonsregresjon

9.1. Kausalitet, regresjon, korrelasjon

I prosessen med statistisk studie av avhengigheter avdekkes årsak-virkningsforhold mellom fenomener, noe som gjør det mulig å identifisere faktorer (tegn) som har stor innflytelse på variasjonen av fenomenene og prosessene som studeres. Et årsak-virkningsforhold er en sammenheng mellom fenomener og prosesser, når en endring i en av dem, årsaken, fører til en endring i den andre, virkningen.

I henhold til deres betydning for å studere forholdet, er tegn delt inn i to typer: faktoriell og effektiv.

Sosioøkonomiske fenomener er et resultat av samtidig påvirkning av et stort antall årsaker. Følgelig, når du studerer disse fenomenene, er det nødvendig å identifisere de viktigste, viktigste årsakene, abstrahere fra de sekundære.

Den første fasen av statistisk studie av sammenhengen er basert på en kvalitativ analyse av fenomenet som studeres, dvs. studie av dens natur ved å bruke metodene økonomisk teori, sosiologi og konkret økonomi. Den andre fasen er å bygge en kommunikasjonsmodell. Det tredje og siste stadiet, tolkning av resultatene, er igjen assosiert med de kvalitative trekkene ved fenomenet som studeres.

I statistikk skilles det mellom funksjonelle og stokastiske sammenhenger. Et funksjonelt forhold er et der en viss verdi av en faktorkarakteristikk tilsvarer én og bare én verdi av den resulterende karakteristikken. Denne sammenhengen er manifestert i alle tilfeller av observasjon og for hver spesifikk enhet av befolkningen som studeres. Hvis en årsaksavhengighet ikke vises i hvert enkelt tilfelle, men generelt i gjennomsnitt over et stort antall observasjoner, kalles en slik avhengighet stokastisk. Et spesielt tilfelle av et stokastisk forhold er et korrelasjonsforhold, der en endring i gjennomsnittsverdien til en effektiv egenskap skyldes en endring i faktorkarakteristikker.

Forbindelsene mellom tegn og fenomener, på grunn av deres store variasjon, klassifiseres på en rekke grunnlag: etter graden av nærhet til forbindelsen, retning og analytisk uttrykk.

Graden av nærhet til korrelasjonsforbindelsen kan vurderes kvantitativt ved hjelp av korrelasjonskoeffisienten, hvis verdi bestemmer sammenhengens art (tabell 1).

Tabell 1 - Kvantitative kriterier for tetthet av kobling

Mot skille mellom direkte og omvendte forbindelser.

I en direkte forbindelse med en økning eller reduksjon i verdiene til en faktorkarakteristikk, oppstår en økning eller reduksjon i verdiene til den resulterende karakteristikken. Når det gjelder tilbakemelding, når verdiene til faktorattributtet øker, reduseres verdiene til det resulterende attributtet, og omvendt.

Ifølge det analytiske uttrykket skilles forbindelser: lineære(eller bare lineær) og ikke-lineær. Hvis det statistiske forholdet mellom fenomener tilnærmet kan uttrykkes ved ligningen til en rett linje, så kalles det lineært; hvis det uttrykkes ved ligningen til en hvilken som helst buet linje (parabel, hyperbel, eksponentiell, eksponentiell, etc.), kalles et slikt forhold ikke-lineært eller krumlinjet.

For å identifisere tilstedeværelsen av en forbindelse, dens natur og retning i statistikk, brukes følgende metoder: bringe parallelle data; analytiske grupper; statistiske grafer; korrelasjoner.

Parallell datareduksjonsmetode er basert på en sammenligning av to eller flere serier med statistiske verdier. En slik sammenligning lar oss fastslå eksistensen av en forbindelse og få en ide om dens natur. For eksempel er endringen i to mengder representert av følgende data.

Grafisk er forholdet mellom to karakteristikker avbildet ved hjelp av korrelasjonsfeltet. I koordinatsystemet er verdiene til faktorkarakteristikken plottet på abscisseaksen, og den resulterende karakteristikken er plottet på ordinataksen. Jo sterkere forbindelsen mellom egenskapene er, desto tettere vil punktene være gruppert rundt en bestemt linje som uttrykker forbindelsens form (fig.).

I fravær av nære forbindelser er det et tilfeldig arrangement av punkter på grafen.

Det er typisk for sosioøkonomiske fenomener at det, sammen med de betydelige faktorene som utgjør nivået til den effektive egenskapen, påvirkes av mange andre uoppdagede og tilfeldige faktorer. Dette indikerer at sammenhengene mellom fenomenene som studeres av statistikk er korrelasjonsmessige.

Sammenheng er en statistisk sammenheng mellom tilfeldige variabler som ikke har en strengt funksjonell karakter, der en endring i en av de tilfeldige variablene fører til en endring i den matematiske forventningen (gjennomsnittsverdien) til den andre.

I statistikk er det vanlig å skille mellom følgende typer avhengigheter.

1. Parkorrelasjon – en sammenheng mellom to egenskaper (resultativ og faktor eller tofaktor).

2. Delvis korrelasjon - avhengigheten mellom de resulterende og en faktorkarakteristikk med en fast verdi av andre faktorkarakteristikker.

3. Multippel korrelasjon - avhengigheten av den resulterende og to eller flere faktorkarakteristika inkludert i studien.

Oppgaven med korrelasjonsanalyse er en kvantitativ bestemmelse av nærheten til forbindelsen mellom to egenskaper (i en parvis sammenheng) og mellom de resulterende og multiple faktorkarakteristikkene (i en multifaktoriell sammenheng).

Nærheten til forbindelsen uttrykkes kvantitativt av størrelsen på korrelasjonskoeffisientene, som gjør det mulig å bestemme "nytten" av faktorkarakteristikker når man konstruerer flere regresjonsligninger. I tillegg tjener verdien av korrelasjonskoeffisienten som en vurdering av konsistensen av regresjonsligningen med de identifiserte årsak-virkningsforhold.

9.2. Vurdere tettheten til forbindelsen

Nærheten til korrelasjonen mellom faktor og ytelsesegenskaper kan beregnes ved å bruke følgende koeffisienter: empirisk korrelasjonskoeffisient (Fechner-koeffisient); assosiasjonskoeffisient; Pearson og Chuprov gjensidig beredskapskoeffisient; betinget faktor; Spearman og Kendal rangerer korrelasjonskoeffisienter; lineær korrelasjonskoeffisient; korrelasjonsforhold osv.

Den lineære korrelasjonskoeffisienten karakteriserer den tetteste forbindelsen: , hvor er gjennomsnittet av produktene av funksjonsverdier xy; – gjennomsnittsverdier av funksjoner X Og på; - standardavvik for egenskaper X Og u. Det brukes hvis forholdet mellom egenskapene er lineært

Den lineære korrelasjonskoeffisienten kan være positiv eller negativ.

Dens positive verdi indikerer en direkte forbindelse, og dens negative verdi indikerer en invers forbindelse. Jo nærmere ±1, jo nærmere forbindelsen. Med en funksjonell sammenheng mellom karakteristikker = ±1. Nærhet til 0 betyr at forholdet mellom funksjonene er svakt.

9.3. Regresjonsanalysemetoder

Nært knyttet til begrepet korrelasjon er begrepet regresjon. Den første tjener til å vurdere nærheten til forbindelsen, den andre undersøker dens form. Korrelasjons- og regresjonsanalyse, som et generelt begrep, inkluderer å måle sammenhengens tetthet og retning (korrelasjonsanalyse) og etablere et analytisk uttrykk (form) av forbindelsen (regresjonsanalyse).

Etter at tilstedeværelsen av statistiske sammenhenger mellom variabler er identifisert ved hjelp av korrelasjonsanalyse og graden av deres nærhet er vurdert, går vi videre til en matematisk beskrivelse av en spesifikk type avhengighet ved hjelp av regresjonsanalyse. For å gjøre dette, velg en klasse funksjoner som relaterer den effektive indikatoren på og argumenter x 1 , x 2, … xk, velg de mest informative argumentene, beregn estimater av ukjente verdier for kommunikasjonsparametere og analyser egenskapene til den resulterende ligningen.

Funksjon som beskriver avhengigheten av gjennomsnittsverdien til den resulterende karakteristikken på fra de gitte argumentverdiene kalles regresjonsfunksjon (ligning). Regresjon er en linje, en type avhengighet av den gjennomsnittlige effektive karakteristikken på faktoren en.

Den mest utviklede i statistikkteorien er metodikken for parkorrelasjon, som vurderer påvirkningen av variasjon av en faktorkarakteristikk x på den resulterende y

Den lineære korrelasjonsligningen har formen: .

Alternativer en 0 Og en 1 kalles parametere for regresjonsligningen.

For å bestemme parametrene til regresjonsligningen, brukes metoden minste kvadrater, som gir et system med to normale ligninger:

Ved å løse dette systemet i generell form, kan vi få formler for å bestemme parametrene til regresjonsligningen: ,

ØVELSER

Oppgave 9.1. 15 fabrikker er rangert i rekkefølge etter økende lønnsomhet i produksjonen.

Bedriftsnr.	Produksjonslønnsomhet, %	Produksjon per arbeider, t/person	Kostnad per produksjonsenhet, gni.

Etablere tilstedeværelsen og formen for en sammenheng mellom produksjonslønnsomhet og produksjon, produksjonslønnsomhet og enhetskostnad for produksjon ved bruk av metodene for statistiske grafer og regresjonsanalyse.

1. Et kurs i statistikkteori for opplæringsspesialister i finansielle og økonomiske profiler: lærebok / Salin V. N. - M.: Finans og statistikk, 2006. - 480 s.

2. Generell teori om statistikk: en lærebok for universitetsstudenter / M. R. Efimova, E. V. Petrova, V. N. Rumyantsev. - 2. utgave, rev. og tillegg - M.: INFRA-M, 2006. - 414 s.

3. Workshop om generell teori om statistikk: opplæringen/ MR. Efimova, O.I. Ganchenko, E.V. Petrova. - Ed. 3., revidert og tillegg - M. Finans og statistikk, 2007. - 368 s.

4. Workshop om statistikk / A.P. Zinchenko, A.E., Shibalkin, O.B. Tarasova, E.V. Shaikina; Ed. A.P. Zinchenk. – M.: KolossS, 2003. – 392 s.

5. Statistikk: Lærebok for elever. institusjoner prof. utdanning / V.S. Mkhitaryan, T.A. Dubrova, V.G. Minashkin et al.; Ed. V.S. Mkhitaryan. – 3. utg., slettet. – M.: Publishing Center “Academy”, 2004. -272 s.

6. Statistikk: lærebok for universitetsstudenter / St. Petersburg. stat Universitetet for økonomi og finans; redigert av I. I. Eliseeva. - M.: Høyere utdanning, 2008. - 566 s.

7. Statistikk teori: en lærebok for studenter av økonomiske spesialiteter ved universiteter / R. A. Shmoilova [et al.]; utg. R.A. Shmoilova. - 5. utg. - M.: Finans og statistikk, 2008. - 656 s.

Studiet av moderne produksjon viser at hvert fenomen henger tett sammen og interagerer.

Når man studerer spesifikke avhengigheter, fungerer noen egenskaper som faktorer som bestemmer endringer i andre egenskaper. Egenskapene til denne gruppen kalles faktorkarakteristikker (faktoregenskaper), og egenskapene som er et resultat av påvirkningen av disse faktorene kalles effektive (ettersom produksjonsvolumet påvirkes av produksjonsteknisk utstyr, deretter produksjonsvolumet er effektivt, og det tekniske utstyret er en faktorkarakteristikk). Det er to typer avhengigheter mellom økonomiske fenomener – funksjonelle og stokastiske. Med en funksjonell forbindelse tilsvarer hvert definert system av verdier av faktorkarakteristikk en eller flere strengt definerte verdier av den resulterende karakteristikken. Eksempler på funksjonell avhengighet kan gis fra feltet fysiske fenomener (S = v·t).

Stokastisk (sannsynlig) sammenheng manifesterer seg bare i massefenomener. I denne forbindelse tilsvarer hvert spesifikt system med verdier av faktorkarakteristikk et visst sett med verdier av den resulterende karakteristikken. En endring i faktorkarakteristikker fører ikke til en strengt definert endring i den resulterende egenskapen, men til en endring bare i fordelingen av dens verdier. Dette skyldes det faktum at den avhengige variabelen, i tillegg til den valgte variabelen, er påvirket av en rekke ukontrollerte eller urapporterte faktorer, og også fordi målingen av variabler uunngåelig er ledsaget av noen tilfeldige feil. Siden verdiene til den avhengige variabelen er gjenstand for tilfeldig spredning, kan de ikke forutsies med tilstrekkelig nøyaktighet, men er bare indikert med en viss sannsynlighet (antall defekte deler per skift, antall nedetid per skift, etc.) .

Stokastisk kommunikasjon kalles korrelasjon. Korrelasjon i ordets vid forstand betyr en sammenheng, et forhold mellom objektivt eksisterende fenomener og prosesser. Regresjon er et spesielt tilfelle av korrelasjon. Mens korrelasjonsanalyse vurderer styrken til et stokastisk forhold, undersøker regresjonsanalyse dens form, dvs. korrelasjonsligningen (regresjonsligningen) er funnet.

La oss vurdere forskjellige typer korrelasjoner og regresjoner.

Regresjon er klassifisert i henhold til antall variabler:

1) paret – regresjon mellom to variabler (profitt og arbeidsproduktivitet);

2) multiple – regresjon mellom den avhengige variabelen y og flere variabler (arbeidsproduktivitet, nivå av produksjonsmekanisering, arbeiderkvalifikasjoner).

Når det gjelder formen for avhengighet, er det:

lineær regresjon; ikke-lineær regresjon.

Avhengig av regresjonens natur, er det:

1) direkte regresjon. Det oppstår hvis, med en økning eller reduksjon i verdiene til faktorvariabler, verdiene til den resulterende variabelen også øker eller reduseres;

2) omvendt regresjon. I dette tilfellet, med en økning eller reduksjon i verdiene til faktorkarakteristikken, reduseres eller øker den resulterende karakteristikken.

Når det gjelder typen kobling av fenomener, skiller de:

1) direkte regresjon. I dette tilfellet er fenomenene direkte knyttet til hverandre (profitkostnader);

2) indirekte regresjon. Det oppstår hvis faktor- og utfallsvariablene ikke er direkte i et årsak-virkningsforhold og faktorvariabelen virker på utfallsvariabelen gjennom en annen variabel (antall branner og kornutbytte (meteorologiske forhold));

3) falsk eller absurd regresjon. Det oppstår med en formell tilnærming til fenomenene som studeres. Som et resultat kan du komme til falske og til og med meningsløse avhengigheter (antall importerte frukter og økningen i dødelige trafikkulykker).

Klassifiseringen og korrelasjonene er like.

Studiet av gjensidig avhengighet i økonomi er av stor betydning. Statistikk svarer ikke bare på spørsmålet om den reelle eksistensen av en sammenheng mellom fenomener, men gir også en kvantitativ beskrivelse av dette forholdet. Når du kjenner til arten av avhengigheten til ett fenomen av et annet, er det mulig å forklare årsakene til og omfanget av endringer i fenomenet, samt planlegge nødvendige tiltak for dens videre endring. For at resultatene av korrelasjonsanalysen skal bli funnet praktisk bruk og ga ønsket resultat, må visse krav oppfylles:

1) homogenitet av enheter som er gjenstand for korrelasjonsanalyse (bedrifter produserer samme type produkter, samme natur av den teknologiske prosessen og type utstyr);

2) et tilstrekkelig antall observasjoner;

3) faktorene som inngår i studien må være uavhengige av hverandre.

For å studere funksjonelle sammenhenger brukes balanse- og indeksmetoder. For å studere stokastiske sammenhenger brukes metoden for parallellserier, metoden for analytiske grupperinger, variansanalyse og analyse av regresjoner og korrelasjoner.

Den enkleste metoden for å oppdage forbindelser er å sammenligne to parallelle serier. Essensen av metoden er at først blir indikatorene som karakteriserer faktorkarakteristikken rangert, og deretter plasseres de tilsvarende indikatorene for den resulterende karakteristikken parallelt med dem. Sammenligning av serier konstruert på denne måten gjør det mulig ikke bare å bekrefte selve tilstedeværelsen av en forbindelse, men også å identifisere dens retning.

I tilfellet når den sammenlignede serien består av et stort antall enheter, kan kommunikasjonsretningen for ulike enheter være forskjellig. I dette tilfellet er det mer tilrådelig å bruke korrelasjonstabeller. I en korrelasjonstabell er faktorkarakteristikken (x) plassert i rader, og den resulterende karakteristikken (y) er plassert i kolonner. Tallene i skjæringspunktet mellom radene og kolonnene i tabellen viser gjentakelsesfrekvensen av en gitt kombinasjon av x og y. Konstruksjonen av en korrelasjonstabell begynner med å gruppere observasjonsenheter i henhold til verdiene til faktoren og resulterende egenskaper. Hvis frekvensene i korrelasjonstabellen er plassert diagonalt fra øvre venstre hjørne til nedre høyre hjørne, kan vi anta tilstedeværelsen av en direkte korrelasjon. Hvis frekvensene er plassert diagonalt fra høyre til venstre, antas tilstedeværelsen av tilbakemelding mellom skiltene.

En annen metode for å oppdage forbindelser er å bygge en gruppetabell (analytisk grupperingsmetode). Settet med verdier av faktor x er delt inn i grupper, og for hver gruppe beregnes gjennomsnittsverdien av den resulterende karakteristikken. Det antas at med et tilstrekkelig stort antall observasjoner i hver gruppe, vil påvirkningen av andre tilfeldige faktorer ved beregning av gruppegjennomsnittet oppheves og avhengigheten av den effektive karakteristikken av faktorkarakteristikken vil bli tydeligere og derfor forskjeller i verdien av midlene vil bare være assosiert med forskjeller i verdien av denne faktorkarakteristikken. Hvis det ikke var noen sammenheng mellom faktoren og den resulterende attributten, ville alle gruppemiddelverdier være omtrent like store.

Den enkleste indikatoren på nærhet til en forbindelse er f(H. Fechner-koeffisienten):

hvor er antall sammenfall av tegn på avvik av en individuell verdi fra gjennomsnittet;

– antall avvik i tegn på avvik av en individuell verdi fra gjennomsnittet.

Denne koeffisienten lar deg få en ide om retningen til forbindelsen og en omtrentlig karakteristikk av dens tetthet. For å beregne det, beregnes gjennomsnittsverdiene for resultat- og faktorkarakteristikkene, og deretter tildeles avvikstegnene for alle verdiene av de innbyrdes relaterte karakteristikkene Kf = [-1;+1]. Hvis tegnene på alle avvik faller sammen, er Kf = 1 - en direkte forbindelse; hvis tegnene på alle avvik er forskjellige, er Kf = - 1, som indikerer tilstedeværelsen av tilbakemelding.

Tabell 28

Antall arbeidere og balanseresultat

Antall arbeidere, mennesker	Balanseoverskudd, tusen rubler.	Tegn på avvik av individuelle egenskapsverdier fra gjennomsnittet	Match (a), mismatch (b)

Tusen gni.

, dermed er det en svak tilbakemelding mellom skiltene.

For å tilnærme retningen og styrken til forholdet mellom egenskapene representert av to serier, kan du også bruke rangkorrelasjonskoeffisienten. Når du bestemmer rangkorrelasjonskoeffisienten, rangeres x-verdiene, og deretter rangeres de tilsvarende y-verdiene. Som et resultat får vi rangeringer, d.v.s. steder, antall enheter av en populasjon i en ordnet serie. Dessuten, hvis det er identiske alternativer, blir hver av dem tildelt det aritmetiske gjennomsnittet av rangeringene deres.

Spearmans rangkorrelasjonskoeffisient:

hvor d er forskjellen mellom rekkene til de tilsvarende verdiene til to egenskaper;

n – antall enheter på rad.

Rangekorrelasjonskoeffisienten tar verdier [-1; 1]. Hvis – nær direkte forbindelse, – nær tilbakemelding, – er det ingen forbindelse. Rangekorrelasjonskoeffisienten har visse fordeler i forhold til andre egenskaper ved forbindelsens retning og nærhet: den kan bestemmes når man studerer data som ikke kan nummereres, men er rangert (nyanser, kvalitet).

For numerisk å karakterisere forbindelsens nærhet, kan indikatorer for variasjon av den resulterende karakteristikken brukes: dens totale spredning og intergruppespredning ().

Kendal rang korrelasjonskoeffisient:

hvor q er antall ranger arrangert i omvendt rekkefølge.

I praksis av statistisk forskning er det ofte nødvendig å analysere alternative fordelinger, når populasjonen fordeles for hver egenskap i to grupper med motsatte egenskaper. Nærheten til forbindelsen i dette tilfellet kan vurderes ved å bruke betinget koeffisient:

Tabell 29

Avhengighet av elevprestasjoner av kjønn

Studentpopulasjon
besto eksamenene	de som ikke besto eksamen

Følgelig er det praktisk talt ingen sammenheng mellom studentens kjønn og hans akademiske prestasjoner.

Assosiasjonskoeffisienten beregnes som følger:

Tidligere anmeldt statistiske metoder Studier av sammenhenger viser seg ofte å være utilstrekkelige, fordi de ikke lar den eksisterende sammenhengen uttrykkes i form av en spesifikk matematisk ligning. Metoder med parallelle serier og analytiske grupperinger er effektive bare med et lite antall faktorkarakteristikker, mens sosioøkonomiske fenomener vanligvis utvikles under påvirkning av mange årsaker. Disse begrensningene elimineres ved metoden for å analysere korrelasjoner og regresjoner.

Metoden for å analysere korrelasjoner og regresjoner består i å konstruere og analysere en økonomisk-matematisk modell i form av en regresjonsligning som uttrykker et fenomens avhengighet av dets bestemmende faktorer. For eksempel er avhengigheten av produksjonsvolum (y) (millioner rubler) av dets tekniske utstyr (x) (%) uttrykt ved følgende avhengighet:

Det kan antas at med en økning i teknisk utstyr med 1%, vil produksjonsvolumet øke med gjennomsnittlig 21,4 millioner rubler.

Metoden for å analysere korrelasjoner og regresjoner består av følgende trinn:

foreløpig analyse; innsamling av informasjon og dens primære behandling; bygge en modell (regresjonsligninger); evaluering og analyse av modellen.

På den første fasen er det nødvendig å formulere forskningsproblemet generelt (studere påvirkningen av ulike faktorer på nivået av arbeidsproduktivitet). Deretter bør du bestemme metodikken for å måle ytelsesindikatoren (arbeidsproduktivitet kan bestemmes ved naturlige, arbeids- eller kostnadsmetoder). Det er også nødvendig å bestemme antall faktorer som har den viktigste innvirkningen på dannelsen av den effektive egenskapen.

På stadiet med innsamling og bearbeiding av informasjon må forskeren huske at populasjonen som studeres må være stor nok i volum. Kildedataene skal være kvalitativt og kvantitativt homogene.

Ved konstruksjon av en korrelasjonsmodell (regresjonsligning) oppstår spørsmålet om hvilken type analytisk funksjon som kjennetegner mekanismen for sammenheng mellom egenskaper. Dette forholdet kan uttrykkes:

rett linje ; andre ordens parabel ; overdrivelse; eksponentiell funksjon osv.

Det vil si at spørsmålet oppstår om valg av kommunikasjonsform. Typen empirisk regresjon antyder hvilken type kurve som kan beskrives. Deretter løses regresjonsligningen. Deretter, ved hjelp av spesielle kriterier, vurderes deres tilstrekkelighet og koblingsformen velges som gir best tilnærming og tilstrekkelig statistisk pålitelighet. Etter å ha valgt formen for forbindelsen og konstruert en regresjonsligning i generell form, er det nødvendig å finne den numeriske verdien av parameterne. For å finne parametrene brukes minste kvadraters metode. Dens essens er som følger.

Studiet av avhengigheter er en vanskelig oppgave, siden sosioøkonomiske fenomener i seg selv er komplekse og mangfoldige. I tillegg er konklusjonene som trekkes sannsynlighetsmessig, siden de er trukket fra data som er et utvalg i tid eller rom.

Statistiske metoder for å studere avhengighet er bygget under hensyntagen til egenskapene til mønstrene som studeres. Statistikk studerer først og fremst stokastiske sammenhenger, når en verdi av en faktorkarakteristikk tilsvarer en gruppe verdier av den resulterende karakteristikken. Hvis, med en endring i verdiene til en faktorkarakteristikk, gruppegjennomsnittsverdiene for den resulterende karakteristikken endres, kalles slike sammenhenger korrelasjon. Ikke hver stokastisk avhengighet er korrelasjonell. Hvis hver verdi av en faktorkarakteristikk tilsvarer en strengt definert verdi av den resulterende karakteristikk, så er en slik avhengighet funksjonell. Det kalles også fullstendig korrelasjon. Tvetydige korrelasjoner kalles ufullstendig korrelasjon.

I henhold til interaksjonsmekanismen skilles de ut:

· Direkte forbindelser - når årsaken direkte påvirker effekten;

· Indirekte sammenhenger - når det er en rekke mellomtegn mellom årsak og virkning (for eksempel alders innvirkning på inntjeningen).

Følgende områder skilles ut:

· Direkte forbindelser - når verdien av faktoren og resulterende egenskaper endres i samme retning;

· Tilbakemelding - når verdiene til faktor og resulterende egenskaper endres i forskjellige retninger.

· Rettlinjede (lineære) forbindelser - uttrykt med en rett linje;

· Kurvilineære forbindelser - uttrykt ved parabel, hyperbel.

Basert på antall sammenhengende egenskaper, skilles de ut:

· Parede forbindelser - når forholdet mellom to egenskaper (faktorielle og resulterende) analyseres;

· Flere forbindelser - karakteriser innflytelsen av flere egenskaper på en effektiv.

Basert på styrken til interaksjon, skilles de ut:

· Svake (merkbare) forbindelser;

· Sterke (nære) forbindelser.

Statistikkens oppgave er å bestemme nærvær, retning, form og nærhet til forholdet.

Ulike statistiske metoder brukes for å studere avhengigheten. Siden avhengigheter i statistikk manifesteres gjennom variasjon av egenskaper, måler og sammenligner metodene hovedsakelig variasjonen av faktor og resulterende egenskaper.

Hvis vi plotter grupperingsresultatene på en graf, får vi en empirisk regresjonslinje. Intervaller med faktorkarakteristiske verdier erstattes av gjennomsnittlige gruppeindikatorer.

I tillegg til den empiriske regresjonslinjen, som direkte bestemmer form og retning av sammenhenger, er det et korrelasjonsfelt som parametriske data reflekteres på.

Korrelasjonsfeltet kan også brukes til å bedømme relasjonens natur. Hvis punktene er konsentrert nær diagonalen som går fra venstre til høyre, fra bunn til topp, er forbindelsen direkte. Hvis nær en annen diagonal - det motsatte. Hvis punktene er spredt over hele graffeltet, er det ingen sammenheng.

Når du konstruerer en analytisk gruppering, er det viktig å bestemme størrelsen på intervallet riktig. Hvis forbindelsen ikke vises tydelig som et resultat av den første grupperingen, kan du forstørre intervallet. Men ved å forstørre intervallene er det noen ganger mulig å oppdage en forbindelse selv der det ikke er noen. Derfor, når vi konstruerer en analytisk gruppering, blir vi styrt av regelen: jo flere grupper vi kan identifisere uten å møte et eneste unntak, desto mer pålitelig er hypotesen vår om tilstedeværelsen og formen til forbindelsen.

Ikke-matematiske metoder gir et omtrentlig estimat av tilstedeværelsen, formen og retningen til forbindelsen. Dypere analyse utføres ved hjelp av matematiske metoder som har utviklet seg på grunnlag av metoder brukt av ikke-matematiske statistikere:

· Regresjonsanalyse, som lar deg uttrykke formen til et forhold ved hjelp av en ligning.

· Korrelasjonsanalyse brukes til å bestemme nærheten eller styrken til forholdet mellom funksjoner. Korrelasjonsmetoder er delt inn i:

- Parametriske metoder som gir en vurdering av nærhet til forholdet direkte basert på verdiene til faktoren og resulterende egenskaper;

- Ikke-parametriske metoder - gi et estimat basert på betingede estimater av egenskaper.

En vurdering av tettheten til krumlinjede avhengigheter er gitt etter beregning av parameteren til regresjonsligningen. Derfor kalles denne metoden korrelasjon-regresjon.

Hvis avhengigheten av én faktor og resulterende egenskaper analyseres, har vi i dette tilfellet å gjøre med parkorrelasjon og regresjon. Hvis flere faktor- og ytelsesegenskaper analyseres, er dette multippel korrelasjon og regresjon.

Regresjon er en linje som karakteriserer den mest generelle trenden i forholdet mellom faktor og resulterende egenskaper.

Det antas at den analytiske ligningen uttrykker den sanne formen for avhengigheten, og alle avvik fra denne funksjonen skyldes virkningen av ulike tilfeldige årsaker. Siden korrelasjoner studeres, tilsvarer en endring i en faktorkarakteristikk en endring i gjennomsnittsnivået til den resulterende karakteristikken. Når vi konstruerte analytiske grupperinger, tok vi for oss den empiriske regresjonslinjen. Imidlertid er denne linjen ikke egnet for økonomisk modellering, og formen avhenger av forskerens vilkårlighet. Teoretisk sett er regresjonslinjen mindre avhengig av subjektiviteten til forskeren, men det kan også være vilkårlighet i valg av relasjonsform eller funksjon. Man mener at valg av funksjon bør baseres på dyp kunnskap spesifikasjoner av forskningsemnet.

I praksis brukes oftest følgende former for regresjonsmodeller:

· Lineær;

· Semi-logaritmetisk kurve;

· Overdrivelse;

· Andre ordens parabel;

· Eksponentiell funksjon;

· Strømfunksjon.

Denne egenskapen til gjennomsnittet, som sier at summen av kvadrerte avvik for alle varianter av en serie fra det aritmetiske gjennomsnittet er mindre enn summen av kvadrerte avvik fra et hvilket som helst annet tall, er grunnlaget for minste kvadraters metode, som tillater du beregne parametrene til den valgte regresjonsligningen på en slik måte at regresjonslinjen i gjennomsnitt er minst fjernt fra empiriske data.

Ikke-parametriske metoder for å måle relasjoners nærhet mellom kvantitative egenskaper var de første metodene for måling av relasjoners nærhet. Den franske vitenskapsmannen Guirriy forsøkte først å måle forbindelsens nærhet på 30-tallet av 1800-tallet. Han sammenlignet de gjennomsnittlige gruppeverdiene for faktoren og resulterende egenskaper. I dette tilfellet ble absolutte verdier erstattet av deres forhold til visse konstanter. Resultatene som ble oppnådd ble rangert i stigende rekkefølge. Girriy bedømte tilstedeværelsen eller fraværet av en forbindelse ved å sammenligne tidligere etter grupper og telle antall kamper og avvik i rangeringer. Hvis antall kamper vant, ble forbindelsen ansett som direkte. Mismatch - revers. Hvis det var like treff og mismatch, var det ingen sammenheng.

Girri-metoden ble brukt av Fechner når han utviklet sin koeffisient, så vel som av Spearman når han utviklet rangkorrelasjonskoeffisienten.

Koeffisienten indikerer tilstedeværelsen av et veldig nært tilbakemeldingsforhold.

Sammen med Fechner-koeffisienten brukes rangkorrelasjonskoeffisienter for å måle forholdet mellom kvantitative egenskaper. Den vanligste blant dem er Spearman-rangkorrelasjonskoeffisienten.

Ikke-parametriske metoder brukes for å måle nærheten av forholdet mellom kvalitative og alternative egenskaper, samt kvantitative egenskaper, hvis fordeling er forskjellig fra normalfordelingen.

For å måle sammenhengen mellom alternative egenskaper brukes David Yules assosiasjonskoeffisient og Karl Pearsons beredskapskoeffisient. For å beregne disse indikatorene brukes følgende matrise for gjensidig frekvensfordeling:

a, b, c, d - frekvenser for gjensidig fordeling av funksjoner.

Ved direkte kobling er frekvensene konsentrert langs a-d-diagonalen, med tilbakemelding langs b-c-diagonalen, uten kobling er frekvensene nesten jevnt fordelt over hele bordets felt.

Assosiasjonskoeffisient

Assosiasjonskoeffisienten er ikke egnet for beregning hvis en av frekvensene langs diagonalen er 0. I dette tilfellet brukes kontingentkoeffisienten, som beregnes med formelen:

Kontingentkoeffisienten indikerer også det praktiske fraværet av forbindelse mellom egenskapene (verdien er alltid mindre enn K ac).

For å måle nærheten til en lineær sammenheng, brukes en korrelasjonskoeffisient. Den grunnleggende formen for korrelasjonskoeffisienten er som følger:

Faktisk er korrelasjonskoeffisienten gjennomsnittet av produktet av standardavvik:

Hvis det ikke er noen sammenheng mellom egenskapene, vil den resulterende karakteristikken ikke variere når faktorkarakteristikken endres, derfor. Det samme resultatet oppnås når summene av negative og positive produkter balanseres.

Vanligvis, for å beregne korrelasjonskoeffisienten, brukes formler som bruker de indikatorene som allerede ble beregnet når parametrene til regresjonsligningen ble bestemt.

Multippel korrelasjon og regresjon brukes til å studere innflytelsen av to eller flere faktorer på en utfallskarakteristikk. Forskningsprosessen omfatter flere stadier.

Først velges formen til relasjonsligningen; oftest velges en n-dimensjonal lineær formel:

Fordi beregningene er viktige og tidkrevende, er utvalget av faktorer som skal inkluderes i regresjonsmodellen kritisk. Basert på kvalitativ analyse er det nødvendig å velge de viktigste faktorene. På faktorvalgstadiet beregnes også en enhetsmatrise av parede korrelasjonskoeffisienter mellom egenskapene til faktorene som er valgt for inkludering i regresjonsligningen.

Studiet av objektivt eksisterende sammenhenger mellom sosioøkonomiske fenomener og prosesser er statistikkteoriens viktigste oppgave. I prosess

Statistisk forskning av avhengigheter avdekker årsak-virkning-sammenhenger mellom fenomener, noe som gjør det mulig å identifisere faktorer (tegn) som har stor innflytelse på variasjonen av fenomenene og prosessene som studeres. Årsak-virkningsforhold er en slik sammenheng mellom fenomener og prosesser når en endring i en av dem – årsaken – fører til endring i den andre – virkningen.

Finansielle og økonomiske prosesser er et resultat av samtidig påvirkning av et stort antall årsaker. Følgelig, når du studerer disse prosessene, er det nødvendig å identifisere de viktigste, viktigste årsakene, abstrahere fra de sekundære.

Den første fasen av den statistiske studien av kommunikasjon er basert på kvalitativ analyse assosiert med analysen av naturen til et sosialt eller økonomisk fenomen ved bruk av metodene økonomisk teori, sosiologi og konkret økonomi. Den andre fasen - å bygge en kommunikasjonsmodell, er basert på statistiske metoder: grupperinger, gjennomsnittsverdier og så videre. Det tredje og siste stadiet, tolkning av resultatene, er igjen assosiert med de kvalitative trekkene ved fenomenet som studeres. Statistikk har utviklet mange metoder for å studere sammenhenger. Valg av kommunikasjonsstudiemetode avhenger av kognitivt formål og forskningsmål.

Tegn, i henhold til deres essens og betydning for å studere forholdet, er delt inn i to klasser. Tegn som forårsaker endringer i andre tilhørende tegn kalles faktoriell, eller bare faktorer. Kjennetegn som endres under påvirkning av faktorkarakteristikker kalles effektive.

I statistikk skilles det mellom funksjonelle og stokastiske avhengigheter. Funksjonell er et forhold der en viss verdi av en faktorkarakteristikk tilsvarer én og bare én verdi av den resulterende karakteristikken.

Hvis en årsaksavhengighet ikke vises i hvert enkelt tilfelle, men generelt i gjennomsnitt med et stort antall observasjoner, kalles en slik avhengighet stokastisk. Et spesielt tilfelle av stokastisk kobling er sammenheng et forhold der en endring i gjennomsnittsverdien til en resulterende karakteristikk skyldes en endring i faktorkarakteristikker.

Forbindelser mellom fenomener og deres egenskaper er klassifisert etter graden av nærhet,

retning og analytisk uttrykk.

I henhold til graden av nærhet til forbindelsen, skilles de ut:

Med en økning eller reduksjon i verdiene til faktorkarakteristikken, er det en økning eller reduksjon i verdiene til den resulterende karakteristikken. Dermed bidrar en økning i produksjonsvolumer til en økning i fortjenesten til foretaket. Når omvendt koblinger, verdiene til den resulterende karakteristikken endres under påvirkning av faktorkarakteristikken, men i motsatt retning sammenlignet med endringen i faktorkarakteristikken, dvs. omvendt– dette er et forhold der det, med en økning eller reduksjon i verdiene til en egenskap, er en reduksjon eller økning i verdiene til en annen egenskap. En reduksjon i kostnaden per produksjonsenhet innebærer således en økning i lønnsomheten.

Ifølge det analytiske uttrykket skilles sammenhenger rett(eller ganske enkelt om-

neynye) Og ikke-lineær. Hvis en statistisk sammenheng mellom fenomener kan brukes

er omtrent uttrykt ved ligningen til en rett linje, kalles det lineær type tilkobling.