Studenter og skoleelever - bistand i studiene. Konseptet med en variasjonsserie. Typer variasjonsserier Oppgitte variantserier

Grupperingsmetoden lar deg også måle variasjon(variabilitet, fluktuasjon) av tegn. Når antallet enheter i en populasjon er relativt lite, måles variasjonen basert på det rangerte antallet enheter som utgjør populasjonen. Serien heter rangert, hvis enhetene er ordnet i stigende (synkende) rekkefølge av karakteristikken.

Rangerte serier er imidlertid ganske veiledende når en komparativ karakteristikk av variasjon er nødvendig. I tillegg må vi i mange tilfeller forholde oss til statistiske populasjoner som består av et stort antall enheter, som er praktisk talt vanskelige å representere i form av en bestemt serie. I denne forbindelse, for en første generell kjennskap til statistiske data og spesielt for å lette studiet av variasjon i egenskaper, kombineres fenomenene og prosessene som studeres vanligvis i grupper, og grupperingsresultatene presenteres i form av gruppetabeller.

Hvis en gruppetabell bare har to kolonner - grupper i henhold til en valgt egenskap (alternativer) og antall grupper (frekvens eller frekvens), kalles den nær distribusjon.

Distribusjonsområde - den enkleste typen strukturell gruppering basert på én karakteristikk, vist i en gruppetabell med to kolonner som inneholder varianter og frekvenser av karakteristikken. I mange tilfeller med en slik strukturell gruppering, dvs. Med sammenstillingen av distribusjonsserier starter studiet av det innledende statistiske materialet.

En strukturell gruppering i form av en distribusjonsserie kan gjøres om til en genuin strukturell gruppering dersom de utvalgte gruppene ikke bare karakteriseres av frekvenser, men også av andre statistiske indikatorer. Hovedformålet med distribusjonsserier er å studere variasjonen av egenskaper. Teorien om distribusjonsserier er utviklet i detalj av matematisk statistikk.

Distribusjonsseriene er delt inn i attributive(gruppering etter attributive egenskaper, for eksempel ved å dele befolkningen etter kjønn, nasjonalitet, sivilstand osv.) og variasjon(gruppering etter kvantitative egenskaper).

Variasjonsserie er en gruppetabell som inneholder to kolonner: gruppering av enheter i henhold til én kvantitativ egenskap og antall enheter i hver gruppe. Intervallene i variasjonsserien er vanligvis utformet like og lukkede. Variasjonsserien er følgende gruppering av den russiske befolkningen etter gjennomsnittlig pengeinntekt per innbygger (tabell 3.10).

Tabell 3.10

Fordeling av befolkningen i Russland etter gjennomsnittlig inntekt per innbygger i 2004-2009.

Befolkningsgrupper etter gjennomsnittlig kontantinntekt per innbygger, rub./måned

Innbyggertall i gruppen, % av totalen

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Over 25 000,0

Hele befolkningen

Variasjonsserier er på sin side delt inn i diskrete og intervaller. Diskret variasjonsserier kombinerer varianter av diskrete egenskaper som varierer innenfor snevre grenser. Et eksempel på en diskret variantserie er fordelingen av russiske familier etter antall barn de har.

Intervall variasjonsserier kombinerer varianter av enten kontinuerlige egenskaper eller diskrete egenskaper som varierer over et bredt spekter. Intervall er variasjonsserien av fordelingen av den russiske befolkningen etter gjennomsnittlig pengeinntekt per innbygger.

Diskrete variasjonsserier brukes ikke så ofte i praksis. I mellomtiden er det ikke vanskelig å kompilere dem, siden sammensetningen av gruppene bestemmes av de spesifikke variantene som de studerte grupperingsegenskapene faktisk har.

Intervallvariasjonsserier er mer utbredt. Når du sammenstiller dem, oppstår et vanskelig spørsmål om antall grupper, samt størrelsen på intervallene som bør etableres.

Prinsippene for å løse dette problemet er nedfelt i kapittelet om metodikk for å konstruere statistiske grupperinger (se avsnitt 3.3).

Variasjonsserier er et middel til å kollapse eller komprimere mangfoldig informasjon til en kompakt form; fra dem kan man gjøre en ganske klar vurdering av variasjonens art, og studere forskjellene i egenskapene til fenomenene som er inkludert i settet som studeres. Men den viktigste betydningen av variasjonsserier er at på grunnlag av disse beregnes de spesielle generaliserende egenskapene til variasjon (se kapittel 7).

Gruppering- dette er inndelingen av en befolkning i grupper som er homogene i henhold til en eller annen egenskap.

Formålet med tjenesten. Ved å bruke den elektroniske kalkulatoren kan du:

  • bygge en variantserie, bygg et histogram og polygon;
  • finne variasjonsindikatorer (gjennomsnitt, modus (inkludert grafisk), median, variasjonsområde, kvartiler, desiler,nt, variasjonskoeffisient og andre indikatorer);

Bruksanvisning. For å gruppere en serie må du velge typen variasjonsserie som er oppnådd (diskret eller intervall) og angi mengden data (antall rader). Den resulterende løsningen lagres i en Word-fil (se eksempel på gruppering av statistiske data).

Hvis grupperingen allerede er utført og diskrete variasjonsserier eller intervallserie, så må du bruke den elektroniske kalkulatoren Variation Indices. Teste hypotesen om type distribusjon utføres ved hjelp av tjenesten Studere distribusjonsskjemaet.

Typer statistiske grupperinger

Variasjonsserie. Ved observasjoner av en diskret tilfeldig variabel kan samme verdi påtreffes flere ganger. Slike verdier x i av en tilfeldig variabel er registrert som indikerer n i antall ganger den vises i n observasjoner, dette er frekvensen til denne verdien.
Ved en kontinuerlig stokastisk variabel brukes gruppering i praksis.
  1. Typologisk gruppering- dette er inndelingen av den kvalitativt heterogene befolkningen som studeres i klasser, sosioøkonomiske typer, homogene grupper av enheter. For å bygge denne grupperingen, bruk parameteren Diskret variantserie.
  2. En gruppering kalles strukturell, der en homogen populasjon er delt inn i grupper som karakteriserer dens struktur i henhold til noen varierende karakteristikk. For å bygge denne grupperingen, bruk parameteren Interval series.
  3. En gruppering som avslører sammenhengene mellom fenomenene som studeres og deres egenskaper kalles analytisk gruppe(se analytisk gruppering av serier).

Eksempel nr. 1. Basert på dataene i tabell 2, konstruer distribusjonsserier for 40 forretningsbanker i den russiske føderasjonen. Ved hjelp av den resulterende distribusjonsserien, bestemme: fortjeneste i gjennomsnitt per kommersiell bank, kredittinvesteringer i gjennomsnitt per kommersiell bank, modal og medianverdi av profitt; kvartiler, desiler, variasjonsområde, gjennomsnittlig lineært avvik, standardavvik, variasjonskoeffisient.

Løsning:
I kapittel "Type statistisk serie" velg Diskret serie. Klikk på Sett inn fra Excel. Antall grupper: i henhold til Sturgess-formelen

Prinsipper for å konstruere statistiske grupperinger

En serie observasjoner ordnet i stigende rekkefølge kalles variantserie . Grupperingsfunksjon er en egenskap som gjør at en populasjon er delt inn i separate grupper. Det kalles grunnlaget for gruppen. Grupperingen kan baseres på både kvantitative og kvalitative egenskaper.
Etter å ha bestemt grunnlaget for grupperingen, bør spørsmålet om antall grupper som befolkningen under utredning skal deles inn i, avgjøres.

Ved bruk av personlige datamaskiner for å behandle statistiske data, utføres gruppering av objektenheter ved bruk av standardprosedyrer.
En slik prosedyre er basert på bruken av Sturgess-formelen for å bestemme det optimale antallet grupper:

k = 1+3,322*log(N)

Der k er antall grupper, N er antall befolkningsenheter.

Lengden på delintervaller beregnes som h=(x maks -x min)/k

Deretter telles antall observasjoner som faller inn i disse intervallene, som tas som frekvenser n i. Få frekvenser, hvis verdier er mindre enn 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
De midterste verdiene av intervallene x i =(c i-1 +c i)/2 tas som nye verdier.

Eksempel nr. 3. Som et resultat av en tilfeldig prøve på 5 % ble følgende fordeling av produkter etter fuktighetsinnhold oppnådd. Beregn: 1) gjennomsnittlig prosentandel av fuktighet; 2) indikatorer som karakteriserer fuktighetsvariasjoner.
Løsningen ble oppnådd ved hjelp av en kalkulator: Eksempel nr. 1

Konstruer en variantserie. Basert på den funnet serien, konstruer en distribusjonspolygon, histogram og kumuler. Bestem modus og median.
Last ned løsning

Eksempel. I henhold til resultatene av prøveobservasjon (prøve A, vedlegg):
a) lage en variantserie;
b) beregne relative frekvenser og akkumulerte relative frekvenser;
c) bygge en polygon;
d) lage en empirisk distribusjonsfunksjon;
e) plotte den empiriske fordelingsfunksjonen;
f) beregne numeriske egenskaper: aritmetisk gjennomsnitt, spredning, standardavvik. Løsning

Basert på dataene gitt i tabell 4 (vedlegg 1) og som tilsvarer ditt alternativ, gjør du:

  1. Basert på den strukturelle grupperingen, konstruer variasjonsfrekvens og kumulative distribusjonsserier ved å bruke like lukkede intervaller, og ta antall grupper lik 6. Presenter resultatene i tabellform og vis grafisk.
  2. Analyser variasjonsserien til fordelingen ved å beregne:
    • aritmetisk middelverdi av karakteristikken;
    • modus, median, 1. kvartil, 1. og 9. desil;
    • standardavvik;
    • variasjonskoeffisienten.
  3. Trekke konklusjoner.

Påkrevd: ranger serien, konstruer en intervallfordelingsserie, beregn gjennomsnittsverdien, variasjonen til gjennomsnittsverdien, modus og median for rangerte og intervallserier.

Basert på de første dataene, konstruer en diskret variasjonsserie; presentere det i form av en statistisk tabell og statistiske grafer. 2). Basert på de første dataene, konstruer en intervallvariasjonsserie med like intervaller. Velg antall intervaller selv og forklar dette valget. Presenter den resulterende variasjonsserien i form av en statistisk tabell og statistiske grafer. Angi hvilke typer tabeller og grafer som brukes.

For å fastslå gjennomsnittlig varighet på kundeservicen i en pensjonskasse, hvor antallet kunder er svært stort, ble det gjennomført en undersøkelse med 100 kunder ved hjelp av en tilfeldig ikke-repetitiv utvalgsordning. Undersøkelsesresultatene er presentert i tabellen. Finne:
a) grensene innenfor hvilke, med sannsynlighet 0,9946, den gjennomsnittlige tjenestetiden for alle kunder i pensjonskassen er inneholdt;
b) sannsynligheten for at andelen av alle fondskunder med en tjenestevarighet på mindre enn 6 minutter avviker fra andelen til slike kunder i utvalget med ikke mer enn 10 % (i absolutt verdi);
c) volumet av gjentatt prøvetaking, hvor det med en sannsynlighet på 0,9907 kan angis at andelen av alle fondskunder med tjenestevarighet på mindre enn 6 minutter avviker fra andelen slike kunder i utvalget med ikke mer enn 10 % (i absolutt verdi).
2. I henhold til oppgave 1, ved bruk av Pearsons X2-test, på signifikansnivået α = 0,05, test hypotesen om at tilfeldig verdi X – kundeservicetid – fordeles etter vanlig lov. Konstruer et histogram av den empiriske fordelingen og den tilsvarende normalkurven i én tegning.
Last ned løsning

Et utvalg av 100 elementer er gitt. Nødvendig:

  1. Konstruer en rangert variantserie;
  2. Finn maksimums- og minimumsbetingelsene for serien;
  3. Finn variasjonsområdet og antall optimale intervaller for å konstruere en intervallserie. Finn lengden på intervallet til intervallserien;
  4. Konstruer en intervallserie. Finn frekvensene til prøveelementene som faller inn i de sammensatte intervallene. Finn midtpunktene til hvert intervall;
  5. Konstruer et histogram og frekvenspolygon. Sammenlignet med normal distribusjon(analytisk og grafisk);
  6. Plott den empiriske fordelingsfunksjonen;
  7. Beregn prøvens numeriske egenskaper: prøvegjennomsnitt og sentralt prøvemoment;
  8. Beregn omtrentlige verdier for standardavvik, skjevhet og kurtose (ved hjelp av MS Excel-analysepakken). Sammenlign omtrentlige beregnede verdier med nøyaktige (beregnet ved hjelp av MS Excel-formler);
  9. Sammenlign utvalgte grafiske egenskaper med de tilsvarende teoretiske.
Last ned løsning

Følgende prøvedata er tilgjengelig (10% prøve, mekanisk) på produktproduksjon og fortjenestebeløp, millioner rubler. I følge de originale dataene:
Oppgave 13.1.
13.1.1. Konstruer en statistisk serie med fordeling av foretak etter mengden overskudd, og danner fem grupper med like intervaller. Konstruer distribusjonsseriegrafer.
13.1.2. Beregn de numeriske egenskapene til distribusjonsserien av foretak ved mengden fortjeneste: aritmetisk gjennomsnitt, standardavvik, spredning, variasjonskoeffisient V. Trekk konklusjoner.
Oppgave 13.2.
13.2.1. Bestem grensene som, med sannsynlighet 0,997, mengden fortjeneste for ett foretak i den generelle befolkningen ligger innenfor.
13.2.2. Ved å bruke Pearsons x2-test, på signifikansnivået α, test hypotesen om at den stokastiske variabelen X – mengden av profitt – er fordelt etter en normallov.
Oppgave 13.3.
13.3.1. Bestem koeffisientene til prøveregresjonsligningen.
13.3.2. Etablere tilstedeværelsen og arten av korrelasjonen mellom kostnaden for produserte produkter (X) og mengden fortjeneste per bedrift (Y). Konstruer et spredningsplott og regresjonslinje.
13.3.3. Beregn den lineære korrelasjonskoeffisienten. Ved å bruke Students t-test, test signifikansen av korrelasjonskoeffisienten. Trekk en konklusjon om den nære sammenhengen mellom faktorene X og Y ved å bruke Chaddock-skalaen.
Retningslinjer . Oppgave 13.3 utføres ved hjelp av denne tjenesten.
Last ned løsning

Oppgave. Følgende data representerer tiden kundene bruker på å inngå kontrakter. Konstruer en intervallvariasjonsserie av de presenterte dataene, et histogram, finn et objektivt estimat matematisk forventning, partisk og objektiv variansestimator.

Eksempel. I følge tabell 2:
1) Bygg distribusjonsserie for 40 forretningsbanker i Den russiske føderasjonen:
A) når det gjelder fortjeneste;
B) ved mengden kredittinvesteringer.
2) Bruk den oppnådde distribusjonsserien, bestem:
A) gjennomsnittlig fortjeneste per forretningsbank;
B) kredittinvesteringer i gjennomsnitt per forretningsbank;
C) modal og median verdi av profitt; kvartiler, desiler;
D) modal og medianverdi av kredittinvesteringer.
3) Bruk distribusjonsradene oppnådd i trinn 1, beregn:
a) variasjonsområde;
b) gjennomsnittlig lineært avvik;
c) standardavvik;
d) variasjonskoeffisient.
Fullfør nødvendige beregninger i tabellform. Analyser resultatene. Trekke konklusjoner.
Plott grafer av den resulterende distribusjonsserien. Bestem modus og median grafisk.

Løsning:
For å bygge en gruppering med like intervaller vil vi bruke tjenesten Gruppere statistiske data.

Figur 1 – Legge inn parametere

Beskrivelse av parametere
Antall linjer: antall inndata. Hvis radstørrelsen er liten, angi antall. Hvis utvalget er stort nok, klikker du på Sett inn fra Excel-knappen.
Antall grupper: 0 – antall grupper vil bli bestemt av Sturgess-formelen.
Hvis et spesifikt antall grupper er spesifisert, spesifiser det (for eksempel 5).
Type serie: Diskret serie.
Signifikansnivå: for eksempel 0,954 . Denne parameteren er satt til å bestemme konfidensintervallet til gjennomsnittet.
Prøve: For eksempel ble det utført 10 % mekanisk prøvetaking. Vi angir tallet 10. For våre data angir vi 100.

Et sett med objekter eller fenomener forent av et fellestrekk eller egenskap av kvalitativ eller kvantitativ art kalles gjenstand for observasjon .

Hvert objekt for statistisk observasjon består av individuelle elementer - observasjonsenheter .

Resultatene av statistisk observasjon representerer numerisk informasjon - data . Statistisk data - dette er informasjon om hvilke verdier karakteristikken av interesse for forskeren tok i den statistiske populasjonen.

Hvis verdiene til en karakteristikk er uttrykt i tall, kalles karakteristikken kvantitativ .

Hvis et tegn karakteriserer en egenskap eller tilstand til elementene i en populasjon, kalles tegnet høy kvalitet .

Hvis alle elementer i en populasjon er gjenstand for studier (kontinuerlig observasjon), kalles den statistiske populasjonen generell

Hvis en del av elementene i den generelle befolkningen er gjenstand for forskning, kalles den statistiske populasjonen selektiv (prøvetaking) . Et utvalg fra en populasjon trekkes tilfeldig slik at hvert av de n elementene i utvalget har like stor sjanse for å bli valgt.

Verdiene av en karakteristisk endring (varierer) når du flytter fra ett element i befolkningen til et annet, derfor kalles også forskjellige verdier av en karakteristikk i statistikk alternativer . Alternativer er vanligvis merket med små latinske bokstaver x, y, z.

Serienummeret til opsjonen (karakteristisk verdi) kalles rang . x 1 - 1. alternativ (1. verdi av attributtet), x 2 - 2. alternativ (2. verdi av attributtet), x i - i-te alternativet (i-te verdi skilt).

En serie med attributtverdier (alternativer) ordnet i stigende eller synkende rekkefølge med deres tilsvarende vekter kalles variantserie (distribusjonsserie).

Som vekter frekvenser eller frekvenser vises.

Frekvens(m i) viser hvor mange ganger dette eller det alternativet (attributtverdi) forekommer i den statistiske populasjonen.

Frekvens eller relativ frekvens(w i) viser hvilken del av befolkningsenhetene som har en eller annen mulighet. Frekvens beregnes som forholdet mellom frekvensen til et bestemt alternativ og summen av alle frekvensene i serien.

. (6.1)

Summen av alle frekvenser er 1.

. (6.2)

Variasjonsserier er diskrete og intervall.

Diskrete variasjonsserier De er vanligvis konstruert hvis verdiene til karakteristikken som studeres kan avvike fra hverandre med ikke mindre enn en viss begrenset mengde.

I diskrete variasjonsserier er punktverdier for karakteristikken spesifisert.

Den generelle oversikten over den diskrete variasjonsserien er vist i tabell 6.1.

Tabell 6.1

hvor i = 1, 2, … l.

I intervallvariasjonsserier skilles i hvert intervall intervallets øvre og nedre grenser.

Forskjellen mellom øvre og nedre grenser for intervallet kalles intervallforskjell eller lengde (verdi) av intervallet .

Verdien av det første intervallet k 1 bestemmes av formelen:

k 1 = a 2 - a 1;

sekund: k 2 = a 3 - a 2; ...

siste: k l = a l - a l -1 .

Generelt intervallforskjell k i beregnes med formelen:

k i = x i (maks) - x i (min). (6.3)

Hvis et intervall har begge grenser, kalles det lukket .

De første og siste intervallene kan være åpen , dvs. har bare en kant.

For eksempel kan det første intervallet settes som "opptil 100", det andre - "100-110", ..., det nest siste - "190-200", det siste - "200 og mer". Det første intervallet har åpenbart ingen nedre grense, og det siste har ingen øvre grense; begge er åpne.

Ofte må åpne intervaller være betinget lukket. For å gjøre dette tas vanligvis verdien av det første intervallet lik verdien av det andre, og verdien av det siste - til verdien av det nest siste. I vårt eksempel er verdien av det andre intervallet 110-100=10, derfor vil den nedre grensen for det første intervallet være betinget 100-10=90; verdien av det nest siste intervallet er 200-190=10, derfor vil den øvre grensen for det siste intervallet være betinget 200+10=210.

I tillegg kan det i en intervallvariasjonsserie være intervaller av ulik lengde. Hvis intervallene i en variasjonsserie har samme lengde (intervallforskjell), kalles de lik størrelse , ellers - ulik størrelse.

Når man konstruerer en intervallvariasjonsserie, oppstår ofte problemet med å velge størrelse på intervallene (intervallforskjell).

For å bestemme den optimale størrelsen på intervaller (i tilfelle en serie er konstruert med like intervaller), bruk Sturgess formel:

, (6.4)

hvor n er antall enheter i populasjonen,

x (maks) og x (min) - de største og minste verdiene av seriealternativene.

For å karakterisere variasjonsseriene, sammen med frekvenser og frekvenser, brukes akkumulerte frekvenser og frekvenser.

Akkumulerte frekvenser (frekvenser) vis hvor mange enheter av populasjonen (hvilken del av dem) som ikke overskrider en gitt verdi (variant) x.

Akkumulerte frekvenser ( v i) basert på diskrete seriedata kan beregnes ved hjelp av følgende formel:

. (6.5)

For en intervallvariasjonsserie er dette summen av frekvensene (frekvensene) av alle intervaller som ikke overskrider denne.

En diskret variantserie kan representeres grafisk ved hjelp av frekvensfordelingspolygon eller frekvenser.

Når du konstruerer en distribusjonspolygon, plottes verdiene til karakteristikken (variantene) langs abscisseaksen, og frekvenser eller frekvenser plottes langs ordinataksen. I skjæringspunktet mellom attributtverdiene og de tilsvarende frekvensene (frekvensene), legges punkter, som igjen er forbundet med segmenter. Den resulterende stiplede linjen kalles en frekvens (frekvens) distribusjonspolygon.

x k
x 2
x 1 x i


Ris. 6.1.

Intervallvariasjonsserier kan representeres grafisk ved hjelp av histogrammer, dvs. stolpediagram.

Når du konstruerer et histogram, plottes verdiene til karakteristikken som studeres (intervallgrenser) langs abscisseaksen.

I tilfelle at intervallene er av samme størrelse, kan frekvenser eller frekvenser plottes langs ordinataksen.

Hvis intervallene har forskjellige størrelser, må verdiene for den absolutte eller relative fordelingstettheten plottes langs ordinataksen.

Absolutt tetthet- forholdet mellom intervallfrekvens og intervallstørrelse:

; (6.6)

hvor: f(a) i - absolutt tetthet av det i-te intervallet;

m i - frekvensen til det i-te intervallet;

k i - verdien av det i-te intervallet (intervallforskjell).

Absolutt tetthet viser hvor mange befolkningsenheter det er per enhetsintervall.

Relativ tetthet- forholdet mellom intervallfrekvens og intervallstørrelse:

; (6.7)

hvor: f(о) i - relativ tetthet av det i-te intervallet;

w i - frekvensen til det i-te intervallet.

Relativ tetthet viser hvilken del av befolkningsenhetene som faller på en enhet av intervallet.

en l
a 1 x i
en 2

Både diskrete og intervallvariasjonsserier kan representeres grafisk i form av kumulater og ogiver.

Ved bygging kumulerer i henhold til dataene i en diskret serie, er verdiene til karakteristikken (variantene) plottet langs x-aksen, og de akkumulerte frekvensene eller frekvensene er plottet langs ordinataksen. I skjæringspunktet mellom verdiene til attributtet (varianter) og de tilsvarende akkumulerte frekvensene (frekvenser), konstrueres punkter, som igjen er forbundet med segmenter eller en kurve. Den resulterende brutte linjen (kurve) kalles kumulert (kumulativ kurve).

Når man konstruerer kumulater basert på data fra en intervallserie, plottes grensene for intervallene langs abscisseaksen. Abscissen til punktene er de øvre grensene for intervallene. Ordinatene danner de akkumulerte frekvensene (frekvensene) til de tilsvarende intervallene. Ofte legges et annet punkt til, hvis abscisse er den nedre grensen til det første intervallet, og ordinaten er null. Ved å koble punktene med segmenter eller en kurve får vi en kumulering.

Ogiva er konstruert på samme måte som et kumulat, med den eneste forskjellen at punktene som tilsvarer de akkumulerte frekvensene (frekvensene) er plottet på abscisseaksen, og verdiene til karakteristikken (variantene) er plottet på ordinataksen.

  • Innledende leksjon gratis;
  • stort antall erfarne lærere (innfødt og russisktalende);
  • Kursene er IKKE for en bestemt periode (måned, seks måneder, år), men for et bestemt antall leksjoner (5, 10, 20, 50);
  • Mer enn 10 000 fornøyde kunder.
  • Kostnaden for en leksjon med en russisktalende lærer er fra 600 rubler, med en morsmål - fra 1500 rubler

Konseptet med en variasjonsserie. Det første trinnet i systematisering av statistisk observasjonsmateriale er å telle antall enheter som har en spesiell egenskap. Ved å ordne enhetene i stigende eller synkende rekkefølge etter deres kvantitative karakteristikk og telle antall enheter med en bestemt verdi av karakteristikken, får vi en variasjonsserie. En variasjonsserie karakteriserer fordelingen av enheter av en viss statistisk populasjon i henhold til en eller annen kvantitativ karakteristikk.

Variasjonsserien består av to kolonner, den venstre kolonnen inneholder verdiene til den varierende karakteristikken, kalt varianter og betegnet (x), og den høyre kolonnen inneholder absolutte tall som viser hvor mange ganger hver variant forekommer. Indikatorene i denne kolonnen kalles frekvenser og er betegnet (f).

Variasjonsserien kan skjematisk presenteres i form av Tabell 5.1:

Tabell 5.1

Type variantserie

Alternativer (x)

Frekvenser (f)

I høyre kolonne kan også relative indikatorer brukes, som karakteriserer andelen av frekvensen til individuelle opsjoner i den totale summen av frekvenser. Disse relative indikatorene kalles frekvenser og er konvensjonelt betegnet med , dvs. . Summen av alle frekvenser er lik én. Frekvenser kan også uttrykkes som prosenter, og da vil summen deres være lik 100 %.

Ulike tegn kan være av ulik karakter. Varianter av noen egenskaper uttrykkes i heltall, for eksempel antall rom i en leilighet, antall utgitte bøker, etc. Disse tegnene kalles diskontinuerlige eller diskrete. Varianter av andre egenskaper kan ta på seg alle verdier innenfor visse grenser, for eksempel oppfyllelse av planlagte oppgaver, lønn osv. Disse egenskapene kalles kontinuerlige.

Diskrete variasjonsserier. Hvis variantene av variantserien er uttrykt i skjemaet diskrete mengder, da kalles en slik variasjonsserie diskret; dens utseende er presentert i tabell. 5.2:

Tabell 5.2

Fordeling av elever etter eksamenskarakterer

Vurderinger (x)

Antall elever (f)

I % av totalt ()

Arten av fordelingen i diskrete serier er avbildet grafisk i form av en distribusjonspolygon, fig. 5.1.

Ris. 5.1. Fordeling av elever etter karakterer oppnådd på eksamen.

Intervallvariasjonsserie. For kontinuerlige karakteristikker er variasjonsserier konstruert som intervaller, dvs. verdiene til karakteristikken i dem uttrykkes i form av intervaller "fra og til". I dette tilfellet kalles minimumsverdien av karakteristikken i et slikt intervall den nedre grensen for intervallet, og maksimum kalles den øvre grensen for intervallet.

Intervallvariasjonsserier er konstruert både for diskontinuerlige egenskaper (diskrete) og for de som varierer over et stort område. Intervallrader kan være med like eller ulikt intervall. I økonomisk praksis brukes de fleste ulik intervaller, gradvis økende eller avtagende. Dette behovet oppstår spesielt i tilfeller hvor fluktuasjonen av en karakteristikk skjer ujevnt og innenfor store grenser.

La oss vurdere typen intervallserier med like intervaller, tabell. 5.3:

Tabell 5.3

Fordeling av arbeidere etter produksjon

Utgang, t.r. (X)

Antall arbeidere (f)

Kumulativ frekvens (f´)

Intervallfordelingsserien er grafisk avbildet i form av et histogram, fig. 5.2.

Fig.5.2. Fordeling av arbeidere etter produksjon

Akkumulert (kumulativ) frekvens. I praksis er det behov for å transformere distribusjonsserier til kumulative serier, bygget i henhold til akkumulerte frekvenser. Med deres hjelp kan du bestemme strukturelle gjennomsnitt som letter analysen av distribusjonsseriedata.

Kumulative frekvenser bestemmes ved å sekvensielt legge til frekvensene (eller frekvensene) til den første gruppen disse indikatorene for påfølgende grupper i distribusjonsserien. Kumulater og ogiver brukes for å illustrere distribusjonsserier. For å konstruere dem, er verdiene til den diskrete karakteristikken (eller endene av intervallene) merket på abscisseaksen, og de kumulative summene av frekvenser (kumulerte) er merket på ordinataksen, fig. 5.3.

Ris. 5.3. Kumulativ fordeling av arbeidere etter produksjon

Hvis skalaene for frekvenser og alternativer er reversert, dvs. abscisseaksen reflekterer de akkumulerte frekvensene, og ordinataksen viser verdiene til variantene, så vil kurven som karakteriserer endringen i frekvenser fra gruppe til gruppe kalles fordelingsogivet, fig. 5.4.

Ris. 5.4. Ogiva av fordeling av arbeidere etter produksjon

Variasjonsserier med like intervaller gir et av de viktigste kravene til statistiske distribusjonsserier, og sikrer deres sammenlignbarhet i tid og rom.

Distribusjonstetthet. Frekvensene til individuelle ulikt intervaller i den navngitte serien er imidlertid ikke direkte sammenlignbare. I slike tilfeller, for å sikre nødvendig sammenlignbarhet, beregnes fordelingstettheten, d.v.s. bestemme hvor mange enheter i hver gruppe er per enhet av intervallverdi.

Når du konstruerer en graf over fordelingen av en variasjonsserie med ulik intervall, bestemmes høyden på rektanglene i forhold til ikke frekvensene, men til tetthetsindikatorene for fordelingen av verdiene til karakteristikken som studeres i den tilsvarende intervaller.

Å tegne en variasjonsserie og dens grafiske representasjon er det første trinnet i behandlingen av de første dataene og det første trinnet i analysen av populasjonen som studeres. Det neste trinnet i analysen av variasjonsserier er å bestemme de viktigste generelle indikatorene, kalt egenskapene til serien. Disse egenskapene skal gi en ide om gjennomsnittsverdien av karakteristikken blant befolkningsenheter.

gjennomsnittlig verdi. Gjennomsnittsverdien er en generalisert karakteristikk av egenskapen som studeres i befolkningen som studeres, og gjenspeiler dens typiske nivå per enhet av befolkningen under spesifikke forhold for sted og tid.

Gjennomsnittsverdien er alltid navngitt og har samme dimensjon som karakteristikken for individuelle enheter av befolkningen.

Før du beregner gjennomsnittsverdier, er det nødvendig å gruppere enhetene i befolkningen som studeres, og identifisere kvalitativt homogene grupper.

Gjennomsnittet beregnet for befolkningen som helhet kalles det samlede gjennomsnittet, og for hver gruppe - gruppegjennomsnitt.

Det finnes to typer gjennomsnitt: potens (aritmetisk gjennomsnitt, harmonisk gjennomsnitt, geometrisk gjennomsnitt, kvadratisk gjennomsnitt); strukturelle (modus, median, kvartiler, desiler).

Valg av gjennomsnitt for beregning avhenger av formålet.

Typer effektgjennomsnitt og metoder for deres beregning. I praksisen med statistisk behandling av innsamlet materiale oppstår det forskjellige problemer, hvis løsning krever forskjellige gjennomsnitt.

Matematisk statistikk utleder ulike gjennomsnitt fra kraftgjennomsnittsformler:

hvor er gjennomsnittsverdien; x – individuelle alternativer (funksjonsverdier); z – eksponent (med z = 1 – aritmetisk gjennomsnitt, z = 0 geometrisk gjennomsnitt, z = - 1 – harmonisk gjennomsnitt, z = 2 – kvadratisk middelverdi).

Spørsmålet om hvilken type gjennomsnitt som skal legges til grunn i hvert enkelt tilfelle avgjøres imidlertid av spesifikk analyse befolkningen som studeres.

Den vanligste typen gjennomsnitt i statistikk er aritmetisk gjennomsnitt. Det beregnes i tilfeller der volumet av den gjennomsnittlige karakteristikken dannes som summen av verdiene for individuelle enheter av den statistiske populasjonen som studeres.

Avhengig av kildedataenes art, bestemmes det aritmetiske gjennomsnittet på forskjellige måter:

Hvis dataene ikke er gruppert, utføres beregningen ved å bruke den enkle gjennomsnittsformelen

Beregning av det aritmetiske gjennomsnittet i en diskret serie skjer i henhold til formel 3.4.

Beregning av det aritmetiske gjennomsnittet i en intervallserie. I en intervallvariasjonsserie, hvor verdien av en karakteristikk i hver gruppe konvensjonelt antas å være midten av intervallet, kan det aritmetiske gjennomsnittet avvike fra gjennomsnittet beregnet fra ugrupperte data. Dessuten, jo større intervallet er i gruppene, desto større er mulige avvik av gjennomsnittet beregnet fra grupperte data fra gjennomsnittet beregnet fra ugrupperte data.

Når man beregner gjennomsnittet over en intervallvariasjonsserie, for å utføre de nødvendige beregningene, beveger man seg fra intervallene til deres midtpunkter. Og så beregnes gjennomsnittet ved hjelp av den vektede aritmetiske gjennomsnittsformelen.

Egenskaper til det aritmetiske gjennomsnittet. Det aritmetiske gjennomsnittet har noen egenskaper som gjør det mulig å forenkle beregninger; la oss vurdere dem.

1. Det aritmetiske gjennomsnittet av konstante tall er lik dette konstante tallet.

Hvis x = a. Deretter .

2. Hvis vektene til alle alternativene endres proporsjonalt, dvs. øke eller redusere med samme antall ganger, vil det aritmetiske gjennomsnittet av den nye serien ikke endres.

Hvis alle vekter f reduseres med k ganger, da .

3. Summen av positive og negative avvik for individuelle opsjoner fra gjennomsnittet, multiplisert med vektene, er lik null, dvs.

Hvis da. Herfra.

Hvis alle alternativer reduseres eller økes med et hvilket som helst tall, vil det aritmetiske gjennomsnittet for den nye serien reduseres eller økes med samme beløp.

La oss redusere alle alternativer xen, dvs. x´ = xen.

Deretter

Det aritmetiske gjennomsnittet av den opprinnelige serien kan oppnås ved å legge til det reduserte gjennomsnittet tallet som tidligere ble trukket fra alternativene en, dvs. .

5. Hvis alle alternativer reduseres eller økes i k ganger, så vil det aritmetiske gjennomsnittet av den nye serien minke eller øke med samme beløp, dvs. V k en gang.

La det være da .

Derfor, dvs. for å få gjennomsnittet av den opprinnelige serien, må det aritmetiske gjennomsnittet av den nye serien (med reduserte opsjoner) økes med k en gang.

Harmonisk middel. Det harmoniske gjennomsnittet er det resiproke av det aritmetiske gjennomsnittet. Den brukes når statistisk informasjon inneholder ikke frekvenser for individuelle varianter av populasjonen, men presenteres som deres produkt (M = xf). Det harmoniske gjennomsnittet vil bli beregnet ved hjelp av formel 3.5

Den praktiske anvendelsen av det harmoniske gjennomsnittet er å beregne noen indekser, spesielt prisindeksen.

Geometrisk gjennomsnitt. Når du bruker geometrisk gjennomsnitt, er individuelle verdier av en karakteristikk som regel relative verdier av dynamikk, konstruert i form av kjedeverdier, i forhold til forrige nivå på hvert nivå i en serie av dynamikk. Gjennomsnittet preger altså den gjennomsnittlige vekstraten.

Den geometriske gjennomsnittsverdien brukes også til å bestemme den ekvidistante verdien fra maksimums- og minimumsverdiene til karakteristikken. For eksempel, Forsikringsselskap inngår kontrakter for levering av bilforsikringstjenester. Avhengig av den spesifikke forsikringstilfellet, kan forsikringsutbetalingen variere fra 10 000 til 100 000 dollar per år. Gjennomsnittlig beløp for forsikringsutbetalinger vil være USD.

Det geometriske gjennomsnittet er en størrelse som brukes som gjennomsnitt av forhold eller i distribusjonsserier presentert i form av en geometrisk progresjon når z = 0. Dette gjennomsnittet er praktisk å bruke når oppmerksomheten ikke rettes mot absolutte forskjeller, men til forholdet mellom to tall.

Formlene for beregning er som følger

hvor er variantene av karakteristikken som gjennomsnittsberegnes; - produkt av alternativer; f– frekvens av opsjoner.

Det geometriske gjennomsnittet brukes i beregninger av gjennomsnittlige årlige vekstrater.

Gjennomsnittlig firkant. Middelkvadratformelen brukes til å måle fluktuasjonsgraden til individuelle verdier av en karakteristikk rundt det aritmetiske gjennomsnittet i distribusjonsserien. Når du beregner variasjonsindikatorer, beregnes gjennomsnittet fra de kvadrerte avvikene til individuelle verdier av en karakteristikk fra det aritmetiske gjennomsnittet.

Rotmiddelverdien beregnes ved hjelp av formelen

I økonomisk forskning det gjennomsnittlige kvadratet i en modifisert form er mye brukt i beregning av indikatorer for variasjon av en karakteristikk, slik som spredning, standardavvik.

Flertallsstyre. Det er følgende forhold mellom effektgjennomsnitt - jo større eksponent, jo større verdi av gjennomsnittet, Tabell 5.4:

Tabell 5.4

Sammenheng mellom gjennomsnitt

z-verdi

Sammenheng mellom gjennomsnitt

Dette forholdet kalles majoritetsregelen.

Strukturelle gjennomsnitt. For å karakterisere befolkningens struktur brukes spesielle indikatorer, som kan kalles strukturelle gjennomsnitt. Disse indikatorene inkluderer modus, median, kvartiler og desiler.

Mote. Modus (Mo) er den hyppigst forekommende verdien av en egenskap blant populasjonsenheter. Modusen er verdien av attributtet som tilsvarer maksimumspunktet på den teoretiske fordelingskurven.

Mote er mye brukt i kommersiell praksis når man studerer forbrukernes etterspørsel (når man bestemmer størrelsene på klær og sko som er etterspurt), og registrerer priser. Det kan være flere mods totalt.

Beregning av modus i en diskret serie. I en diskret serie er modus varianten med høyest frekvens. La oss vurdere å finne en modus i en diskret serie.

Beregning av modus i en intervallserie. I en intervallvariasjonsserie anses modusen tilnærmet å være den sentrale varianten av det modale intervallet, dvs. intervallet som har høyest frekvens (frekvens). Innenfor intervallet må du finne verdien av attributtet som er modusen. For en intervallserie vil modusen bli bestemt av formelen

hvor er den nedre grensen for det modale intervallet; – verdien av det modale intervallet; – frekvens som tilsvarer det modale intervallet; – frekvens før det modale intervallet; – frekvensen av intervallet etter det modale.

Median. Median () er verdien av attributtet til den midterste enheten i den rangerte serien. En rangert serie er en serie der attributtverdiene er skrevet i stigende eller synkende rekkefølge. Eller medianen er en verdi som deler tallet på en ordnet variasjonsserie i to like deler: den ene delen har en verdi av den varierende karakteristikken som er mindre enn gjennomsnittsalternativet, og den andre har en verdi som er større.

For å finne medianen må du først bestemme dets ordinære tall. For å gjøre dette, hvis antall enheter er oddetall, legges en til summen av alle frekvenser og alt deles på to. Med et partall enheter, er medianen funnet som verdien av attributtet til en enhet, hvis serienummer bestemmes av den totale summen av frekvenser delt på to. Når du kjenner serienummeret til medianen, er det lett å finne verdien ved å bruke de akkumulerte frekvensene.

Beregning av medianen i en diskret serie. I følge utvalgsundersøkelsen ble det innhentet data om fordeling av familier etter antall barn, tabell. 5.5. For å bestemme medianen, bestemmer vi først dens ordinære tall

=

Deretter vil vi konstruere en serie med akkumulerte frekvenser (, ved å bruke serienummeret og den akkumulerte frekvensen finner vi medianen. Den akkumulerte frekvensen på 33 viser at i 33 familier overstiger ikke antall barn 1 barn, men siden antall medianen er 50, medianen vil være i området fra 34 til 55 familier.

Tabell 5.5

Fordeling av antall familier basert på antall barn

Antall barn i familien

Antall familier, – verdien av medianintervallet;

Alle betraktede former for kraftgjennomsnitt har en viktig egenskap (i motsetning til strukturelle gjennomsnitt) - formelen for å bestemme gjennomsnittet inkluderer alle verdiene i serien, dvs. Størrelsen på gjennomsnittet påvirkes av verdien av hvert alternativ.

På den ene siden er dette en svært positiv egenskap pga i dette tilfellet blir effekten av alle årsaker som påvirker alle enheter av befolkningen som studeres, tatt i betraktning. På den annen side kan til og med en observasjon inkludert i kildedataene ved en tilfeldighet forvrenge ideen om utviklingsnivået til egenskapen som studeres i befolkningen under vurdering (spesielt i korte serier).

Kvartiler og desiler. I analogi med å finne medianen i variasjonsserier, kan du finne verdien av en karakteristikk for enhver enhet i den rangerte serien. Så spesielt kan du finne verdien av attributtet for enheter som deler en serie i 4 like deler, i 10 osv.

Kvartiler. Alternativene som deler den rangerte serien i fire like deler kalles kvartiler.

I dette tilfellet skiller de: den nedre (eller første) kvartilen (Q1) - verdien av attributtet for en enhet i den rangerte serien, og deler populasjonen i forholdet ¼ til ¾ og den øvre (eller tredje) kvartilen ( Q3) - verdien av attributtet for enheten til den rangerte serien, og deler populasjonen i forholdet ¾ til ¼.

Den andre kvartilen er medianen Q2 = Me. De nedre og øvre kvartilene i en intervallserie beregnes ved å bruke en formel som ligner medianen.

hvor er den nedre grensen for intervallet som inneholder henholdsvis nedre og øvre kvartiler;

– akkumulert frekvens av intervallet før intervallet som inneholder den nedre eller øvre kvartilen;

– frekvenser av kvartilintervaller (nedre og øvre)

Intervallene som inneholder Q1 og Q3 bestemmes av de akkumulerte frekvensene (eller frekvensene).

Desiler. I tillegg til kvartiler beregnes desiler - alternativer som deler den rangerte serien i 10 like deler.

De er betegnet med D, den første desilen D1 deler serien i forholdet 1/10 og 9/10, den andre D2 - 2/10 og 8/10, etc. De er beregnet etter samme skjema som medianen og kvartilene.

Både median, kvartiler og desiler tilhører den såkalte ordinære statistikken, som forstås som et alternativ som inntar en viss ordinær plass i den rangerte rekken.

RUSSIAN ACADEMY OF NATIONAL ECONOMY OG OFFENTLIG TJENESTE under PRESIDENTEN FOR DEN RUSSISKE FEDERASJONEN

ORYOL GREEN

Matematisk institutt og matematiske metoder i ledelsen

Selvstendig arbeid

Matematikk

om emnet "Variasjonsserier og dens egenskaper"

for studenter fulltidsavdeling Fakultet for økonomi og ledelse

opplæringsområder "Human Resources Management"


Målet med arbeidet: Mestre konsepter matematisk statistikk og metoder for primær databehandling.

Et eksempel på å løse typiske problemer.

Oppgave 1.

Følgende data ble innhentet gjennom undersøkelsen ():

1 2 3 2 2 4 3 3 5 1 0 2 4 3 2 2 3 3 1 3 2 4 2 4 3 3 3 2 0 6

3 3 1 1 2 3 1 4 3 1 7 4 3 4 2 3 2 3 3 1 4 3 1 4 5 3 4 2 4 5

3 6 4 1 3 2 4 1 3 1 0 0 4 6 4 7 4 1 3 5

Nødvendig:

1) Lag en variantserie ( statistisk fordeling prøver), etter å ha skrevet ned en rangert diskret serie med alternativer.

2) Konstruer en frekvenspolygon og kumuler.

3) Sett sammen en serie fordelinger av relative frekvenser (frekvenser).

4) Finn de viktigste numeriske egenskapene til variasjonsseriene (bruk forenklede formler for å finne dem): a) aritmetisk gjennomsnitt, b) median Meh og mote Mo c) dispersjon s 2, d) standardavvik s, e) variasjonskoeffisient V.

5) Forklar betydningen av de oppnådde resultatene.

Løsning.

1) Å kompilere rangert diskret serie med alternativer La oss sortere undersøkelsesdataene etter størrelse og ordne dem i stigende rekkefølge

0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2

3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

5 5 5 5 6 6 6 7 7.

La oss komponere en variantserie ved å skrive de observerte verdiene (variantene) i den første raden i tabellen, og de tilsvarende frekvensene i den andre (tabell 1)

Tabell 1.

2) En frekvenspolygon er en brutt linje som forbinder punkter ( x i; n i), Jeg=1, 2,…, m, Hvor m X.

La oss skildre polygonen til frekvensene til variasjonsserien (fig. 1).

Figur 1. Frekvens polygon

Den kumulative kurven (kumulert) for en diskret variasjonsserie representerer en stiplet linje som forbinder punktene ( x i; n i nak), Jeg=1, 2,…, m.

La oss finne de akkumulerte frekvensene n i nak(den akkumulerte frekvensen viser hvor mange varianter som ble observert med en karakteristisk verdi mindre X). Vi legger inn de funnet verdiene i den tredje raden i tabell 1.



La oss bygge et kumulat (fig. 2).

Fig.2. Akkumulerer

3) La oss finne de relative frekvensene (frekvensene), hvor , hvor m– antall forskjellige karakteristiske verdier X, som vi vil beregne med lik nøyaktighet.

La oss skrive ned distribusjonsserien av relative frekvenser (frekvenser) i form av tabell 2

tabell 2

4) La oss finne de viktigste numeriske egenskapene til variantserien:

a) Finn det aritmetiske gjennomsnittet ved å bruke en forenklet formel:

,

hvor er betingede alternativer

La oss sette Med= 3 (en av de gjennomsnittlige observerte verdiene), k= 1 (forskjellen mellom to naboalternativer) og lag en beregningstabell (tabell 3).

Tabell 3.

x i n Jeg u i u i n i u i 2 n i
-3 -12
-2 -26
-1 -14
Sum -11

Så det aritmetiske gjennomsnittet

b) Median Meh variasjonsserier er verdien av karakteristikken som faller i midten av den rangerte observasjonsserien. Denne diskrete variantserien inneholder et partall av termer ( n=80), som betyr at medianen er lik halvparten av summen av de to midterste alternativene.

Mote Mo variasjonsserier kalles alternativet som tilsvarer den høyeste frekvensen. For en gitt variasjonsserie, den høyeste frekvensen n max = 24 tilsvarer alternativet X= 3, betyr mote Mo=3.

c) Varians s 2, som er et mål på spredningen av mulige verdier for indikatoren X rundt gjennomsnittsverdien finner vi den ved å bruke en forenklet formel:

, Hvor u i– betingede alternativer

Vi vil også inkludere mellomberegninger i tabell 3.

Så variansen

d) Standardavvik s vi finner det ved å bruke formelen:

.

e) Variasjonskoeffisient V: (),

Variasjonskoeffisienten er en umålelig mengde, så den er egnet for å sammenligne spredningen av variasjonsserier, hvis varianter har forskjellige dimensjoner.

Variasjonskoeffisienten

.

5) Betydningen av de oppnådde resultatene er at verdien karakteriserer gjennomsnittsverdien av egenskapen X innenfor utvalget under vurdering, det vil si at gjennomsnittsverdien var 2,86. Standardavvik s beskriver den absolutte spredningen av indikatorverdier X og i i dette tilfellet beløper seg til s≈ 1,55. Variasjonskoeffisienten V karakteriserer den relative variasjonen til indikatoren X, det vil si den relative spredningen rundt gjennomsnittsverdien, og i dette tilfellet er .

Svar: ; ; ; .

Oppgave 2.

Følgende data er tilgjengelig om egenkapitalen til de 40 største bankene i Sentral-Russland:

12,0 49,4 22,4 39,3 90,5 15,2 75,0 73,0 62,3 25,2
70,4 50,3 72,0 71,6 43,7 68,3 28,3 44,9 86,6 61,0
41,0 70,9 27,3 22,9 88,6 42,5 41,9 55,0 56,9 68,1
120,8 52,4 42,0 119,3 49,6 110,6 54,5 99,3 111,5 26,1

Nødvendig:

1) Konstruer en intervallvariasjonsserie.

2) Beregn prøvegjennomsnittet og prøvevariansen

3) Finn standardavviket og variasjonskoeffisienten.

4) Konstruer et histogram over frekvensfordelinger.

Løsning.

1) La oss velge et vilkårlig antall intervaller, for eksempel 8. Da er bredden på intervallet:

.

La oss lage en beregningstabell:

Intervallalternativ, x k –x k +1 Frekvens, n i Midt i intervallet x i Betinget alternativ, og jeg og i n i og jeg 2 n i (og i+ 1) 2 n i
10 – 25 17,5 – 3 – 12
25 – 40 32,5 – 2 – 10
40 – 55 47,5 – 1 – 11
55 – 70 62,5
70 – 85 77,5
85 – 100 92,5
100 – 115 107,5
115 – 130 122,5
Sum – 5

Verdien valgt som falsk null er c= 62,5 (dette alternativet er plassert omtrent i midten av variantserien) .

Betingede alternativer bestemmes av formelen

Del med venner eller spar selv:

Laster inn...