Libro di testo: Statistica matematica. Oggetto della statistica matematica Su quale scienza si basa la statistica matematica?

Introduzione

2. Concetti base di statistica matematica

2.1 Concetti base del metodo di campionamento

2.2 Distribuzione campionaria

2.3 Funzione di distribuzione empirica, istogramma

Conclusione

Riferimenti

Introduzione

Statistica matematica- la scienza dei metodi matematici per la sistematizzazione e l'utilizzo dei dati statistici per conclusioni scientifiche e pratiche. In molte delle sue sezioni, la statistica matematica si basa sulla teoria della probabilità, che consente di valutare l'affidabilità e l'accuratezza delle conclusioni tratte sulla base di materiale statistico limitato (ad esempio, per stimare la dimensione del campione richiesta per ottenere risultati con l'accuratezza richiesta in un’indagine campionaria).

La teoria della probabilità considera variabili casuali Con data distribuzione o esperimenti casuali le cui proprietà sono interamente note. L'oggetto della teoria della probabilità sono le proprietà e le relazioni di queste quantità (distribuzioni).

Ma spesso un esperimento è una scatola nera che produce solo determinati risultati dai quali è necessario trarre una conclusione sulle proprietà dell'esperimento stesso. L'osservatore ha una serie di risultati numerici (o possono essere resi numerici) ottenuti ripetendo lo stesso esperimento casuale nelle stesse condizioni.

In questo caso, ad esempio, sorgono le seguenti domande: se osserviamo una variabile casuale, come possiamo trarre la conclusione più accurata sulla sua distribuzione sulla base di un insieme dei suoi valori in diversi esperimenti?

Un esempio di una tale serie di esperimenti è un'indagine sociologica, una serie di indicatori economici o, infine, la sequenza di testa e croce quando si lancia una moneta mille volte.

Tutti i fattori di cui sopra determinano pertinenza e il significato dell'argomento su cui lavorare palcoscenico moderno finalizzato ad uno studio approfondito ed esaustivo dei concetti base della statistica matematica.

A questo proposito, lo scopo di questo lavoro è sistematizzare, accumulare e consolidare la conoscenza sui concetti di statistica matematica.

1. Oggetto e metodi della statistica matematica

La statistica matematica è la scienza dei metodi matematici per l'analisi dei dati ottenuti durante le osservazioni di massa (misure, esperimenti). A seconda della natura matematica dei risultati osservativi specifici, la statistica matematica è divisa in statistiche dei numeri, multidimensionali analisi statistica, analisi di funzioni (processi) e serie temporali, statistica di oggetti di natura non numerica. Una parte significativa della statistica matematica si basa su modelli probabilistici. Evidenziare compiti generali descrivere dati, valutare e testare ipotesi. Considerano anche compiti più specifici relativi alla conduzione di indagini campionarie, al ripristino delle dipendenze, alla costruzione e all'utilizzo di classificazioni (tipologie), ecc.

Per descrivere i dati, vengono costruite tabelle, diagrammi e altre rappresentazioni visive, ad esempio campi di correlazione. Di solito non vengono utilizzati modelli probabilistici. Alcuni metodi di descrizione dei dati si basano sulla teoria avanzata e sulle capacità dei computer moderni. Tra questi rientrano, in particolare, la cluster analysis, volta a individuare gruppi di oggetti simili tra loro, e lo scaling multidimensionale, che permette di rappresentare visivamente gli oggetti su un piano, distorcendo il meno possibile le distanze tra loro.

I metodi per valutare e testare le ipotesi si basano su modelli probabilistici di generazione dei dati. Questi modelli si dividono in parametrici e non parametrici. Nei modelli parametrici si assume che gli oggetti oggetto di studio siano descritti da funzioni di distribuzione dipendenti da un piccolo numero (1-4) di parametri numerici. Nei modelli non parametrici, si presuppone che le funzioni di distribuzione siano arbitrariamente continue. Nella statistica matematica, parametri e caratteristiche della distribuzione (aspettativa matematica, mediana, varianza, quantili, ecc.), funzioni di densità e distribuzione, dipendenze tra variabili (basate su coefficienti di correlazione lineari e non parametrici, nonché stime parametriche o non parametriche di funzioni che esprimono dipendenze) vengono valutati ecc. Usano stime puntuali e di intervallo (che danno limiti per i valori veri).

Nella statistica matematica c'è teoria generale verifica delle ipotesi e gran numero metodi dedicati alla verifica di ipotesi specifiche. Vengono considerate ipotesi sui valori di parametri e caratteristiche, sulla verifica dell'omogeneità (cioè sulla coincidenza di caratteristiche o funzioni di distribuzione in due campioni), sull'accordo della funzione di distribuzione empirica con una data funzione di distribuzione o con una funzione parametrica famiglia di tali funzioni, sulla simmetria della distribuzione, ecc.

Di grande importanza è la sezione di statistica matematica legata all'esecuzione di indagini campionarie, con le proprietà vari schemi organizzare campioni e costruire metodi adeguati per valutare e testare le ipotesi.

I problemi del recupero delle dipendenze sono stati studiati attivamente per più di 200 anni, dallo sviluppo del metodo da parte di K. Gauss nel 1794 minimi quadrati. Attualmente, i metodi più rilevanti per la ricerca di un sottoinsieme informativo di variabili e metodi non parametrici.

Lo sviluppo di metodi per l'approssimazione dei dati e la riduzione della dimensionalità della descrizione è iniziato più di 100 anni fa, quando K. Pearson creò il metodo delle componenti principali. Successivamente furono sviluppate l'analisi fattoriale e numerose generalizzazioni non lineari.

Vari metodi di costruzione (analisi di cluster), analisi e utilizzo (analisi discriminante) di classificazioni (tipologie) sono anche chiamati metodi di riconoscimento di modelli (con e senza insegnante), classificazione automatica, ecc.

I metodi matematici in statistica si basano o sull'uso di somme (basate sul Teorema del Limite Centrale della teoria della probabilità) o di indici di differenza (distanze, metriche), come nella statistica di oggetti di natura non numerica. Di solito solo i risultati asintotici sono rigorosamente comprovati. Al giorno d'oggi i computer svolgono un ruolo importante nella statistica matematica. Sono utilizzati sia per i calcoli che per le simulazioni (in particolare, nei metodi di moltiplicazione dei campioni e nello studio dell'idoneità dei risultati asintotici).

Concetti base di statistica matematica

2.1 Concetti base del metodo di campionamento

Sia una variabile casuale osservata in un esperimento casuale. Si presuppone che lo spazio delle probabilità sia dato (e non ci interesserà).

Assumeremo che, dopo aver effettuato questo esperimento nelle stesse condizioni, abbiamo ottenuto i numeri , , , - i valori di questa variabile casuale nella prima, nella seconda, ecc. esperimenti. Una variabile casuale ha una distribuzione che ci è parzialmente o completamente sconosciuta.

Diamo uno sguardo più da vicino a un set chiamato campione.

In una serie di esperimenti già effettuati, un campione è un insieme di numeri. Ma se questa serie di esperimenti viene ripetuta ancora una volta, invece di questa serie otterremo una nuova serie di numeri. Invece del numero, apparirà un altro numero: uno dei valori della variabile casuale. Cioè (e, e, ecc.) è un valore di variabile che può assumere gli stessi valori di una variabile casuale, e altrettanto spesso (con le stesse probabilità). Pertanto, prima dell'esperimento - una variabile casuale, identicamente distribuita con , e dopo l'esperimento - il numero in cui osserviamo questo prima esperimento, cioè uno dei possibili valori di una variabile casuale.

Una dimensione del campione è un insieme di variabili casuali indipendenti e identicamente distribuite (“copie”), che, come , hanno una distribuzione.

Cosa significa “fare inferenze sulla distribuzione da un campione”? La distribuzione è caratterizzata da una funzione di distribuzione, densità o tabella, un insieme di caratteristiche numeriche - , , ecc. Utilizzando un campione, è necessario essere in grado di creare approssimazioni per tutte queste caratteristiche.

.2 Distribuzione campionaria

Consideriamo l'implementazione del campionamento su un risultato elementare: un insieme di numeri , , . Su un opportuno spazio di probabilità, introduciamo una variabile casuale che assume valori, , con probabilità pari a (se uno qualsiasi dei valori coincide, aggiungiamo le probabilità il numero corrispondente di volte). La tabella di distribuzione di probabilità e la funzione di distribuzione delle variabili casuali hanno il seguente aspetto:

La distribuzione di una quantità è detta distribuzione empirica o campionaria. Calcoliamo l'aspettativa matematica e la varianza della quantità e introduciamo la notazione per queste quantità:

Calcoliamo allo stesso modo il momento dell'ordine

Nel caso generale, indichiamo con la quantità

Se, quando costruiamo tutte le caratteristiche che abbiamo introdotto, consideriamo il campione , , un insieme di variabili casuali, allora queste stesse caratteristiche - , , , , - diventeranno variabili casuali. Queste caratteristiche della distribuzione campionaria vengono utilizzate per stimare (approssimare) le corrispondenti caratteristiche sconosciute della distribuzione reale.

La ragione per utilizzare le caratteristiche della distribuzione per stimare le caratteristiche della distribuzione reale (o ) è la vicinanza di queste distribuzioni in generale.

Consideriamo, ad esempio, il lancio di un dado normale. Permettere - il numero di punti persi durante il trentesimo lancio, . Supponiamo che uno appaia nel campione una volta, due - una volta, ecc. Quindi la variabile casuale assumerà i valori 1 , , 6 con probabilità , , rispettivamente. Ma queste proporzioni con la crescita si avvicinano secondo la legge grandi numeri. Cioè, la distribuzione del valore in un certo senso si avvicina alla vera distribuzione del numero di punti che appaiono quando si lancia il dado corretto.

Non chiariremo cosa si intende per vicinanza del campione e distribuzioni reali. Nei paragrafi seguenti, daremo uno sguardo più da vicino a ciascuna delle caratteristiche introdotte sopra ed esamineremo le sue proprietà, compreso il suo comportamento all’aumentare della dimensione del campione.

.3 Funzione di distribuzione empirica, istogramma

Poiché una distribuzione sconosciuta può essere descritta, ad esempio, dalla sua funzione di distribuzione, costruiremo una “stima” per questa funzione basata sul campione.

Definizione 1.

Viene chiamata una funzione di distribuzione empirica costruita da un campione di volume funzione casuale, per ogni uguale

Promemoria: Funzione casuale

chiamato indicatore di eventi. Per ciascuno si tratta di una variabile casuale avente distribuzione di Bernoulli con parametro . Perché?

In altre parole, per qualsiasi valore , pari alla vera probabilità che la variabile casuale sia inferiore a , viene stimata dalla proporzione di elementi del campione inferiori a .

Se gli elementi del campione , , vengono ordinati in ordine crescente (ad ogni risultato elementare), si otterrà un nuovo insieme di variabili casuali, chiamato serie di variazioni:

L'elemento , , è chiamato l'esimo membro della serie di variazioni o la statistica dell'esimo ordine.

Esempio 1.

Campione:

Serie di variazioni:

Riso. 1. Esempio 1

La funzione di distribuzione empirica ha salti nei punti campione, l'entità del salto in un punto è uguale a , dove è il numero di elementi del campione che coincidono con .

È possibile costruire una funzione di distribuzione empirica utilizzando una serie di variazioni:

Un'altra caratteristica della distribuzione è la tabella (per distribuzioni discrete) o la densità (per quelle assolutamente continue). Un analogo empirico o selettivo di una tabella o di una densità è il cosiddetto istogramma.

Un istogramma viene creato utilizzando dati raggruppati. L'intervallo di valori stimato di una variabile casuale (o intervallo di dati campionari) è suddiviso, indipendentemente dal campione, in un certo numero di intervalli (non necessariamente identici). Siano , , intervalli sulla linea, detti intervalli di raggruppamento. Indichiamo con il numero di elementi del campione che rientrano nell'intervallo:

(1)

Ad ogni intervallo viene costruito un rettangolo la cui area è proporzionale a . L'area totale di tutti i rettangoli deve essere uguale a uno. Sia la lunghezza dell'intervallo. L'altezza del rettangolo sopra è

La figura risultante è chiamata istogramma.

Esempio 2.

Disponibile serie di variazioni(vedi esempio 1):

Ecco quindi il logaritmo decimale, cioè quando il campione viene raddoppiato, il numero di intervalli di raggruppamento aumenta di 1. Si noti che maggiore è il numero di intervalli di raggruppamento, meglio è. Ma se prendiamo il numero di intervalli, diciamo, dell'ordine di , allora con la crescita l'istogramma non si avvicinerà alla densità.

È vera la seguente affermazione:

Se la densità di distribuzione degli elementi del campione è funzione continua, allora per tale che , c'è una convergenza puntuale nella probabilità dell'istogramma rispetto alla densità.

Quindi la scelta del logaritmo è ragionevole, ma non l’unica possibile.

Conclusione

La statistica matematica (o teorica) si basa sui metodi e sui concetti della teoria della probabilità, ma in un certo senso risolve problemi inversi.

Se osserviamo la manifestazione di due (o più) segni contemporaneamente, ad es. abbiamo un insieme di valori di diverse variabili casuali: cosa possiamo dire della loro dipendenza? Lei è lì oppure no? E se esiste, qual è questa dipendenza?

Spesso è possibile fare alcune ipotesi sulla distribuzione nascosta nella scatola nera o sulle sue proprietà. In questo caso, sulla base dei dati sperimentali, è necessario confermare o confutare queste ipotesi (“ipotesi”). Va ricordato che la risposta "sì" o "no" può essere data solo con un certo grado di certezza, e più a lungo possiamo continuare l'esperimento, più accurate saranno le conclusioni. La situazione più favorevole per la ricerca è quando si possono affermare con sicurezza alcune proprietà dell'esperimento osservato - ad esempio, la presenza di una relazione funzionale tra le quantità osservate, la normalità della distribuzione, la sua simmetria, la presenza di densità nella distribuzione o la sua natura discreta, ecc.

Quindi, ha senso ricordare le statistiche (matematiche) se

· esiste un esperimento casuale, le cui proprietà sono parzialmente o completamente sconosciute,

· siamo in grado di riprodurre questo esperimento nelle stesse condizioni alcune (o meglio ancora, qualsiasi) numero di volte.

Riferimenti

1. Baumol U. Teoria economica e ricerca operativa. - M.; Scienza, 1999.

2. Bolshev L.N., Smirnov N.V. Tabelle di statistica matematica. M.: Nauka, 1995.

3. Borovkov A.A. Statistica matematica. M.: Nauka, 1994.

4. Korn G., Korn T. Manuale di matematica per scienziati e ingegneri. - San Pietroburgo: Casa editrice Lan, 2003.

5. Korshunov D.A., Chernova N.I. Raccolta di problemi ed esercizi di statistica matematica. Novosibirsk: Casa editrice dell'Istituto di Matematica da cui prende il nome. S.L. Sobolev SBRAS, 2001.

6. Peheletsky I.D. Matematica: un libro di testo per gli studenti. - M.: Accademia, 2003.

7. Sukhodolsky V.G. Lezioni su matematica superiore per gli umanisti. - Casa editrice di San Pietroburgo di San Pietroburgo università statale. 2003

8. Feller V. Introduzione alla teoria della probabilità e alle sue applicazioni. - M.: Mir, T.2, 1984.

9. Harman G., Analisi fattoriale moderna. - M.: Statistica, 1972.


Harman G., Analisi fattoriale moderna. - M.: Statistica, 1972.

Sotto statistica matematica comprendere "il ramo della matematica dedicato a metodi matematici raccolta, sistematizzazione, elaborazione e interpretazione dei dati statistici, nonché il loro utilizzo per conclusioni scientifiche o pratiche. Le regole e le procedure della statistica matematica si basano sulla teoria della probabilità, che consente di valutare l’accuratezza e l’affidabilità delle conclusioni ottenute in ciascun problema sulla base del materiale statistico disponibile”. In questo caso, i dati statistici si riferiscono alle informazioni sul numero di oggetti in una collezione più o meno ampia che presentano determinate caratteristiche.

In base al tipo di problemi da risolvere, la statistica matematica è solitamente divisa in tre sezioni: descrizione dei dati, stima e verifica delle ipotesi.

In base alla tipologia dei dati statistici trattati, la statistica matematica si suddivide in quattro aree:

— statistica unidimensionale (statistica delle variabili casuali), in cui il risultato di un'osservazione è descritto da un numero reale;

— analisi statistica multivariata, in cui il risultato dell'osservazione di un oggetto è descritto da diversi numeri (vettore);

— statistiche di processi casuali e serie temporali, in cui il risultato dell'osservazione è una funzione;

— statistiche di oggetti di natura non numerica, in cui il risultato di un'osservazione è di natura non numerica, ad esempio, è un insieme ( figura geometrica), ordinati o ottenuti come risultato della misurazione secondo un criterio qualitativo.

Storicamente, alcune aree della statistica di oggetti di natura non numerica (in particolare, problemi di stima della proporzione dei difetti e di verifica di ipotesi al riguardo) e statistiche unidimensionali sono state le prime ad apparire. L'apparato matematico è più semplice per loro, quindi il loro esempio viene solitamente utilizzato per dimostrare le idee di base della statistica matematica.

Solo le modalità di trattamento dei dati, ad es. le statistiche matematiche sono basate sull'evidenza, che si basano su modelli probabilistici di fenomeni e processi reali rilevanti. Stiamo parlando di modelli di comportamento del consumatore, insorgenza del rischio, funzionamento attrezzature tecnologiche, ottenendo i risultati dell'esperimento, il decorso della malattia, ecc. Modello probabilistico fenomeno reale dovrebbero considerarsi costruiti se le quantità in esame e le connessioni tra loro sono espresse in termini di teoria della probabilità.

Corrispondenza al modello probabilistico della realtà, cioè la sua adeguatezza è comprovata, in particolare, utilizzando metodi statistici per verificare le ipotesi.

I metodi non probabilistici di elaborazione dei dati sono esplorativi; possono essere utilizzati solo nell'analisi preliminare dei dati, poiché non consentono di valutare l'accuratezza e l'affidabilità delle conclusioni ottenute sulla base di materiale statistico limitato.

I metodi probabilistici e statistici sono applicabili ovunque sia possibile costruire e giustificare un modello probabilistico di un fenomeno o processo. Il loro utilizzo è obbligatorio quando le conclusioni tratte dai dati del campione vengono trasferite all'intera popolazione (ad esempio, da un campione a un intero lotto di prodotti).

In aree specifiche di applicazione vengono utilizzati sia metodi probabilistici e statistici di applicazione generale che specifici. Ad esempio, nella sezione della gestione della produzione dedicata a metodi statistici gestione della qualità del prodotto, utilizzo della statistica matematica applicata (compresa la pianificazione degli esperimenti). Utilizzando i suoi metodi, vengono effettuate analisi statistiche dell'accuratezza e della stabilità dei processi tecnologici e valutazione statistica della qualità. A metodi specifici Questi includono metodi di controllo statistico dell'accettazione della qualità del prodotto, regolamentazione statistica dei processi tecnologici, valutazione e controllo dell'affidabilità, ecc.

Le discipline probabilistiche e statistiche applicate come la teoria e la teoria dell'affidabilità sono ampiamente utilizzate. fare la fila. Il contenuto del primo è chiaro dal nome, il secondo riguarda lo studio di sistemi come una centrale telefonica, che riceve chiamate in orari casuali - i requisiti degli abbonati che compongono i numeri sui loro apparecchi telefonici. La durata della manutenzione di questi requisiti, ad es. anche la durata delle conversazioni è modellata da variabili casuali. Un grande contributo allo sviluppo di queste discipline è stato dato dal membro corrispondente dell'Accademia delle scienze dell'URSS A.Ya. Khinchin (1894-1959), accademico dell'Accademia delle scienze della SSR ucraina B.V. Gnedenko (1912-1995) e altri scienziati nazionali.


Contenuto.

1) Introduzione:
- Come vengono utilizzate la teoria della probabilità e la statistica matematica? - pagina 2
- Cos'è la “statistica matematica”? - pagina 3
2) Esempi di applicazione della teoria della probabilità e della statistica matematica:
- Campionamento. - pagina 4
- Compiti di valutazione. – pagina 6
- Metodi probabilistico-statistici e ottimizzazione. – pagina 7
3) Conclusione.

Introduzione.

Come vengono utilizzate la teoria della probabilità e la statistica matematica? Queste discipline sono la base dei metodi probabilistici e statistici del processo decisionale. Per utilizzare il loro apparato matematico è necessario esprimere i problemi decisionali in termini di modelli probabilistico-statistici. L’applicazione di uno specifico metodo decisionale probabilistico-statistico si compone di tre fasi:
- transizione dalla realtà economica, gestionale, tecnologica a uno schema matematico e statistico astratto, vale a dire costruzione di un modello probabilistico di un sistema di controllo, processo tecnologico, procedura decisionale, in particolare basato sui risultati del controllo statistico, ecc.
- eseguire calcoli e ottenere conclusioni utilizzando mezzi puramente matematici nell'ambito di un modello probabilistico;
- interpretazione delle conclusioni matematiche e statistiche in relazione alla situazione reale e presa di una decisione adeguata (ad esempio, sulla conformità o non conformità della qualità del prodotto con i requisiti stabiliti, la necessità di adeguare il processo tecnologico, ecc.), in particolare , conclusioni (sulla proporzione di unità di prodotto difettose in un lotto, sul tipo specifico di leggi di distribuzione dei parametri controllati del processo tecnologico, ecc.).

La statistica matematica utilizza i concetti, i metodi e i risultati della teoria della probabilità. Consideriamo le principali questioni relative alla costruzione di modelli probabilistici del processo decisionale in situazioni economiche, gestionali, tecnologiche e di altro tipo. Per l'uso attivo e corretto dei documenti normativi, tecnici e didattici sui metodi probabilistici e statistici del processo decisionale, è richiesta una conoscenza preliminare. Pertanto, è necessario sapere in quali condizioni dovrebbe essere utilizzato un determinato documento, quali informazioni iniziali sono necessarie per la sua selezione e applicazione, quali decisioni dovrebbero essere prese sulla base dei risultati dell'elaborazione dei dati, ecc.

Cos'è la "statistica matematica"? Per statistica matematica si intende “una branca della matematica dedicata ai metodi matematici di raccolta, sistematizzazione, elaborazione e interpretazione dei dati statistici, nonché al loro utilizzo per conclusioni scientifiche o pratiche. Le regole e le procedure della statistica matematica si basano sulla teoria della probabilità, che ci consente di valutare l’accuratezza e l’affidabilità delle conclusioni ottenute in ciascun problema sulla base del materiale statistico disponibile”. In questo caso, i dati statistici si riferiscono alle informazioni sul numero di oggetti in una collezione più o meno ampia che presentano determinate caratteristiche.

In base al tipo di problemi da risolvere, la statistica matematica è solitamente divisa in tre sezioni: descrizione dei dati, stima e verifica delle ipotesi.

In base alla tipologia dei dati statistici trattati, la statistica matematica si suddivide in quattro aree:

Statistica univariata (statistica delle variabili casuali), in cui il risultato di un'osservazione è descritto da un numero reale;

Analisi statistica multivariata, in cui il risultato dell'osservazione di un oggetto è descritto da più numeri (vettore);

Statistica di processi casuali e serie temporali, dove il risultato dell'osservazione è una funzione;

Statistiche di oggetti di natura non numerica, in cui il risultato di un'osservazione è di natura non numerica, ad esempio è un insieme (una figura geometrica), un ordinamento o ottenuto come risultato di una misurazione basata su un criterio qualitativo.

Esempi di applicazione della teoria della probabilità e della statistica matematica.
Consideriamo alcuni esempi in cui i modelli statistici probabilistici sono un buon strumento per risolvere problemi gestionali, produttivi, economici ed economici nazionali. Quindi, ad esempio, una moneta utilizzata come lotto deve essere “simmetrica”, cioè quando lo si lancia, in media, nella metà dei casi dovrebbe apparire lo stemma e nell'altra metà dei casi un hash (code, numero). Ma cosa significa "in media"? Se esegui molte serie da 10 lanci in ciascuna serie, incontrerai spesso serie in cui la moneta atterra come uno stemma 4 volte. Per una moneta simmetrica, ciò avverrà nel 20,5% delle esecuzioni. E se dopo 100.000 lanci ci sono 40.000 stemmi, la moneta può dirsi simmetrica? La procedura decisionale si basa sulla teoria della probabilità e sulla statistica matematica.

L’esempio in questione potrebbe non sembrare abbastanza serio. Tuttavia, questo non è vero. Il sorteggio è ampiamente utilizzato nell'organizzazione di esperimenti tecnici ed economici industriali, ad esempio, quando si elaborano i risultati della misurazione dell'indicatore di qualità (coppia di attrito) dei cuscinetti in base a vari fattori tecnologici (l'influenza dell'ambiente di conservazione, metodi di preparazione dei cuscinetti prima della misurazione , l'influenza dei carichi sui cuscinetti durante il processo di misurazione, ecc.). Diciamo che è necessario confrontare la qualità dei cuscinetti in base ai risultati della loro conservazione in diversi oli preservanti, ad es. negli oli di composizione A e B. Quando si pianifica un esperimento del genere, sorge la questione di quali cuscinetti dovrebbero essere collocati nell'olio di composizione A e quali dovrebbero essere collocati nell'olio di composizione B, ma in modo tale da evitare soggettività e garantire l’obiettività della decisione presa.

Campione
La risposta a questa domanda può essere ottenuta mediante sorteggio. Un esempio simile può essere fornito con il controllo di qualità di qualsiasi prodotto. Per decidere se il lotto di prodotti controllato soddisfa o meno i requisiti stabiliti, da esso viene selezionato un campione. Sulla base dei risultati del controllo del campione, viene tratta una conclusione sull'intero lotto. In questo caso è molto importante evitare la soggettività nella formazione del campione, ovvero è necessario che ciascuna unità di prodotto del lotto controllato abbia la stessa probabilità di essere selezionata per il campione. In condizioni di produzione, la selezione delle unità di prodotto per il campione viene solitamente effettuata non per lotto, ma tramite tabelle speciali di numeri casuali o utilizzando sensori di numeri casuali del computer.
Problemi simili per garantire l'obiettività del confronto sorgono quando si confrontano vari schemi di organizzazione della produzione, retribuzione, durante gare e concorsi, selezione dei candidati per posti vacanti, ecc. Ovunque abbiamo bisogno di un sorteggio o di procedure simili. Spieghiamo con l'esempio di identificazione della squadra più forte e della seconda più forte quando si organizza un torneo secondo il sistema olimpico (il perdente viene eliminato). Lascia che la squadra più forte sconfigga sempre quella più debole. È chiaro che la squadra più forte diventerà sicuramente campione. La seconda squadra più forte raggiungerà la finale se e solo se non avrà partite con il futuro campione prima della finale. Se è prevista una partita del genere, la seconda squadra più forte non arriverà alla finale. Chi pianifica il torneo può "eliminare" la seconda squadra più forte del torneo prima del previsto, contrapponendola al leader nel primo incontro, oppure fornirle il secondo posto assicurando incontri con le squadre più deboli fino al finale. Per evitare soggettività, viene effettuato un sorteggio. Per un torneo a 8 squadre, la probabilità che le prime due squadre si incontrino in finale è 4/7. Di conseguenza, con una probabilità di 3/7, la seconda squadra più forte lascerà anticipatamente il torneo.
Qualsiasi misurazione delle unità del prodotto (utilizzando un calibro, un micrometro, un amperometro, ecc.) contiene errori. Per scoprire se esistono errori sistematici, è necessario effettuare misurazioni ripetute di un'unità di prodotto di cui si conoscono le caratteristiche (ad esempio, un campione standard). Va ricordato che oltre all’errore sistematico esiste anche l’errore casuale.

Sorge quindi la questione di come scoprire dai risultati della misurazione se esiste un errore sistematico. Se notiamo solo se l'errore ottenuto durante la misurazione successiva è positivo o negativo, questo compito può essere ridotto a quello precedente. Paragoniamo infatti una misura al lancio di una moneta, un errore positivo alla perdita di uno stemma, un errore negativo ad una griglia (un errore zero con un numero sufficiente di divisioni di scala non si verifica quasi mai). Allora verificare l’assenza di errori sistematici equivale a verificare la simmetria della moneta.

Lo scopo di queste considerazioni è ridurre il problema della verifica dell'assenza di un errore sistematico al problema della verifica della simmetria di una moneta. Il ragionamento sopra esposto porta al cosiddetto “criterio dei segni” in statistica matematica.
Il “test del segno” è un criterio statistico che consente di verificare l'ipotesi nulla che il campione obbedisca a una distribuzione binomiale con il parametro p=1/2. Il test del segno può essere utilizzato come test statistico non parametrico per verificare l'ipotesi che la mediana sia uguale a un dato valore (nello specifico, zero) e che non vi sia alcuna distorsione (l'assenza di un effetto del trattamento) in due campioni correlati. Consente anche di verificare l'ipotesi di simmetria della distribuzione, tuttavia esistono criteri più potenti per questo: il test di Wilcoxon a campione singolo e le sue modifiche.

Nella regolamentazione statistica dei processi tecnologici, basata sui metodi della statistica matematica, vengono sviluppate regole e piani per il controllo statistico dei processi, volti al rilevamento tempestivo di problemi nei processi tecnologici e all'adozione di misure per adeguarli e impedire il rilascio di prodotti che non lo fanno soddisfare i requisiti stabiliti. Queste misure mirano a ridurre i costi di produzione e le perdite derivanti dalla fornitura di unità di bassa qualità. Durante il controllo statistico di accettazione, sulla base dei metodi della statistica matematica, vengono sviluppati piani di controllo della qualità analizzando campioni provenienti da lotti di prodotto. La difficoltà sta nel riuscire a costruire correttamente modelli probabilistico-statistici dei processi decisionali, sulla base dei quali poter rispondere alle domande sopra poste. Nella statistica matematica, a questo scopo sono stati sviluppati modelli probabilistici e metodi per verificare le ipotesi, in particolare l'ipotesi che la proporzione di unità di produzione difettose sia uguale a un certo numero p0, ad esempio p0 = 0,23.

Compiti di valutazione.
In una serie di situazioni gestionali, produttive, economiche ed economiche nazionali sorgono problemi di tipo diverso: problemi di valutazione delle caratteristiche e dei parametri delle distribuzioni di probabilità.

Diamo un'occhiata a un esempio. Lascia che un lotto di lampade elettriche N arrivi per l'ispezione. Da questo lotto è stato selezionato casualmente un campione di n lampade elettriche. Sorgono una serie di domande naturali. Come determinare la durata media delle lampade elettriche in base ai risultati dei test sugli elementi campione e con quale precisione è possibile valutare questa caratteristica? Come cambierà la precisione se prendiamo un campione più grande? Per quale numero di ore T si può garantire che almeno il 90% delle lampade elettriche durerà T o più ore?

Supponiamo che testando un campione di n lampade elettriche, X lampade elettriche risultino difettose. Allora sorgono le seguenti domande. Quali limiti si possono specificare per il numero D di lampade elettriche difettose in un lotto, per il livello di difettosità D/N, ecc.?

Oppure, quando si analizza statisticamente l'accuratezza e la stabilità dei processi tecnologici, è necessario valutare indicatori di qualità come il valore medio del parametro controllato e il grado della sua dispersione nel processo in esame. Secondo la teoria della probabilità, è consigliabile utilizzare la sua aspettativa matematica come valore medio di una variabile casuale e la dispersione, la deviazione standard o il coefficiente di variazione come caratteristica statistica dello spread. Ciò solleva la domanda: come valutare queste caratteristiche statistiche dai dati campione e con quale accuratezza è possibile farlo? Ci sono molti esempi simili che si possono fornire. Qui era importante mostrare come la teoria della probabilità e la statistica matematica possano essere utilizzate nella gestione della produzione quando si prendono decisioni nel campo della gestione statistica della qualità del prodotto.

Metodi probabilistico-statistici e ottimizzazione. L'idea di ottimizzazione permea la moderna statistica matematica applicata e altri metodi statistici. Vale a dire, metodi di pianificazione degli esperimenti, controllo statistico dell'accettazione, regolamentazione statistica dei processi tecnologici, ecc. D'altra parte, le formulazioni di ottimizzazione nella teoria del processo decisionale, ad esempio, la teoria applicata dell'ottimizzazione della qualità del prodotto e dei requisiti standard, prevedono la uso diffuso di metodi statistici probabilistici, principalmente statistiche matematiche applicate.

Nella gestione della produzione, in particolare, quando si ottimizza la qualità del prodotto e i requisiti standard, è particolarmente importante applicare metodi statistici fase iniziale ciclo vitale prodotti, cioè nella fase di preparazione della ricerca per gli sviluppi della progettazione sperimentale (sviluppo di requisiti di prodotto promettenti, progettazione preliminare, specifiche tecniche per lo sviluppo della progettazione sperimentale). Ciò è dovuto alle limitate informazioni disponibili nella fase iniziale del ciclo di vita del prodotto e alla necessità di prevedere le capacità tecniche e la situazione economica per il futuro. I metodi statistici dovrebbero essere utilizzati in tutte le fasi della risoluzione di un problema di ottimizzazione: quando si ridimensionano le variabili, si sviluppano modelli matematici del funzionamento di prodotti e sistemi, si conducono esperimenti tecnici ed economici, ecc.

Nei problemi di ottimizzazione, inclusa l'ottimizzazione della qualità del prodotto e dei requisiti standard, vengono utilizzate tutte le aree della statistica. Vale a dire statistica di variabili casuali, analisi statistica multivariata, statistica di processi casuali e serie temporali, statistica di oggetti di natura non numerica. Si consiglia di selezionare un metodo statistico per l'analisi di dati specifici in base alle raccomandazioni.

Conclusione.
IN
ecc.............

Per statistica matematica si intende “una branca della matematica dedicata ai metodi matematici di raccolta, sistematizzazione, elaborazione e interpretazione dei dati statistici, nonché al loro utilizzo per conclusioni scientifiche o pratiche. Le regole e le procedure della statistica matematica si basano sulla teoria della probabilità, che consente di valutare l’accuratezza e l’affidabilità delle conclusioni ottenute in ciascun problema sulla base del materiale statistico disponibile”. In questo caso, i dati statistici si riferiscono alle informazioni sul numero di oggetti in una collezione più o meno ampia che presentano determinate caratteristiche.

In base al tipo di problemi da risolvere, la statistica matematica è solitamente divisa in tre sezioni: descrizione dei dati, stima e verifica delle ipotesi.

In base alla tipologia dei dati statistici trattati, la statistica matematica si suddivide in quattro aree:
- statistica unidimensionale (statistica delle variabili casuali), in cui il risultato di un'osservazione è descritto da un numero reale;
- analisi statistica multivariata, in cui il risultato dell'osservazione di un oggetto è descritto da più numeri (vettore);
- statistica di processi casuali e serie temporali, dove il risultato dell'osservazione è una funzione;
- statistica di oggetti di natura non numerica, in cui il risultato di un'osservazione è di natura non numerica, ad esempio è un insieme (figura geometrica), un ordinamento o ottenuto come risultato di una misurazione basata su un criterio qualitativo.

Storicamente, alcune aree della statistica di oggetti di natura non numerica (in particolare, problemi di stima della proporzione dei difetti e di verifica di ipotesi al riguardo) e statistiche unidimensionali sono state le prime ad apparire. L'apparato matematico è più semplice per loro, quindi il loro esempio viene solitamente utilizzato per dimostrare le idee di base della statistica matematica.

Solo le modalità di trattamento dei dati, ad es. le statistiche matematiche sono basate sull'evidenza, che si basano su modelli probabilistici di fenomeni e processi reali rilevanti. Stiamo parlando di modelli di comportamento dei consumatori, del verificarsi di rischi, del funzionamento delle apparecchiature tecnologiche, dell'ottenimento di risultati sperimentali, del decorso di una malattia, ecc.

Un modello probabilistico di un fenomeno reale dovrebbe considerarsi costruito se le quantità considerate e le connessioni tra loro sono espresse in termini di teoria della probabilità. Corrispondenza al modello probabilistico della realtà, cioè la sua adeguatezza è comprovata, in particolare, utilizzando metodi statistici per verificare le ipotesi.

I metodi non probabilistici di elaborazione dei dati sono esplorativi; possono essere utilizzati solo nell'analisi preliminare dei dati, poiché non consentono di valutare l'accuratezza e l'affidabilità delle conclusioni ottenute sulla base di materiale statistico limitato.

I metodi probabilistici e statistici sono applicabili ovunque sia possibile costruire e giustificare un modello probabilistico di un fenomeno o processo. Il loro utilizzo è obbligatorio quando le conclusioni tratte dai dati del campione vengono trasferite all'intera popolazione (ad esempio, da un campione a un intero lotto di prodotti).

Le discipline probabilistiche e statistiche applicate come la teoria dell'affidabilità e la teoria delle code sono ampiamente utilizzate. Il contenuto del primo è chiaro dal nome, il secondo riguarda lo studio di sistemi come una centrale telefonica, che riceve chiamate in orari casuali - i requisiti degli abbonati che compongono i numeri sui loro apparecchi telefonici. La durata della manutenzione di questi requisiti, ad es.

anche la durata delle conversazioni è modellata da variabili casuali. Un grande contributo allo sviluppo di queste discipline è stato dato dal membro corrispondente dell'Accademia delle scienze dell'URSS A.Ya. Khinchin (1894-1959), accademico dell'Accademia delle scienze della SSR ucraina B.V. Gnedenko (1912-1995) e altri scienziati nazionali. Ogni studio nel campo dei fenomeni casuali affonda sempre le sue radici nell'esperimento, nei dati sperimentali. Vengono chiamati i dati numerici raccolti durante lo studio di qualsiasi attributo di un oggetto statistico . I dati statistici costituiscono il materiale iniziale dello studio. Affinché possano rappresentare scientifici o valore pratico

, devono essere elaborati con metodi di statistica matematica. Statistica matematica - Questo disciplina scientifica

, il cui oggetto di studio è lo sviluppo di metodi per la registrazione, la descrizione e l'analisi dei dati sperimentali statistici ottenuti a seguito di osservazioni di fenomeni casuali di massa.

    I compiti principali della statistica matematica sono:

    determinazione della legge di distribuzione di una variabile casuale o di un sistema di variabili casuali;

    testare la plausibilità delle ipotesi;

determinazione dei parametri di distribuzione sconosciuti.

Tutti i metodi della statistica matematica si basano sulla teoria della probabilità. Tuttavia, a causa della specificità dei problemi da risolvere, la statistica matematica si distingue dalla teoria della probabilità in un campo indipendente. Se nella teoria della probabilità si considera dato un modello di un fenomeno e si calcola il possibile corso reale di questo fenomeno (Fig. 1), nella statistica matematica viene selezionato un modello di probabilità teorico adatto sulla base di dati statistici (Fig. 2).

Fig.1. Problema generale della teoria della probabilità

Fig.2. Problema generale di statistica matematica

Come disciplina scientifica, la statistica matematica si è sviluppata insieme alla teoria della probabilità. L'apparato matematico di questa scienza fu costruito nella seconda metà del XIX secolo.

2. Popolazione generale e campione. Per studiare i metodi statistici vengono introdotti i concetti di popolazioni generali e campione. In generale, sotto popolazione generale
. Una popolazione campione o una dimensione campionaria n per una data variabile casuale X è un insieme
osservazioni indipendenti di questa quantità, dove è chiamato valore campionario o realizzazione di una variabile casuale X. Così, possono essere considerate come numeri (se si effettua l'esperimento e si preleva il campione) e come variabili casuali (prima che si effettui l'esperimento), poiché cambiano da campione a campione.

Esempio 1. Per determinare il rapporto tra lo spessore di un tronco d'albero e la sua altezza, sono stati selezionati 200 alberi. IN in questo caso dimensione del campione n=200.

Esempio 2. Come risultato del taglio dei pannelli truciolari su una sega circolare, sono stati ottenuti 15 valori di lavoro di taglio specifico. In questo caso n=15.

D
Per poter giudicare con sicurezza dai dati del campione la caratteristica della popolazione generale che ci interessa, gli oggetti campione devono rappresentarla correttamente, cioè il campione deve essere rappresentante(rappresentante). La rappresentatività di un campione viene solitamente raggiunta mediante una selezione casuale di oggetti: a ciascun oggetto della popolazione generale viene fornita la stessa probabilità di essere incluso nel campione come tutti gli altri.

Fig.3. Dimostrazione della rappresentatività del campione

Condividi con gli amici o salva per te stesso:

Caricamento...