Transformacije slučajnih varijabli

Za svaku slučajnu varijablu x odrediti još tri veličine – centrirano Y, normalizirano V i dano U. Centrirana slučajna varijabla Y je razlika između date slučajne varijable x i njegovo matematičko očekivanje M(X), oni. Y = X – M(X). Očekivanje centrirane slučajne varijable Y jednaka je 0, a varijanca je varijanca dane slučajne varijable: M(Y) = 0, D(Y) = D(x). Funkcija distribucije F Y(x) centrirana slučajna varijabla Y vezane uz funkciju distribucije F(x) originalna slučajna varijabla x omjer:

F Y(x) = F(x + M(x)).

Gustoće ovih slučajnih varijabli zadovoljavaju jednakost

f Y(x) = f(x + M(x)).

Normalizirana slučajna varijabla V je omjer zadane slučajne varijable x svojoj standardnoj devijaciji, tj. . Očekivanje i varijanca normalizirane slučajne varijable V izražen kroz karakteristike x Tako:

,

Gdje v– koeficijent varijacije izvorne slučajne varijable x. Za distribucijsku funkciju F V(x) i gustoća f V(x) normalizirana slučajna varijabla V imamo:

Gdje F(x) – funkcija distribucije izvorne slučajne varijable x, A f(x) – njegovu gustoću vjerojatnosti.

Smanjena slučajna varijabla U je centrirana i normalizirana slučajna varijabla:

.

Za zadanu slučajnu varijablu

Normalizirane, centrirane i reducirane slučajne varijable stalno se koriste kako u teorijskim studijama tako iu algoritmima, softverskim proizvodima, regulatornoj, tehničkoj i instruktivnoj dokumentaciji. Konkretno, jer jednakosti omogućuju pojednostavljenje obrazloženja metoda, formulacije teorema i formula za izračun.

Koriste se transformacije slučajnih varijabli i one općenitije. Dakle, ako Y = sjekira + b, Gdje a I b– onda neke brojke

Primjer 7. Ako tada Y je reducirana slučajna varijabla, a formule (8) pretvaraju se u formule (7).

Uz svaku slučajnu varijablu x možete pridružiti mnoge slučajne varijable Y, dano formulom Y = sjekira + b na različitim a> 0 i b. Ovaj skup se zove obitelj pomaka na ljestvici, koju generira slučajna varijabla x. Funkcije raspodjele F Y(x) čine familiju distribucija s pomakom na skali koju generira funkcija distribucije F(x). Umjesto Y = sjekira + bčesto koriste snimanje

Broj S naziva se parametar posmaka, a broj d- parametar mjerila. Formula (9) to pokazuje x– rezultat mjerenja određene veličine – ulazi u U– rezultat mjerenja iste veličine ako se početak mjerenja pomakne na točku S, a zatim upotrijebite novu mjernu jedinicu, in d puta veći od starog.

Za obitelj pomaka na skali (9), distribucija X naziva se standardna. U probabilističkim statističkim metodama odlučivanja i drugim primijenjenim istraživanjima koriste se standardna normalna distribucija, standardna Weibull-Gnedenko distribucija, standardna gama distribucija itd. (vidi dolje).

Također se koriste i druge transformacije slučajnih varijabli. Na primjer, za pozitivnu slučajnu varijablu x razmatraju Y= log x, gdje je lg x– decimalni logaritam broja x. Lanac jednakosti

F Y (x) = P( lg x< x) = P(X < 10x) = F( 10x)

povezuje distribucijske funkcije x I Y.

Centrirana slučajna varijabla koja odgovara SVx je razlika između slučajne varijable x i njegovo matematičko očekivanje

Slučajna varijabla se zove normalizirao, ako je njegova varijanca 1. Centrirana i normalizirana slučajna varijabla se zove standard.

Standardna slučajna varijabla Z, koji odgovara slučajnoj varijabli x nalazi se formulom:

(1.24)

1.2.5. Ostale numeričke karakteristike

Diskretni SV način x definira se kao takva moguća vrijednost x m, za koji

Kontinuirana SV modax naziva realnim brojem M 0 (x), definirana kao točka najveće distribucije gustoće vjerojatnosti f(x).

Dakle, moda SV x je njegova najvjerojatnija vrijednost ako je takva vrijednost jedinstvena. Modus možda ne postoji, ima jednu vrijednost (unimodalna distribucija) ili ima više vrijednosti (multimodalna distribucija).

Medijan kontinuiranog SVx naziva realnim brojem M D (x), zadovoljavajući uvjet

Budući da ova jednadžba može imati više korijena, medijan se određuje, općenito govoreći, dvosmisleno.

Početni trenutakm-ti red SVx (ako postoji) nazivamo realnim brojem m, određeno formulom

(1.27)

Centralni moment m. reda SVx(ako postoji) naziva se broj m, određeno formulom

(1.28)

Očekivanje SV x je njegov prvi početni moment, a disperzija je drugi središnji moment.

Među momentima viših redova posebno su važni središnji momenti 3. i 4. reda.

Koeficijent asimetrije ("iskrivljenosti") A(x) naziva se količina

Koeficijent kurtoze ("oštrine") E(x) NEx naziva se količina

1.3. Neki zakoni raspodjele diskretnih slučajnih varijabli

1.3.1. Geometrijska raspodjela

Diskretni SV x ima geometrijsku raspodjelu ako su njegove moguće vrijednosti 0, 1, 2, …, m, ... odgovaraju vjerojatnostima izračunatim formulom

gdje je 0< str< 1,q= 1 –str.

U praksi, geometrijska distribucija se javlja kada se u nekoliko neovisnih pokušaja postigne neki rezultat. A i vjerojatnosti događanja događaja A u svakom pokušaju P(A) =P. NE x– broj beskorisnih pokušaja (prije prvog eksperimenta u kojem se događaj pojavljuje A), ima geometrijsku distribuciju sa nizom distribucije:

x ja

str ja

q 2 str

q m str

i numeričke karakteristike:

(1.30)

1.3.2. Hipergeometrijska raspodjela

Diskretni SV x s mogućim vrijednostima 0, 1, …, m, …,M ima hipergeometrijsku raspodjelu s parametrima N,M,n, Ako

(1.31)

Gdje MN,m n,nN,m,n,N,M- cijeli brojevi.

Hipergeometrijska distribucija javlja se u slučajevima kao što su sljedeći: postoji N objekata, od kojih M imaju određenu karakteristiku. Od dostupnih N predmeti se biraju nasumično n objekti.

NE x broj objekata s navedenim atributom među odabranima raspoređuje se prema hipergeometrijskom zakonu.

Hipergeometrijska razdioba se posebno koristi pri rješavanju problema vezanih uz kontrolu kvalitete proizvoda.

Matematičko očekivanje slučajne varijable koja ima hipergeometrijsku distribuciju jednako je:

(1.32)

Razlika između slučajne varijable i njenog matematičkog očekivanja naziva se odstupanje ili centrirana slučajna varijabla:

Niz distribucije centrirane slučajne varijable ima oblik:

x M(X)

x 1 M(X)

x 2 M(X)

x n M(X)

R 1

str 2

R n

Svojstva centrirana slučajna varijabla:

1. Matematičko očekivanje odstupanja je 0:

2. Varijanca odstupanja slučajne varijable x iz svog matematičkog očekivanja jednako je varijanci same slučajne varijable X:

Drugim riječima, varijanca slučajne varijable i varijanca njezina odstupanja jednake su.

4.2. Ako odstupanje xM(X) podijelite standardnom devijacijom (X), tada dobivamo bezdimenzionalnu centriranu slučajnu varijablu, koja se naziva standardna (normalizirana) slučajna varijabla:

Svojstva standardna slučajna varijabla:

    Matematičko očekivanje standardne slučajne varijable je nula: M(Z) =0.

    Varijanca standardne slučajne varijable je 1: D(Z) =1.

    ZADACI ZA SAMOSTALNO RJEŠAVANJE

    U lutriji za 100 ulaznica izvlače se dvije stvari čija je cijena 210 i 60 USD. Sastavite zakon raspodjele dobitka za osobu koja ima: a) 1 listić, b) 2 listića. Pronađite numeričke karakteristike.

    Dva strijelca gađaju metu jednom. Slučajna vrijednost x– broj bodova postignut u jednom hicu od strane prvog strijelca – ima zakon raspodjele:

Z– zbroj bodova oba strijelca. Odrediti brojčane karakteristike.

    Dva strijelca pucaju u svoju metu, ispaljujući svaki po jedan metak neovisno jedan o drugom. Vjerojatnost pogađanja mete za prvog strijelca je 0,7, za drugog - 0,8. Slučajna vrijednost x 1 – broj pogodaka prvog strijelca, x 2 - broj pogodaka drugog strijelca. Nađite zakon raspodjele: a) ukupnog broja pogodaka; b) slučajna varijabla Z=3x 1  2x 2 . Odredite brojčane karakteristike ukupnog broja pogodaka. Provjerite ispunjenje svojstava matematičkog očekivanja i disperzije: M(3 x 2 Y)=3 M(x) 2 M(Y), D(3 x 2 Y)=9 D(x)+4 D(Y).

    Slučajna vrijednost x– prihod društva – ima zakon o raspodjeli:

Pronađite zakon raspodjele za slučajnu varijablu Z- dobit poduzeća. Odredite njegove numeričke karakteristike.

    Slučajne varijable x I U nezavisni i imaju isti zakon raspodjele:

Značenje

Imaju li slučajne varijable iste zakone raspodjele? x I x + U ?

    Dokažite da je matematičko očekivanje standardne slučajne varijable jednako nuli, a varijanca jednaka 1.

ima varijancu jednaku 1 i matematičko očekivanje jednako 0.

Normalizirana slučajna varijabla V je omjer zadane slučajne varijable X i njezine standardne devijacije σ

Standardna devijacija je kvadratni korijen varijance

Matematičko očekivanje i varijanca normalizirane slučajne varijable V izražavaju se kroz karakteristike X na sljedeći način:

MV= M(X)σ=1v, DV= 1,

gdje je v koeficijent varijacije originalne slučajne varijable X.

Za funkciju distribucije F V (x) i gustoću distribucije f V (x) imamo:

F V (x) = F(σx), f V (x) = σf(σx),

Gdje F(x)– funkcija distribucije izvorne slučajne varijable x, A f(x)– njegovu gustoću vjerojatnosti.

Koeficijent korelacije.

Koeficijent korelacije je pokazatelj prirode međusobnog stohastičkog utjecaja promjena dviju slučajnih varijabli. Koeficijent korelacije može imati vrijednosti od -1 do +1. Ako je apsolutna vrijednost bliža 1, to znači postojanje jake veze, a ako je bliža 0, veze nema ili je značajno nelinearna. Kada je koeficijent korelacije po modulu jednak jedinici, govorimo o funkcionalnom odnosu (odnosno linearnoj ovisnosti), odnosno da se promjene dviju veličina mogu opisati linearnom funkcijom.

Proces se zove stohastički, ako je opisan slučajnim varijablama čija se vrijednost mijenja tijekom vremena.

Pearsonov koeficijent korelacije.

Za metričke veličine koristi se Pearsonov koeficijent korelacije čiju je točnu formulu izveo Francis Hamilton. Neka su X i Y dvije slučajne varijable definirane na istom prostoru vjerojatnosti. Tada se njihov koeficijent korelacije daje formulom:

Čebiševljeve nejednakosti.

Markovljeva nejednakost.

Markovljeva nejednakost u teoriji vjerojatnosti daje procjenu vjerojatnosti da će slučajna varijabla premašiti fiksnu pozitivnu konstantu u apsolutnoj vrijednosti, u smislu svog matematičkog očekivanja. Dobivena procjena obično je prilično gruba. Međutim, omogućuje dobivanje određene ideje o distribuciji kada potonja nije eksplicitno poznata.

Neka je slučajna varijabla definirana na prostoru vjerojatnosti i neka je njezino matematičko očekivanje konačno. Zatim

,

Gdje a > 0.

Chebyshev-Bieniemeova nejednakost.

Ako E< ∞ (E – математическое ожидание), то для любого , справедливо

Zakon velikih brojeva.

Zakon velikih brojeva navodi da je empirijska sredina (aritmetička sredina) dovoljno velikog konačnog uzorka iz fiksne distribucije blizu teorijske sredine (matematičkog očekivanja) te distribucije. Ovisno o vrsti konvergencije, razlikuje se slabi zakon velikih brojeva, kada dolazi do konvergencije u vjerojatnosti, i jaki zakon velikih brojeva, kada se konvergencija pojavljuje gotovo posvuda.



Uvijek će postojati određeni broj pokusa u kojima će se, uz bilo koju unaprijed zadanu vjerojatnost, učestalost pojavljivanja nekog događaja razlikovati onoliko malo koliko je željeno od njegove vjerojatnosti. Općenito značenje zakona velikih brojeva je da kombinirano djelovanje velikog broja slučajnih faktora dovodi do rezultata koji je gotovo neovisan o slučaju.

Slabi zakon velikih brojeva.

Tada je Sn P M(X).

Pojačani zakon velikih brojeva.

Tada je Sn→M(X) gotovo siguran.

Uz karakteristike položaja - prosječne, tipične vrijednosti slučajne varijable - koristi se niz karakteristika, od kojih svaka opisuje jedno ili drugo svojstvo distribucije. Kao takve karakteristike najčešće se koriste momenti tzv.

Pojam momenta široko se koristi u mehanici za opisivanje raspodjele masa (statički momenti, momenti tromosti itd.). Potpuno iste tehnike koriste se u teoriji vjerojatnosti za opisivanje osnovnih svojstava distribucije slučajne varijable. Najčešće se u praksi koriste dvije vrste trenutaka: početni i središnji.

Početni trenutak s. reda diskontinuirane slučajne varijable je zbroj oblika:

. (5.7.1)

Očito se ova definicija podudara s definicijom početnog momenta reda s u mehanici, ako su mase koncentrirane na apscisnoj osi u točkama.

Za kontinuiranu slučajnu varijablu X, početni moment s-tog reda naziva se integral

. (5.7.2)

Lako je vidjeti da glavna karakteristika pozicije uvedene u prethodnom br. - matematičko očekivanje - nije ništa više od prvog početnog momenta slučajne varijable.

Pomoću znaka matematičkog očekivanja možete dvije formule (5.7.1) i (5.7.2) spojiti u jednu. Doista, formule (5.7.1) i (5.7.2) po strukturi su potpuno slične formulama (5.6.1) i (5.6.2), s tom razlikom da umjesto i stoje redom i . Stoga možemo napisati opću definiciju početnog trenutka ti reda, koja vrijedi i za diskontinuirane i za kontinuirane veličine:

, (5.7.3)

oni. Početni trenutak th reda slučajne varijable je matematičko očekivanje th stupnja te slučajne varijable.

Prije definiranja središnjeg trenutka, uvodimo novi koncept "centrirane slučajne varijable".

Neka postoji slučajna varijabla s matematičkim očekivanjem. Centrirana slučajna varijabla koja odgovara vrijednosti je odstupanje slučajne varijable od njenog matematičkog očekivanja:

Ubuduće ćemo se dogovoriti da svugdje centriranu slučajnu varijablu koja odgovara danoj slučajnoj varijabli označavamo istim slovom sa simbolom na vrhu.

Lako je provjeriti da je matematičko očekivanje centrirane slučajne varijable jednako nuli. Doista, za diskontinuiranu količinu

slično za kontinuiranu količinu.

Centriranje slučajne varijable očito je jednako pomicanju ishodišta koordinata u središnju, “središnju” točku, čija je apscisa jednaka matematičkom očekivanju.

Momenti centrirane slučajne varijable nazivaju se centralni momenti. Oni su analogni momentima o težištu u mehanici.

Dakle, središnji trenutak reda s slučajne varijable je matematičko očekivanje th potencije odgovarajuće centrirane slučajne varijable:

, (5.7.6)

a za kontinuirano – integralom

. (5.7.8)

U nastavku ćemo, u slučajevima kada nema dvojbe kojoj slučajnoj varijabli pripada dati trenutak, radi sažetosti pisati jednostavno i umjesto i .

Očito je da je za bilo koju slučajnu varijablu središnji moment prvog reda jednak nuli:

, (5.7.9)

budući da je matematičko očekivanje centrirane slučajne varijable uvijek jednako nuli.

Izvedimo relacije koje povezuju središnje i početne momente raznih redova. Zaključak ćemo provesti samo za diskontinuirane količine; lako je provjeriti da potpuno iste relacije vrijede za kontinuirane veličine ako konačne zbrojeve zamijenimo integralima, a vjerojatnosti elementima vjerojatnosti.

Razmotrimo drugu središnju točku:

Slično za treći središnji trenutak dobivamo:

Izrazi za itd. može se dobiti na sličan način.

Dakle, za središnje trenutke bilo koje slučajne varijable vrijede formule:

(5.7.10)

Općenito govoreći, momenti se mogu smatrati ne samo relativnim u odnosu na ishodište (početni momenti) ili matematičko očekivanje (centralni momenti), već i relativno u odnosu na proizvoljnu točku:

. (5.7.11)

Međutim, središnji momenti imaju prednost u odnosu na sve ostale: prvi središnji moment, kao što smo vidjeli, uvijek je jednak nuli, a sljedeći, drugi središnji moment, u ovom referentnom sustavu ima minimalnu vrijednost. Dokažimo to. Za diskontinuiranu slučajnu varijablu pri, formula (5.7.11) ima oblik:

. (5.7.12)

Transformirajmo ovaj izraz:

Očito, ova vrijednost doseže svoj minimum kada , tj. kada se trenutak uzme u odnosu na točku.

Od svih momenata, kao karakteristike slučajne varijable najčešće se koriste prvi početni moment (matematičko očekivanje) i drugi centralni moment.

Drugi središnji moment naziva se varijanca slučajne varijable. S obzirom na iznimnu važnost ove karakteristike, između ostalog, uvodimo posebnu oznaku za nju:

Prema definiciji središnjeg momenta

, (5.7.13)

oni. varijanca slučajne varijable X je matematičko očekivanje kvadrata odgovarajuće centrirane varijable.

Zamjenom količine u izrazu (5.7.13) s njenim izrazom također imamo:

. (5.7.14)

Za izravan izračun varijance upotrijebite sljedeće formule:

, (5.7.15)

(5.7.16)

Prema tome za diskontinuirane i kontinuirane količine.

Disperzija slučajne varijable je karakteristika disperzije, raspršivanja vrijednosti slučajne varijable oko njenog matematičkog očekivanja. Sama riječ "disperzija" znači "raspršenost".

Ako se okrenemo mehaničkoj interpretaciji raspodjele, tada disperzija nije ništa više od momenta tromosti dane raspodjele mase u odnosu na težište (matematičko očekivanje).

Varijanca slučajne varijable ima dimenziju kvadrata slučajne varijable; Za vizualnu karakterizaciju disperzije prikladnije je koristiti veličinu čija se dimenzija podudara s dimenzijom slučajne varijable. Da biste to učinili, izvadite kvadratni korijen varijance. Rezultirajuća vrijednost naziva se standardna devijacija (inače "standardna") slučajne varijable. Označit ćemo standardnu ​​devijaciju:

, (5.7.17)

Kako bismo pojednostavili zapise, često ćemo koristiti kratice za standardnu ​​devijaciju i disperziju: i . U slučaju kada nema sumnje na koju se slučajnu varijablu ove karakteristike odnose, ponekad ćemo izostaviti simbol x y i i pisati jednostavno i . Riječi "standardna devijacija" ponekad će biti skraćene i zamijenjene slovima r.s.o.

U praksi se često koristi formula koja izražava disperziju slučajne varijable kroz njezin drugi početni moment (druga od formula (5.7.10)). U novoj notaciji izgledat će ovako:

Očekivanje i varijanca (ili standardna devijacija) najčešće su korištene karakteristike slučajne varijable. Oni karakteriziraju najvažnije značajke distribucije: njen položaj i stupanj raspršenosti. Za detaljniji opis raspodjele koriste se momenti viših redova.

Treća središnja točka služi za karakterizaciju asimetrije (ili "iskrivljenosti") distribucije. Ako je raspodjela simetrična u odnosu na matematičko očekivanje (ili, u mehaničkoj interpretaciji, masa je raspoređena simetrično u odnosu na težište), tada su svi momenti neparnog reda (ako postoje) jednaki nuli. Dapače, ukupno

kada je zakon raspodjele simetričan u odnosu na zakon i neparan, svakom pozitivnom članu odgovara negativni član jednake apsolutne vrijednosti, tako da je cijeli zbroj jednak nuli. Isto očito vrijedi i za integral

,

koji je jednak nuli kao integral u simetričnim granicama neparne funkcije.

Prirodno je stoga odabrati jedan od neparnih momenata kao karakteristiku asimetrije distribucije. Najjednostavniji od njih je treći središnji moment. Ima dimenziju kocke slučajne varijable: da bi se dobila bezdimenzijska karakteristika, treći se moment dijeli s kubom standardne devijacije. Dobivena vrijednost naziva se "koeficijent asimetrije" ili jednostavno "asimetrija"; označit ćemo ga:

Na sl. 5.7.1 prikazuje dvije asimetrične raspodjele; jedan od njih (krivulja I) ima pozitivnu asimetriju (); druga (krivulja II) je negativna ().

Četvrta središnja točka služi za karakterizaciju takozvane “coolnessa”, tj. šiljasta ili ravnovrhna distribucija. Ova svojstva distribucije opisuju se korištenjem takozvane kurtoze. Kurtoza slučajne varijable je količina

Od omjera se oduzima broj 3 jer za vrlo važan i u prirodi raširen zakon normalne raspodjele (koji ćemo kasnije detaljnije upoznati). Dakle, za normalnu distribuciju kurtosis je nula; krivulje koje su šiljatije u usporedbi s normalnom krivuljom imaju pozitivnu kurtozu; Krivulje koje su ravnije na vrhu imaju negativnu kurtozu.

Na sl. 5.7.2 prikazuje: normalnu distribuciju (krivulja I), distribuciju s pozitivnim kurtosisom (krivulja II) i distribuciju s negativnim kurtosisom (krivulja III).

Uz prethodno razmotrene početne i središnje momente, u praksi se ponekad koriste i tzv. apsolutni momenti (početni i središnji), određeni formulama

Očito se apsolutni momenti parnih redova poklapaju s običnim momentima.

Od apsolutnih momenata najčešće se koristi prvi apsolutni središnji moment.

, (5.7.21)

naziva se odstupanje aritmetičke sredine. Uz disperziju i standardnu ​​devijaciju, odstupanje aritmetičke sredine ponekad se koristi kao karakteristika disperzije.

Očekivanje, mod, medijan, početni i središnji momenti, a posebno disperzija, standardna devijacija, asimetrija i kurtoza su najčešće korištene numeričke karakteristike slučajnih varijabli. U mnogim praktičnim problemima potpuna karakteristika slučajne varijable - zakon distribucije - ili nije potrebna ili se ne može dobiti. U tim slučajevima, korisnik je ograničen na približan opis slučajne varijable pomoću pomoći. Numeričke karakteristike, od kojih svaka izražava neko karakteristično svojstvo distribucije.

Vrlo često se numeričke karakteristike koriste za približno zamjenu jedne distribucije drugom, a obično se nastoji izvršiti ta zamjena na način da nekoliko bitnih točaka ostane nepromijenjeno.

Primjer 1. Proveden je jedan pokus uslijed kojeg se može ili ne mora pojaviti događaj čija je vjerojatnost jednaka . Razmatra se slučajna varijabla – broj pojavljivanja događaja (karakteristična slučajna varijabla događaja). Odredite njegove karakteristike: matematičko očekivanje, disperziju, standardnu ​​devijaciju.

Riješenje. Niz distribucije vrijednosti ima oblik:

gdje je vjerojatnost da se događaj ne dogodi.

Pomoću formule (5.6.1) nalazimo matematičko očekivanje vrijednosti:

Disperzija vrijednosti određena je formulom (5.7.15):

(Predlažemo da čitatelj dobije isti rezultat izražavajući disperziju u smislu drugog početnog trenutka).

Primjer 2. Ispaljena su tri neovisna hica u metu; Vjerojatnost pogađanja svakog udarca je 0,4. slučajna varijabla – broj pogodaka. Odredite karakteristike veličine - matematičko očekivanje, disperzija, r.s.d., asimetrija.

Riješenje. Niz distribucije vrijednosti ima oblik:

Izračunavamo numeričke karakteristike količine:

Imajte na umu da se iste karakteristike mogu izračunati mnogo jednostavnije korištenjem teorema o numeričkim karakteristikama funkcija (vidi Poglavlje 10).