« poprzedni punkt | następny punkt » |
Rozważmy dwie zmienne losowe o rozkładach {(100,1/2), (-100,1/2)} i {(2,1/3), (-1, 2/3)} Chociaż zmienne bardzo się różnią przyjmowanymi wartościami, to ich wartości oczekiwane są takie same. Rzeczywiście mamy EX = EY = 0. Wariancja jest parametrem, który pozwoli rozróżnić te zmienne. Ogólnie, wartość oczekiwana i wariancja są parametrami komplementarnymi.
Definicja 14.5.1
Wariancją zmiennej losowej X, oznaczaną przez V(X), nazywamy wartość oczekiwaną zmiennej losowej (X-EX)2, tzn. V(X) = E((X-EX)2).
Jeśli X jest zmienną dyskretną o rozkładzie prawdopodobieństwa {(xi,pi)}i=1,...n, oraz E(X) = m, to
V(X) = (x1- m)2 ⋅ p1 +...+ (xn -m)2 ⋅ pn.
Z podanej definicji widać, że jeśli wartości badanej zmiennej losowej istotnie odbiegają od wartości średniej, to wariancja V(X) ma dużo większą wartość niż w przypadku, gdy wartości badanej zmiennej są skupione wokół wartości oczekiwanej E(X). W związku z tym wariancję uważa się za miarę rozproszenia wartości zmiennej losowej wokół średniej. Im bardziej wartości zmiennej skupiają się wokół wartości oczekiwanej, tym mniejszą liczbą jest wariancja.
Twierdzenie 14.5.1
Dla dowolnej zmiennej losowej dyskretnej
Dowód.
Niech m = E(X).
Ad.(a). Korzystając z wcześniej udowodnionych własności dla wartości oczekiwanej, mamy
V(X) = E((X-m)2) = E(X2 - 2X ⋅ m + m2) = E(X2) - 2E(X) ⋅ m + m2 = E(X2) - m2 .
Ad.(b)
E((X-c)2) = E(((X-m) + (m -c))2) = E((X-m)2 + 2(X-m)(m-c) + (m-c)2) = E((X-m)2) + 2(m-c)E(X-m) + (m-c)2 .
Ponieważ E(X-m) = 0, zatem E((X-c)2) = V(X) + (m-c)2. Na mocy założenia c ≠ m, więc (m-c) 2 >0 i w konsekwencji V(X) < E[(X-c)2]. ♦
Twierdzenie 14.5.2
Jeżeli V(X) jest wariancją zmiennej losowej dyskretnej X, a V(Y) jest wariancją zmiennej losowej dyskretnej Y, to dla dowolnej stałej rzeczywistej c,
(1) V(cX) = c2V(X),
(2) Jeśli zmienne losowe X i Y są niezależne, to V(X+Y)= V(X) + V(Y).
Dowód.
Bardzo prosty dowód pierwszej z wymienionych własności pomijamy.
Ad.(2) Ponieważ X i Y są niezależne, więc również (X-c) i (Y-c) są zmiennymi niezależnymi. Stąd i z twierdzenia 14.4.2, E((X-EX)(Y-EY)) = E(X-EX) ⋅ E(Y-EY) = 0.
Wykorzystując powyższy fakt i własności wartości oczekiwanej sformułowane w twierdzeniu 14.4.1 otrzymujemy
V(X+Y) = E((X+Y - E(X+Y)) 2 ) = E((X- EX + Y- EY) 2) =
E((X-EX)2 + 2(X - EX)(Y - EY) + (Y-EY) 2) =
E ((X-EX)2 ) + E(2(X-EX)(Y-EY)) + E((Y-EY)2) = V(X) + V(Y). ♦
Ostatni z parametrów, który zaprezentujemy w tym wykładzie to odchylenie standardowe.
Przykład 14.5.1
Na egzaminie podano 30 pytań. Za każde z nich można dostać 1 punkt, o ile poprawnie wybierze się jedną z trzech możliwych. Załóżmy, że decyzje o wyborze odpowiedzi są podejmowane niezależnie dla każdego pytania i, że wybór każdego z wariantów odpowiedzi jest tak samo prawdopodobny. Jaka jest wartość oczekiwana zmiennej losowej Y opisującej wynik egzaminu i jaka jest wariancja tej zmiennej? Wartościami rozważanej zmiennej Y są liczby naturalne 0, 1, 2, ..., 30. Zauważmy, że zmienna Y może być potraktowana jako suma zmiennych Xi odpowiadających kolejnym pytaniom i = 1, 2, ..., 30. Zmienna Xi przyjmuje wartość 1 lub 0 i, wobec przyjętych założeń, ma rozkład P(Xi=1) = 1/3, P(Xi=0) = 2/3. Wartość oczekiwana zmiennej Xi jest taka sama dla wszystkich i, i wynosi
E(Xi) = 1 ⋅ (1/3) +0 ⋅ (2/3) = 1/3
V(Xi) = E((Xi -E(Xi))2 ) = E((Xi -(1/3))2 )= (2/3)2 ⋅ (1/3) + (-1/3)2 ⋅ (2/3) = 2/9.
Stąd i z twierdzenia 14.4.1 otrzymujemy
E(Y) = E(X1 + X2 + ... + X30) = E(X1) + E(X2) + ...+ E(X30) = 30/3 = 10.
Wariancję zmiennej Y policzymy wykorzystując twierdzenie 14.5.2, a właściwie jego uogólnienie na dowolną liczbę składników. Mamy
V(Y) = V(X1 + X2 + ... + X30) = V(X1)+ V(X2)+ ...+ V(X30) = 30 (2/9) = 6.666.
Odchylenie standardowe zmiennej Y wynosi w przybliżeniu 2.5.
Pytanie 14.5.1 Czy dla dowolnych dwóch niezależnych zmiennych losowych dyskretnych X i Y, określonych w tej samej przestrzeni zdarzeń, V(X+Y) = V(X-Y)?
W dalszym ciągu rozważymy pewne znane rozklady prawdopodobieństwa i wyznaczymy dla nich wartości średnie i wariancje.
Lemat 14.5.1
Niech X będzie zmienną losową o rozkładzie zerojedynkowym P(X=1) = p i P(X=0) = 1-p.
Wtedy EX = p oraz VX = p(1-p).
Rzeczywiście EX = 1 ⋅ p +0 ⋅ (1-p) = p oraz
VX = E((X- EX)2) = (1-p) 2 p + (0-p) 2(1-p) = p(1-p). ♦
Lemat 14.5.2
Niech zmienna losowa X opisuje liczbę sukcesów w schemacie Beroulliego z parametrami n i p. Wtedy E(X) = np oraz V(X) = np(1-p).
Dowód.
Jak ustaliliśmy wcześniej, zmienna X ma rozkład dwumianowy z parametrami n i p, tzn. jej rozkład jest określony wzorem:
f(k) = (n nad k) p k (1-p)n-k dla k=0,1,...n
f(x) = 0 dla pozostałych x
Obliczymy wartość oczekiwaną, wariancję i odchylenie standardowe dla tej zmiennej. Zamiast jednak badać samą zmienną X rozważmy rodzinę zmiennych Xi, takich, że Xi odpowiada i-temu doświadczeniu
Xi(sukces w i-tym doświadczeniu) = 1 i Xi(porażka w itym doświadczeniu) = 0 .
Oczywiście, zmienna X jest sumą zmiennych X1,.., Xn.
Mamy P(Xi=1) = p, P(Xi=0)=1-p, a stąd E(Xi) = p, E(Xi2) = p, V(Xi) = p(1-p)
Zmienna losowa X jest sumą rozważanych zmiennych X = X1 + ...+ Xn. Ponieważ zmienne Xi są niezależne, zatem, na mocy przytoczonych w poprzednim punkcie twierdzeń, mamy
Odchylenie standardowe jest więc równe . ♦
Lemat 14.5.3
Niech zmienna X ma rozkład geometryczny, tzn. rozkład określony następująco:
fX(k) = P(X=k) = p (1-p)k-1 dla k = 1, 2, 3,...
Wtedy wartość oczekiwana zmiennej X , EX = 1/p. ♦
Przykład 14.5.2
Niech P(żarówka przepali się w ciągu 1 godziny) = q.
Jeśli q jest małe to możemy założyć, że zdarzenia "żarówka przepali się w ciągu k tej godziny" są niezależne. Niech zmienna losowa X przyjmuje wartość k, jeśli żarówka przepali się w ciągu k godzin. Wtedy P(X=k) = (1-q) k-1 q. Zmienna X ma rozkład geometryczny, zatem wartość oczekiwana zmiennej X wynosi 1/q.
Spodziewany czas oczekiwania na przepalenie się żarówki wynosi więc 1/q.
Pytanie 14.5.2 Niech A będzie podzbiorem pewnego skończonego uniwersum U. Ze zbioru U wybieramy losowo jeden element. Załóżmy, że wszystkie wybory są tak samo prawdopodobne. Niech X będzie zmienną losową przyjmującą wartość 1, gdy wybrany element należy do zbioru A, a wartość 0 dla pozostałych elementów. Jaka jest wartość wariancji tej zmiennej losowej?
« poprzedni punkt | następny punkt » |