# ...................................................................................... # ................Cvičení 6 - Vybraná rozdělení spojité náhodné veličiny................ # ........................upravené studijní materiály od:............................... # ..................Martina Litschmannová, Adéla Vrtková, Michal Béreš.................. # ...................................................................................... # Nezobrazuje-li se vám text korektně, nastavte File \ Reopen with Encoding... na UTF-8 # Pro zobrazení obsahu skriptu použijte CTRL+SHIFT+O # Pro spouštění příkazů v jednotlivých řádcích použijte CTRL+ENTER # Přehled rozdělení a jejich funkcí #### # * Úvod: Hustota pravděpodobnosti, Distribuční funkce a Kvantilová funkce #### # ** Hustota pravděpodobnosti #### # - začíná písmenkem **d**: p = d...(x, ...) # # ** Distribuční funkce #### # - začíná písmenkem **p**: $p = P(X < x)$: p = p...(x, ...) # # ** Kvantilová funkce #### # - začíná písmenkem **q**: najdi x pro zadané p: $p = F(x) \rightarrow x = F^{-1}(p)$: # x = q...(p, ...) #----------------------------------------------------------------------------------- #----------------------------------------------------------------------------------- #----------------------------------------------------------------------------------- # * Rovnoměrné rozdělení: $X \sim Ro(a, b)$ #### # - náhodná veličina nabývá pouze hodnot větších než a a menších než b # - všechny hodnoty mají stejnou hustotu výskytu -> hustota pravděpodobnosti je # konstantní mezi a a b, jinde nulová # Hustota pravděpodobnosti f(x) a = 2 # odkud b = 4 # kam x = 3 # v jakém bodě dunif(x, a, b) # Distribuční funkce F(x) = P(X < x) a = 2 # odkud b = 4 # kam x = 3 # v jakém bodě punif(x, a, b) # kvantilová funkce F^(-1)(p) = x: P(X X ~ Exp(lambda), kde E(X)=1/lambda # určete parametr lambda # E(X)=1/lambda => lambda = 1/E(X) lambda = 1/30000 #----------------------------------------------------------------------------------- # b) Načrtněte graf hustoty pravděpodobnosti # Hustota pravděpodobnosti f(x) = dexp(x, lambda) # vykreslíme graf x = seq(from = 0, to = 60000, by = 1) f_x = dexp(x, lambda) plot(x, f_x, type='l') grid() #----------------------------------------------------------------------------------- # c) Načrtněte graf distribuční funkce # Distribuční funkce F(x) = P(X < x) # vykreslíme graf x = seq(from = 0, to = 60000, by = 1) F_x = pexp(x, lambda) plot(x, F_x, type = 'l') grid() #----------------------------------------------------------------------------------- # d) Určete pravděpodobnost, že součástka nevydrží více než 2 000 hodin. # P(X<2000)=F(2000) pexp(2000, lambda) #0.06449301 #----------------------------------------------------------------------------------- # e) Určete pravděpodobnost, že součástka vydrží více než 35 000 hodin. # P(X>35000)=1-F(35000) 1 - pexp(35000, lambda) #0.3114032 #----------------------------------------------------------------------------------- # f) Určete pravděpodobnost, že součástka vydrží více než 20 000 až 30 000 hodin. # P(20 000X< X < 30 000)= F(30 000) - F(20 000) pexp(30000, lambda) - pexp(20000, lambda) #0.1455377 #----------------------------------------------------------------------------------- # g) Určete dobu, do níž se porouchá 50 % součástek. # P(X F(x)=0,5 -> x… 50% kvantil qexp(0.50, lambda) #20794.42 #Nebo: -30000*log(0.5) #----------------------------------------------------------------------------------- # g) Určete dobu, kterou přežije jen 5 % součástek. # hledáme x: P(X>x) = 0.05 => P(X F(x)=0,95 -> x… 95% kvantil qexp(0.95, lambda) #89871.97 #Nebo: -30000*log(0.05) #----------------------------------------------------------------------------------- #----------------------------------------------------------------------------------- #----------------------------------------------------------------------------------- # * Weibullovo rozdělení: $X \sim W(\theta,\beta)$ #### # - doba do 1. události (poruchy)(vhodná volba β umožuje použití v libovolném období # intenzity poruch) # - zobecnění exponenciálního rozdělení Exp(λ) = W(Θ=1/λ, β=1) # Hustota pravděpodobnosti f(x) theta = 1/2 # ekvivalent 1/lambda u exp. rozdělení beta = 1 # beta = 1 -> exponenciální rozdělení x = 5 dweibull(x,shape=beta, scale=theta) # Distribuční funkce F(x) = P(X < x) theta = 3 # ekvivalent 1/lambda u exp. rozdělení beta = 2 # beta = 1 -> exponenciální rozdělení x = 5 pweibull(x,shape=beta, scale=theta) # kvantilová funkce F^(-1)(p) = x: P(X exponenciální rozdělení p = 0.5 qweibull(p,shape=beta, scale=theta) # vykreslení - kvantilová funkce F^(-1)(p) = x p = seq(from=0, to=1, by=0.01) x = qweibull(p,shape=beta, scale=theta) plot(p, x, type = 'l') grid() #----------------------------------------------------------------------------------- #----------------------------------------------------------------------------------- # 3.Příklad # Předpokládejme, že životnost sondy na Venuši má Weibulovo rozdělení pravděpodobnosti # (jednotkou času jsou dny) s lineárně rostoucí rizikovou funkcí a parametrem měřítka # theta = 1/lambda = 2. #----------------------------------------------------------------------------------- # a) načrtněte graf rizikové funkce lambda(x) # obecně u Weibulova rozdělení: lambda(x) = beta . lambda^beta . x^(beta-1) => beta = 2 # lambda(x) = 1/2.x pro x>0 a 0 pro x\leq 0 rizf = function(x){ f = 0.5*x # jinde f[x< 0] = 0 # 0 pro x< 0, return(f) } # vykreslíme si Distribuční funkci x = seq(from = -6, to = 6, by = 0.01) rizf_x = rizf(x) plot(x, rizf_x, type = 'l') grid() #----------------------------------------------------------------------------------- # b) Načrtněte graf hustoty pravděpodobnosti NV X -> Wb(theta =2, beta = 2) # Hustota pravděpodobnosti f(x) theta = 2 # ekvivalent 1/lambda u exp. rozdělení beta = 2 # beta = 1 -> exponenciální rozdělení # f(x) = dweibull(x,shape=beta, scale=theta) # vykreslíme graf x = seq(from = 0, to = 6, by = 0.01) f_x = dweibull(x,shape=beta, scale=theta) plot(x, f_x, type='l') grid() #----------------------------------------------------------------------------------- # c) Načrtněte graf distribuční funkce NV X -> Wb(theta =2, beta = 2) # Distribuční funkce F(x) = P(X < x) theta = 2 # ekvivalent 1/lambda u exp. rozdělení beta = 2 # beta = 1 -> exponenciální rozdělení # F(x) = pweibull(x,shape=beta, scale=theta) # vykreslíme graf x = seq(from = 0, to = 6, by = 0.01) F_x = pweibull(x,shape=beta, scale=theta) plot(x, F_x, type = 'l') grid() #----------------------------------------------------------------------------------- # d) Určete pravděpodobnost, že sonda přežije alespoň 3 dny # P(X > 3) = 1 - F(3) = 1 - pweibull(3,shape=beta, scale=theta) #0.1053992 #NEBO: exp(1)^(-9/4) #----------------------------------------------------------------------------------- # e) Odhadněte kolik dní vydrží na Venuši 90% sond. # hledáme x : P(X > x) = 0,9 => P(X < x) = 0,1 => F(x) = 0.1 => x= qweibull(0.1,shape=beta, scale=theta) # 0.6491857 #NEBO: 2*sqrt(-log(0.9)) #----------------------------------------------------------------------------------- # f) Odhadněte pravděpodobnost, že sonda, která právě přežila 3dny nepřežije déle než dalších 10 hodin. # Odhad obecně : P(x < X < x+Δx | X>x) =cca= f(x)*Δx/(1 - F(x)) = λ(x)*Δx # Odhad číselně : P(3 < X < 3+10/24 | X>3) =cca= f(3)*10/24/(1 - F(3)) = dweibull(3,2,2)/(1-pweibull(3,2,2))*10/24 # 0.625 # Skutečná hodnota P(x < X < x+Δx | X>x) = (F(x+Δx) - F(x))/(1 - F(x)) = (pweibull(3+10/24,2,2) - pweibull(3,2,2))/(1-pweibull(3,2,2)) # 0.4874735 #----------------------------------------------------------------------------------- # g) Odhadněte pravděpodobnost, že sonda, která právě přežila 3dny nepřežije déle než dalších 24 hodin. # Odhad obecně : P(x < X < x+Δx | X>x) =cca= f(x)*Δx/(1 - F(x)) = λ(x)*Δx # Odhad číselně : P(3 < X < 3+24/24 | X>3) =cca= f(3)*10/24/(1 - F(3)) = dweibull(3,2,2)/(1-pweibull(3,2,2))*24/24 # 1.5 # Skutečná hodnota P(x < X < x+Δx | X>x) = (F(x+Δx) - F(x))/(1 - F(x)) = (pweibull(3+24/24,2,2) - pweibull(3,2,2))/(1-pweibull(3,2,2)) # 0.8262261 #----------------------------------------------------------------------------------- #----------------------------------------------------------------------------------- # Příklad Doba přežití (měsíce) pacienta má Weibulovo rozdělení s lineárně rostoucí rizikovou funkcí (tj. beta = shape = 2) a parametrem měřítka (theta = scale) 50. #----------------------------------------------------------------------------------- # a) Jaká je hodnota rizikové funkce v 24 měsících? Jaká je pravděpodobnost, že pacient, který # přežil 24 měsíců, zemře v následujících 14 dnech? # Odhad obecně : P(x < X < x+Δx | X>x) =cca= f(x)*Δx/(1 - F(x)) = λ(x)*Δx # Odhad číselně : P(24 < X < 24 + 0,5 | X>24) =cca= f(24)*0,5/(1 - F(24)) = dweibull(24,2,50)*0.5/(1-pweibull(24,2,50)) # 0.0096 # Skutečná hodnota P(x < X < x+Δx | X>x) = (F(x+Δx) - F(x))/(1 - F(x)) (pweibull(24.5,2,50)-pweibull(24,2,50))/(1-pweibull(24,2,50)) # 0.009653107 #----------------------------------------------------------------------------------- #----------------------------------------------------------------------------------- #----------------------------------------------------------------------------------- # * Normální rozdělení: $X \sim N(\mu,\sigma^2)$ #### # - rozdělení modelující např. chyby měření, chování součtu/průměru mnoha jiných # náhodných veličin # - viz. Centrální limitní věta # - $\mu$ je přímo střední hodnota rozdělení: $E(X)=\mu$ # - $\sigma$ je přímo směrodatná odchyla rozdělení: $D(X)=\sigma^2$ # - s parametry $\mu=0,\sigma=1$ se nazývá normované Normální rozdělení # Hustota pravděpodobnosti f(x) mu = 2 sigma = 3 x = 4 dnorm(x, mean=mu, sd=sigma) # vykreslíme si Hustotu pravděpodobnosti x = seq(from = -5, to = 10, by = 0.01) f_x = dnorm(x, mean=mu, sd=sigma) plot(x, f_x, type='l') grid() # Distribuční funkce F(x) = P(X < x) mu = 2 sigma = 3 x = 4 pnorm(x, mean=mu, sd=sigma) # vykreslíme si Distribuční funkci x = seq(from = -5, to = 10, by = 0.01) F_x = pnorm(x, mean=mu, sd=sigma) plot(x, F_x, type = 'l') grid() # kvantilová funkce F^(-1)(p) = x: P(X N(μ,σ) = N(102,4.5) x = seq(from = 0, to = 204, by = 1) fx = dnorm(x,102,4.5) plot(x,fx,type="l") grid() #----------------------------------------------------------------------------------- # d) Načrtněte graf distribuční funkce NV X -> N(μ,σ) = N(102,4.5) x = seq(from = 0, to = 204, by = 1) Fx = pnorm(x,102,4.5) plot(x,Fx,type="l") grid() # Příklady na procvičení: #----------------------------------------------------------------------------------- #----------------------------------------------------------------------------------- # 5.Příklad # Výrobní zařízení má poruchu v průměru jednou za 2000 hodin. Veličina Y představující # dobu čekání na poruchu má exponenciální rozdělení. Určete dobu T0 tak, aby # pravděpodobnost, že přístroj bude pracovat delší dobu než T0, byla 0,99. # X ... doba čekání na poruchu (h) # X ~ Exp(lambda), kde E(X)=1/lambda lambda = 1/2000 #P(X>t)=0,99 -> 1-F(t)=0,99 -> F(t)=0,01 -> t… 1% kvant. qexp(0.01, lambda) #20.10067 #----------------------------------------------------------------------------------- #----------------------------------------------------------------------------------- # 6.Příklad # Při kontrole jakosti přebíráme součástku pouze tehdy, jestliže se její rozměr pohybuje # v rozmezí 26-27 mm. Rozměry součástek mají normální rozdělení se střední hodnotou 26,4 # mm a směrodatnou odchylkou 0,2 mm. Jaká je pravděpodobnost, že rozměr součástky # náhodně vybrané ke kontrole bude v požadovaných mezích? # X ... rozměr součástky (mm) # X ~ N(mu = 26.4,sigma = 0.2) mu = 26.4 sigma = 0.2 #P(26=1)=1-P(X=0) 1 - dbinom(0, n, p) #----------------------------------------------------------------------------------- #----------------------------------------------------------------------------------- # 8.Příklad # Ve velké počítačové síti se průměrně přihlašuje 25 uživatelů za hodinu. Určete # pravděpodobnost, # že: # ** a) #### # se nikdo nepřihlásí během 14:30 - 14:36, # X … počet uživatelů přihlášených za 6 minut # X ~ Po(lt = 2.5) lambda = 25/60 t = 6 lt = lambda*t # P(X=0) dpois(0, lt) # ** b) #### # do dalšího přihlášení uběhnou 2-3 minuty. # Y … doba do dalšího přihlášení # Y ~ Exp(lambda = 25/60), kde E(X)=1/lambda lambda = 25/60 # P(2t)=0,90 -> 1-F(t)=0,90 -> F(t)=0,10 -> t…10% kv. qexp(0.10, lambda) # = 0.2528652 minut = 0.2528652*60 = 15.17191 sekund qexp(0.1, 25/60) #----------------------------------------------------------------------------------- #----------------------------------------------------------------------------------- # 9.Příklad # Předpokládejme, že svítivost hvězdy (ve vhodných jednotkách) je náhodná veličina X # a má normální rozdělení N(µ; σ), kde µ = 10 a σ = 1 Určete svítivost, již překoná pouze # 10 procent hvězd. #X...svítivost hvězdy # X -> N(\mu = 10; \sigma = 1) # hledáme x_0: P(X > x_0) = 0,1 # P(X < x_0) = 0,9 # F(x_0) = 0,9 # x_0 = F^{-1}(0,9) = qnorm(0.9, 10, 1) qnorm(0.9, 10, 1) #11.28155 #----------------------------------------------------------------------------------- #----------------------------------------------------------------------------------- # 10.Příklad # Náhodná veličina X má normální rozdělení N(µ; σ). Určete: # ** a) #### # P(µ − 2σ < X < µ + 2σ), # P(µ − 2σ < X < µ + 2σ) = F(µ + 2σ) - F(µ - 2σ) # X~N(µ,σ) # je jedno jaké hodnoty zvolíme mu = -105.5447 sigma = 2.654 pnorm(mu + 2*sigma, mean=mu, sd=sigma) - pnorm(mu - 2*sigma, mean=mu, sd=sigma) # ** b) #### # nejmenší k ∈ Z, tak, aby P(µ − kσ < X < µ + kσ) > 0,99. # normální rozdělení je symetrické # P(µ − kσ < X < µ + kσ) = # = 1 - (P(X < µ − kσ ) + P(X > µ + kσ)) = # = 1 - 2*P(X > µ + kσ) = 0.99 -> P(X > µ + kσ) = 0.005 # -> P(X < µ + kσ) = 0.995 # x = µ + kσ x = qnorm(0.995, mean=mu, sd=sigma) (x - mu)/sigma for(k in 1:5){ p = pnorm(mu + k*sigma, mean=mu, sd=sigma) - pnorm(mu - k*sigma, mean=mu, sd=sigma) print(paste0(k,":",p)) } #----------------------------------------------------------------------------------- #----------------------------------------------------------------------------------- # 11.Příklad # Délka skoků sportovce Jakuba měřená v cm má normální rozdělení N(µ1; σ1), kde µ1 = 690 # a σ1 = 10. Délka skoků sportovce Aleše měřená v cm má také normální rozdělení N(µ2; # σ2), kde µ2 = 705 a σ2 = 15. Na závody se kvalifikuje ten, kdo ze dvou skoků alespoň # jednou skočí více než 700 cm. # SJ ... délka skoku Jakuba # SJ ~ N(mu = 690,sigma = 10) mu_J = 690 sigma_J = 10 # SA … délka skoku Aleše # SA ~ N(mu = 705,sigma = 15) mu_A = 705 sigma_A = 15 # J...Jakubův skok je úspěšný (delší než 700 cm) # A...Alešův skok je úspěšný (delší než 700 cm) # P(J)=P(SJ>700)=1-F(700) P.J = 1-pnorm(700,mean=mu_J,sd=sigma_J) P.J # P(A)=P(SA>700)=1-F(700) P.A = 1-pnorm(700,mean=mu_A, sd=sigma_A) P.A # KJ … Jakub se kvalifikuje na závody, # P(KJ) = 1-(1-P(J))(1-P(J)) P.KJ=1-(1-P.J)*(1-P.J) P.KJ # KA … Aleš se kvalifikuje na závody, # P(KA) = 1-(1-P(A))(1-P(A)) P.KA=1-(1-P.A)*(1-P.A) P.KA # ** a) #### # S jakou pravděpodobností se oba dva kvalifikují na závody? # ada) P.KJ*P.KA # ** b) #### # S jakou pravděpodobností se kvalifikuje Aleš, ale Jakub ne? # adb) (1-P.KJ)*P.KA