runif(10, 3, 5)
[1] 3.941792 3.523222 3.539218 3.447028 3.306410 4.923029 3.419321 4.912218
[9] 3.740015 4.107419
Note de laborator
În afară de repartițiile discrete văzute în notele de laborator aferente repartițiilor discrete, R
pune la dispoziție și o gamă largă de repartiții continue. Tabelul de mai jos prezintă numele și parametrii acestora:
R
.
Repartiția | Nume | Parametrii | Valori prestabilite | Densitatea |
---|---|---|---|---|
Uniformă \(\mathcal{U}(a, b)\) | unif |
min (\(a\)), max (\(b\)) |
min = 0 , max = 1 |
\(\frac{1}{b-a}\mathbf{1}_{(a,b)}(x)\) |
Normală \(\mathcal{N}(\mu, \sigma^2)\) | norm |
mean (\(\mu\)), sd (\(\sigma\)) |
mean = 0 , sd = 1 |
\(\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\) |
Log-Normală \(\mathcal{LN}(\mu, \sigma^2)\) | lnorm |
mean (\(\mu\)), sd (\(\sigma\)) |
mean = 0 , sd = 1 |
\(\frac{1}{x\sigma\sqrt{2\pi}}e^{-\frac{(\log(x)-\mu)^2}{2\sigma^2}}\) |
Exponențială \(\mathrm{Exp}(\lambda)\) | exp |
rate (\(\lambda\)) |
rate = 1 |
\(\lambda e^{-\lambda x}\mathbf{1}_{x\geq 0}\) |
Cauchy \(\mathrm{C}(\alpha, \beta)\) | cauchy |
location (\(\alpha\)), scale (\(\beta\)) |
location = 0 , scale = 1 |
\(\frac{1}{\pi} \frac{\beta}{(x-\alpha)^2+\beta^2}\) |
Gamma \(\Gamma(\alpha, \beta)\) | gamma |
shape (\(\alpha\)), scale (\(\beta\)=1/rate) |
rate = 1 |
\(\frac{\beta^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x}\) |
Beta \(\mathrm{B}(\alpha, \beta)\) | beta |
shape1 (\(\alpha\)), shape2 (\(\beta\)) |
\(\frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)} x^{\alpha-1} (1-x)^{\beta-1}\mathbf{1}_{[0,1]}(x)\) | |
Student \(t(\nu)\) | t |
df (\(\nu\)) |
\(\frac{\Gamma\left(\frac{\nu+1}{2}\right)}{\sqrt{\pi\nu}\Gamma\left(\frac{\nu}{2}\right)}\left(1+\frac{x^2}{\nu}\right)^{-\frac{\nu+1}{2}}\) | |
Chi-Squared \(\chi^2(\nu)\) | chisq |
df (\(\nu\)) |
\(\frac{1}{2^{\frac{\nu}{2}}\Gamma\left(\frac{\nu}{2}\right)}x^{\frac{\nu}{2}-1}e^{-\frac{x}{2}}\mathbf{1}_{(0,\infty)}(x)\) | |
Fisher \(\mathrm{F}(\nu_1,\nu_2)\) | f |
df1 , df2 |
\(\frac{\Gamma\left(\frac{\nu_1+\nu_2}{2}\right)}{\Gamma\left(\frac{\nu_1}{2}\right)\Gamma\left(\frac{\nu_2}{2}\right)}\left(\frac{\nu_1}{\nu_2}\right)^{\frac{\nu_1}{2}}\frac{x^{\frac{\nu_1-2}{2}}}{\left(1+\frac{\nu_1}{\nu_2}x\right)^{\frac{\nu_1+\nu_2}{2}}}\) | |
Weibull \(\mathrm{Weib}(\alpha,\beta)\) | weibull |
shape (\(\alpha\)), scale (\(\beta\)) |
scale = 1 |
\(\frac{\alpha}{\beta}\left(\frac{x}{\beta}\right)^{\alpha-1}e^{-\left(\frac{x}{\beta}\right)^{\alpha}}\mathbf{1}_{\{x\geq0\}}\) |
Pentru fiecare repartiție continuă, există patru comenzi în R
care sunt compuse din prefixul d
, p
, q
și r
și din numele repartiției (coloana a 2-a). De exemplu dnorm
, pnorm
, qnorm
și rnorm
sunt comenzile corespunzătoare repartiției normale pe când dunif
, punif
, qunif
și runif
sunt cele corespunzătoare repartiției uniforme.
dnume
: calculează densitatea atunci când vorbim de o variabilă continuă sau funcția de masă atunci când avem o repartiție discretă
pnume
: calculează funcția de repartiție, i.e. \(F(x)=\mathbb{P}(X\leq x)\)
qnume
: reprezintă funcția cuantilă, cu alte cuvinte valoarea pentru care funcția de repartiție are o anumită probabilitate; în cazul continuu, dacă pnume(x) = p
atunci qnume(p) = x
iar în cazul discret întoarce cel mai mic întreg \(u\) pentru care \(\mathbb{P}(X\leq u)\geq p\).
rnume
: generează observații independente din repartiția dată
Definiție 1.1 (Variabilă aleatoare repartizată uniform) Spunem că o variabilă aleatoare \(X\) este repartizată uniform pe intervalul \([a,b]\), și notăm cu \(X\sim \mathcal{U}([a,b])\), dacă admite densitatea de repartiție
\[ f_X(x) = \left\{\begin{array}{ll} \frac{1}{b-a}, & x\in[a,b]\\ 0, & \text{altfel} \end{array}\right. \]
Funcția de repartiție a repartiției uniforme este
\[ F_X(x) =\int_{-\infty}^{x}f_X(t)\,dt = \left\{\begin{array}{ll} 0, & x\leq a\\ \frac{x-a}{b-a}, & x\in(a,b)\\ 1, & x\geq b \end{array}\right. \]
Media și varianța variabilei aleatoare \(X\) repartizate uniform pe \([a,b]\) sunt egale cu
\[ \mathbb{E}[X] = \frac{a+b}{2},\qquad Var(X) = \frac{(a-b)^2}{12}. \]
Variabilele aleatoare repartizate uniform joacă un rol important în teoria simulării variabilelor aleatoare datorită următorului rezultat datorat lui Paul Levy și numit teorema de universalitate a repartiției uniforme:
Teorema 1.1 (Universalitatea Repartiției Uniforme) Fie \(X\) o variabilă aleatoare reală cu funcția de repartiție \(F\), \(U\) o variabilă aleatoare repartizată uniform pe \([0,1]\) și fie funcția cuantilă (inversa generalizată) asociată lui \(F\), \(F^{-1}:(0,1)\to\mathbb{R}\) definită prin
\[ F^{-1}(u) = \inf\{x\in\mathbb{R}\,|\,F(x)\geq u\}, \quad \forall u\in(0,1). \]
Atunci \(X\) și \(F^{-1}(U)\) sunt repartizate la fel.
În R
putem să
[1] 3.941792 3.523222 3.539218 3.447028 3.306410 4.923029 3.419321 4.912218
[9] 3.740015 4.107419
Exercițiul 1.1 Fie \(X\) o variabilă aleatoare repartizată uniform pe \([2,7]\). Determinați:
Exercițiul 1.2 Dacă \(X\) o variabilă aleatoare repartizată uniform pe \([a,b]\) și \([c,d]\subset [a,b]\) este un subinterval, atunci repartiția condiționată a lui \(X\) la \(X\in [c,d]\) este \(\mathcal{U}[c,d]\).
Definiție 2.1 (Variabilă aleatoare repartizată normal) Spunem că o variabilă aleatoare \(X\) este repartizată normal sau Gaussian de medie \(\mu\) și varianță \(\sigma^2\), și se notează cu \(X\sim\mathcal{N}(\mu, \sigma^2)\), dacă densitatea ei de repartiție are forma
\[ f_X(x) \left(\overset{not}{=} \varphi(x)\right) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}, \quad x\in\mathbb{R}. \]
Funcția de repartiție a unei variabile \(X\sim\mathcal{N}(\mu, \sigma^2)\) este dată de
\[ F_X(x) \left(\overset{not}{=} \Phi(x)\right) = \int_{-\infty}^{x}\varphi(t)\,dt = \frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}}\,dt. \]
Pentru funcția de repartiție nu avem o formulă explicită de calcul, ea poate fi aproximată cu ajutorul descompunerii în serie. În cazul variabilelor normale standard (\(X\sim\mathcal{N}(0,1)\)) avem proprietățile
Media și varianța variabilei aleatoare \(X\) repartizate normal de parametrii \(\mathcal{N}(\mu, \sigma^2)\) sunt egale cu
\[ \mathbb{E}[X] = \mu,\quad Var(X) = \sigma^2. \]
Mai mult, momentele de ordin se pot calcula cu ușurință și avem că
\[ \mathbb{E}[X^k] = \left\{\begin{array}{ll} \sigma^k (k-1)!!, & \text{$k$ este par} \\ 0, & \text{$k$ este impar}. \end{array}\right. \]
Pentru o variabilă aleatoare repartizată normal, avem următoarea regulă numită și regula \(68-95-99.7\%\):
Propoziție 2.1 (Regula 68-95-99.7) Fie \(X\) o variabilă aleatoare repartizată \(\mathcal{N}(\mu, \sigma^2)\). Atunci
\[\begin{align*} \mathbb{P}(|X-\mu|<\sigma) &\approx 0.68\\ \mathbb{P}(|X-\mu|<2\sigma) &\approx 0.95\\ \mathbb{P}(|X-\mu|<3\sigma) &\approx 0.997 \end{align*}\]În R
putem să
R
funcțiile rnorm
, dnorm
, pnorm
și qnorm
primesc ca parametrii media și abaterea standard, \(\sigma\) nu varianța \(\sigma^2\)) [1] -1.9816606 2.4294560 1.1687872 2.6425718 -0.7418783 1.4698140
[7] 0.7893129 -0.9859651 -0.8728752 0.4595643
[1] 0.04839414 0.05115647 0.05390019 0.05660592 0.05925368 0.06182308
[7] 0.06429362 0.06664492 0.06885700 0.07091058 0.07278734 0.07447021
[13] 0.07594361 0.07719368 0.07820854
[1] 3.167124e-05 5.736006e-05 1.018892e-04 1.775197e-04 3.033834e-04
[6] 5.086207e-04 8.365374e-04 1.349898e-03 2.137367e-03 3.320943e-03
[11] 5.063995e-03 7.579219e-03 1.113549e-02 1.606229e-02 2.275013e-02
[1] -2.3263479 -1.9599640 -1.6448536 -0.6744898 0.0000000 0.6744898 1.6448536
[8] 1.9599640 2.3263479
Exercițiul 2.1 Fie \(X\) o variabilă aleatoare repartizată \(\mathcal{N}(\mu, \sigma^2)\). Atunci pentru \(\mu = 1\) și \(\sigma = 3\) calculați:
Exercițiul 2.2 Fie \(X\) o variabilă aleatoare repartizată \(\mathcal{N}(\mu, \sigma^2)\). Pentru \(\mu = 0\) și \(\sigma^2 \in \{0.2, 0.5, 1.5, 5\}\) trasați pe același grafic densitățile repartițiilor normale cu parametrii \(\mathcal{N}(\mu, \sigma^2)\). Adăugați legendele corespunzătoare. Aceeași cerință pentru funcțiile de repartiție.
Exercițiul 2.3 Generați \(250\) de observații din repartiția \(\mathcal{N}(0, 2)\), trasați histograma acestora și suprapuneți densitatea repartiției date (vezi Figura 2.3).
Exercițiul 2.4 Fie \(X\) o variabilă aleatoare repartizată normal de parametrii \(\mu\) și \(\sigma^2\). Ilustrați grafic pentru \(\mu = 0\) și \(\sigma = 1\) că are loc următoarea inegalitate:
\[ \left(\frac{1}{x}-\frac{1}{x^3}\right)\phi(x)<1-\Phi(x)<\frac{1}{x}\phi(x), \quad x>0. \]
Definiție 3.1 (Variabilă aleatoare repartizată exponențial) Spunem că o variabilă aleatoare \(X\) este repartizată exponențial de parametru \(\lambda\), și se notează cu \(X\sim\mathrm{Exp}(\lambda)\), dacă densitatea ei de repartiție are forma
\[ f_X(x) = \lambda e^{-\lambda x}\mathbb{1}_{\mathbb{R}_+}(x),\quad \forall x\in\mathbb{R}. \]
Funcția de repartiție a unei variabile aleatoare \(X\sim \mathrm{Exp}(\lambda)\) este dată de
\[ F_{X}(x) = (1 - e^{-\lambda x})\mathbb{1}_{\mathbb{R}_+}(x), \quad x\in \mathbb{R}. \]
Media și varianța variabilei aleatoare \(X\) repartizate exponențial de parametru \(\lambda\) sunt egale cu
\[ \mathbb{E}[X] = \frac{1}{\lambda},\quad Var(X) = \frac{1}{\lambda^2}. \]
Exercițiul 3.1 Arătați că momentul de ordin \(k\), \(k\geq 1\), al unei variabile aleatoare repartizate exponențial \(X\sim\mathrm{Exp}(\lambda)\) este egal cu
\[ \mathbb{E}[X^k] = \frac{k!}{\lambda^k}. \]
Următorul rezultat caracterizează repartiția exponențială:
Propoziție 3.1 Fie \(X\) o variabilă repartizată exponențial de parametru \(\lambda\). Atunci are loc următoarea proprietate numită și lipsa de memorie:
\[ \mathbb{P}(X>s+t|X>s) = \mathbb{P}(X>t),\quad \forall s,t \geq 0. \]
Mai mult, dacă o variabilă aleatoare continuă2 \(X\) verifică proprietatea de mai sus atunci ea este repartizată exponențial.
Variabilele aleatoare repartizate exponențial sunt utilizate în modelarea fenomenelor care se desfășoară în timp continuu și care satisfac (aproximativ) proprietatea lipsei de memorie: de exemplu timpul de așteptare la un ghișeu, durata de viață a unui bec sau timpul până la următoarea convorbire telefonică.
În R
putem să
[1] 0.067567660 0.120417318 0.006950867 0.138357319 0.098559327 0.131825762
[7] 0.281899074 0.117643375 0.223034167 0.082130254 0.499318683 0.498366452
[13] 0.062904910 0.204294186 0.134167613
[1] 5.000000e+00 1.341312e+00 3.598237e-01 9.652719e-02 2.589462e-02
[6] 6.946555e-03 1.863500e-03 4.999070e-04 1.341063e-04 3.597568e-05
[11] 9.650925e-06 2.588981e-06 6.945263e-07 1.863153e-07 4.998141e-08
[16] 1.340814e-08 3.596899e-09 9.649130e-10 2.588499e-10 6.943972e-11
[1] 0.0000000 0.8323228 0.9718843 0.9952856 0.9992095 0.9998675 0.9999778
[8] 0.9999963 0.9999994 0.9999999 1.0000000 1.0000000 1.0000000 1.0000000
[15] 1.0000000
[1] 0.002010067 0.005063562 0.010258659 0.057536414 0.138629436 0.277258872
[7] 0.599146455 0.737775891 0.921034037
Exercițiul 3.2 Fie \(X\) o variabilă aleatoare repartizată \(\mathcal{E}(\lambda)\). Pentru \(\lambda \in \{0.5, 1.5, 5\}\) trasați pe același grafic densitățile repartițiilor exponențiale de parametru \(\lambda\). Adăugați legendele corespunzătoare. Aceeași cerință pentru funcțiile de repartiție.
Exercițiul 3.3 Folosind rezultatul de universalitate de la repartiția uniformă, descrieți o procedură prin care puteți simula o variabilă aleatoare repartizată exponențial \(\mathrm{Exp}(\lambda)\).
Definiție 4.1 (Variabilă aleatoare repartizată Cauchy) Spunem că o variabilă aleatoare \(X\) este repartizată Cauchy de parametrii \((0, 1)\), și se notează cu \(X\sim C(0,1)\), dacă densitatea ei de repartiție are forma
\[ f_X(x) = \frac{1}{\pi} \frac{1}{1+x^2},\quad \forall x\in\mathbb{R}. \]
Observăm că graficul densității repartiției Cauchy este asemănător cu cel al repartiției normale. Parametrul \(M = 0\) reprezintă mediana (de fapt \(\mathbb{P}(X\leq 0) = \mathbb{P}(X\geq 0) = \frac{1}{2}\)) variabilei aleatoare \(X\) și nu media iar prima și a treia cuartilă sunt \(Q_1 = -1\) și respectiv \(Q_3=1\) (avem \(\mathbb{P}(X\leq -1) = \mathbb{P}(X\geq 1) = \frac{1}{4}\)).
Funcția de repartiție a unei variabile aleatoare \(X\sim C(0,1)\) este dată de
\[ F_{X}(x) = \frac{1}{2} + \frac{1}{\pi}\arctan(x), \quad x\in \mathbb{R}. \]
Media și varianța variabilei aleatoare \(X\sim C(0,1)\) nu există.
Exercițiul 4.1 Arătați că o variabilă aleatoare repartizată Cauchy \(C(0,1)\) nu are medie.
Soluție. Dacă vrem să calculăm media sub forma integralei improprii
\[ \mathbb{E}[X] = \int_{-\infty}^{\infty} \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x \]
atunci conform definiției acesteia avem că
\[ \mathbb{E}[X] = \int_{-\infty}^{\infty} \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x=\lim _{T_1 \rightarrow-\infty} \lim _{T_2 \rightarrow+\infty} \int_{T_1}^{T_2} \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x. \]
Pentru \(T_1 = -T\) și \(T_2 = \alpha T\) unde \(\alpha>0\) avem
\[ \begin{aligned} \mathbb{E}[X] &= \lim _{T_1 \rightarrow-\infty} \lim _{T_2 \rightarrow+\infty} \int_{T_1}^{T_2} \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x = \lim _{T \rightarrow+\infty}\int_{-T}^{\alpha T} \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x \\ &=\lim _{T \rightarrow+\infty}\left(\int_{-T}^T \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x+\int_T^{\alpha T} \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x\right) \\ & =0+\lim _{T \rightarrow+\infty}\left.\frac{\ln \left(1+x^2\right)}{2 \pi}\right|_T ^{\alpha T} = \lim _{T \rightarrow+\infty}\frac{1}{2 \pi} \ln \left(\frac{1+\alpha^2 T^2}{1+T^2}\right) \\ & =\frac{1}{2 \pi} \ln(\alpha), \end{aligned} \] prin urmare limita nu este definită, ea depinde de \(\alpha\).
Alternativ, ținând cont că o variabilă aleatoare admite medie dacă \(\mathbb{E}[|X|]<\infty\) și cum
\[ \mathbb{E}[|X|] = \int_{0}^{\infty} \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x = \left.\frac{\ln \left(1+x^2\right)}{2 \pi}\right|_0 ^{\infty} = \infty \]
obținem concluzia.
Fie \(Y\sim C(0,1)\) și \(\alpha, \beta\in\mathbb{R}\) cu \(\beta>0\). Spunem că variabila aleatoare \(X = \alpha + \beta Y\) este repartizată Cauchy de parametrii \((\alpha, \beta)\), \(X\sim C(\alpha, \beta)\). Densitatea ei este
\[ f_X(x) = \frac{1}{\pi\beta} \frac{1}{1+\left(\frac{x-\alpha}{\beta}\right)^2},\quad \forall x\in\mathbb{R}. \]
Parametrii \(\alpha\) și \(\beta\) se interpretează în modul următor: \(M = \alpha\) este mediana lui \(X\) iar \(Q_1 = \alpha-\beta\) și \(Q_3 = \alpha + \beta\) reprezintă prima și a treia cuartilă.
În R
putem să
[1] -0.5966228 3.7627987 0.6864597 -0.4316018 1.4524446 0.3427032
[7] 8.4285326 3.6056089 2.3506764 -3.5453329 -1.6137218 10.4304800
[13] -0.4449169 2.3005176 -3.6644199
[1] 0.02122066 0.02450975 0.02852541 0.03345265 0.03951056 0.04693392
[7] 0.05591721 0.06648594 0.07825871 0.09012539 0.10006665 0.10558334
[13] 0.10494052 0.09835367 0.08782920 0.07584810 0.06425529 0.05399054
[19] 0.04532934 0.03819719
[1] 0.1475836 0.1643213 0.1848605 0.2104166 0.2425988 0.2833834 0.3347507
[8] 0.3975836 0.4697759 0.5451672 0.6158581 0.6764416 0.7255627 0.7644587
[15] 0.7951672
[1] -94.46155 -37.11861 -17.94125 -2.00000 1.00000 4.00000 19.94125
[8] 39.11861 96.46155
Exercițiul 4.2 Generați \(2500\) de observații din repartiția Cauchy, trasați histograma acestora și suprapuneți densitatea repartiției date pentru intervalul \([-5,5]\) (vezi Figura 4.2).
Exercițiul 4.3 Fie \(X\) o variabilă aleatoare repartizată Cauchy \(C(\alpha, \beta)\). Pentru fiecare pereche de parametrii \((\alpha, \beta)\) din mulțimea \(\{(0,0.5), (0, 1), (0, 2), (-1, 1.5), (-2, 1)\}\) trasați pe același grafic densitățile repartițiilor Cauchy cu parametrii \((\alpha, \beta)\). Adăugați legendele corespunzătoare. Aceeași cerință pentru funcțiile de repartiție.
Exercițiul 4.4 Folosind rezultatul de universalitate de la repartiția uniformă, descrieți o procedură prin care puteți simula o variabilă aleatoare repartizată Cauchy \(C(0,1)\) și construiți o funcție care permite generarea de \(n\) observații independente dintr-o variabilă repartizată \(X\sim C(\alpha, \beta)\). Verificați pentru parametrii \(\alpha = 3\) și \(\beta = 5\) (a se vedea Figura 4.4).
Exercițiul 4.5 Fie \(X\) și \(Y\) două variabile aleatoare independente repartizate \(\mathcal{N}(0,1)\). Arătați că variabila aleatoare \(\frac{X}{Y}\) este repartizată Cauchy \(C(0,1)\).