Variabile aleatoare continue

Note de laborator

În afară de repartițiile discrete văzute în notele de laborator aferente repartițiilor discrete, R pune la dispoziție și o gamă largă de repartiții continue. Tabelul de mai jos prezintă numele și parametrii acestora:

Tabelul 1: Numele și parametrii repartițiilor continue uzuale în R.
Repartiția Nume Parametrii Valori prestabilite Densitatea
Uniformă \(\mathcal{U}(a, b)\) unif min (\(a\)), max (\(b\)) min = 0, max = 1 \(\frac{1}{b-a}\mathbf{1}_{(a,b)}(x)\)
Normală \(\mathcal{N}(\mu, \sigma^2)\) norm mean (\(\mu\)), sd (\(\sigma\)) mean = 0, sd = 1 \(\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\)
Log-Normală \(\mathcal{LN}(\mu, \sigma^2)\) lnorm mean (\(\mu\)), sd (\(\sigma\)) mean = 0, sd = 1 \(\frac{1}{x\sigma\sqrt{2\pi}}e^{-\frac{(\log(x)-\mu)^2}{2\sigma^2}}\)
Exponențială \(\mathrm{Exp}(\lambda)\) exp rate (\(\lambda\)) rate = 1 \(\lambda e^{-\lambda x}\mathbf{1}_{x\geq 0}\)
Cauchy \(\mathrm{C}(\alpha, \beta)\) cauchy location (\(\alpha\)), scale (\(\beta\)) location = 0, scale = 1 \(\frac{1}{\pi} \frac{\beta}{(x-\alpha)^2+\beta^2}\)
Gamma \(\Gamma(\alpha, \beta)\) gamma shape (\(\alpha\)), scale (\(\beta\)=1/rate) rate = 1 \(\frac{\beta^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x}\)
Beta \(\mathrm{B}(\alpha, \beta)\) beta shape1 (\(\alpha\)), shape2 (\(\beta\)) \(\frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)} x^{\alpha-1} (1-x)^{\beta-1}\mathbf{1}_{[0,1]}(x)\)
Student \(t(\nu)\) t df (\(\nu\)) \(\frac{\Gamma\left(\frac{\nu+1}{2}\right)}{\sqrt{\pi\nu}\Gamma\left(\frac{\nu}{2}\right)}\left(1+\frac{x^2}{\nu}\right)^{-\frac{\nu+1}{2}}\)
Chi-Squared \(\chi^2(\nu)\) chisq df (\(\nu\)) \(\frac{1}{2^{\frac{\nu}{2}}\Gamma\left(\frac{\nu}{2}\right)}x^{\frac{\nu}{2}-1}e^{-\frac{x}{2}}\mathbf{1}_{(0,\infty)}(x)\)
Fisher \(\mathrm{F}(\nu_1,\nu_2)\) f df1, df2 \(\frac{\Gamma\left(\frac{\nu_1+\nu_2}{2}\right)}{\Gamma\left(\frac{\nu_1}{2}\right)\Gamma\left(\frac{\nu_2}{2}\right)}\left(\frac{\nu_1}{\nu_2}\right)^{\frac{\nu_1}{2}}\frac{x^{\frac{\nu_1-2}{2}}}{\left(1+\frac{\nu_1}{\nu_2}x\right)^{\frac{\nu_1+\nu_2}{2}}}\)
Weibull \(\mathrm{Weib}(\alpha,\beta)\) weibull shape (\(\alpha\)), scale (\(\beta\)) scale = 1 \(\frac{\alpha}{\beta}\left(\frac{x}{\beta}\right)^{\alpha-1}e^{-\left(\frac{x}{\beta}\right)^{\alpha}}\mathbf{1}_{\{x\geq0\}}\)

Pentru fiecare repartiție continuă, există patru comenzi în R care sunt compuse din prefixul d, p, q și r și din numele repartiției (coloana a 2-a). De exemplu dnorm, pnorm, qnorm și rnorm sunt comenzile corespunzătoare repartiției normale pe când dunif, punif, qunif și runif sunt cele corespunzătoare repartiției uniforme.

1 Repartiția Uniformă \(\mathcal{U}([a,b])\)

Definiție 1.1 (Variabilă aleatoare repartizată uniform) Spunem că o variabilă aleatoare \(X\) este repartizată uniform pe intervalul \([a,b]\), și notăm cu \(X\sim \mathcal{U}([a,b])\), dacă admite densitatea de repartiție

\[ f_X(x) = \left\{\begin{array}{ll} \frac{1}{b-a}, & x\in[a,b]\\ 0, & \text{altfel} \end{array}\right. \]

Funcția de repartiție a repartiției uniforme este

\[ F_X(x) =\int_{-\infty}^{x}f_X(t)\,dt = \left\{\begin{array}{ll} 0, & x\leq a\\ \frac{x-a}{b-a}, & x\in(a,b)\\ 1, & x\geq b \end{array}\right. \]

(a) Densitatea
(b) Funcția de repartiție
Figura 1.1: Densitatea și funcția de repartiție a repartiției uniforme \(\mathcal{U}([a,b])\).

Media și varianța variabilei aleatoare \(X\) repartizate uniform pe \([a,b]\) sunt egale cu

\[ \mathbb{E}[X] = \frac{a+b}{2},\qquad Var(X) = \frac{(a-b)^2}{12}. \]

Variabilele aleatoare repartizate uniform joacă un rol important în teoria simulării variabilelor aleatoare datorită următorului rezultat datorat lui Paul Levy și numit teorema de universalitate a repartiției uniforme:

Teorema 1.1 (Universalitatea Repartiției Uniforme) Fie \(X\) o variabilă aleatoare reală cu funcția de repartiție \(F\), \(U\) o variabilă aleatoare repartizată uniform pe \([0,1]\) și fie funcția cuantilă (inversa generalizată) asociată lui \(F\), \(F^{-1}:(0,1)\to\mathbb{R}\) definită prin

\[ F^{-1}(u) = \inf\{x\in\mathbb{R}\,|\,F(x)\geq u\}, \quad \forall u\in(0,1). \]

Atunci \(X\) și \(F^{-1}(U)\) sunt repartizate la fel.

În R putem să

  • generăm observații independente din repartiția \(\mathcal{U}([a, b])\) (e.g. \(a = 3\) și \(b = 5\))
runif(10, 3, 5)
 [1] 3.941792 3.523222 3.539218 3.447028 3.306410 4.923029 3.419321 4.912218
 [9] 3.740015 4.107419
  • calculăm densitatea unei variabile aleatoare repartizate uniform pe \([a, b]\) în diferite puncte
dunif(c(3.1, 3.7, 3.95, 4.86), 3, 5)
[1] 0.5 0.5 0.5 0.5
  • calculăm funcția de repartiție a unei variabile repartizate uniform pe \([a,b]\) pentru diferite valori
punif(c(3.1, 3.7, 3.95, 4.86), 3, 5)
[1] 0.050 0.350 0.475 0.930

Exercițiul 1.1 Fie \(X\) o variabilă aleatoare repartizată uniform pe \([2,7]\). Determinați:

  1. \(\mathbb{P}(X\in\{1,2,3,4,5,6,7\})\)
  2. \(\mathbb{P}(X<3)\) și \(\mathbb{P}(X\leq 3)\)
  3. \(\mathbb{P}(X\leq 3 \cup X>4)\)
  4. Generați \(250\) de observații din repartiția dată, trasați histograma acestora și suprapuneți densitatea repartiției date (vezi figura de mai jos).
Figura 1.2: Densitatea repartiției uniforme suprapuse peste histograma celor \(250\) de observații generate.

Exercițiul 1.2 Dacă \(X\) o variabilă aleatoare repartizată uniform pe \([a,b]\) și \([c,d]\subset [a,b]\) este un subinterval, atunci repartiția condiționată a lui \(X\) la \(X\in [c,d]\) este \(\mathcal{U}[c,d]\).

2 Repartiția Normală \(\mathcal{N}(\mu, \sigma^2)\)

Definiție 2.1 (Variabilă aleatoare repartizată normal) Spunem că o variabilă aleatoare \(X\) este repartizată normal sau Gaussian de medie \(\mu\) și varianță \(\sigma^2\), și se notează cu \(X\sim\mathcal{N}(\mu, \sigma^2)\), dacă densitatea ei de repartiție are forma

\[ f_X(x) \left(\overset{not}{=} \varphi(x)\right) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}, \quad x\in\mathbb{R}. \]

Funcția de repartiție a unei variabile \(X\sim\mathcal{N}(\mu, \sigma^2)\) este dată de

\[ F_X(x) \left(\overset{not}{=} \Phi(x)\right) = \int_{-\infty}^{x}\varphi(t)\,dt = \frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}}\,dt. \]

(a) Densitatea
(b) Funcția de repartiție
Figura 2.1: Densitatea și funcția de repartiție a repartiției normale \(\mathcal{N}(\mu, \sigma^2)\).

Pentru funcția de repartiție nu avem o formulă explicită de calcul, ea poate fi aproximată cu ajutorul descompunerii în serie. În cazul variabilelor normale standard (\(X\sim\mathcal{N}(0,1)\)) avem proprietățile

  1. \(\Phi(x) = 1-\Phi(-x)\) pentru toate valorile \(x\in\mathbb{R}\)
  2. \(1-\Phi(a)\leq\frac{1}{2}e^{-\frac{a^2}{2}}\) pentru \(a>0\)1

Media și varianța variabilei aleatoare \(X\) repartizate normal de parametrii \(\mathcal{N}(\mu, \sigma^2)\) sunt egale cu

\[ \mathbb{E}[X] = \mu,\quad Var(X) = \sigma^2. \]

Mai mult, momentele de ordin se pot calcula cu ușurință și avem că

\[ \mathbb{E}[X^k] = \left\{\begin{array}{ll} \sigma^k (k-1)!!, & \text{$k$ este par} \\ 0, & \text{$k$ este impar}. \end{array}\right. \]

Pentru o variabilă aleatoare repartizată normal, avem următoarea regulă numită și regula \(68-95-99.7\%\):

Propoziție 2.1 (Regula 68-95-99.7) Fie \(X\) o variabilă aleatoare repartizată \(\mathcal{N}(\mu, \sigma^2)\). Atunci

\[\begin{align*} \mathbb{P}(|X-\mu|<\sigma) &\approx 0.68\\ \mathbb{P}(|X-\mu|<2\sigma) &\approx 0.95\\ \mathbb{P}(|X-\mu|<3\sigma) &\approx 0.997 \end{align*}\]

În R putem să

  • generăm observații independente din repartiția \(\mathcal{N}(\mu, \sigma^2)\) (e.g. \(\mu = 0\) și \(\sigma^2 = 2\) - în R funcțiile rnorm, dnorm, pnorm și qnorm primesc ca parametrii media și abaterea standard, \(\sigma\) nu varianța \(\sigma^2\))
rnorm(10, mean = 0, sd = sqrt(2))
 [1] -1.9816606  2.4294560  1.1687872  2.6425718 -0.7418783  1.4698140
 [7]  0.7893129 -0.9859651 -0.8728752  0.4595643
  • calculăm densitatea unei variabile aleatoare repartizate normal \(\mathcal{N}(\mu, \sigma^2)\) în diferite puncte
dnorm(seq(-2, 2, length.out = 15), mean = 3, sd = 5)
 [1] 0.04839414 0.05115647 0.05390019 0.05660592 0.05925368 0.06182308
 [7] 0.06429362 0.06664492 0.06885700 0.07091058 0.07278734 0.07447021
[13] 0.07594361 0.07719368 0.07820854
  • calculăm funcția de repartiție a unei variabile repartizate normal \(\mathcal{N}(\mu, \sigma^2)\) pentru diferite valori
pnorm(seq(-1, 1, length.out = 15), mean = 3, sd = 1)
 [1] 3.167124e-05 5.736006e-05 1.018892e-04 1.775197e-04 3.033834e-04
 [6] 5.086207e-04 8.365374e-04 1.349898e-03 2.137367e-03 3.320943e-03
[11] 5.063995e-03 7.579219e-03 1.113549e-02 1.606229e-02 2.275013e-02
  • calculăm cuantilele de ordin \(\alpha\in(0,1)\) (i.e. valoarea \(z_{\alpha}\) pentru care \(\Phi(z_{\alpha}) = \alpha\) sau altfel spus \(z_{\alpha} = \Phi^{-1}(\alpha)\))
qnorm(c(0.01, 0.025, 0.05, 0.25, 0.5, 0.75, 0.95, 0.975, 0.99), mean = 0, sd = 1)
[1] -2.3263479 -1.9599640 -1.6448536 -0.6744898  0.0000000  0.6744898  1.6448536
[8]  1.9599640  2.3263479

Exercițiul 2.1 Fie \(X\) o variabilă aleatoare repartizată \(\mathcal{N}(\mu, \sigma^2)\). Atunci pentru \(\mu = 1\) și \(\sigma = 3\) calculați:

  1. \(\mathbb{P}(\text{$X$ este par})\)
  2. \(\mathbb{P}(X<3.4)\) și \(\mathbb{P}(X>1.3)\)
  3. \(\mathbb{P}(1<X<4)\)
  4. \(\mathbb{P}(X\in [2,3]\cup[3.5,5])\)
  5. \(\mathbb{P}(|X-3|>6)\)

Exercițiul 2.2 Fie \(X\) o variabilă aleatoare repartizată \(\mathcal{N}(\mu, \sigma^2)\). Pentru \(\mu = 0\) și \(\sigma^2 \in \{0.2, 0.5, 1.5, 5\}\) trasați pe același grafic densitățile repartițiilor normale cu parametrii \(\mathcal{N}(\mu, \sigma^2)\). Adăugați legendele corespunzătoare. Aceeași cerință pentru funcțiile de repartiție.

Figura 2.2: Densitatea și funcția de repartiție pentru o serie de repartiții normale.

Exercițiul 2.3 Generați \(250\) de observații din repartiția \(\mathcal{N}(0, 2)\), trasați histograma acestora și suprapuneți densitatea repartiției date (vezi Figura 2.3).

Figura 2.3: Densitatea normalei suprapusă peste histograma eșantionului generat.

Exercițiul 2.4 Fie \(X\) o variabilă aleatoare repartizată normal de parametrii \(\mu\) și \(\sigma^2\). Ilustrați grafic pentru \(\mu = 0\) și \(\sigma = 1\) că are loc următoarea inegalitate:

\[ \left(\frac{1}{x}-\frac{1}{x^3}\right)\phi(x)<1-\Phi(x)<\frac{1}{x}\phi(x), \quad x>0. \]

Figura 2.4: Ilustrarea inegalității din enunț.

3 Repartiția Exponențială \(\mathrm{Exp}(\lambda)\)

Definiție 3.1 (Variabilă aleatoare repartizată exponențial) Spunem că o variabilă aleatoare \(X\) este repartizată exponențial de parametru \(\lambda\), și se notează cu \(X\sim\mathrm{Exp}(\lambda)\), dacă densitatea ei de repartiție are forma

\[ f_X(x) = \lambda e^{-\lambda x}\mathbb{1}_{\mathbb{R}_+}(x),\quad \forall x\in\mathbb{R}. \]

Funcția de repartiție a unei variabile aleatoare \(X\sim \mathrm{Exp}(\lambda)\) este dată de

\[ F_{X}(x) = (1 - e^{-\lambda x})\mathbb{1}_{\mathbb{R}_+}(x), \quad x\in \mathbb{R}. \]

(a) Densitatea
(b) Funcția de repartiție
Figura 3.1: Densitatea și funcția de repartiție a repartiției exponențiale \(\mathrm{Exp}(\lambda)\).

Media și varianța variabilei aleatoare \(X\) repartizate exponențial de parametru \(\lambda\) sunt egale cu

\[ \mathbb{E}[X] = \frac{1}{\lambda},\quad Var(X) = \frac{1}{\lambda^2}. \]

Exercițiul 3.1 Arătați că momentul de ordin \(k\), \(k\geq 1\), al unei variabile aleatoare repartizate exponențial \(X\sim\mathrm{Exp}(\lambda)\) este egal cu

\[ \mathbb{E}[X^k] = \frac{k!}{\lambda^k}. \]

Următorul rezultat caracterizează repartiția exponențială:

Propoziție 3.1 Fie \(X\) o variabilă repartizată exponențial de parametru \(\lambda\). Atunci are loc următoarea proprietate numită și lipsa de memorie:

\[ \mathbb{P}(X>s+t|X>s) = \mathbb{P}(X>t),\quad \forall s,t \geq 0. \]

Mai mult, dacă o variabilă aleatoare continuă2 \(X\) verifică proprietatea de mai sus atunci ea este repartizată exponențial.

Variabilele aleatoare repartizate exponențial sunt utilizate în modelarea fenomenelor care se desfășoară în timp continuu și care satisfac (aproximativ) proprietatea lipsei de memorie: de exemplu timpul de așteptare la un ghișeu, durata de viață a unui bec sau timpul până la următoarea convorbire telefonică.

În R putem să

  • generăm observații independente din repartiția \(\mathrm{Exp}(\lambda)\) (e.g. \(\lambda = 5\))
rexp(15, rate = 5)
 [1] 0.067567660 0.120417318 0.006950867 0.138357319 0.098559327 0.131825762
 [7] 0.281899074 0.117643375 0.223034167 0.082130254 0.499318683 0.498366452
[13] 0.062904910 0.204294186 0.134167613
  • calculăm densitatea unei variabile aleatoare repartizate exponențial \(\mathrm{Exp}(\lambda)\) în diferite puncte
dexp(seq(0, 5, length.out = 20), rate = 5)
 [1] 5.000000e+00 1.341312e+00 3.598237e-01 9.652719e-02 2.589462e-02
 [6] 6.946555e-03 1.863500e-03 4.999070e-04 1.341063e-04 3.597568e-05
[11] 9.650925e-06 2.588981e-06 6.945263e-07 1.863153e-07 4.998141e-08
[16] 1.340814e-08 3.596899e-09 9.649130e-10 2.588499e-10 6.943972e-11
  • calculăm funcția de repartiție a unei variabile repartizate exponențial \(\mathrm{Exp}(\lambda)\) pentru diferite valori
pexp(seq(0, 5, length.out = 15), rate = 5)
 [1] 0.0000000 0.8323228 0.9718843 0.9952856 0.9992095 0.9998675 0.9999778
 [8] 0.9999963 0.9999994 0.9999999 1.0000000 1.0000000 1.0000000 1.0000000
[15] 1.0000000
  • calculăm cuantilele de ordin \(\alpha\in(0,1)\)
qexp(c(0.01, 0.025, 0.05, 0.25, 0.5, 0.75, 0.95, 0.975, 0.99), rate = 5)
[1] 0.002010067 0.005063562 0.010258659 0.057536414 0.138629436 0.277258872
[7] 0.599146455 0.737775891 0.921034037

Exercițiul 3.2 Fie \(X\) o variabilă aleatoare repartizată \(\mathcal{E}(\lambda)\). Pentru \(\lambda \in \{0.5, 1.5, 5\}\) trasați pe același grafic densitățile repartițiilor exponențiale de parametru \(\lambda\). Adăugați legendele corespunzătoare. Aceeași cerință pentru funcțiile de repartiție.

Figura 3.2: Densitatea și funcția de repartiție pentru o serie de repartiții exponențiale.

Exercițiul 3.3 Folosind rezultatul de universalitate de la repartiția uniformă, descrieți o procedură prin care puteți simula o variabilă aleatoare repartizată exponențial \(\mathrm{Exp}(\lambda)\).

  1. Construiți o funcție care permite generarea de \(n\) observații independente dintr-o variabilă repartizată \(X\sim \mathrm{Exp}(\lambda)\).
  2. Generați \(250\) de observații din repartiția \(\mathrm{Exp}(3)\), trasați histograma acestora și suprapuneți densitatea repartiției date (vezi Figura 3.3).
Figura 3.3: Histograma observațiilor generate și densitatea teoretică suprapusă.

4 Repartiția Cauchy \(C(\alpha, \beta)\)

Definiție 4.1 (Variabilă aleatoare repartizată Cauchy) Spunem că o variabilă aleatoare \(X\) este repartizată Cauchy de parametrii \((0, 1)\), și se notează cu \(X\sim C(0,1)\), dacă densitatea ei de repartiție are forma

\[ f_X(x) = \frac{1}{\pi} \frac{1}{1+x^2},\quad \forall x\in\mathbb{R}. \]

Observăm că graficul densității repartiției Cauchy este asemănător cu cel al repartiției normale. Parametrul \(M = 0\) reprezintă mediana (de fapt \(\mathbb{P}(X\leq 0) = \mathbb{P}(X\geq 0) = \frac{1}{2}\)) variabilei aleatoare \(X\) și nu media iar prima și a treia cuartilă sunt \(Q_1 = -1\) și respectiv \(Q_3=1\) (avem \(\mathbb{P}(X\leq -1) = \mathbb{P}(X\geq 1) = \frac{1}{4}\)).

Funcția de repartiție a unei variabile aleatoare \(X\sim C(0,1)\) este dată de

\[ F_{X}(x) = \frac{1}{2} + \frac{1}{\pi}\arctan(x), \quad x\in \mathbb{R}. \]

(a) Densitatea
(b) Funcția de repartiție
Figura 4.1: Densitatea și funcția de repartiție a repartiției Cauchy \(C(0,1)\).

Media și varianța variabilei aleatoare \(X\sim C(0,1)\) nu există.

Exercițiul 4.1 Arătați că o variabilă aleatoare repartizată Cauchy \(C(0,1)\) nu are medie.

Soluție. Dacă vrem să calculăm media sub forma integralei improprii

\[ \mathbb{E}[X] = \int_{-\infty}^{\infty} \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x \]

atunci conform definiției acesteia avem că

\[ \mathbb{E}[X] = \int_{-\infty}^{\infty} \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x=\lim _{T_1 \rightarrow-\infty} \lim _{T_2 \rightarrow+\infty} \int_{T_1}^{T_2} \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x. \]

Pentru \(T_1 = -T\) și \(T_2 = \alpha T\) unde \(\alpha>0\) avem

\[ \begin{aligned} \mathbb{E}[X] &= \lim _{T_1 \rightarrow-\infty} \lim _{T_2 \rightarrow+\infty} \int_{T_1}^{T_2} \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x = \lim _{T \rightarrow+\infty}\int_{-T}^{\alpha T} \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x \\ &=\lim _{T \rightarrow+\infty}\left(\int_{-T}^T \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x+\int_T^{\alpha T} \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x\right) \\ & =0+\lim _{T \rightarrow+\infty}\left.\frac{\ln \left(1+x^2\right)}{2 \pi}\right|_T ^{\alpha T} = \lim _{T \rightarrow+\infty}\frac{1}{2 \pi} \ln \left(\frac{1+\alpha^2 T^2}{1+T^2}\right) \\ & =\frac{1}{2 \pi} \ln(\alpha), \end{aligned} \] prin urmare limita nu este definită, ea depinde de \(\alpha\).

Alternativ, ținând cont că o variabilă aleatoare admite medie dacă \(\mathbb{E}[|X|]<\infty\) și cum

\[ \mathbb{E}[|X|] = \int_{0}^{\infty} \frac{x}{\pi\left(1+x^2\right)} \mathrm{d} x = \left.\frac{\ln \left(1+x^2\right)}{2 \pi}\right|_0 ^{\infty} = \infty \]

obținem concluzia.

Fie \(Y\sim C(0,1)\) și \(\alpha, \beta\in\mathbb{R}\) cu \(\beta>0\). Spunem că variabila aleatoare \(X = \alpha + \beta Y\) este repartizată Cauchy de parametrii \((\alpha, \beta)\), \(X\sim C(\alpha, \beta)\). Densitatea ei este

\[ f_X(x) = \frac{1}{\pi\beta} \frac{1}{1+\left(\frac{x-\alpha}{\beta}\right)^2},\quad \forall x\in\mathbb{R}. \]

Parametrii \(\alpha\) și \(\beta\) se interpretează în modul următor: \(M = \alpha\) este mediana lui \(X\) iar \(Q_1 = \alpha-\beta\) și \(Q_3 = \alpha + \beta\) reprezintă prima și a treia cuartilă.

În R putem să

  • generăm observații independente din repartiția Cauchy \(C(\alpha, \beta)\) (e.g. \(\alpha = 0\), \(\beta = 2\))
rcauchy(15, location = 0, scale = 2)
 [1] -0.5966228  3.7627987  0.6864597 -0.4316018  1.4524446  0.3427032
 [7]  8.4285326  3.6056089  2.3506764 -3.5453329 -1.6137218 10.4304800
[13] -0.4449169  2.3005176 -3.6644199
  • calculăm densitatea unei variabile aleatoare repartizate Cauchy \(C(\alpha, \beta)\) în diferite puncte
dcauchy(seq(-5, 5, length.out = 20), location = 1, scale = 3)
 [1] 0.02122066 0.02450975 0.02852541 0.03345265 0.03951056 0.04693392
 [7] 0.05591721 0.06648594 0.07825871 0.09012539 0.10006665 0.10558334
[13] 0.10494052 0.09835367 0.08782920 0.07584810 0.06425529 0.05399054
[19] 0.04532934 0.03819719
  • calculăm funcția de repartiție a unei variabile repartizate Cauchy \(C(\alpha, \beta)\) pentru diferite valori
pcauchy(seq(-5, 5, length.out = 15), location = 1, scale = 3)
 [1] 0.1475836 0.1643213 0.1848605 0.2104166 0.2425988 0.2833834 0.3347507
 [8] 0.3975836 0.4697759 0.5451672 0.6158581 0.6764416 0.7255627 0.7644587
[15] 0.7951672
  • calculăm cuantilele de ordin \(p\in(0,1)\)
qcauchy(c(0.01, 0.025, 0.05, 0.25, 0.5, 0.75, 0.95, 0.975, 0.99), location = 1, scale = 3)
[1] -94.46155 -37.11861 -17.94125  -2.00000   1.00000   4.00000  19.94125
[8]  39.11861  96.46155

Exercițiul 4.2 Generați \(2500\) de observații din repartiția Cauchy, trasați histograma acestora și suprapuneți densitatea repartiției date pentru intervalul \([-5,5]\) (vezi Figura 4.2).

Figura 4.2: Histograma observațiilor generate din repartiția Cauchy \(C(0,1)\).

Exercițiul 4.3 Fie \(X\) o variabilă aleatoare repartizată Cauchy \(C(\alpha, \beta)\). Pentru fiecare pereche de parametrii \((\alpha, \beta)\) din mulțimea \(\{(0,0.5), (0, 1), (0, 2), (-1, 1.5), (-2, 1)\}\) trasați pe același grafic densitățile repartițiilor Cauchy cu parametrii \((\alpha, \beta)\). Adăugați legendele corespunzătoare. Aceeași cerință pentru funcțiile de repartiție.

Figura 4.3: Densitatea și funcția de repartiție pentru o serie de repartiții Cauchy \(C(\alpha, \beta)\).

Exercițiul 4.4 Folosind rezultatul de universalitate de la repartiția uniformă, descrieți o procedură prin care puteți simula o variabilă aleatoare repartizată Cauchy \(C(0,1)\) și construiți o funcție care permite generarea de \(n\) observații independente dintr-o variabilă repartizată \(X\sim C(\alpha, \beta)\). Verificați pentru parametrii \(\alpha = 3\) și \(\beta = 5\) (a se vedea Figura 4.4).

Figura 4.4: Histograma observațiilor generate din repartiția Cauchy \(C(3,5)\).

Exercițiul 4.5 Fie \(X\) și \(Y\) două variabile aleatoare independente repartizate \(\mathcal{N}(0,1)\). Arătați că variabila aleatoare \(\frac{X}{Y}\) este repartizată Cauchy \(C(0,1)\).

Note de subsol

  1. Pentru mai multe astfel de inegalități se poate consulta cartea (capitolul 2): Lin, Z. și Bai, Z. Probability Inequalities, Springer, 2010.↩︎

  2. Pentru cazul discret avem variabila repartizată Geometric.↩︎