Mai jos regăsiți subiectele pentru proiectul de laborator pentru cursul de Statistică.
Fiecare echipa (care conține maxim 2 persoane) va trimite prin liderul echipei un singur e-mail la adresa alexandru.amarioarei@fmi.unibuc.ro ce va conține proiectul. De asemenea am să fac o temă (un assignment) pe Teams și vă rog să încărcați proiectele și acolo (toată lumea, chiar dacă se vor repeta). Documentația proiectului trebuie scrisă prin intermediul pachetului
Rmarkdown
/Quarto
dinR
. Informații introductive despre modul de folosire a acestui pachet pot fi găsite aici sau aici iar pentru mai multe detalii se poate consulta cartea R Markdown: The definitive guide. Toate simulările, figurile și codurile folosite trebuie incluse în raport. Se va folosi doar limbajulR
. Documentația trimisă trebuie să conțină pe lângă fișierul generat (HTML, Microsoft Word sau ) și fișierul.Rmd
care conține codul sursă (comentat!).Documentația proiectului trebuie să conțină, pe prima pagină, numele membrilor echipei, liderul echipei și grupa din care face parte fiecare. Pentru fiecare exercițiu în parte documentația trebuie să conțină:
- Calculele matematice solicitate (pot fi tehnoredactate sau scrise de mână și scanate, însă dacă apelați la ultima variantă vă rog să vă asigurați că ați scris citeț, fără ștersături sau zone scanate deficitar)
- Codul
R
comentat - Graficele realizate
- Comentariile și concluziile voastre
Pentru obținerea punctajului maxim trebuie să rezolvați toate subiectele.
Data de predare a proiectului este 4 februarie 2024 ora 22:00.
Subiect
Fie
este repartizată cu densitatea
unde
admite densitatea de repartiție
unde
Obiectivul aceste probleme este de a estima probabilitatea
pentru un
Metoda 1 - Monte Carlo clasic (naiv)
Calculați exact probabilitatea
. Comparați cu rezultatul obținut prin aplicarea funcțieiintegrate
.Descrieți o metodă de simulare a unor observații din repartiția vectorului
și scrieți codulR
corespunzător. Precizați eventualele calcule efectuate.Verificați grafic (e.g. prin intermediul unor histograme) că metoda propusă de simulare și codul sunt corecte.
Descrieți estimatorul Monte Carlo naiv
a lui folosind un eșantion i.i.d. de volum din repartiția vectorului .Scrieți un cod
R
care să returneze pentru o valoare a lui (e.g. ) valoarea estimatorului și eroarea pătratică medie a lui .Notăm cu
funcția de repartiție a lui . Arătați că
Implementați un cod
R
care să returneze pentru o valoare a lui (e.g. ) valoarea estimatorului și eroarea pătratică medie a lui .Plecând de la aceste rezultate, putem spune că estimatorul
este mai bun decât estimatorul în termeni de varianță? Dacă da, atunci arătați că are loc inegalitatea
Metoda 2 - variabile antitetice
Metoda bazată pe variabile antitetice are ca scop propunerea unui estimator a cărui varianță este mai redusă decât cea a estimatorului Monte Carlo naiv. Metoda ține cont de simetria problemei. Astfel, dacă
unde
Folosind metoda variabilelor antitetice, propuneți un estimator
a lui . Arătați că .Implementați în
R
un cod care să returneze pentru o valoare a lui (e.g. ) valoarea estimatorului și eroarea pătratică medie a lui .
Metoda 3 - variabile de control
O altă metodă de reducere a varianței unui estimator este metoda bazată pe o variabilă de control. Metoda presupune găsirea unei funcții
unde
Notăm cu
Între
și ce funcție este de preferat pentru a reduce varianța estimatorului prin intermediul metodei variabilei de control? Notăm acest estimator cu .Implementați un cod
R
care să returneze pentru o valoare a lui (e.g. ) valoarea estimatorului și eroarea pătratică medie a lui .
Pentru un șir
unde
- Arătați că
unde
Calculați explicit
și verificați dacă este inversabilă.Demonstrați că
- Implementați un cod
R
care să returneze pentru o valoare a lui (e.g. ) valoarea estimatorului și eroarea pătratică medie a lui .
Metoda 4
- Fie
. Arătați că pentru un șir de variabile aleatoare i.i.d repartizate are loc relația
Deduceți un estimator
a lui . Cum puteți interpreta acest estimator?Implementați un cod
R
care să returneze pentru o valoare a lui (e.g. ) valoarea estimatorului și eroarea pătratică medie a lui .Comparați eficacitatea relativă a estimatorilor lui
propuși în punctele anterioare.
Referințe
Note de subsol
Atenție la volumul eșantionului: dacă
este estimatorul Monte Carlo clasic a lui atunci ↩︎