Mai jos regăsiți o serie de teme ce pot fi utile pentru proiectul aferent cursului de Modele de regresie.
FFiecare echipa (care conține maxim 2 persoane) va încărca proiectul (toți membrii echipei, chiar dacă se vor repeta) prin intermediul platformei Teams, unde am să fac o temă (un assignment) corespunzătoare cursului. Documentația proiectului poate fi scrisă în Microsoft Word sau \(\LaTeX\), pentru ușurință recomand folosirea pachetului Rmarkdown/Quarto din R. Informații introductive despre modul de folosire a acestui pachet pot fi găsite aici - rmarkdown, aici - quarto sau aici - rmarkdown iar pentru mai multe detalii se poate consulta cartea R Markdown: The definitive guide.
Documentația proiectului va specifica, pe prima pagină, numele membrilor echipei și liderul echipei. Documentația trimisă (într-un fișier arhivat .zip) trebuie să conțină pe lângă fișierul generat (HTML, Microsoft Word sau PDF+\(\LaTeX\)), setul/seturile de date folosite precum și fișierul .Rmd/.qmd (sau .R) care conține codul sursă (comentat!). Toate simulările, figurile și codurile folosite trebuie incluse în raport.
Este recomandat ca proiectul să conțină următoarele secțiuni:
Secțiunea de introducere - se va prezenta motivația/tematica proiectului, se vor/va introduce seturile/setul de date folosite/folosit și o scurtă analiză exploratorie a acestora/acestuia
Secțiunea de metodologie - se vor prezenta aspecte teoretice privind tematica proiectului și va include o descriere a procesului de modelare
Secțiunea de rezultate - se va prezenta modelul (final) ales și se va include o discuție asupra aspectelor relevante care au condus la ajustarea acestuia pe date (e.g. discuție asupra ipotezelor modelului, diagnostic, etc.)
Exemplele din fiecare proiect vor avea la bază unul sau mai multe seturi de date. Setul/seturile de date trebuie să îndeplinească următoarele criterii:
- să conțină cel puțin 250 de observații
- să aibă cel puțin 5 coloane, dintre care cel puțin o variabilă să poată fi identificată drept variabilă răspuns (continuă sau nu) iar celelalte drept covariabile (unice)
- observațiile ar trebui să îndeplinească în mod rezonabil condiția de independență (evitați datele din studii observaționale - culese în timp sau cele cu măsuri repetate, etc.)
Data de predare a proiectului este 16.05.2026, ora 22:00. Susținerea proiectelor va avea loc pe data de 18.05.2026 de la ora 8:00.
Posibile teme
Mai jos am inclus o serie de teme pentru proiect ca referință:
Exemplificarea modelelor de regresie în biostatistică sau alte științe – aspecte teoretice și exemple în
RModele de regresie logistică (simplă și multiplă) – aspecte teoretice și exemple în
RSelecția modelelor în regresie – aspecte teoretice și exemple în
RValidarea modelului de regresie liniară – metode grafice - aspecte teoretice și exemple în
RDetecția de valori aberante și de valori influente în regresie – metode grafice – aspecte teoretice și exemple în
RTransformări în modelele de regresie – covariabile și variabila răspuns (modelul Box-Cox) – aspecte teoretice și exemple în
RAnaliză de varianță cu aplicații - aspecte teoretice și exemple în
RModelul Deming - aspecte teoretice și exemple în
R
Orice alte teme sunt binevenite, dar pentru aprobare vă rog să îmi scrieți înainte!
Posibile surse pentru date
Următoarele link-uri pot fi utile în determinarea setului de date adecvat proiectului vostru: