Curs: Modele de Regresie 2024-2025

Facultatea de Matematică și Informatică, Universitatea din București

Bine ați venit!

Bine ați venit pe pagina cursului de Modele de Regresie.

Cursul prezintă o introducere, atât din perspectivă matematică cât și aplicativă, în modelele clasice de regresie și este adresat studenților de anul 3 de la matematici-aplicate. Materialul expus pune accent pe noțiunile fundamentale de regresie liniară simplă și multiplă și este completat de elemente de statistică computațională.

Tematici abordate

Cursul urmărește parcurgerea următoarelor tematici (în funcție de timp):

  • Modelul de regresie liniară simplă.
  • Estimarea parametrilor prin metoda celor mai mici pătrate. Interpretări geometrice.
  • Cazul erorilor gaussiene în modelul de regresie liniară simplă. Estimarea parametrilor prin metoda verosimilității maxime. Repartițiile estimatorilor și intervale de încredere.
  • Modelul de regresie liniară multiplă.
  • Estimarea parametrilor prin metoda celor mai mici pătrate în modelul de regresie multiplă. Interpretare geometrică.
  • Modelul Gaussian. Estimarea parametrilor prin metoda verosimilității maxime. Intervale de încredere pentru parametrii. Testarea ipotezelor statistice și compararea modelelor.
  • Metode de validare/diagnostic a modelului.
  • Metode de selecție a modelului. Criterii clasice de alegere a modelului.

Note de curs

Tabelul de mai jos prezintă succint tematicile abordate:

Cursul Scurtă descriere Note de curs
1 Elemente introductive de modelare 📖
2 Modelul de regresie liniară simplă - estimarea parametrilor prin metoda celor mai mici pătrate 📖
3 Modelul de regresie liniară simplă - interpretări geometrice - coeficientul de determinare 📖
4 Modelul de regresie liniară multiplă - aspecte de modelare: liniaritatea covariabilelor, homoscedasticitatea și necorelarea termenilor eroare. 📖
5 Modelul de regresie liniară multiplă - interpretarea efectelor induse de variabilele explicative: continue sau discrete. Prezentarea efectului de interacție. 📖
6 Modelul de regresie liniară multiplă - estimarea parametrilor și proprietățile acestora. 📖
7 Modelul de regresie liniară multiplă - interpretări geometrice și coeficientul de determinare. 📖
8 Modelul de regresie liniară multiplă - modelul condiționat normal, estimatorii obținuți prin metoda verosimilității maxime, proprietăți statistice. 📖

Seturi de date folosite

Nr. Setul de date Descărcare
1 Setul de date Munchen

2 Setul de date Eucalypt

3 Setul de date Iris

4 Setul de date gapminder-FiveYearData

5 Setul de date msleep

6 Setul de date life_expectancy

7 Setul de date population_total

Moduri de comunicare

Putem comunica pentru ușurință prin intermediul platformei MSTeams unde am creat un canal special pentru acest curs.

  • Dacă aveți o întrebare în timpul cursului sau a laboratorului/seminarului vă rog să o adresați! Aproape sigur mai sunt colegi cu aceeași întrebare, prin urmare, dacă întrebați veți crea o oportunitate de învățare pentru toată lumea.

  • Ca sfat: dacă o anumită informație (noțiune, terminologie, concept, demonstrație, etc.) este confuză pentru voi în a doua săptămână atunci în săptămâna următoare va deveni și mai confuză și în cele din urmă nu veți mai ști de unde să începeți. Astfel, dacă vă aflați într-o situație de acest tip, întrebați!

  • Putem programa de comun acord întâlniri online (prin MSTeams) pentru a discuta și a vă răspunde la neclarități.

Notarea și promovarea

Notarea se face după cum urmează:

  • Activitate laborator/seminar (\(A\)) = 20 puncte. Punctajul se obține din activitatea desfășurată în cadrul laboratorului/seminarului.
  • Proiect de laborator (\(P\)) = 80 puncte ce urmează a fi prezentat. În cadrul prezentării proiectului va fi și o examinare orală pe baza noțiunilor învățate la curs.
  • 10 puncte din oficiu

Pentru a promova examenul trebuie să obțineți cel puțin 50 puncte.

Bibliografie selectivă

  • Modele de Regresie:
  1. George Seber, Alan Lee, Linear Regression Analysis, Wiley, 2003
  2. Ashish Sen, Muni Srivastava, Regression Analysis - Theory, methods and applications. Springer-Verlag, 1990
  3. Julian Faraway, Linear Models with R, Chapman & Hall, 2014
  • Statistică:
  1. Hogg, McKean, & Craig, Introduction to Mathematical Statistics, 7th edition, Pearson, 2012
  2. Wasserman, L., All of Statistics: A concise course in statistical inference. Springer-Verlag, 2010
  3. Virgil Craiu, Statistică Matematică, Ed. Univ. Buc., 1997
  4. George Casella, Roger Berger, Statistical Inference, Duxbury, 2002
  5. George Roussas, A Course in Mathematical Statistics, Academic Press, 1997
  • Probabilități:
  1. Jacod, J. & Protter, P., Probability Essentials, Springer-Verlag, 2003
  2. Geoffrey Grimmett, David Stirzaker, Probability and Random Processes, Oxford University Press, 2001
  • Utilizare R:
  1. Introducere în R
  2. Introducere în Tidyverse
  3. Tilman Davies, The Book of R. A First Course in Programming and Statistics. No Starch Press, Inc., 1st edition, 2016
  4. Norman Matloff, The Art of R Programming. A Tour of Statistical Software Design. No Starch Press, Inc., 1st edition, 2011