La modélisation linéaire est l’un des fondements de la statistique et de l’apprentissage automatique : simple, interprétable, et souvent un excellent point de départ.
C’est une méthode statistique qui consiste à représenter la relation entre une ou plusieurs variables explicatives (entrées) et une variable cible (sortie) à l’aide d’une fonction linéaire c’est-à-dire une droite (en 2D) ou un hyperplan (en dimensions supérieures).
La modélisation linéaire cherche à expliquer ou prédire une grandeur (comme le prix d’une maison, la consommation d’énergie, etc.) à partir d’autres grandeurs, en supposant que leur lien peut être approximé par une ligne droite.
Objectifs :
- Comprendre l’influence de certaines variables sur un phénomène.
- Prédire des valeurs futures (ex. : ventes, température).
- Quantifier la force et le sens (positif/négatif) des relations.
Outils courants :
- En Python :
scikit-learn(LinearRegression),statsmodels - En R : fonction
lm() - En Excel : outil « Régression » ou courbe de tendance
Explorer les thématiques : Données, information & contenus, Modélisation linéaire