Les statistiques inférentielles (ou statistique inférentielle) sont une branche de la statistique qui permet de tirer des conclusions sur une population entière à partir d’un échantillon limité de données. Contrairement à la statistique descriptive (qui se contente de résumer les données observées), l’inférence vise à généraliser, estimer ou tester des hypothèses avec un certain niveau de confiance.
Objectifs principaux :
- Estimer une caractéristique inconnue de la population
→ Ex. : « Quel est le temps moyen passé sur notre site ? » → on calcule une moyenne échantillonnale et on construit un intervalle de confiance. - Tester des hypothèses
→ Ex. : « Ce nouveau design augmente-t-il le taux de conversion ? » → on compare deux groupes avec un test statistique (comme le test t, khi², ANOVA…). - Modéliser des relations
→ Ex. : « Le revenu influence-t-il les achats en ligne ? » → on utilise la régression linéaire (qui repose sur l’inférence).
Concepts clés :
- Population : l’ensemble visé (ex. : tous les utilisateurs d’un site).
- Échantillon : sous-ensemble observé (ex. : 1 000 visiteurs analysés).
- Paramètre : valeur vraie dans la population (inconnue).
- Estimateur : valeur calculée à partir de l’échantillon (ex. : moyenne, proportion).
- Niveau de confiance : probabilité que l’inférence soit correcte (souvent 95 %).
- Seuil de significativité (p-value) : probabilité d’observer les données si l’hypothèse nulle était vraie.
Méthodes courantes :
- Intervalles de confiance
- Tests de comparaison de moyennes (test t)
- Tests d’indépendance (khi-deux)
- Régression linéaire / logistique (avec tests sur les coefficients)
- Analyse de variance (ANOVA)
Exemple concret :
Vous interrogez 500 clients sur leur satisfaction (note sur 10). La moyenne observée est 7,8.
Grâce aux statistiques inférentielles, vous pouvez dire :
« Nous sommes à 95 % sûrs que la satisfaction moyenne de tous nos clients se situe entre 7,5 et 8,1. »