L’« IA côté client » désigne l’exécution de modèles d’intelligence artificielle directement dans le navigateur ou l’appareil de l’utilisateur, sans transfert de données vers un serveur distant.
L’« IA côté client » marque une rupture avec le modèle traditionnel du cloud, où l’IA nécessitait un appel serveur pour traiter chaque requête.
Désormais, grâce à des avancées en compression de modèles, en accélération WebGPU et en optimisation pour le Web, des modèles d’IA de plusieurs milliards de paramètres comme Phi-4-mini (3,8 B de paramètres) intégré nativement à Microsoft Edge peuvent s’exécuter localement dans le navigateur.
Cela permet des fonctionnalités telles que :
- la génération de texte en temps réel (résumés, réécriture, traduction),
- la personnalisation contextuelle (recommandations basées sur le contenu affiché),
- l’assistance interactive (chat, aide à la saisie, correction),
- le traitement sensible sans fuite de données (confidentialité renforcée).
Les avantages sont multiples : latence quasi nulle, fonctionnement hors ligne, souveraineté des données, et réduction de la charge serveur. Ce paradigme redéfinit le navigateur : il n’est plus un « client » affichant du HTML, mais une plateforme d’exécution intelligente, capable de raisonner localement.
Exemple concret : Dans Edge, un utilisateur peut sélectionner un paragraphe sur une page et demander « Résume ceci » — le modèle Phi-4-mini s’exécute entièrement dans le navigateur, sans envoyer le texte à Microsoft.
Ce mouvement s’inscrit dans la tendance plus large de l’IA à la périphérie (edge AI), où la puissance cognitive migre des data centers vers les terminaux, au service de la performance, de l’éthique et de l’autonomie numérique.