Kimi est une intelligence artificielle développée par la licorne technologique chinoise Moonshot AI, fondée en 2023. Elle s’est fait connaître mondialement en étant la première à proposer une fenêtre de contexte « perte zéro » extrêmement large, permettant d’analyser des documents massifs là où ses concurrents étaient limités.
1. Les Débuts (Fin 2023 – Mi-2024) : le roi du long contexte
- Kimi Chat (Octobre 2023) : lancement initial avec une fenêtre de 128 000 tokens, un record à l’époque.
- Expansion (Mars 2024) : passage à une capacité de 2 millions de caractères, permettant de lire d’un coup plusieurs romans ou des centaines de fichiers PDF.
- Kimi Explore (Octobre 2024) : introduction d’un mode de recherche autonome sur le web, capable de synthétiser des informations provenant de dizaines de sources en temps réel.
2. Le Virage du Raisonnement (Début 2025)
- Kimi K1.5 (Janvier 2025) : Moonshot AI adopte l’architecture Mixture-of-Experts (MoE). Ce modèle commence à rivaliser avec OpenAI o1 sur le raisonnement logique, les mathématiques et le code.
- Kimi-VL (Avril 2025) : version spécialisée dans la vision (multimodal), capable d’analyser des images et des schémas techniques complexes.
3. La Maturité avec K2 et K2.5 (Fin 2025 – Janvier 2026)
- Kimi K2 (Juillet 2025) : un modèle géant de 1 billion (1T) de paramètres (32B actifs). Il est publié en « open-weights », devenant instantanément la référence pour la communauté open-source.
- Kimi K2.5 (Janvier 2026) : introduction des modes « Instant » et « Thinking ». Le modèle devient nativement multimodal (texte/image/vidéo) et commence à être intégré dans des outils de développement célèbres comme Cursor.
4. L’ère des Agents : Kimi K2.6 (Avril 2026)
- Agent Swarm : Kimi peut désormais orchestrer jusqu’à 300 sous-agents en parallèle pour résoudre une tâche complexe.
- Endurance : Capable d’exécuter des sessions de codage ou de recherche en autonomie totale pendant plus de 12 heures.
- Optimisation : Bien que très puissant, il reste extrêmement économique grâce à une gestion intelligente du cache mémoire.