Ouvrir le menu principal

MacGeneration

Recherche

L'utilitaire de LLM en local Ollama passe à la vitesse supérieure avec MLX

Félix Cattafesta

mardi 31 mars 2026 à 11:03 • 17

Intelligence artificielle

Ollama accélère doucement sa transformation. Ce qui n’était au départ qu’un outil pour lancer des modèles en local depuis le Terminal devient une véritable plateforme plus grand public et plus poussée. Après avoir gagné la possibilité de générer des images, ses développeurs viennent de lui ajouter la prise en charge du framework MLX d’Apple. De quoi grandement améliorer les performances pour ceux ayant des assistants comme OpenClaw ou s’en servant avec Claude Code ou Codex.

Ollama en action.

Ollama passait jusqu’à présent par l'implémentation Metal de llama.cpp, et ce changement de framework lui permet d’optimiser encore plus ses performances sur les appareils Apple Silicon. Tout passer par une meilleure exploitation conjointe du CPU, du GPU et du Neural Engine. Sur les puces M5, M5 Pro et M5 Max, Ollama exploite aussi les nouveaux accélérateurs neuronaux intégrés au GPU, ce qui améliore à la fois le temps de réponse initial et la vitesse de génération.

MLX : un framework de machine learning adapté aux puces Apple

MLX : un framework de machine learning adapté aux puces Apple

De plus, l’utilitaire adopte désormais le format NVFP4 de NVIDIA, conçu pour maintenir un bon niveau de précision tout en réduisant les besoins en mémoire et en bande passante lors de l’exécution des modèles, notamment pour les tâches courantes comme la génération de texte ou l’analyse de données. Cette optimisation concerne surtout les environnements équipés de GPU NVIDIA récents et ouvre la voie à l’exécution de modèles optimisés pour cette technologie.

Sur un autre registre, Ollama fait évoluer son système de cache pour gagner en efficacité sur les usages liés au code et aux agents. La mémoire est mieux optimisée grâce à la réutilisation du cache entre conversations, tandis que des points de sauvegarde intelligents accélèrent le traitement des requêtes. Enfin, la gestion du cache devient plus fine, en conservant plus longtemps les éléments communs entre différentes interactions.

Les évolutions sur Qwen3.5-35B-A3B (la machine n’est pas indiquée).

Cette nouvelle version d’Ollama permet notamment pour l'instant de faire tourner certains modèles exigeants comme Qwen3.5-35B-A3B : elle demande donc un Mac avec au moins 32 Go de RAM. D’autres modèles seront pris en charge par la suite, en plus d’une solution pour importer les modèles custom dans Ollama. Ollama 0.19 peut être téléchargé sur le site des développeurs.

Fuite de données personnelles d’élèves après une attaque visant l’Éducation nationale

14/04/2026 à 22:51

• 8


Apple Business, la nouvelle plateforme pour les entreprises, est ouverte

14/04/2026 à 21:13

• 2


Comment personnaliser le look de macOS de fond en comble avec les nouvelles options de Tahoe

14/04/2026 à 20:30

• 5


Cartes vides au Liban : Apple assure que Plans a toujours été nul

14/04/2026 à 19:41

• 45


Journée MacG du 18 avril : découvrez le programme et réservez votre place

14/04/2026 à 19:20

• 15


Apple aurait trouvé une nouvelle adresse pour sa boutique de Zurich

14/04/2026 à 17:39

• 0


Compressor 5.2 retire discrètement l’encodage H.264 pour Blu-ray

14/04/2026 à 17:18

• 16


Amazon met la main sur Globalstar, le partenaire satellite d’Apple

14/04/2026 à 14:42

• 23


Call the Yak fait revivre un célèbre easter egg de Final Cut Pro

14/04/2026 à 12:24

• 5


Blackmagic s’attaque à Lightroom avec DaVinci Resolve 21

14/04/2026 à 10:55

• 18


RAMPocalypse : Microsoft augmente fortement les prix des Surface en France

14/04/2026 à 10:15

• 52


SFR : Orange, Bouygues et Free dans un final sous haute tension

14/04/2026 à 10:03

• 30


MacBook Pro : 25 marches plus tard, il fonctionne encore !

14/04/2026 à 08:42

• 34


Les premiers éléments de la publicité dans Plans apparaissent dans iOS 26.5 beta 2

14/04/2026 à 08:42

• 26


La conduite entièrement autonome (supervisée) de Tesla autorisée aux Pays-Bas

14/04/2026 à 07:57

• 64


Apple retire Pages, Keynote et Numbers de l'App Store… pour ne garder que Keynote, Numbers et Pages

13/04/2026 à 23:14

• 50