Voici les commnandes à utiliser dans le terminal

Utiliser un modèle Ollama

Dans son utilisation basique, on lance l'application Ollama depuis le terminal en tapant ollama run et en indiquant le nom du modèle à utiliser. Pour cela on utilise la commande run de Ollama qui est la plus importante.

ollama run lama3.2

Mais il existe d'autres commandes qu'il faut apprendre à utiliser au fur et à mesure de votre progression. La première commande à apprendre est d'accéder à l'aide pour avoir la liste des commandes Ollama, mais cette aide est en anglais.

Afficher l'aide

ollama -h

Details

Large language model runner

Usage: ollama [flags] ollama [command]

Available Commands: serve Start ollama create Create a model from a Modelfile show Show information for a model run Run a model stop Stop a running model pull Pull a model from a registry push Push a model to a registry list List models ps List running models cp Copy a model rm Remove a model help Help about any command

Flags: -h, --help help for ollama -v, --version Show version information

Afficher la liste des modeles

ollama list

La commande list permet de lister tous les LLM qui sont disponibles localement pour être utilisé dans Ollama avec la taille de chacun d'eux et la date à laquelle le modèle a été chargé sur la machine ainsi que le code interne du modele. Par exemple sur mon MacBook voici ce que ça donne :

Liste des modèles sur mon MacBook

deepseek-r1:latest qwen2.5vl:72b devstral:latest gemma3:27b-it-qat llama3.2-vision:90b-instruct-q8_0 llama3.2-vision:11b llama4:scout gemma3:12b-it-qat llama4:17b-scout-16e-instruct-q8_0 llama4:maverick llama4:latest qwen3:235b phi4-reasoning:14b-q8_0 agdeqwen:latest mistral-small:24b deepseek-r1:70b guidejson:latest miniguide:latest llama3.2:latest llama3.2:3b-instruct-q8_0 cognac:latest marioguide:latest phindguide:latest cognacguide:latest smallthinker:latest falcon3:10b granite3.1-dense:8b qwen2.5:14b granite3.1-dense:latest granite3-moe:latest aya:35b llama3.3:70b-instruct-q8_0 llama3.3:latest athene-v2:latest qwq:latest qwen2.5-coder:32b-instruct-q8_0 llama3.2:3b-text-q8_0 pdlfagent3.1:latest pdlfagent48:latest llama3.1:8b pdlf-agent:latest yi-coder:9b-base-q8_0 qwen2.5:7b qwen2.5:72b-instruct-q8_0 reader-lm:1.5b-q8_0 deepseek-v2.5:236b-q5_0 minicpm-v:latest minicpm-v:8b-2.6-q8_0 mailrouter:latest llama3-groq-tool-use:8b mistral-large:123b-instruct-2407-q8_0 CognitiveComputations/dolphin-llama3.1phi3:mini gemma2:2b-instruct-q8_0 starcoder2:3b gemma2:2b tinydolphin:latest llama3.1:70b-instruct-fp16 llama3.1:8b-instruct-fp16 llama3.1:latest llama3.1:70b-instruct-q8_0 mistral-nemo:latest llama3-groq-tool-use:70b-q8_0 mathstral:7b-v0.1-q8_0 gemma2:27b-text-q8_0 test:latest mistrallite:latest codegemma:7b wizard-math:latest falcon2:latest mixtral:8x22b-instruct-v0.1-q4_0 llava-llama3:latest llama3:latest nomic-embed-text:latest dolphincoder:latest gemma:7b gemma:2b wizard-math:70b mistral:latest llama2:13b-chat educ:latest education:latest stable-code:latest llava:34b megadolphin:120b stablelm2:latest nous-hermes2-mixtralsqlcoder:latest mixtral:latest phi:latest notux:latest tinyllama:latest dolphin-mixtral:latest bakllava:latest solar:latest llava:latest llava:13b llava:7b 6995872bfe4c 5.2 GB 47 minutes ago
05ea68274581 48 GB 6 days ago
c4b2fa0c33d7 14 GB 6 days ago
29eb0b9aeda3 18 GB 6 days ago
0882d58d0635 95 GB 6 days ago
6f2f9757ae97 7.8 GB 7 days ago
4f01ed6b6e01 67 GB 13 days ago
5d4fa005e7bb 8.9 GB 2 weeks ago
35a57d398f89 116 GB 3 weeks ago
8e7b2f6c7b57 244 GB 3 weeks ago
4f01ed6b6e01 67 GB 3 weeks ago
8471b4f16b88 142 GB 3 weeks ago
30b78bf47222 17 GB 4 weeks ago
faf5c68c1c7c 9.0 GB 2 months ago
8039dd90c113 14 GB 3 months ago
0c1615a8ca32 42 GB 3 months ago
38c5fd1f2172 2.0 GB 4 months ago
9a8f8994332d 2.0 GB 4 months ago
a80c4f17acd5 2.0 GB 4 months ago
e410b836fe61 3.4 GB 4 months ago
b249bb0bc76f 2.0 GB 4 months ago
b5ded031a389 4.7 GB 4 months ago
94d84f524e0c 4.7 GB 4 months ago
b7f4f020594b 4.7 GB 4 months ago
945eb1864589 3.6 GB 5 months ago
1653ff122acd 6.3 GB 5 months ago
86ac4cf0cb84 4.9 GB 5 months ago
7cdf5a0187d5 9.0 GB 5 months ago
86ac4cf0cb84 4.9 GB 5 months ago
d84e1e38ee39 821 MB 5 months ago
bab44e009440 20 GB 5 months ago
d5b5e1b84868 74 GB 5 months ago
a6eb4748fd29 42 GB 5 months ago
d14346ed7d55 47 GB 6 months ago
1211a3265dc8 19 GB 6 months ago
f37bbf27ec01 34 GB 6 months ago
945fcc4a41b8 3.4 GB 6 months ago
54a29dff4c71 4.7 GB 8 months ago
54a29dff4c71 4.7 GB 8 months ago
42182419e950 4.7 GB 8 months ago
6b73bd504091 2.0 GB 8 months ago
eea07012d69e 9.4 GB 8 months ago
845dbda0ea48 4.7 GB 8 months ago
23f2cb48bb9a 77 GB 8 months ago
39ec9eda0492 1.6 GB 8 months ago
9de079142600 162 GB 8 months ago
1862d7d5fee5 5.5 GB 8 months ago
50e40737b5af 9.1 GB 8 months ago
8a52e8522943 4.1 GB 9 months ago
36211dad2b15 4.7 GB 9 months ago
20d741bc6d75 130 GB 9 months ago
-->:latest b29828c83a1d 4.7 GB 9 months ago
4f2222927938 2.2 GB 9 months ago
9d27a8c2325c 2.8 GB 9 months ago
f67ae0f64584 1.7 GB 10 months ago
8ccf136fdd52 1.6 GB 10 months ago
0f9dd11f824c 636 MB 10 months ago
0241f75cdd27 141 GB 10 months ago
9d95e89188d4 16 GB 10 months ago
62757c860e01 4.7 GB 10 months ago
613c5de138f9 74 GB 10 months ago
4b300b8c6a97 7.1 GB 10 months ago
53f605a586ef 74 GB 10 months ago
939f2d6f06c5 7.7 GB 10 months ago
0f062e1aad57 28 GB 10 months ago
03dac094567b 4.4 GB 11 months ago
03dac094567b 4.4 GB 11 months ago
0c96700aaada 5.0 GB 11 months ago
5ab8dc2115d3 4.1 GB 12 months ago
d8c09dbc67c3 6.4 GB 12 months ago
6a0910fa6dc1 79 GB 12 months ago
44c161b1f465 5.5 GB 12 months ago
a6990ed6be41 4.7 GB 13 months ago
0a109f422b47 274 MB 14 months ago
1102380927c2 9.1 GB 15 months ago
430ed3535049 5.2 GB 15 months ago
b50d6c999e59 1.7 GB 15 months ago
78a12f5c753b 38 GB 15 months ago
61e88e884507 4.1 GB 15 months ago
d475bf4c50bc 7.4 GB 15 months ago
41e4e38113ac 38 GB 15 months ago
41e4e38113ac 38 GB 15 months ago
aa5ab8afb862 1.6 GB 16 months ago
3d2d24f46674 20 GB 16 months ago
8fa55398527b 67 GB 16 months ago
ea04e74d6b59 982 MB 16 months ago
-->:latest 599da8dce2c1 26 GB 16 months ago
77ac14348387 4.1 GB 16 months ago
7708c059a8bb 26 GB 17 months ago
c651b7a89d73 1.6 GB 17 months ago
fe14e7d66184 26 GB 17 months ago
2644915ede35 637 MB 17 months ago
cfada4ba31c7 26 GB 17 months ago
3dd68bd4447c 4.7 GB 17 months ago
059fdabbe6e6 6.1 GB 17 months ago
e4c3eb471fd8 4.5 GB 17 months ago
99e3bfdf4655 8.0 GB 17 months ago
e4c3eb471fd8 4.5 GB 17 months ago

charger un modèle localement

Si on veut charger un modèle sans l'utiliser ou si on veut charger la nouvelle version d'un modèle, on peut faire un pull

ollama pull llama3.2

C'est arrivé plusieurs fois qu'il y a des problèmes dans le LLM et qu'il faille le recharger, car une nouvelle version a été silencieusement mise à disposition. Silencieusement, car cette mise à jour a été faite sans changer le numéro de version du modèle. Ça arrive parfois quand la mise à jour ne concerne pas le modèle en lui-même, mais les paramètres du modèle.

Supprimer un modèle

Si vous avez essayé un modèle et que vous voyez qu'il ne correspond pas à vos attentes et donc que vous n'allez pas l'utiliser, vous pouvez le supprimer de votre ordinateur, car chaque modèle pèse souvent pas loin de 10 Go et sur un Mac avec 256 Go de disque dur, chaque modèle peut prendre 4% de l'espace disque du disque dur. Il faut donc faire faire attention à bien nettoyer de temps en temps les modèles qu'on a dans la liste. Ce sont souvent les plus anciens qu'il faut supprimer, car les modèles actifs sont remis à jour régulièrement.

ollama rm llava:13b

Garder un modèle en mémoire

Quand vous travaillez régulièrement avec un LLM, vous constatez que parfois le LLM répond instantanément et parfois c'est plus long. En effet, la première fois qu'on utilise un LLM il doit être chargé en mémoire à partrir du disque dur et pour des raisons d'efficacité, au bout de 5 minutes, Ollama libère la mémoire vive et décharge ce LLM. La prochaine fois que vous faites un prompt, vous allez constater que Ollama doit recharger le LLM en mémoire avant de répondre.

Plus le modèle en grand, plus ce délais est long.

Vous pouvez ajouter un paramètre en lançant le LLM pour qu'il reste en mémoire jusqu'à une commande pour l'arrêter et le vider, soit jusqu'au moment où vous quittez l'application Ollama et que la mémoire soit purgée de tous les modèles.

ollama run llama3.2  --keepalive -1s

Arrêter un modèle

Pour arrêter un modèle et qu'il libère la mémoire vous pouvez utiliser la commande STOP.

ollama stop llama3.2

voir la liste des modèles actifs

Il faut faire attention à ne pas avoir trop de modèles qui tournent en parallèle sans libérer la mémoire. Pour voir la liste des modèles qui sont en train de fonctionner, il faut utiliser la commande list

ollama ps

Dans la liste qui s'affiche on voit jusque quand chaque modèle reste en mémoire.

Maintenant que vous savez comment utiliser Ollama, on va voir qu'il y a des applications qui offrent des interfaces plus sympas que le terminal pour utiliser Ollama.