Le moteur sous le capot Débutant

Un modèle, c'est une recette mathématique

Comprendre qu'un modèle n'est pas une liste de réponses, mais un moteur rempli de réglages appris.

🫏 Commence par la BD, c'est plus rigolo ! 🫏 Cette notion existe aussi en BD 🫏 Cette notion existe aussi en BD « IA et le gâteau à mille molettes » — lire l'histoire →

10 min modèlepoidsarchitecture

Je commence Je teste ma compréhension

Pas de jargon Compréhensible vite

L'architecture décrit comment l'information circule dans le système.

Les paramètres sont des nombres appris qui influencent les sorties.

Quand l'entrée arrive, le modèle applique sa recette de calcul et renvoie le résultat le plus probable.

1. Je découvre une version simple et imagée

2. Je comprends le vrai mécanisme sans jargon inutile

3. Je m'entraîne avec un mini quiz immédiat

4. Je retiens les points clés à réexpliquer

Pas un dossier de réponses : un moteur réglé

Un modèle ne garde pas les réponses au chaud quelque part : il les calcule à chaque fois, comme un moteur qui tourne plutôt qu'un classeur où tout serait déjà écrit.
Ce qui pilote ses réponses, ce sont ses réglages, appelés paramètres ou poids : des millions (voire des milliards) de petits curseurs ajustés pendant l'entraînement.
Quand on dit qu'un modèle est « gros », ça veut surtout dire qu'il a beaucoup de réglages et qu'il demande beaucoup de calcul, pas qu'il est forcément meilleur pour ce que tu veux.
Du coup, le meilleur modèle dans l'absolu, ça n'existe pas : il y en a un fort en code, un fort en images, un rapide pour le chat. La vraie question, c'est lequel sert le mieux ton usage.

Un exemple pour toi

Le filtre qui transforme ta photo, l'IA qui te génère un avatar, l'autocomplétion de ton clavier qui devine le prochain mot : ce sont tous des moteurs réglés. Aucun ne pioche une réponse toute prête, chacun la fabrique avec ses propres curseurs.

Comme le modèle fabrique sa réponse au lieu de la lire dans une base de vérité, il peut sortir une bêtise avec un ton hyper sûr de lui. C'est exactement pour ça qu'une réponse d'IA n'est pas une preuve : vérifie les infos importantes (notes de cours, dates, chiffres) à une autre source avant de t'y fier.

À retenir : un modèle calcule une réponse probable, il ne la récite pas par cœur.

Le déclic en mouvement

Regarde l'entrée traverser les molettes du modèle

Un modèle, c'est une recette réglée par des milliers de molettes (les paramètres). Compare des réglages appris à des réglages au hasard.

Tu me donnes une entrée. Je vais la faire passer dans ma « recette ».

« Le chat dort sur le… »Recette

Une entrée arrive. Le modèle n'a pas la réponse toute prête : il va la calculer.

Réglage des molettes ?Réglages appris pendant l'entraînement.

Étape 1 / 4

Sous le capot

Pour les curieux : ce qui se passe à l'intérieur

Tape pour explorer Replier

Les boutons

Plein de petits boutons qui font la réponse

Imagine une télécommande géante avec des millions de tout petits boutons. Un seul bouton, ça ne change presque rien, comme une seule goutte d'eau. Mais tous les boutons ensemble, bien réglés, décident comment le robot répond. C'est en s'entraînant beaucoup que le robot apprend à bien tourner ses boutons.

La boîte de chiffres

Le robot est rangé comme une grande boîte de chiffres

Quand tu télécharges un modèle, tu ne reçois pas un cahier rempli de phrases déjà écrites. Tu reçois surtout une énorme boîte pleine de chiffres, comme un coffre de billes. Le robot sait lire ces chiffres pour fabriquer ses réponses. Il n'y a pas de réponses cachées dedans, juste des nombres.

La recette

Il suit sa recette étape par étape

Quand tu poses une question, le robot la transforme d'abord en chiffres. Puis il la fait passer par plein d'étapes, comme une recette de gâteau qu'on fait pas à pas. À chaque étape il réfléchit un peu plus, et à la fin il sort la réponse qui lui semble la meilleure.

Le bon copain

Chaque robot est fort à un jeu différent

C'est comme tes copains : un court super vite, un autre dessine super bien, un autre raconte les meilleures histoires. Les robots, c'est pareil ! Il n'y en a pas un qui est le meilleur partout. Il faut juste choisir celui qui est le plus fort pour ce que tu veux faire.

Les réglages

Les poids sont des milliers de curseurs réglés automatiquement

Pense à une table de mixage avec des milliers de curseurs. Chaque poids est un nombre qui modifie un tout petit peu le son final. Un seul curseur ne change presque rien, mais des millions réglés ensemble pendant l'entraînement décident de tout le comportement du modèle. C'est l'apprentissage qui ajuste ces curseurs, pas un humain à la main.

Le fichier

Un modèle, c'est surtout un énorme fichier de nombres

Quand tu télécharges un modèle (comme une app de plusieurs Go), tu récupères principalement ses poids, plus parfois le tokenizer (l'outil qui découpe le texte en morceaux) et sa config. Il n'y a aucune phrase toute prête cachée dedans : juste des données numériques que le moteur sait lire et faire tourner.

Le calcul

À l'utilisation, l'info traverse les couches une par une

Quand tu envoies un message, il est d'abord transformé en nombres, puis il passe dans des couches de calcul successives (un peu comme des filtres empilés). À chaque étape le modèle affine sa compréhension du contexte, jusqu'à produire la sortie la plus probable. Ce moment où on l'utilise s'appelle l'inférence.

Le bon choix

Chaque modèle a ses points forts, comme un joueur d'équipe

Comme dans un jeu vidéo où chaque perso a sa spécialité, un modèle peut être rapide, un autre meilleur en code, un autre champion des longs textes ou des images. La vraie question n'est jamais « lequel est le meilleur en général ? » mais « lequel est le mieux adapté à ce que je veux faire ? ».

Paramètres

Les poids sont des réglages numériques appris

Chaque poids est un nombre qui influence la manière dont l'information circule et se combine. Pris seul, un poids ne veut pas dire grand-chose. Pris ensemble par millions ou milliards, ils forment le comportement global du modèle.

Stockage

Le modèle est stocké comme de grands tableaux de nombres

Quand on télécharge un modèle, on récupère surtout ses poids, parfois son tokenizer et sa configuration. Ce n'est pas un fichier magique rempli de phrases toutes faites : c'est un ensemble de données numériques que le moteur sait interpréter.

Exécution

À l'inférence, le modèle déroule sa recette couche après couche

Une requête arrive, elle est convertie en nombres, puis traverse différentes couches de calcul. À chaque étape, le modèle transforme l'information, affine sa représentation du contexte et prépare la sortie la plus plausible.

Choix produit

Deux modèles peuvent avoir des forces très différentes

L'un peut être excellent en vitesse, l'autre en code, un autre en contexte long ou en multimodal. La bonne question produit n'est jamais 'quel modèle est le meilleur dans l'absolu ?', mais 'quel modèle sert le mieux cet usage précis ?'.

L'image mentale

L'analogie qui aide à retenir

La machine, c'est un robot cuisinier avec des milliers de petites molettes pour réussir son plat.

Un modèle, c'est un moteur de jeu vidéo avec des milliers de réglages : l'entraînement, c'est la phase où on a calibré tous les curseurs.

Un modèle, c'est un moteur de cuisine avec des milliers de molettes : l'entraînement règle chaque molette pour que le plat sorte bien.

À retenir

Le coeur de l'idée

La machine ne récite pas une réponse cachée : elle la fabrique avec ses molettes.

Un modèle ne récite pas des réponses stockées : il les recalcule à la demande avec ses réglages appris.

Un modèle, c'est un moteur appris, pas une encyclopédie figée qui récite des réponses stockées.

Comment ça marche

Le mécanisme, découpé étape par étape

Tu poses une question à la machine.

Avant, elle s'est entraînée avec plein, plein d'exemples.

Elle tourne ses petites molettes pour fabriquer la réponse.

Elle ne lit pas une fiche toute prête : elle invente la réponse à chaque fois.

Tu donnes une demande à la machine, comme un prompt dans un chat.

Elle la fait passer dans sa « recette » : une grosse structure de calcul faite de couches.

Cette recette utilise des réglages appris (les paramètres, ou « poids ») pour orienter le calcul.

Au bout, elle sort la réponse la plus probable, morceau par morceau, pas une fiche toute prête.

Tu envoies une entrée (texte, image, son) au modèle.

Elle est convertie en nombres puis traverse une architecture de calcul, couche après couche.

À chaque couche, des paramètres appris (les poids) transforment et orientent l'information.

Le modèle produit la sortie la plus probable selon ces réglages, par exemple le prochain token pour un LLM.

Exemples très concrets

Où tu retrouves ça dans le monde réel

Tape pour explorer Replier

Sur la tablette de papa, le clavier devine le mot que tu vas écrire.

La machine dessine un chat tout coloré quand tu lui demandes.

Elle écoute ta voix et écrit ce que tu dis, comme une dictée.

Le clavier de ton smartphone qui devine le prochain mot quand tu écris un texto.

Un générateur d'images qui transforme ta phrase en visuel pour ta story.

La transcription automatique qui change ta voix en sous-titres dans une vidéo.

Un modèle de texte qui complète ton mail ou rédige un brouillon.

Un modèle d'image qui transforme une consigne en visuel cohérent pour une présentation.

Un modèle audio qui transcrit une réunion en compte rendu écrit.

Points de vigilance

Ce qu'il ne faut pas confondre

Tape pour explorer Replier

Une grosse machine n'est pas toujours la meilleure pour tout.

Une machine rapide peut se tromper sur les choses difficiles.

Deux machines peuvent être fortes sur des jeux très différents.

Un gros modèle n'est pas forcément le bon choix pour chaque usage.

Un modèle rapide peut être moins fiable sur des tâches compliquées.

Deux modèles peuvent être excellents sur des choses totalement différentes.

Un gros modèle n'est pas forcément le meilleur choix pour tous les cas.

Un modèle peut être rapide mais moins fiable sur des tâches complexes.

Deux modèles peuvent exceller sur des usages totalement différents.

Mythes vs réalité

Remplace les fausses idées par les bonnes

On corrige les réflexes faux que beaucoup gardent, pour ancrer une image mentale juste et solide.

Ce qu'on imagine

On croit que la machine a toutes les réponses cachées dans une boîte.

Ce qu'il faut garder

En vrai, elle n'a pas de boîte de réponses : elle les fabrique quand tu demandes.

Ce qu'on imagine

On croit que la plus grosse machine gagne toujours.

Ce qu'il faut garder

En vrai, une petite machine peut être meilleure et plus rapide pour un jeu.

Ce qu'on imagine

On croit qu'on télécharge un vrai cerveau.

Ce qu'il faut garder

En vrai, on télécharge juste plein de nombres que la machine sait lire.

Ce qu'on imagine

« Le modèle a toutes les réponses rangées dans un fichier. »

Ce qu'il faut garder

Non : il ne stocke pas de réponses, il les calcule à la demande à partir de ses réglages.

Ce qu'on imagine

« Le plus gros modèle gagne toujours. »

Ce qu'il faut garder

Faux : un petit modèle bien choisi peut être plus rapide, moins cher et meilleur sur une tâche précise.

Ce qu'on imagine

« Télécharger un modèle, c'est récupérer un cerveau. »

Ce qu'il faut garder

En vrai tu récupères surtout de grands tableaux de nombres que le moteur sait lire.

Ce qu'on imagine

« Un modèle contient toutes les réponses, rangées quelque part. »

Ce qu'il faut garder

Non : il ne stocke pas de réponses, il les calcule à la demande à partir de ses poids.

Ce qu'on imagine

« Le plus gros modèle est toujours le meilleur. »

Ce qu'il faut garder

Faux : un petit modèle bien adapté peut battre un gros modèle sur un usage précis, plus vite et moins cher.

Ce qu'on imagine

« Télécharger un modèle, c'est récupérer un cerveau. »

Ce qu'il faut garder

C'est récupérer de grands tableaux de nombres (les poids) que le moteur sait interpréter.

Mémo final

À la fin, ce sont ces idées qui doivent rester

Si tu peux les redire sans relire la fiche, l'essentiel est acquis.

Une machine qui fabrique

Elle invente la réponse, elle ne la copie pas sur une fiche.

Plein de molettes

La machine a des milliers de petits boutons pour bien répondre.

Elle s'entraîne d'abord

Avant, elle a vu plein d'exemples pour bien régler ses molettes.

La plus grosse n'est pas la meilleure

Une petite machine peut gagner si elle est faite pour ça.

Mémo final

À la fin, ce sont ces idées qui doivent rester

Si tu peux les redire sans relire la fiche, l'essentiel est acquis.

Un moteur, pas une base de réponses

Le modèle fabrique sa réponse au moment où tu l'utilises, il ne la copie pas d'une liste.

Paramètres = les réglages

Des millions, voire des milliards de nombres ajustés pendant l'entraînement.

« Gros » = beaucoup de réglages

Un gros modèle a surtout plus de paramètres et demande plus de calcul.

Le meilleur dépend du besoin

Vitesse, code, images, texte long : chaque modèle a ses points forts.

Mémo final

À la fin, ce sont ces idées qui doivent rester

Si tu peux les redire sans relire la fiche, l'essentiel est acquis.

Un modèle = un moteur appris

Il calcule une réponse probable à la demande, il ne la récite pas depuis une liste.

Les poids = les réglages

De grands tableaux de nombres, ajustés pendant l'entraînement, chargés en mémoire à l'exécution.

Pas une encyclopédie

On télécharge des poids et une configuration, pas un fichier rempli de phrases toutes faites.

Le meilleur dépend de l'usage

Vitesse, code, contexte long, multimodal : chaque modèle a ses forces et ses compromis.

🫏 L'IA du Zéro🧑 Ado

Ma carte mémo

Un modèle, c'est une recette mathématique

À la fin, ce sont ces idées qui doivent rester

Un moteur, pas une base de réponsesLe modèle fabrique sa réponse au moment où tu l'utilises, il ne la copie pas d'une liste.
Paramètres = les réglagesDes millions, voire des milliards de nombres ajustés pendant l'entraînement.
« Gros » = beaucoup de réglagesUn gros modèle a surtout plus de paramètres et demande plus de calcul.
Le meilleur dépend du besoinVitesse, code, images, texte long : chaque modèle a ses points forts.

iaduzero.fr — Comprendre l'IA, de zéro à expert 🇫🇷

Questions fréquentes