L'architecture décrit comment l'information circule dans le système.
Un modèle, c'est une recette mathématique
Comprendre qu'un modèle n'est pas une liste de réponses, mais un moteur rempli de réglages appris.
🫏 Commence par la BD, c'est plus rigolo ! 🫏 Cette notion existe aussi en BD 🫏 Cette notion existe aussi en BD « IA et le gâteau à mille molettes » — lire l'histoire →
Les paramètres sont des nombres appris qui influencent les sorties.
Quand l'entrée arrive, le modèle applique sa recette de calcul et renvoie le résultat le plus probable.
Pas un dossier de réponses : un moteur réglé
- Un modèle ne garde pas les réponses au chaud quelque part : il les calcule à chaque fois, comme un moteur qui tourne plutôt qu'un classeur où tout serait déjà écrit.
- Ce qui pilote ses réponses, ce sont ses réglages, appelés paramètres ou poids : des millions (voire des milliards) de petits curseurs ajustés pendant l'entraînement.
- Quand on dit qu'un modèle est « gros », ça veut surtout dire qu'il a beaucoup de réglages et qu'il demande beaucoup de calcul, pas qu'il est forcément meilleur pour ce que tu veux.
- Du coup, le meilleur modèle dans l'absolu, ça n'existe pas : il y en a un fort en code, un fort en images, un rapide pour le chat. La vraie question, c'est lequel sert le mieux ton usage.
Le filtre qui transforme ta photo, l'IA qui te génère un avatar, l'autocomplétion de ton clavier qui devine le prochain mot : ce sont tous des moteurs réglés. Aucun ne pioche une réponse toute prête, chacun la fabrique avec ses propres curseurs.
Comme le modèle fabrique sa réponse au lieu de la lire dans une base de vérité, il peut sortir une bêtise avec un ton hyper sûr de lui. C'est exactement pour ça qu'une réponse d'IA n'est pas une preuve : vérifie les infos importantes (notes de cours, dates, chiffres) à une autre source avant de t'y fier.
À retenir : un modèle calcule une réponse probable, il ne la récite pas par cœur.
Regarde l'entrée traverser les molettes du modèle
Un modèle, c'est une recette réglée par des milliers de molettes (les paramètres). Compare des réglages appris à des réglages au hasard.
Une entrée arrive. Le modèle n'a pas la réponse toute prête : il va la calculer.
Sous le capot Pour les curieux : ce qui se passe à l'intérieur
Tape pour explorer Replier
Plein de petits boutons qui font la réponse
Imagine une télécommande géante avec des millions de tout petits boutons. Un seul bouton, ça ne change presque rien, comme une seule goutte d'eau. Mais tous les boutons ensemble, bien réglés, décident comment le robot répond. C'est en s'entraînant beaucoup que le robot apprend à bien tourner ses boutons.
Le robot est rangé comme une grande boîte de chiffres
Quand tu télécharges un modèle, tu ne reçois pas un cahier rempli de phrases déjà écrites. Tu reçois surtout une énorme boîte pleine de chiffres, comme un coffre de billes. Le robot sait lire ces chiffres pour fabriquer ses réponses. Il n'y a pas de réponses cachées dedans, juste des nombres.
Il suit sa recette étape par étape
Quand tu poses une question, le robot la transforme d'abord en chiffres. Puis il la fait passer par plein d'étapes, comme une recette de gâteau qu'on fait pas à pas. À chaque étape il réfléchit un peu plus, et à la fin il sort la réponse qui lui semble la meilleure.
Chaque robot est fort à un jeu différent
C'est comme tes copains : un court super vite, un autre dessine super bien, un autre raconte les meilleures histoires. Les robots, c'est pareil ! Il n'y en a pas un qui est le meilleur partout. Il faut juste choisir celui qui est le plus fort pour ce que tu veux faire.
Les poids sont des milliers de curseurs réglés automatiquement
Pense à une table de mixage avec des milliers de curseurs. Chaque poids est un nombre qui modifie un tout petit peu le son final. Un seul curseur ne change presque rien, mais des millions réglés ensemble pendant l'entraînement décident de tout le comportement du modèle. C'est l'apprentissage qui ajuste ces curseurs, pas un humain à la main.
Un modèle, c'est surtout un énorme fichier de nombres
Quand tu télécharges un modèle (comme une app de plusieurs Go), tu récupères principalement ses poids, plus parfois le tokenizer (l'outil qui découpe le texte en morceaux) et sa config. Il n'y a aucune phrase toute prête cachée dedans : juste des données numériques que le moteur sait lire et faire tourner.
À l'utilisation, l'info traverse les couches une par une
Quand tu envoies un message, il est d'abord transformé en nombres, puis il passe dans des couches de calcul successives (un peu comme des filtres empilés). À chaque étape le modèle affine sa compréhension du contexte, jusqu'à produire la sortie la plus probable. Ce moment où on l'utilise s'appelle l'inférence.
Chaque modèle a ses points forts, comme un joueur d'équipe
Comme dans un jeu vidéo où chaque perso a sa spécialité, un modèle peut être rapide, un autre meilleur en code, un autre champion des longs textes ou des images. La vraie question n'est jamais « lequel est le meilleur en général ? » mais « lequel est le mieux adapté à ce que je veux faire ? ».
Les poids sont des réglages numériques appris
Chaque poids est un nombre qui influence la manière dont l'information circule et se combine. Pris seul, un poids ne veut pas dire grand-chose. Pris ensemble par millions ou milliards, ils forment le comportement global du modèle.
Le modèle est stocké comme de grands tableaux de nombres
Quand on télécharge un modèle, on récupère surtout ses poids, parfois son tokenizer et sa configuration. Ce n'est pas un fichier magique rempli de phrases toutes faites : c'est un ensemble de données numériques que le moteur sait interpréter.
À l'inférence, le modèle déroule sa recette couche après couche
Une requête arrive, elle est convertie en nombres, puis traverse différentes couches de calcul. À chaque étape, le modèle transforme l'information, affine sa représentation du contexte et prépare la sortie la plus plausible.
Deux modèles peuvent avoir des forces très différentes
L'un peut être excellent en vitesse, l'autre en code, un autre en contexte long ou en multimodal. La bonne question produit n'est jamais 'quel modèle est le meilleur dans l'absolu ?', mais 'quel modèle sert le mieux cet usage précis ?'.
L'analogie qui aide à retenir
La machine, c'est un robot cuisinier avec des milliers de petites molettes pour réussir son plat.
Un modèle, c'est un moteur de jeu vidéo avec des milliers de réglages : l'entraînement, c'est la phase où on a calibré tous les curseurs.
Un modèle, c'est un moteur de cuisine avec des milliers de molettes : l'entraînement règle chaque molette pour que le plat sorte bien.
Le coeur de l'idée
La machine ne récite pas une réponse cachée : elle la fabrique avec ses molettes.
Un modèle ne récite pas des réponses stockées : il les recalcule à la demande avec ses réglages appris.
Un modèle, c'est un moteur appris, pas une encyclopédie figée qui récite des réponses stockées.
Le mécanisme, découpé étape par étape
Tu poses une question à la machine.
Avant, elle s'est entraînée avec plein, plein d'exemples.
Elle tourne ses petites molettes pour fabriquer la réponse.
Elle ne lit pas une fiche toute prête : elle invente la réponse à chaque fois.
Tu donnes une demande à la machine, comme un prompt dans un chat.
Elle la fait passer dans sa « recette » : une grosse structure de calcul faite de couches.
Cette recette utilise des réglages appris (les paramètres, ou « poids ») pour orienter le calcul.
Au bout, elle sort la réponse la plus probable, morceau par morceau, pas une fiche toute prête.
Tu envoies une entrée (texte, image, son) au modèle.
Elle est convertie en nombres puis traverse une architecture de calcul, couche après couche.
À chaque couche, des paramètres appris (les poids) transforment et orientent l'information.
Le modèle produit la sortie la plus probable selon ces réglages, par exemple le prochain token pour un LLM.
Exemples très concrets Où tu retrouves ça dans le monde réel
Tape pour explorer Replier
Sur la tablette de papa, le clavier devine le mot que tu vas écrire.
La machine dessine un chat tout coloré quand tu lui demandes.
Elle écoute ta voix et écrit ce que tu dis, comme une dictée.
Le clavier de ton smartphone qui devine le prochain mot quand tu écris un texto.
Un générateur d'images qui transforme ta phrase en visuel pour ta story.
La transcription automatique qui change ta voix en sous-titres dans une vidéo.
Un modèle de texte qui complète ton mail ou rédige un brouillon.
Un modèle d'image qui transforme une consigne en visuel cohérent pour une présentation.
Un modèle audio qui transcrit une réunion en compte rendu écrit.
Points de vigilance Ce qu'il ne faut pas confondre
Tape pour explorer Replier
Une grosse machine n'est pas toujours la meilleure pour tout.
Une machine rapide peut se tromper sur les choses difficiles.
Deux machines peuvent être fortes sur des jeux très différents.
Un gros modèle n'est pas forcément le bon choix pour chaque usage.
Un modèle rapide peut être moins fiable sur des tâches compliquées.
Deux modèles peuvent être excellents sur des choses totalement différentes.
Un gros modèle n'est pas forcément le meilleur choix pour tous les cas.
Un modèle peut être rapide mais moins fiable sur des tâches complexes.
Deux modèles peuvent exceller sur des usages totalement différents.
Remplace les fausses idées par les bonnes
On corrige les réflexes faux que beaucoup gardent, pour ancrer une image mentale juste et solide.
On croit que la machine a toutes les réponses cachées dans une boîte.
En vrai, elle n'a pas de boîte de réponses : elle les fabrique quand tu demandes.
On croit que la plus grosse machine gagne toujours.
En vrai, une petite machine peut être meilleure et plus rapide pour un jeu.
On croit qu'on télécharge un vrai cerveau.
En vrai, on télécharge juste plein de nombres que la machine sait lire.
« Le modèle a toutes les réponses rangées dans un fichier. »
Non : il ne stocke pas de réponses, il les calcule à la demande à partir de ses réglages.
« Le plus gros modèle gagne toujours. »
Faux : un petit modèle bien choisi peut être plus rapide, moins cher et meilleur sur une tâche précise.
« Télécharger un modèle, c'est récupérer un cerveau. »
En vrai tu récupères surtout de grands tableaux de nombres que le moteur sait lire.
« Un modèle contient toutes les réponses, rangées quelque part. »
Non : il ne stocke pas de réponses, il les calcule à la demande à partir de ses poids.
« Le plus gros modèle est toujours le meilleur. »
Faux : un petit modèle bien adapté peut battre un gros modèle sur un usage précis, plus vite et moins cher.
« Télécharger un modèle, c'est récupérer un cerveau. »
C'est récupérer de grands tableaux de nombres (les poids) que le moteur sait interpréter.
À la fin, ce sont ces idées qui doivent rester
Si tu peux les redire sans relire la fiche, l'essentiel est acquis.
Elle invente la réponse, elle ne la copie pas sur une fiche.
La machine a des milliers de petits boutons pour bien répondre.
Avant, elle a vu plein d'exemples pour bien régler ses molettes.
Une petite machine peut gagner si elle est faite pour ça.
À la fin, ce sont ces idées qui doivent rester
Si tu peux les redire sans relire la fiche, l'essentiel est acquis.
Le modèle fabrique sa réponse au moment où tu l'utilises, il ne la copie pas d'une liste.
Des millions, voire des milliards de nombres ajustés pendant l'entraînement.
Un gros modèle a surtout plus de paramètres et demande plus de calcul.
Vitesse, code, images, texte long : chaque modèle a ses points forts.
À la fin, ce sont ces idées qui doivent rester
Si tu peux les redire sans relire la fiche, l'essentiel est acquis.
Il calcule une réponse probable à la demande, il ne la récite pas depuis une liste.
De grands tableaux de nombres, ajustés pendant l'entraînement, chargés en mémoire à l'exécution.
On télécharge des poids et une configuration, pas un fichier rempli de phrases toutes faites.
Vitesse, code, contexte long, multimodal : chaque modèle a ses forces et ses compromis.
Les questions qu'on se pose souvent
Des réponses courtes et claires, sans jargon, pour lever les doutes.
C'est quoi un modèle d'IA, simplement ?
Un moteur de calcul entraîné : il prend une entrée, la fait passer dans sa recette de réglages, et produit la sortie la plus probable.
C'est quoi les paramètres (ou poids) ?
Des nombres appris pendant l'entraînement. Pris ensemble par millions, ils forment le comportement du modèle.
Un modèle mémorise-t-il les réponses ?
Non. Il ne range pas des réponses toutes faites : il les reconstruit à chaque fois, à partir de ses réglages.
Quel modèle est le meilleur ?
Aucun dans l'absolu. La bonne question est : lequel sert le mieux cet usage précis (vitesse, coût, qualité, multimodal) ?
La suite, pensée comme une montée en compréhension
On monte d'un cran à chaque étape, toujours avec la même promesse de clarté.