Se souvenir, mais pas tout seul Intermédiaire

La mémoire d'un assistant

Comprendre pourquoi un modèle n'a pas de mémoire native, et comment un produit lui en donne une.

🫏 Commence par la BD, c'est plus rigolo ! 🫏 Cette notion existe aussi en BD 🫏 Cette notion existe aussi en BD « IA perd la mémoire (encore) » — lire l'histoire →
10 min mémoirecontexteproduit
Pas de jargon Compréhensible vite
Mascotte de L'IA du Zéro

Le modèle seul ne garde rien entre deux sessions.

Le produit capture l'essentiel : préférences, faits, résumés.

Ces notes sont stockées puis récupérées quand c'est utile.

1. Je découvre une version simple et imagée
2. Je comprends le vrai mécanisme sans jargon inutile
3. Je m'entraîne avec un mini quiz immédiat
4. Je retiens les points clés à réexpliquer

L'assistant n'a pas de mémoire, on lui en bricole une

  • Tout seul, le modèle repart de zéro à chaque nouvelle conversation : il ne te « connaît » pas vraiment.
  • Mémoire courte = ce qui tient dans la conversation en cours (sa « fenêtre »). Trop long, et le début finit par sortir.
  • Mémoire longue = des notes (ton prénom, tes goûts, un résumé) stockées par l'appli, puis relues plus tard.
  • L'appli ne ressort que ce qui est utile au moment voulu, pas tout le carnet d'un coup.
Un exemple pour toi

Sur un assistant qui t'aide pour les devoirs, il « retient » que tu es en 3e et que tu révises l'Histoire. En vrai, ce n'est pas lui : l'appli a noté ça dans un coin et le lui rappelle au début de chaque session. Pareil qu'une appli de musique qui se souvient de tes playlists.

Cette « mémoire » est stockée quelque part par l'entreprise. Avant de confier des trucs perso (adresse, problèmes intimes, mots de passe), demande-toi : est-ce que je veux que ce soit gardé ? Va voir les réglages : tu peux souvent consulter, désactiver ou effacer ce que l'assistant a mémorisé sur toi.

Deux mémoires : la courte (la conversation actuelle) et la longue (des notes rangées dehors, ré-injectées au bon moment).

Le déclic en mouvement

Regarde l'assistant se souvenir… ou repartir de zéro

Sans mémoire, il t'oublie d'une session à l'autre. Active le « carnet » et vois le produit lui relire ton prénom et tes goûts.

Tu me dis qui tu es. Pour l'instant, je le « vois » dans la conversation.
« Bonjour, je m'appelle Léa et j'aime le vélo. »

Pendant cette conversation, je vois cette info (mémoire courte = fenêtre de contexte).

Mémoire longue ?ON : on garde un carnet et on le relit.
Étape 1 / 4
Sous le capot

Pour les curieux : ce qui se passe à l'intérieur

Tape pour explorer Replier
1
Là maintenant

Sa mémoire de tout de suite, c'est juste ce qu'on lui dit

Pendant que tu lui parles, l'âne se souvient de ce que tu viens de raconter, comme quand tu retiens une histoire qu'on est en train de te lire. Mais si ça devient trop long, le début s'envole de sa tête, pile comme quand tu oublies le tout premier mot d'une grande phrase.

2
Le carnet

Pour se souvenir longtemps, on écrit dans un carnet

Pour ne pas tout oublier quand tu pars, on note des petites choses sur un carnet : « Léa aime les chats ». Le carnet n'est pas dans la tête de l'âne, il est posé à côté. C'est le carnet qui se souvient, pas lui tout seul !

3
On relit

On relit juste les pages qui servent

Si on lui relisait TOUT le carnet à chaque fois, ce serait trop long et il s'embrouillerait. Alors on choisit juste la bonne page : celle qui parle de ce dont tu as besoin aujourd'hui, comme quand tu cherches une seule image dans ton album.

4
Mes secrets

Garder tes secrets, c'est important

Écrire des choses sur toi, c'est sérieux. Il faut faire attention : qu'est-ce qu'on a le droit de noter, et quand est-ce qu'on doit gommer le carnet ? On ne garde pas tout, juste ce qui aide, et on peut effacer quand tu veux.

1
Court terme

La mémoire courte, c'est la fenêtre de contexte

Pendant une conversation, le modèle « voit » tout l'historique tant qu'il rentre dans sa fenêtre de contexte (la quantité de texte qu'il peut lire d'un coup, un peu comme un nombre de messages max). Quand ça déborde, le plus ancien est coupé ou résumé, et il disparaît — comme un fil de discussion qui charge seulement les derniers messages.

2
Long terme

La mémoire longue est stockée à l'extérieur

Pour se souvenir d'une session à l'autre, on enregistre des faits, des préférences ou des résumés dans une base de données (un stockage externe), puis on va les rechercher plus tard. C'est l'appli autour du modèle qui « se souvient », pas le modèle : lui redémarre à zéro à chaque fois.

3
Récupération

On ne ré-injecte que le pertinent

Renvoyer toutes les notes saturerait la fenêtre et noierait l'info utile. On sélectionne donc seulement ce qui colle à la situation, puis on le remet dans le contexte. C'est le principe du RAG (Retrieval-Augmented Generation) appliqué à toi : on récupère la bonne note au bon moment, comme une recherche ciblée.

4
Vie privée

Mémoriser engage la responsabilité

Stocker des infos perso impose des choix sérieux : que garde-t-on, combien de temps, et comment permettre l'effacement (le droit à l'oubli, encadré par le RGPD). Une mémoire utile ne veut pas dire tout retenir : on garde le strict nécessaire et on doit pouvoir tout supprimer sur demande.

1
Court terme

La mémoire courte, c'est la fenêtre de contexte

Pendant une conversation, le modèle voit l'historique tant qu'il tient dans la fenêtre. Au-delà, on tronque ou on résume — et l'ancien sort.

2
Long terme

La mémoire longue est stockée à l'extérieur

On enregistre des faits, des préférences ou des résumés dans une base, puis on les récupère plus tard. C'est le produit, pas le modèle, qui « se souvient ».

3
Récupération

On ne ré-injecte que le pertinent

Tout ressortir noierait la fenêtre. On sélectionne les notes utiles à la situation (comme du RAG centré sur l'utilisateur) et on les remet dans le contexte.

4
Vie privée

Mémoriser engage la responsabilité

Stocker des informations personnelles impose des choix : que garde-t-on, combien de temps, comment permettre l'effacement. Mémoire utile ne veut pas dire tout retenir.

L'image mentale

L'analogie qui aide à retenir

C'est comme un ami très gentil qui oublie tout, sauf si on lui tient un carnet.

L'assistant est un pote génial mais amnésique : sa mémoire, c'est les notes que l'appli garde et lui relit.

L'assistant est un génie amnésique : sa mémoire, c'est le carnet de notes qu'on tient pour lui et qu'on lui relit.

À retenir

Le coeur de l'idée

La machine ne se souvient pas toute seule : c'est le carnet qu'on lui relit.

Un assistant ne se souvient pas tout seul : c'est l'appli autour qui range des notes et les lui relit.

Un assistant ne se souvient pas tout seul : sa mémoire est un dispositif autour du modèle, à concevoir avec soin.

Comment ça marche

Le mécanisme, découpé étape par étape

1

La machine oublie tout quand tu pars.

2

Alors on écrit ce qui compte sur un petit carnet.

3

On garde le carnet bien au chaud.

4

Avant de répondre, elle relit le carnet pour se rappeler.

1

Tout seul, le modèle oublie tout dès que tu fermes la conversation.

2

L'appli autour de lui note l'essentiel : ton prénom, tes préférences, un résumé.

3

Ces notes sont rangées quelque part, puis ressorties quand elles servent.

4

On les remet au début de la discussion pour donner l'impression qu'il se souvient.

1

Seul, le modèle ne conserve rien d'une session à l'autre : il repart de zéro.

2

Le produit capture l'essentiel : préférences, faits importants, résumés d'échanges.

3

Ces notes sont stockées à l'extérieur, puis récupérées quand elles sont utiles.

4

On ne ré-injecte dans le contexte que le pertinent, pour simuler une mémoire.

Exemples très concrets

Où tu retrouves ça dans le monde réel

Tape pour explorer Replier

Le carnet dit : « Léa adore le vélo », alors elle s'en souvient.

Il note ton dessin animé préféré pour t'en reparler.

Il garde le nom de ton doudou pour ne pas l'oublier.

Ton appli de révision retient en quelle classe tu es et les matières que tu bosses.

Un chatbot d'aide aux devoirs se rappelle que tu préfères les explications courtes.

Ton assistant de jeu garde ton pseudo et ton style préféré entre deux parties.

Un assistant retient ton prénom et ton objectif d'apprentissage.

Un support client se souvient de tes derniers tickets pour ne pas tout reposer.

Un copilote de code garde tes conventions de nommage préférées.

Points de vigilance

Ce qu'il ne faut pas confondre

Tape pour explorer Replier

Si le carnet a une bêtise dedans, elle redit la bêtise.

Garder trop de secrets, ce n'est pas bien.

Si elle lit la mauvaise page, elle se trompe.

Une note fausse ou périmée peut ressortir et fausser la réponse.

Tout stocker coûte cher et expose des infos perso.

La mémoire longue ne sert à rien si l'appli retrouve la mauvaise note.

Une mémoire mal gérée peut ressortir des infos fausses ou périmées.

Tout stocker coûte cher et pose des risques de vie privée.

La mémoire longue n'est fiable que si la récupération l'est.

Mythes vs réalité

Remplace les fausses idées par les bonnes

On corrige les réflexes faux que beaucoup gardent, pour ancrer une image mentale juste et solide.

Ce qu'on imagine

On croit qu'elle se souvient toute seule.

Ce qu'il faut garder

En vrai, c'est le carnet qui se souvient. Elle, elle oublie tout.

Ce qu'on imagine

On croit que tout noter, c'est mieux.

Ce qu'il faut garder

En vrai, si on note trop, le carnet se trompe et raconte des bêtises.

Ce qu'on imagine

« L'assistant me connaît, donc il se souvient tout seul. »

Ce qu'il faut garder

Non : c'est l'appli qui garde les notes et les lui relit. Le modèle, lui, recommence à zéro à chaque fois.

Ce qu'on imagine

« Plus il mémorise de trucs, mieux c'est. »

Ce qu'il faut garder

Faux : tout garder coûte cher, peut ressortir des infos périmées et touche à ta vie privée.

Ce qu'on imagine

« Avec de la mémoire, l'IA ne se trompe plus. »

Ce qu'il faut garder

Non : si elle ressort une note fausse ou vieille, elle se plante. La mémoire ne vaut que si on retrouve la bonne note.

Ce qu'on imagine

« L'assistant me connaît, donc il se souvient tout seul. »

Ce qu'il faut garder

Non. C'est le produit qui garde des notes et les lui relit ; le modèle repart de zéro à chaque session.

Ce qu'on imagine

« Plus on mémorise, mieux c'est. »

Ce qu'il faut garder

Pas vraiment. Tout retenir coûte cher, peut ressortir des infos périmées et pose des risques de vie privée.

Ce qu'on imagine

« La mémoire rend l'IA infaillible. »

Ce qu'il faut garder

Non. Une mémoire mal récupérée peut injecter des infos fausses : elle n'est fiable que si la récupération l'est.

Mémo final

À la fin, ce sont ces idées qui doivent rester

Si tu peux les redire sans relire la fiche, l'essentiel est acquis.

1
Elle oublie

Quand tu pars, la machine ne sait plus qui tu es.

2
Le carnet

On écrit ce qui compte dans un petit carnet.

3
Elle relit

Avant de parler, elle regarde le carnet.

4
Pas trop

On ne note pas tout, juste ce qui sert vraiment.

Mémo final

À la fin, ce sont ces idées qui doivent rester

Si tu peux les redire sans relire la fiche, l'essentiel est acquis.

1
Zéro mémoire native

Le modèle repart de zéro à chaque conversation.

2
Courte vs longue

Courte = la conversation en cours. Longue = des notes gardées entre les sessions.

3
On ressort le pertinent

On ne remet que les notes utiles, pas tout, sinon ça déborde.

4
Vie privée

Que garder, combien de temps, comment effacer.

Mémo final

À la fin, ce sont ces idées qui doivent rester

Si tu peux les redire sans relire la fiche, l'essentiel est acquis.

1
Pas de mémoire native

Le modèle repart de zéro entre les sessions.

2
Courte vs longue

Fenêtre de contexte (en cours) vs notes stockées (entre sessions).

3
On ré-injecte le pertinent

Comme un RAG centré sur l'utilisateur : on retrouve ce qui compte.

4
Vie privée

Que garder, combien de temps, comment permettre l'effacement.

Questions fréquentes

Les questions qu'on se pose souvent

Des réponses courtes et claires, sans jargon, pour lever les doutes.

Un assistant se souvient-il vraiment de moi ?

Pas le modèle lui-même. C'est le produit autour qui garde des notes (prénom, préférences) et les lui relit au bon moment.

Différence entre mémoire courte et longue ?

La mémoire courte est la fenêtre de la conversation en cours. La mémoire longue est faite de notes stockées et réutilisées entre les sessions.

La mémoire peut-elle se tromper ?

Oui. Si on récupère une note fausse ou périmée, l'assistant s'appuiera dessus. La mémoire n'est fiable que si la récupération l'est.

Et la vie privée ?

Mémoriser des données personnelles impose des règles : choisir ce qu'on garde, la durée, et permettre l'effacement (droit à l'oubli).