Les LLMs expliqués en 3 min chrono !

Écrit par Hasnen
Dernière maj : 04 Juin 2025

Tout le monde parle des LLM. Mais… c’est quoi exactement ?

Pas de jargon compliqué ici — dans cet article, je t’explique tout, vite fait bien fait, pour que tu comprennes comment ça marche et pourquoi c’est une vraie révolution. Accroche-toi, c’est parti.

LLM : ça veut dire quoi ?

LLM, c’est l’acronyme de Large Language Model, ou en français, modèle de langage à grande échelle. Mais on va rester sur “LLM”, c’est plus simple (et clairement plus stylé).

Concrètement, un LLM, c’est une intelligence artificielle qui a “mangé” des tonnes de textes sur internet. Le but ? Apprendre à comprendre le langage humain… et surtout, à générer du texte tout seul. Un peu comme un perroquet : il répète des choses qu’il a vues ou entendues — sans forcément les comprendre.

Comment fonctionne un LLM ?

Quand tu poses une question à ChatGPT, il ne réfléchit pas comme un humain. Il prédit le mot le plus probable après celui que tu viens de taper, en se basant sur des milliards de textes. C’est tout. Pas d’émotions, pas de réflexion profonde — juste de la prédiction.

Mais pour bien comprendre, voici les 3 grandes étapes du fonctionnement d’un LLM :

1. L’apprentissage

Le LLM est “entraîné” sur d’immenses bases de données textuelles : Wikipédia, des livres, des forums, des articles scientifiques, etc.

Il ne lit pas au sens humain du terme, mais il absorbe des milliards de phrases pour repérer comment on parle, écrit, pense.

Et tout ça grâce à une architecture appelée transformer, un type de réseau neuronal inventé par Google en 2017 avec le papier “Attention is all you need”.

Le transformer fonctionne avec des couches (ou blocks) qui se combinent : auto-attention, normalisation, réseaux de neurones internes, etc.

Plus il y a de couches, plus le modèle est puissant (mais aussi plus gourmand).

2. L’identification des schémas

Contrairement à un moteur de recherche qui te ressort un texte existant, un LLM analyse les relations entre les mots.

Par exemple, si tu demandes “quelle est la capitale de la France ?”, il sait que la réponse est Paris parce que dans plein de textes, “capitale” + “France” = “Paris”.

Ce tour de magie repose sur deux éléments clés :

Le self-attention : une technique qui permet au modèle de savoir sur quels mots il doit vraiment se concentrer dans ta phrase. En gros, il ne lit pas tout au même niveau, il pondère ce qui est important.
Le positional encoding : vu que les mots sont traités en parallèle (et pas dans l’ordre), cette technique permet de garder la notion de séquence (qui vient avant, qui vient après).

C’est ce combo qui permet aux LLM de comprendre des phrases complexes… même quand les mots sont très éloignés les uns des autres.

3. La prédiction

C’est là toute la magie (ou l’illusion) : le LLM devine ce qui devrait venir ensuite. Il prédit le mot suivant avec la probabilité la plus élevée, selon le contexte.

Un peu comme un perroquet sous stéroïdes, hyper puissant, qui a lu toute la bibliothèque d’Internet.

Tous les LLM ne se valent pas

Il existe deux grandes familles :

Les modèles propriétaires (fermés) : comme GPT-4 (OpenAI), Claude (Anthropic), ou Gemini (Google).
Les modèles open source (ouverts) : comme LLaMA 3 (Meta), Qwen (Alibaba), ou Mistral (cocorico ).

Les premiers sont développés par des entreprises, entraînés de façon opaque, souvent censurés ou limités.

Les seconds, eux, sont libres, modifiables et peuvent même être utilisés hors ligne, sur ton propre ordinateur ou serveur.

À quoi ça sert concrètement ?

Les LLM sont capables de lire, écrire, traduire, résumer, coder, et même aider à créer du contenu.

Quelques exemples très concrets :

Un auteur en panne d’inspiration peut utiliser un LLM pour générer des idées.
Un développeur peut transformer une simple consigne en code exécutable.
Un chercheur peut faire résumer un article scientifique ou générer une hypothèse.
Un médecin peut analyser des notes cliniques et repérer des signaux faibles dans les dossiers.
Un conseiller financier peut résumer une réunion et classer des documents en temps réel.

Ces IA sont polyvalentes parce qu’elles sont entraînées sur des volumes gigantesques de données. On les appelle même des foundation models, car elles servent de base à plein d’autres usages.

Mieux encore : certaines sont capables de zero-shot learning, c’est-à-dire de résoudre un problème sans aucun exemple, juste à partir du contexte.

Et si on leur donne un ou deux exemples, on parle alors de one-shot ou few-shot learning.

Trois types de LLM selon leur architecture

Il existe différents “formats” de LLM selon ce qu’on veut qu’ils fassent :

Encodeurs uniquement (ex : BERT) → pour comprendre le langage (analyse de sentiments, classification…)
Décodeurs uniquement (ex : GPT-3) → pour générer du texte (rédaction, écriture créative…)
Encodeur + Décodeur (ex : T5) → pour traduire, résumer, convertir d’un format à un autre

Mais attention, tout n’est pas rose

Les hallucinations

Un LLM peut inventer des infos en toute confiance, juste parce que ça “colle” avec ce qu’il a vu dans ses données d’entraînement.

Il peut te sortir le nom d’un président qui n’a jamais existé… sans trembler.

Les biais & censures

Si les données sont biaisées, le modèle répète les mêmes biais.

Et quand il est contrôlé par une entreprise, il peut être filtré, censuré ou politiquement orienté.

Essaye de poser une question sensible à un LLM chinois, genre sur le régime politique : tu vas vite comprendre.

La confidentialité

Ce que tu tapes dans ChatGPT ou Gemini peut être enregistré et analysé.

Si tu bosses sur des sujets sensibles (santé, finance, recherche), mieux vaut héberger ton propre LLM open source.

Et pourquoi ce n’est pas encore partout ?

Parce que créer un LLM, c’est extrêmement cher et complexe :

Le coût : entraîner un modèle comme GPT-3 peut coûter plus de 12 millions de dollars juste en énergie et en GPU.
Les données : il faut des quantités de textes gigantesques et souvent pas disponibles, surtout pour les domaines sensibles (santé, finance…).
L’expertise : il faut des équipes de chercheurs, ingénieurs, et de l’infrastructure costaude pour gérer tout ça.

Heureusement, les modèles open source changent un peu la donne, et rendent ce savoir plus accessible.

En résumé

Les LLM, ce sont des machines à prédire du texte.

Mais leur impact est gigantesque : ils vont remplacer certains métiers, en créer de nouveaux et surtout changer notre façon de bosser avec les machines.

D’ailleurs, petite anecdote : toutes les vidéos qui ont illustré ma vidéo YouTube… ont été générées par un LLM spécialisé dans la vidéo.

Et maintenant, si tu veux aller plus loin, regarde cette autre vidéo que le LLM de Google pense que tu devrais absolument voir — selon ton historique. Comme quoi, les LLM sont partout.

Abonne-toi à notre newsletter 👇

Les LLMs expliqués en 3 min chrono !

LLM : ça veut dire quoi ?