Machines?

De quoi on parle ici?

  • Applications
    • chatGPT
    • Claude
    • Gemini
  • Algorithmes propriétaires
  • LLMs
  • D’autres modèles avec des architectures semblables (impliquant une softmax)

Mais diff entre algos et app des gafam

Inverser le raisonnement

  • On peut tout automatiser
  • La question est donc: que voulons-nous automatiser et pourquoi?
  • On automatise ce qui perd de la valeur
  • On automatise la “créativité” parce que le travail créatif s’est prolétarisé

Creativité: la mauvaise question

Une machine, peut-elle être créative?

Creativité: la bonne question

Qu’est-ce que la créativité?

La temperature comme définition formelle de créativité

\[\sigma(z_i) = \frac{e^{\beta z_{i}}}{\sum_{j=1}^K e^{z_{j}}} \ \ \ for\ i=1,2,\dots,K\]

Qu’est-ce qu’un LLM?

Un LLM est un modèle qui apprend la probabilité d’un token t étant donné le token t-1. Soit:

\[P(e_t | e_{t-1})\]

Exemple simplifié

  1. J’aime les roses
  2. J’aime les roses rouges
  3. J’aime les roses blanches
  4. J’aime les fonctions
  5. J’aime les fonctions mathématiques
  6. J’aime les chiens
  7. J’aime les filles qui font vieille France
  8. J’aime les filles des cinémas
  9. J’aime les filles de l’assistance
  10. J’aime les filles dans l’embarras
roses = 3
fonctions = 2
chiens = 1
filles = 4

Softmax!

\[\sigma(z_i) = \frac{e^{z_{i}}}{\sum_{j=1}^K e^{z_{j}}} \ \ \ for\ i=1,2,\dots,K\]

\[z_1 = 3\] \[z_2 = 2\] \[z_3 = 1\] \[z_4 = 4\]

La softmax est la fonction \[\sigma(z_i)\]

Nous voulons:

\[\sigma(3) = ?\]

\[\sigma(2) = ?\]

\[\sigma(1) = ?\]

\[\sigma(4) = ?\]

La somme doit donner 1

\[\frac{e^{z_{i}}}{\sum_{j=1}^K e^{z_{j}}}\]

Le numérateur de la fraction est constitué par la fonction exponentielle qui a pour base \(e\), le nombre d’Euler et pour exposant \(z_i\) à savoir le chiffre auquel nous sommes en train d’appliquer l’équation.

Le dénominateur est \(\sum_{j=1}^K e^{z_{j}}\), à savoir la somme de tous les résultats de la fonction exponentielle appliquée aux chiffres que nous voulons traiter.

Dans notre cas le dénominateur sera: \(e^3 + e^2 + e^1 + e^4 = 84.791024884\)

(\(e = 2.71828...\))

ed donc:

\(\sigma(3) = \frac{e^3}{84.791024884} = 0.23\)

\(\sigma(2) = \frac{e^2}{84.791024884} = 0.10\)

\(\sigma(1) = \frac{e^1}{84.791024884} = 0.03\)

\(\sigma(4) = \frac{e^4}{84.791024884} = 0.64\)

We therefore have the following probabilities:

  • roses = 23%
  • fonctions = 10%
  • chiens = 3%
  • filles = 64%

Ouais… mais la créativité dans tout ça?

Une ruse mathématique

\[\sigma(z_i) = \frac{e^{\beta z_{i}}}{\sum_{j=1}^K e^{\beta z_{j}}} \ \ \ for\ i=1,2,\dots,K\]

Température?

\[T = \frac{1}{\beta}\]

température haute->système désorganisé

L’effet

si on augmente la température (et donc si on diminue \(\beta\)), la différence entre les pourcentages sera diminuée.

La probabilité sera donc distribuée de manière plus homogène - intuitivement, les écarts entre le terme le plus probable, dans notre exemple “filles” et le terme le moins probable, “chiens” sera plus petit.

Exemple

température à 5 et donc $= = 0,2 $

Notre 4 chiffres seront transformés comme suit:

  • roses: 3 x 0,2 = 0,6
  • fonctions: 2 x 0,2 = 0,4
  • chiens: 1 x 0,2 = 0,2
  • filles: 4 x 0,2 = 0,8

Notre dénominateur sera donc:

\[e^{0,6} + e^{0,4} + e^{0,2} + e^{0,8} = 6,760887185\]

Et si on fait les calculs avec ces nouveaux chiffres (il est intuitif que l’exposant étant plus petit, le résultat sera inférieur, donc l’écart inférieur):

\[\sigma(3) = \frac{e^{0,6}}{6,760887185} = 0,27\]

\[\sigma(2) = \frac{e^{0,4}}{6,760887185} = 0,22\]

\[\sigma(1) = \frac{e^{0,2}}{6,760887185} = 0,18\]

\[\sigma(4) = \frac{e^{0,8}}{6,760887185} = 0,33\]

Les nouvelles probabilités:

  • roses = 27%
  • fonctions = 22%
  • chiens = 18%
  • filles = 33%

Cool demo

Complètement nouveau?

smoothing

Qu’est-ce que la créativité selon cette définition formelle ?

Un comportement qui dévie de la distribution normale de probabilités – tout en gardant le sens.

Est-ce “la bonne définition”?

Mauvaise question

Mais pour moi la créativité c’est plutôt…

GIVE THE F***(ORMAL) DEFINITION!